IPTV视频编解码标准的对比与选择

分享到:

   1、引言

  IPTV业务是指基于宽带互联网与宽带接入,以机顶盒或其它具有视频编解码能力的数字化设备作为终端,通过聚合SP的各种流媒体服务内容和增值应用,为用户提供多种互动多媒体服务的宽带增值业务。

  IPTV能否成功开展的一个关键点是采用什么样的视频编解码标准,因为IPTV业务需要在有限的网络带宽条件下提供清晰的图像质量,对编码效率有较高的要求;同时,视频编码标准的选择会直接影响到整个IPTV产业链的发展,涉及从内容编码到流媒体服务器以及组播复制点直至用户机顶盒各个层面,要从某一种编码格式转换为另一种编码格式,需要进行的系统升级甚至硬件更换的成本是极其巨大的。也正因为这一点,视频编码标准的选择一直是IPTV业界关注的首要问题。

  2、视频编解码标准简介

  视频编解码标准有很多种,目前国内IPTV产业中主要采用了MPEG-4、H.264技术以及中国提出的具有自主知识产权的标准AVS这3种标准,相对于H.264和AVS技术标准,MPEG4 ASP在流媒体和IPTV应用市场中起步时间最早,因此产业化程度最成熟,IPTV设备提供商的支持也最广泛;AVS的产业化程度最低,H.264次之。下面对这3种标准进行介绍。

  2.1 MPEG-4标准简介

  运动图像专家组(MPEG)于1999年2月正式公布了MPEG-4(ISO/IEC14496)标准第一版本。同年年底公布了MPEG-4第 2版,且于2000年年初正式成为国际标准。MPEG-4与MPEG-1和MPEG-2有着很大的差异,MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用、交互式多媒体等整合及压缩技术的需求而制定的国际标准。

  MPEG-4除采用第一代视频编码的核心技术,如变换编码、运动估计与运动补偿、量化、熵编码外,还提出了一些有创见性的关键技术,其中包括:

  (1)视频对象提取技术

  MPEG-4标准同以前标准的最显著的差别在于它是采用基于对象的编码理念,即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象,分别编码后再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。这样可以实现对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,同时也便于对各种对象进行操作及编辑。视频对象提取(即视频对象分割)是MPEG-4视频编码的关键技术,也是新一代视频编码的研究热点和难点。

  (2)VOP视频编码技术

  视频对象平面(VOP,Video Object Plane)是视频对象(VO)在某一时刻的采样,VOP是MPEG-4视频编码的核心概念。MPEG-4在编码过程中针对不同VO采用不同的编码策略,即对前景VO的压缩编码尽可能保留细节和平滑;对背景VO则采用高压缩率的编码策略,甚至不予传输而在解码端由其他背景拼接而成。这种基于对象的视频编码不仅克服了第一代视频编码中高压缩率编码所产生的方块效应,而且使用户可与场景交互,从而既提高了压缩比,又实现了基于内容的交互,为视频编码提供了广阔的发展空间。MPEG-4支持任意形状图像与视频的编解码。

  (3)视频编码可分级性技术

  MPEG-4通过视频对象层(VOL,Video Object Layer)数据结构来实现分级编码。MPEG-4提供了两种基本分级工具,即时域分级(Temporal Scalability)和空域分级(Spatial Scalability),此外还支持时域和空域的混合分级。每一种分级编码都至少有两层VOL,低层称为基本层,高层称为增强层。基本层提供了视频序列的基本信息,增强层提供了视频序列更高的分辨率和细节。

  (4)运动估计与运动补偿技术

  MPEG-4采用I-VOP、P-VOP、B-VOP3种帧格式来表征不同的运动补偿类型。它采用了H.263中的半像素搜索技术和重叠运动补偿技术,同时又引入重复填充(repetitive padding)技术和修改的块匹配(modified block matching)技术以支持任意形状的VOP区域。

  在MPEG-4视频编码中,运动估计相当耗时,对编码的实时性影响很大。因此这里特别强调快速算法。运动估计方法主要有像素递归法和块匹配法两大类,前者复杂度很高,实际中应用较少,后者则在H.263和MPEG中广泛采用。

  2.2 H.264标准简介

  2003年,ITU-T通过了一个新的数字视频编解码标准,即H.264标准,H.264是由ISO/IEC与ITU-T组成的联合视频组制定的新一代视频压缩编解码标准。国际电信联盟将该系统命名为H.264/AVC,国际标准化组织和国际电工委员会将其称为14496-10/MPEG-4 AVC。

  H.264标准只有3个子集:基本子集、主体子集和扩展子集。基本子集是专为视频会议应用设计的,能够提供强大的差错隐消技术,并且支持低延时编/解码技术,使视频会议显得更自然。主体子集和扩展子集更适合于电视应用(数字广播、DVD)和延时影响不会太大的视频流应用。


  H.264标准的关键技术如下:

  (1)帧内预测编码

  帧内编码用来缩减图像的空间冗余。为了提高H.264帧内编码的效率,在给定帧中充分利用相邻宏块的空间相关性,相邻的宏块通常含有相似的属性。因此,在对一给定宏块编码时,首先可以根据周围的宏块预测,然后对预测值与实际值的差值进行编码,这样,相对于直接对该帧编码而言,可以大大减小码率。H.264提供6种模式进行4×4像素宏块预测,包括1种直流预测和5种方向预测,H.264也支持16×16的帧内编码。

  (2)帧间预测编码

  帧间预测编码利用连续帧中的时间冗余来进行运动估计和补偿。H.264的运动补偿支持以往的视频编码标准中的大部分关键特性,而且灵活地添加了更多的功能,除了支持P帧、B帧外,H.264还支持一种新的流间传送帧——SP帧,码流中包含SP帧后,能在有类似内容 
但有不同码率的码流之间快速切换,同时支持随机接入和快速回放模式。

  (3)整数变换

  在变换方面,H.264使用了基于4×4像素块的类似于DCT的变换,但使用的是以整数为基础的空间变换,不存在反变换。与浮点运算相比,整数 DCT变换会引起一些额外的误差,但因为DCT变换后的量化也存在量化误差,与之相比,整数DCT变换引起的量化误差影响并不大。此外,整数DCT变换还具有减少运算量和复杂度,有利于向定点DSP移植的优点。

  (4)量化

  H.264中可选32种不同的量化步长,这与H.263中有31个量化步长很相似,但是在H.264中,步长是以12.5%的复合率递进的,而不是一个固定常数。在H.264中,变换系数的读出方式也有两种:之字形(Zigzag)扫描和双扫描,大多数情况下使用简单的之字形扫描;双扫描仅用于使用较小量化级的块内,有助于提高编码效率。

  (5)熵编码

  视频编码处理的最后一步就是熵编码,H.264标准采用的熵编码有两种:一种是基于内容的自适应变长编码(CAVLC)与统一的变长编码(UVLC)结合;另一种是基于内容的自适应二进制算术编码(CABAC)。CAVLC与CABAC根据相临块的情况进行当前块的编码,以达到更好的编码效率。CABAC比CAVLC压缩效率高,但要复杂一些。

  2.3 AVS标准简介

  AVS是基于我国创新技术和部分公开技术的自主标准,AVS标准包括系统、视频、音频、数字版权管理等4个主要技术标准和一致性测试等支撑标准。2002年在信息产业部支持下,成立了“数字音视频编解码技术标准”工作组(简称AVS工作组),在国内外上百家企业和科研单位共同参与下,AVS标准制定工作进展顺利,其中最重要的视频编码标准于2005年通过国家广电总局测试,2006年1月得到信息产业部批准,2月国家标准化管理委员会正式颁布,3月1日起实施。

  AVS视频编解码的核心技术包括:8×8整数变换、量化、帧内预测、1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码等。

继续阅读
IPTV业务在酒店行业的应用与实现

随着国内酒店行业的迅猛发展,技术创新与高科技的引入已成为酒店塑造个性化服务品牌的重要途径,越来越多的宾馆酒店正朝着“酒店E化”——数字化、网络化、智能化、信息化方向迈进。各项基础条件也日益成熟,在网络

智能电视的未来是否应是 OTT+IPTV ?

最近几年,智能电视的概念持续火爆,人们期待着它能给客厅带来一场变革,但当前市面上所谓的智能电视跟用户的预期仍有一段距离。爱范儿一直关注这一领域的发展,上周末,我们与广东电信共同主办了2013年智能电视

后IPTV时代运营商的破局之道 家庭业务经营的组合营销策略

IPTV与OTT的增量不增收 经过近10年的发展,全球IPTV已有超过5000万用户,但与6亿的宽带用户相比,渗透率依然比较低,潜在市场空间依然很大。另一方面,IPTV在全球范围呈现很不平衡的发展状

10G PON技术发展应用

1 10G PON 技术发展背景 随着各大运营商“宽带提速”、“光进铜退”工程的大规模展开,未来宽带业务将会以多媒体、视频点播、互动游戏为主要特征,高带宽、综合化将成为评判运营商所推广的宽带产品优劣

数字电视传输标准和传播途径全解析

数字电视的传输标准三大核心解析 根据地域性、传输方式以及调制方式的不同,所以传输方式需要搭配不同的调制才能够有最佳的效果首先下面我们先来看一下世界上目前都有哪些主要的传输标准其中卫星传输的是DVB-

精彩活动