流媒体网欢迎您!
全世界的网络联合起来,流媒体世界一定能实现!
 
   
IPTV | P2P流媒体 | 移动流媒体 | 数字家庭 | 流媒体宽频 | 网络流媒体 | 安防监控 | 视频会议 | VIP会员 | 新闻专题
 
 
 
您现在的位置: 流媒体网 >> 技术平台 >> 应用 >> 技术正文
 
H.263数字视频压缩技术
作者:未知  来源:中国安防产品网  发布时间:2004-11-8 9:09:00

 一、视频压缩编码的基本概念 
                       
    视频压缩的目标是在尽可能保证视觉效果的前提下减少视频数据率。视频压缩比一般指压缩后的数据量与压缩前的数据量之比。  在视频压缩中常需用到以下的一些基本概念:
1、有损和无损压缩:在视频压缩中有损(Lossy )和无损(Lossless)的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢复。丢失的数据率与压缩比有关,压缩比越小,丢失的数据越多,解压缩后的效果一般越差。此外,某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。


                       
2、 帧内和帧间压缩:帧内(Intraframe)压缩也称为空间压缩(Spatial compression)。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。帧内压缩一般达不到很高的压缩。

    采用帧间(Interframe)压缩是基于许多视频或动画的连续前后两帧具有很大的相关性,或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧之间具有冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以进一步提高压缩量,减小压缩比。帧间压缩也称为时间压缩(Temporal compression),它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。 

3 、对称和不对称编码:对称性(symmetric)是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频,如视频会议应用就以采用对称的压缩编码算法为好。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好地实时回放,也即以不同的速度进行压缩和解压缩。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。
                      
二、H.263压缩编码格式                       
1 、H.263压缩编码格式
    H.263 视频编码标准是专为中高质量运动图像压缩所设计的低码率图像压缩标准。H.263 采用运动视频编码中常见的编码方法,将编码过程分为帧内编码和帧间编码两个部分。I帧内用改进的DCT变换并量化,在帧间采用1/2 象素运动矢量预测补偿技术,使运动补偿更加精确,量化后适用改进的变长编码表(VLC)地量化数据进行熵编码,得到最终的编码系数。

 2、H.263 帧类型
                       
A 内码帧(I帧)不能由任何其它帧构造出来,包含所有可显示它的信息。
I帧编码过程: 
    每个光亮度和色差平面被分成8*8的块 
    各块使用DCT转换成频率域 
    利用量化表进行量化。 
    对各块中最重要系数序列(DC系数)用DPCM技术进行编码,且仅编码两个相邻DC值的差 
    各块中的系数是按锯齿形次序进行行程编码 
    最后进行类哈夫曼编码
预测帧(P帧):由前面的帧构造所得。
P帧编码:
P帧编码过程:
在基准帧中对每个宏块均查找其最佳匹配宏块 
计算实际宏块和最佳匹配宏块的差,作为运动向量
误差项用DCT进行转换 
    接着进行量化步,形成“锯齿形次序”行程编码,最后进行类哈夫曼平均信息量编码。注意量化表与I帧所用的不同,DC系数的编码与其他系数的编码方式相同

3、H.263特点 
    与H.261 的p×64K 的传输码率相比,H.263的码率更低,单位码率可以小于64K,且支持的原始图像格式更多,包括了在视频和电视信号中常见的QCIF,CIF,EDTV,ITU-R 601,ITU-R 709 等等。 
     H.263的编码速度快,其设计编码延时不超过150ms;码率低,在512 K 乃至 384K 带宽下仍可得到相当满意的图像效果,十分适用于需要双向编解码并传输的场合(如:可视电话)和网络条件不是很好的场合(如:远程监控)。 H.263图象被编码为一个亮度信号和两个色差成分(Y,CB和CR)。 
                       
4、 H.263的数据结构 
    H.263采用句法和语义学的方法对多路视频来管理的。 
    句法被划分为四层,四个层分别是图象、块组、宏块、块。图象层每帧图象的数据包含一个图象头,并紧跟着块组数据,最后是一个end-of-sequence码和填塞位。其中包括有图象开始码(PSC) (22 bits)、时域参照(TR)(8 bits)、类型信息 (PTYPE) (13 bits) 和量化器信息 (PQUANT) (5 bits)等十三个选项。 
    每个块组层(GOB)包含了一个块组层头,紧跟着宏块数据。每个GOB包含了一行或多行宏块。对于每帧图象的第一个GOB(0号),不需要传送GOB头。而对于其它的GOB,GOB头可以为空,这决定于编码策略。译码器可以通过外部手段发送信号给远程变码器要求只传送非空GOB头,例如建议H.245。

    每个宏块中包含了一个宏块头和后续的块数据。COD只出现在用PTYPE指定为"INTER"的图象帧中,对于这些图象中的宏块,当COD指定或PTYPE指示为"INTRA"时会出现宏块类型 & 色度的编码块样式(MCPBC)。如果PTYPE指示了"PB帧",对于B块的宏块 (MODB)会出现。只有在MODB中指定时才会出现CBPB(指示将传送宏块的B系数)和B宏块的运动矢量数据 (MVDB) (变长)。当MCPBC和CBPY中指定时会出现"块数据"。 
    块层如果不在PB帧模式,一个宏块包含四个亮度块和两个色差块。在PB帧模式下,一个宏块包含12个块。在缺省H.263模式下,首先传送6个P块数据,然后是6个B块数据。

责任编辑:sand


发表评论】【告诉好友】【打印此文】【关闭窗口收藏此页到365Key   
  • 上一篇技术:
  • 下一篇技术:
  •  
    相关新闻
    TeaVea 发布H.264编码软件,速度超X264一倍
    IPTV经典技术盘点
    基于XScaIe处理器的视频通信系统
    视频压缩技术的系统考虑
    视频压缩标准的技术原理及其发展