本文目录导航:
图像和视频编码的国内规范有哪些?
摘要:本文艰深地探讨了图像视频编码的国内规范以及每种图像和视频编码的技术特点。
关键词:图像 视频编辑 国内特性 �近10年来,图像编码技术失掉了迅速开展和宽泛运行,关且日臻成熟,其标记就是几个关于图像编码的国内规范的制订,即国内规范化组织ISO和国内电工委员会IEC关于运动图像的编码规范JPEG、国内电信联盟ITU-T关于电视电话/会议电视的视频编码规范 H261,H.263和ISO/IEC关于优惠图像的编码规范MPEG-1,MPEG-2和MPEG-4等。
这些规范图像编码算法融合了各种性能优异的图像编码方法,代表了目前图像编码的开展水平。
表1给出了各种图像与视频编码国内规范的题目,制订日期、指标比特率、运行场所以及所采用的关键编码技术等。
表1图像视频编码的国内规范�1、JPEG(Joint Photographic Expert Group)�JPEG是ISO/IEC联结图像专家组制订的运动图像紧缩规范,是实用于延续颜色(包括灰度和黑白)运动图像紧缩算法的国内规范。
JPEC算法共有4种运转形式,其中一种是基于空间预测(DPCM)的无损紧缩算法,另外3种是基于DCT的有损紧缩算法。
�1)无损紧缩算法,可以保障无失真地重建原始图像。
�2)基于DCT的顺序形式,按从上到下,从左到右的顺序对图像启动编码,称为基本系统。
�3)基于DCT的递进形式,指对一幅图像按由粗到细对图像启动编码。
4)分层形式。
以各种分辨率对图像启动编码,可以依据不同的要求,取得不同分辨率的图像。
�JEPG对图像的紧缩有很大的伸缩性,图像品质与比特率的相关如下:�a)1�5~2�0比特/像素:与原始图像基本没有区别(transparent quality)。
�b)0�75~1�5比特/像素:极好(excellent quality),满足大少数运行。
�c)0�5~0�75比特/像素:好至很好(good to very good quality),满足少数运行。
�d)0�25~0�5比特/像素:中至好(moderate to very good quality),满足某些运行。
2、JPEG-2000�与以往的JPEG规范相比,JPEG-2000紧缩率比JPEG高约30%,它有许多原先的规范所无法比拟的好处。
JPEG-2000与传统JPEG最大的不同,在于它丢弃了JPEG所采用的以DCT变换为主的分块编码形式,而改为以小波变换为主的多分辨率编码形式。
�首先,JPEG-2000能成功无损紧缩(lossless compression)。
在实践运行中,有一些关键的图像,如卫星遥感图像、医学图像、文物照片等,理论须要启动无损紧缩。
对图像启动无损编码的经典方法——预测法曾经开展成熟,并作为一个规范写入了JPEG-2000中。
�JPEG-2000还有一个很好的好处就是误码鲁棒性(robustness to bit error)好。
因此经常使用JPEG-2000的系统稳固性好,运转颠簸,抗搅扰性好,易于操作。
JPEG-2000能成功渐进运输(progressive transmission),这是JPEG-2000的 一个极端关键的特色。
它可以先传输图像的轮廓,而后逐渐传输数据,不时提高图像品质,以满足用户的须要,这在网络传输中具有十分严重的意义。
经常使用JPEG-2000下载一个图片,用户可先看到这个图片的轮廓或缩影,而后再选择能否下载。
而且,下载时可以依据用户须要和带宽来选择下载图像品质的好坏,从而控制数据量的大小。
JPEG-2000另一个极端关键的好处就是感兴味区(ROI,Region Of Interest)特性。
用户在解决的图像中可以指定感兴味区,对这些区域启动紧缩时可以指定特定的紧缩品质,或在恢复时指定特定的解紧缩要求,这给人们带来了极大的繁难。
在有些状况下,图像中只要一小块区域对用户是有用的,对这些区域采用高紧缩比。
在保障不失落关键消息的同时,又能有效地紧缩数据量,这就是感兴味区的编码打算所采取的紧缩战略。
基于感兴味区紧缩方法的好处,在于它结合了接纳方对紧缩的客观要求,成功了交互式紧缩。
3、MPEG-1�国内规范化组织ISO/IEC的运动图像专家组MPEG(Moving Picture Expert Group)不时努力于运动图像及其伴音编码规范化上班,并制订了一系列关于普通优惠图像的国内规范。
1993年制订的MPEG-1规范是针对1�5Mbit/s速率的数字存储媒体运动图像及其伴音编码制订的国内规范,该规范的制订使得基于CD-ROM的数字视频以及MP3等产品成为或许。
MPEG-1的带宽最多为1�5Mbit/s,其中11Mbit/s用于视频,128Kbit/s用于音频,其他带宽用于MPEG系统自身。
�为了谋求高的紧缩效率,去除图像序列的期间冗余度,同时满足多媒体等运行所必定的随机存取要求,MPEG-1视频把图像编码分红I帧、P帧、B帧和D帧共4种类型。
I帧为帧内编码帧(intra coded frame),编码时采用相似JPEG的帧内DCT编码,I帧的紧缩率是几种编码类型中最低的。
P帧为预测编码帧(predictive coded rame),采用前向运动补救预测和误差的DCT编码,由其前面的I或P帧启动预测。
B帧为双向预测编码帧(bi-directionally predictive coded frame),采用双向运动补救预测和误差的DCT编码,由前面和前面的I或P帧启动预测,所以B帧的紧缩效率最高。
D帧为直流编码帧(DC coded frame),只蕴含每个块的直流重量。
MPEG-1采用运动补救支除图像序列期间轴上的冗余度,可使对P帧和B帧图像的紧缩倍数比I帧提高很多。
4、MPEG-2�MPEG组织1995年推出的MPEG-2规范是在MPEG-1规范基础上的进一步裁减和改良,关键是针对数字视频广播、拙劣晰度电视和数字视盘等制订的4~9Mbit/s运动图像及其伴音的编码规范,MPEG-2是数字电视机顶盒与DVD等产品的基础。
MPEG-2系统要求必定与MPEG-l系统向下兼容,因此其语法的最大特点在于兼容性好并可裁减。
MPEG-2的指标与MPEG-1相反,依然是提高紧缩比,改善音频、视频品质,采用的外围技术还是分块DCT和帧间运动补救预测技术。
MPEG-2视频准许数据速率高达100Mbit/s,支持隔行扫描视频格局和许多初级性能。
思考到视频信号隔行扫描的特点,MPEG-2专门设置了“按帧编码”和“按场编码”两种形式,并相应地对运动补救和DCT方法启动了裁减,从而清楚提高了紧缩编码的效率。
思考到规范的通用性,增大了关键的参数值,准许有更大的画面格局、比特率和运动矢量长度。
除此之外,MPEG-2视频紧缩编码还启动了以下裁减:1)输入/输入图像黑白重量之比可以是4∶2∶0,4∶2∶2,4∶4∶4。
�2)输入/输入图像格局不限定。
3)可以间接对隔行扫描视频信号启动解决。
�4)在空间分辨率、期间分辨率、信噪比如面的可分级性适宜于不同用途的解码图像要求,并可给出传输上不等同级的优先级。
�5)码流结构的可分级性,比如头部消息、运动矢量等局部可以给予较高的优先级,而关于DCT系数的高频重量局部则给予较低的优先级。
�6)输入码率可以是恒定的也可以是变动的, 以顺应同步和异步传输。
�MPEG-2视频是一系列的系统,每一个系统具有布置好的特性和兼容水平。
它准许对四种源格局或许级别启动编码,从繁难明晰度(CIF格局)到齐全的拙劣晰度电视HDTV(High Definition Television)。
除了源格局的这种灵敏性外,MPEG-2还规则了分辨率从低到高的4级5类共11种独自的技术规范,同一种类不同级别间的图像分辨率和编码速率相差甚远。
表2给出了MPEG-2准许的级别和类的组合。
�5、MPEG-4�1992年11月,MPEG专家组选择开发新的顺应于极低码率的音频/视频(AV,Audio-Visual)编码的国内规范,即MPEG-4。
关于学术界来说,极低码率(即小于64Kbit/s)是视频编码规范的最后一个比特率范围。
表2 MPEG-2视频规范注:繁难规范(无B帧,无法缩放);主规范(B祯无法缩放) SNR缩放(B帧,空间或SNR可缩放) 空间可缩放的规范(B帧,空间或SNR可缩放);初级规范(B帧,空间或SNR 可缩放)。
MPEG-4专家组深化剖析了AV畛域中电视(television)、计算机(computer)、通讯(communication)以及其交叉融合的开展趋向后,以为MPEG-4应该提供用于通讯的新形式,其外围是基于内容content-based)的AV消息存储、解决与操作,支持交互性、高紧缩比以及通用存储性等性能。
同时在其结构上应具有顺应性与可裁减性,以顺应硬、软件技术的不时开展,便于及时融合新的技术。
�相关于MPEG的前两个紧缩规范,MPEG-4已不再是一个单纯的视频音频编解码规范,它将内容与交互性作为外围,从而为多媒体提供了一个更为宽广的平台。
它更多定义的是一种格局和框架,而不是详细的算法,这样人们可以在系统中添加许多新的算法。
除了一些紧缩工具和算法外,各种各样的多媒体技术如图像剖析与分解、计算机视觉、语音分解等也可以充沛运行于编码中。
�H.261是ITU-T针对可视电话和会议电视、窄带ISDN等要务实时编解码和低延时运行提出的一个编码规范。
该规范蕴含的比特率为p*64Kbit/s,其中p是一个整数,取值范围为1~30,对应比特率为64Kbit/s~92Mbit/s。
�6、H.261H.261规范大体上分为两种编码形式:帧内形式和帧间形式。
关于紧张运动的人头肩像,帧间编码形式将占主导位置;而对画面切换频繁或运动猛烈的序列图像,则帧间编码形式要频繁地向帧内编码形式切换。
为了缩小信道误码,采用一种叫做BCH(511,493)的纠错编码形式。
这种纠错码可以在493比特中智能纠正2比特的失误。
按H�261规则,源编码器必定具有纠错编码的性能,而纠错编码是选择的。
7、H.年,ITU-T总结过后国内上视频图像编码的最新停顿,针对低比特率视频运行制订了H.263规范,该规范被公以为是以像素为基础的采用第一代编码技术的混合编码打算所能到达的最佳结果。
随后几年中,ITU-T又对其启动了屡次补充,以提高编码效率,增强编码性能。
补充订正的版本有1998年的H�263+,2000年的H�263++。
H�263系列规范特意适宜于PSTN网络、无线网络与因特网等环境下的视频传输。
H.263已被几种可视电话采用为终端规范,如支持PSTN与无线网的H�324,支持N-ISDN的H.320,支持B-ISDN的H�310等。
H�263信源编码算法的外围依然是H�261规范中采用的DPCM/DCT混和编码算法,原理框图也和H�261十分相似。
8、MPEG-7与MPEG-21�MPEG-7是为“多媒体内容形容接口”,是用于消息示意的,PEG-7是“基于语义的示意”。
MPEG-7定义了一个形容符规范集,用于形容各种类型的多媒体消息,与之相应的形容打算可以用于规范多媒体形容符的生成和不同形容符之间的无机咨询。
�这些形容符与指定的多媒体对象的内容严密咨询,采用提取对象特色的方法为成功基于内容和语义的准确检索提供接口。
在此基础上,MPEG-7定义了一种形容定义言语(DDL,Description Definition Language)用于指定和生成形容打算,即宿愿提出新的视频、音频消息示意形式,它既不同于基于波形和基于紧缩的示意形式(如MPEG-1和MPEG-2),又不同于基于对象的示意形式(MPEG-4)。
这一示意形式准许对消息的含意启动必定水平的解释,它可以被一个设施或计算机解码器存取。
MPEG-7的目的在于提供一个规范化的外围技,以便形容多媒环境下的视频和音频内容,最终使视频和音频收集像文本收集一样简双繁难。
�MPEG-7可以形容的多媒体对象范围极端宽泛,其外围局部DDL言语将充沛排汇现有的各种媒体形容言语的特点,以到达对多媒体数据的普遍顺应性。
MPEG-4中提出的基于对象编码的思维将成为对多媒体数据库中的视频、音频对象启动解决(包括特色提取、紧缩编码等)的基本手腕。
而MPEG-7的多媒体内容形容性能对MPEG-1,MPEG-2,MPEG-4起到性能提高和性能裁减的作用。
最后,MPEG-7将提供内容的形容而不是内容自身,它将不能代替已有的MPEG规范(MPEG-1,MPEG-2,MPEG-4),仅仅是已有3个规范的补充。
�正在研制的新规范MPEG-21是一个支持经过异构网络和设施,经常使用户透明繁难地经常使用多媒体资源的规范,其目的是建设一个交互的多媒体对象,成功多种业务模型,包括对版权和买卖的智能治理,对内容经常使用者隐衷的尊重等。
视频编码格局有哪些?
视频紧缩规范如下:
H.261规范是为ISDN设计,关键针对实时编码和解码设计,紧缩和解紧缩的信号延时不超越150ms,码率px64kbps(p=1~30)。
H.261规范关键采用运动补救的帧间预测、DCT变换、自顺应量化、熵编码等紧缩技术。
只要I帧和P帧,没有B帧,运动预计精度只准确到像素级。
支持两种图像扫描格局:QCIF和CIF。
H.263规范是甚低码率的图像编码国内规范,它一方面以H.261为基础,以混合编码为外围,其基本原理框图和H.261十分相似,原始数据和码流组织也相似;另一方面,H.263也排汇了MPEG等其它一些国内规范中有效、正当的局部,如:半像素精度的运动预计、PB帧预测等,使它性能优于H.261。
H.263经常使用的位率可小于64Kb/s,且传输比特率可不固定(变码率)。
H.263支持多种分辨率:SQCIF(128x96)、 QCIF、CIF、4CIF、16CIF。
3、H.264/AVC
视频紧缩国内规范关键有由ITU-T制订的H.261、H.262、H.263、H.264和由MPEG制订的MPEG-1、MPEG-2、MPEG-4,其中H.262/MPEG-2和H.264/MPEG-4 AVC由ITU-T与MPEG联结制订。
从繁难来说H.264就是一种视频编码技术,与微软的WMV9都属于同一种技术也就是紧缩灵活图像数据的“编解码器”程序。
普通来说,假设灵活图像数据未经紧缩就经常使用的话,数据量十分大,容易形成通讯线路缺点及数据存储容量紧张。
因此,在发送灵活图像时、或许把影像内容保留在DVD上时、以及经常使用存储介质容量较小的数码相机或相机手机拍摄映像时,就必定经常使用编解码器。
只管编解码器有许多种类,但DVD-Video与微波数字电视等经常使用的关键是MPEG2,数码相机等摄像时关键经常使用MPEG4。
既然作为紧缩视频编码技术,H.264最大的作用对视频的紧缩了。
咱们相熟的MPEG2也就是最罕用的DVD视频编码技术曾经比拟落后。
MPEG-4规范并非是MPEG-2的代替品,它着眼于不同的运行畛域。
MPEG-4的制订初衷关键针对视频会议、可视电话超低比特率紧缩(小于64Kb/s)的需求。
在制订环节中,MPEG组织深深感遭到人们对媒体消息,特意是对视频消息的需求由播放型转向基于内容的访问、检索和操作。
MPEG-4与前面提到的JPEG、MPEG-1/2有很大的不同,它为多媒体数据紧缩编码提供了更为宽广的平台,它定义的是一种格局、一种框架,而不是详细算法,它宿愿建设一种更自在的通讯与开发环境。
于是MPEG-4新的指标就是定义为:支持多种多媒体的运行,特意是多媒体消息基于内容的检索和访问,可依据不同的运行需求,现场性能解码器。
编码系统也是开明的,可随时添加新的有效的算法模块。
运行范围包括实时视听通讯、多媒体通讯、远地监测/监督、VOD、家庭购物/文娱等。
MPEG-4视频紧缩算法相关于MPEG-1/2在低比特率紧缩上有着清楚提高,在CIF(352*288)或许更拙劣晰度(768*576)状况下的视频紧缩,无论从明晰度还是从存储量上都比MPEG1具有更大的好处,也更适宜网络传输。
另外MPEG-4可以繁难地灵活调整帧率、比特率,以降低存储量。
MPEG-4由于系统设计过于复杂,使得MPEG-4难以齐全成功并且兼容,很难在视频会议、可视电话等畛域成功,这一点有点偏离原来地初衷。
图片、音频、视频区分经常使用了什么编码格局?
一、图像:
JPEG文件的裁减名为其紧缩技术十分先进,它用去除冗余的图像和黑白数据,失掉得极高的紧缩率的同时能展现十分丰盛活泼的图像,换句话说,就是可以用起码的磁盘空间失掉较好的图像品质。
PNG经常使用从LZ77派生的无损数据紧缩算法,普通运行于JAVA程序、网页或S60程序中,要素是它紧缩比高,生成文件体积小。
二、音频:
应用 MPEG Audio Layer 3 的技术,将音乐以1:10 甚至 1:12 的紧缩率,紧缩成容量较小的文件,而关于大少数用户来说重放的音质与最后的不紧缩音频相比没有清楚的降低。
FLAC是一套驰名的自在音频紧缩编码,其特点是无损紧缩。
不同于其他有损紧缩编码如MP3及AAC,它不会破坏任何原有的音频新闻,所以可以恢复音乐光盘音质。
三、视频:
MP4是一套用于音频、视频消息的紧缩编码规范,由国内规范化组织(ISO)和国内电工委员会(IEC)下属的“灵活图像专家组”(Moving Picture Experts Group,即MPEG)制订。
AVI英文全称为Audio Video Interleaved,即音频视频交织格局,是微软公司于1992年11月推出、作为其Windows视频软件一局部的一种多媒体容器格局。
裁减资料
相关背景:
AVI格局和VFW软件只管是为以后的MPC设计的,但它也可以不时提高以顺应MPC的开展。
依据AVI格局的参数,其视窗的大小和帧率可以依据播放环境的配件才干和解决速度启动调整。
在高档MPC机上或在网络上播放时,VFW的视窗可以很小,颜色数和帧率可以很低;而在Pentium级系统上,关于64K色、320×240的紧缩视频数据可成功每秒25帧的回放速率。
由于AVI数据的交叉存储,VFW播放AVI数据时只要占用有限的内存空间,由于播放程序可以一边读取硬盘或光盘上的视频数据一边播放,而无需预先把容量很大的视频数据加载到内存中。