視音頻編解碼技術(shù)及其實(shí)現(xiàn)
來源:杭州??低晹?shù)字技術(shù)股份有限公司 作者:胡揚(yáng)忠 編輯:數(shù)字音視工程 2009-07-08 20:49:46 加入收藏
視音頻編解碼技術(shù)及其實(shí)現(xiàn)
一、視音頻編碼國際標(biāo)準(zhǔn)化組織及其壓縮標(biāo)準(zhǔn)介紹
國際上有兩個負(fù)責(zé)視音頻編碼的標(biāo)準(zhǔn)化組織,一個是VCEG(Video code Expert Group),是國際電信聯(lián)合會下的視頻編碼專家組,一個是MPEG(Motion Picture Expert Group),是國際標(biāo)準(zhǔn)化組織下的運(yùn)動圖象專家組。這兩個視音頻編碼標(biāo)準(zhǔn)化組織都對視音頻的編解碼做出了非常重要的貢獻(xiàn):一是推動視音頻編碼技術(shù)的發(fā)展,一是推動視音頻編解碼的應(yīng)用。
國際上有兩個負(fù)責(zé)視音頻編碼的標(biāo)準(zhǔn)化組織,一個是VCEG(Video code Expert Group),是國際電信聯(lián)合會下的視頻編碼專家組,一個是MPEG(Motion Picture Expert Group),是國際標(biāo)準(zhǔn)化組織下的運(yùn)動圖象專家組。這兩個視音頻編碼標(biāo)準(zhǔn)化組織都對視音頻的編解碼做出了非常重要的貢獻(xiàn):一是推動視音頻編碼技術(shù)的發(fā)展,一是推動視音頻編解碼的應(yīng)用。
視音頻編解碼涉及很多項(xiàng)視頻和音頻處理技術(shù),每一項(xiàng)技術(shù)的改進(jìn)都對視音頻編碼做出貢獻(xiàn),但作為一套完整、高效的編碼方案,需要集中全人類在視音頻編解碼方面的最新智慧。個人或公司的研究成果,都希望被標(biāo)準(zhǔn)化組織,其經(jīng)濟(jì)回報是標(biāo)準(zhǔn)使用許可權(quán)費(fèi)。
這兩個標(biāo)準(zhǔn)化組織制定的相關(guān)編碼標(biāo)準(zhǔn)都獲得了廣泛的應(yīng)用,VCEG制定的標(biāo)準(zhǔn)有H.261(被國際電信聯(lián)合會選定為電視會議的視頻壓縮標(biāo)準(zhǔn))、H.262(該標(biāo)準(zhǔn)同MPEG-2完全一樣,是VCEG同MPEG組成的聯(lián)合編碼專家組JVT制定的壓縮標(biāo)準(zhǔn),VCEG發(fā)布的是H.262,MPEG發(fā)布的是MPEG-2)、H.263(該標(biāo)準(zhǔn)被國際電信聯(lián)合會選定為可視電話的視頻壓縮標(biāo)準(zhǔn),有增強(qiáng)型版本H.263+、H.263++)、H.264(該標(biāo)準(zhǔn)是2002年5月VCEG為新一代交互式視頻通訊制定的標(biāo)準(zhǔn))。MPEG名氣要大得多,制定的標(biāo)準(zhǔn)有MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21 ,MPEG-1壓縮標(biāo)準(zhǔn)為VCD所采納,MPEG-2的壓縮標(biāo)準(zhǔn)為DVD采納,MPEG-4是為交互式多媒體通訊制定的壓縮標(biāo)準(zhǔn),MPEG-7是為互聯(lián)網(wǎng)視頻檢索制定的壓縮標(biāo)準(zhǔn)。
VCEG制定的壓縮標(biāo)準(zhǔn)H.26X都是針對單一矩形視頻對象,其追求的是更高的壓縮效率。MPEG-4在目前之所以很熱,是因?yàn)镸PEG-4是基于多個視音頻對象的壓縮編碼標(biāo)準(zhǔn),這非常適合于互聯(lián)網(wǎng)上的多媒體應(yīng)用。在互聯(lián)網(wǎng)上傳播的多媒體信息,很多是可以劃分為多個視頻對象的,如電腦制作的動畫節(jié)目、電視新聞節(jié)目等,而在實(shí)時視頻圖象編碼中,在一個圖象矩形框中很難實(shí)時識別多個視頻對象,還是把一個視頻源當(dāng)作一個矩形視頻對象進(jìn)行編碼。
VCEG在97年發(fā)布H.263的壓縮標(biāo)準(zhǔn)后,制定了短期開發(fā)計劃H.26N和長期開發(fā)計劃H.26L,H.26N發(fā)展成H.263+和H.263++,H.26L經(jīng)過5年時間的發(fā)展,在2002年5月作為H.264壓縮標(biāo)準(zhǔn)進(jìn)行發(fā)布。
MPEG在VCEG發(fā)布H.263之后,發(fā)布了MPEG-4 SP(即MPEG-4第一板),在該版本中引入了兩個非常重要的概念:一個是一個視頻源多個視音頻對象編碼,一個是碼流傳輸異常處理(特別是無線傳輸應(yīng)用)。從這里可以看出,VCEG致力于高效率的視頻編碼技術(shù),MPEG更側(cè)重系統(tǒng)和框架。
在2001年第四季度,VCEG H.26L發(fā)展到TML9.0時,MPEG同VCEG再次組成聯(lián)合聯(lián)合視頻編碼專家組JVT,對H.26L的算法進(jìn)行了改進(jìn)和完善,在2003年5月VCEG發(fā)布了H.264的壓縮標(biāo)準(zhǔn)。MPEG在JVT對H.26L壓縮算法修改的基礎(chǔ)上,將該技術(shù)規(guī)范納入到MPEG-4的標(biāo)準(zhǔn)中,作為MPEG-4 PART10發(fā)布,即MPEG-4的第三版,MPEG-4 AVC。H.264和MPEG-4 AVC代表了全人類在視音頻編解碼方面的最新成果。
針對單一矩形視頻對象,MPEG-4 AVC比MPEG-4第二版MPEG-4 ACE的壓縮效率提高30%以上。
二、H.264與MPEG-4 PART10的技術(shù)說明
同以前的視頻壓縮標(biāo)準(zhǔn)H.263++和MPEG-4 ACE相比,H.264與MPEG-4 PART10采用了一些新的算法,主要表現(xiàn)在以下幾個方面:
1、運(yùn)動搜索
a、引入多參考幀
引入多達(dá)5個參考幀。
b、多種BLOCK形狀
有16*16、16*8、8*16、8*8、8*4、4*8、4*4七種BLOCK形狀。
c、運(yùn)動搜索精度更高
1/2象素精度搜索采用了6階濾波器,搜索精度有很大提高。也引入了1/4象素精度搜索和1/8象素精度搜索。
同以前的視頻壓縮標(biāo)準(zhǔn)H.263++和MPEG-4 ACE相比,H.264與MPEG-4 PART10采用了一些新的算法,主要表現(xiàn)在以下幾個方面:
1、運(yùn)動搜索
a、引入多參考幀
引入多達(dá)5個參考幀。
b、多種BLOCK形狀
有16*16、16*8、8*16、8*8、8*4、4*8、4*4七種BLOCK形狀。
c、運(yùn)動搜索精度更高
1/2象素精度搜索采用了6階濾波器,搜索精度有很大提高。也引入了1/4象素精度搜索和1/8象素精度搜索。
2、殘余編碼
a、 采用整型4*4 DCT變換
b、 量化技術(shù)改進(jìn)
c、 采用DE-BLOCK技術(shù)
d、 SP幀技術(shù)
這些技術(shù)的改變,一方面提高了壓縮效率,另一方面運(yùn)算強(qiáng)度大幅提高,大大地提高了實(shí)現(xiàn)的難度。
三、??低?/a>開發(fā)的視音頻數(shù)字化產(chǎn)品
海康威視從2000年5月進(jìn)入視音頻編解碼這個行業(yè),就緊跟標(biāo)準(zhǔn)化組織制定的視音頻編解碼標(biāo)準(zhǔn)的步伐,特別是在MPEG-4、H.26L等標(biāo)準(zhǔn)發(fā)展過程中,扮演實(shí)現(xiàn)者的角色,首先是在PC平臺上實(shí)時實(shí)現(xiàn)壓縮標(biāo)準(zhǔn)所描述的視音頻編解碼。但PC平臺上的應(yīng)用,屬于商業(yè)化軟件的范疇,我們更適合做電子產(chǎn)品,在DSP上實(shí)時實(shí)現(xiàn),降低產(chǎn)品成本、提高產(chǎn)品的可靠性,才有更大的實(shí)用價值。
海康威視從2000年5月進(jìn)入視音頻編解碼這個行業(yè),就緊跟標(biāo)準(zhǔn)化組織制定的視音頻編解碼標(biāo)準(zhǔn)的步伐,特別是在MPEG-4、H.26L等標(biāo)準(zhǔn)發(fā)展過程中,扮演實(shí)現(xiàn)者的角色,首先是在PC平臺上實(shí)時實(shí)現(xiàn)壓縮標(biāo)準(zhǔn)所描述的視音頻編解碼。但PC平臺上的應(yīng)用,屬于商業(yè)化軟件的范疇,我們更適合做電子產(chǎn)品,在DSP上實(shí)時實(shí)現(xiàn),降低產(chǎn)品成本、提高產(chǎn)品的可靠性,才有更大的實(shí)用價值。
從一個視音頻編解碼模型,到一個實(shí)用的視音頻編解碼軟件,要做大量的工作,從運(yùn)算強(qiáng)度而言,要降低100倍以上。
??低曉跀?shù)字化視音頻編解碼方面做了大量的工作,主要成果在以下幾個方面:
1、在PC(P4 1.4GHz)平臺上完成了MPEG-4 ACE的編碼和解碼;
2、在PC(P4 1.4GHz))平臺上完成了H.264的編碼和解碼;
3、在PHILIPS公司的DSP PNX1301(166MHz主頻)上完成了MPEG-4 ACE的編碼和解碼(CIF或QCIF分辨率);
4、在PHILIPS公司的DSP PNX1301(180MHz)上完成了H.264的編碼和解碼(CIF或QCIF分辨率);
5、在PHILIPS公司的DSP PNX1302(200MHz)上完成了H.264的編碼和解碼(2CIF分辨率);
6、在EQUATOR公司的DSP BSP-15-350(350MHz)上完成了MPEG-4 AVC的編解碼(2CIF分辨率)。
其中,在PHILIPS公司的DSP PNX1301上完成了MPEG-4 ACE的編碼和解碼技術(shù),應(yīng)用在DS-400XM壓縮板卡上,在國內(nèi)獲得了廣泛的應(yīng)用。
在推出DS-400XM壓縮板卡之后,又推出基于H.264壓縮技術(shù)的DS-400XH系列(CIF分辨率)和DS-400XH+系列(2CIF分辨率)。
四、結(jié)束語
杭州海康威視數(shù)字技術(shù)有限公司是一家致力于研究視音頻編解碼核心技術(shù)、開發(fā)和生產(chǎn)自主數(shù)字視音頻壓縮產(chǎn)品的專業(yè)公司,作為國內(nèi)在視頻處理器(DSP)上開發(fā)視頻編碼軟件的先驅(qū),在多款視頻視頻處理器(DSP)上進(jìn)行了不懈的嘗試,已經(jīng)取得了非常有意義的進(jìn)展,目前推出的DS-400XH和DS-400XH+兩個系列的產(chǎn)品,代表了監(jiān)控類數(shù)字視音頻編碼產(chǎn)品邁向更低碼率、更高分辨率的發(fā)展方向。
杭州海康威視數(shù)字技術(shù)有限公司是一家致力于研究視音頻編解碼核心技術(shù)、開發(fā)和生產(chǎn)自主數(shù)字視音頻壓縮產(chǎn)品的專業(yè)公司,作為國內(nèi)在視頻處理器(DSP)上開發(fā)視頻編碼軟件的先驅(qū),在多款視頻視頻處理器(DSP)上進(jìn)行了不懈的嘗試,已經(jīng)取得了非常有意義的進(jìn)展,目前推出的DS-400XH和DS-400XH+兩個系列的產(chǎn)品,代表了監(jiān)控類數(shù)字視音頻編碼產(chǎn)品邁向更低碼率、更高分辨率的發(fā)展方向。
免責(zé)聲明:本文來源于杭州海康威視數(shù)字技術(shù)股份有限公司,本文僅代表作者個人觀點(diǎn),本站不作任何保證和承諾,若有任何疑問,請與本文作者聯(lián)系或有侵權(quán)行為聯(lián)系本站刪除。(原創(chuàng)稿件未經(jīng)許可,不可轉(zhuǎn)載,轉(zhuǎn)載請注明來源)
評論comment