中星電子核心技術(shù)推SVAC國際標(biāo)準(zhǔn)
眾所周知,安全防范監(jiān)控系統(tǒng)在社會(huì)治安防控體系建設(shè)中占有重要地位,其中“眼見為憑”的視頻監(jiān)控功能更是舉足輕重;而當(dāng)監(jiān)控畫面及聲音需要被傳輸時(shí),視音頻編解碼標(biāo)準(zhǔn)就扮演了決定性的關(guān)鍵角色。但是,目前已有的視音頻編解碼標(biāo)準(zhǔn),都是針對(duì)廣播電視和大眾娛樂方面的多媒體和流媒體應(yīng)用,在安全防范領(lǐng)域直接采用具有很大的不適應(yīng)性;環(huán)顧國內(nèi)、國際也都沒有專門針對(duì)安全防范監(jiān)控應(yīng)用的視音頻編解碼標(biāo)準(zhǔn)。在目前總體安防產(chǎn)業(yè)網(wǎng)絡(luò)化、高清化、智能化的潮流趨勢下,制定符合安全防范監(jiān)控應(yīng)用需要的視音頻編解碼標(biāo)準(zhǔn)更是燃眉之急。
該標(biāo)準(zhǔn)的橫空出世,從核心層的視音頻編解碼方面解決了長期以來數(shù)字監(jiān)控領(lǐng)域標(biāo)準(zhǔn)、協(xié)議無法統(tǒng)一的難題,更填補(bǔ)了安防監(jiān)控專用視音頻編解碼標(biāo)準(zhǔn)的空白。中星電子作為SVAC標(biāo)準(zhǔn)的發(fā)起人、推動(dòng)者之一,期望扮演好安防領(lǐng)域“核心技術(shù)提供商”的角色,助力中國本土安防制造升級(jí),也在安防標(biāo)準(zhǔn)化方面搶抓到先機(jī)。
憑借芯片和算法優(yōu)勢,中星電子為SVAC技術(shù)的主要承擔(dān)者
經(jīng)過多年努力,由公安部第一研究所與中星微電子牽頭作為組長單位,聯(lián)合包括中星電子在內(nèi)的40余家知名企業(yè)、科研院所、大學(xué)等組員單位,共同制定了專門針對(duì)安全防范監(jiān)控領(lǐng)域的數(shù)字視音頻編解碼標(biāo)準(zhǔn)《安全防范監(jiān)控?cái)?shù)字視音頻編解碼技術(shù)要求》,英文為TechnicalSpecificationofSurveillanceVideoandAudioCoding(簡稱SVAC)。此標(biāo)準(zhǔn)已于2010年8月獲批、12月正式公布,標(biāo)準(zhǔn)號(hào)GB/T25724-2010,歸口單位為全國安全防范報(bào)警系統(tǒng)標(biāo)準(zhǔn)化技術(shù)委員會(huì)(簡稱SAC/TC100)。具有我國自主知識(shí)產(chǎn)權(quán)的SVAC不僅是全球第一個(gè)針對(duì)安防應(yīng)用的視音頻編解碼標(biāo)準(zhǔn),更對(duì)中國社會(huì)治安防控體系的建設(shè)樹立了新的標(biāo)竿。
在SVAC標(biāo)準(zhǔn)工作組成員當(dāng)中,成立于2008年的中星電子是由天津經(jīng)濟(jì)技術(shù)開發(fā)區(qū)國有資產(chǎn)經(jīng)營公司和北京中星微電子公司共同出資組建,專注于安防監(jiān)控市場,以數(shù)字監(jiān)控多媒體芯片核心技術(shù)為基礎(chǔ),提供具有完整自主知識(shí)產(chǎn)權(quán)的高端數(shù)字安防監(jiān)控產(chǎn)品和解決方案。是國內(nèi)本土安防企業(yè)之中,少數(shù)同時(shí)具備核心技術(shù)和整方案提供能力的企業(yè)之一。遺傳自主要投資方中星微電子所擁有的十幾年開發(fā)圖像處理芯片和算法的經(jīng)驗(yàn),為中星電子參與SVAC標(biāo)的準(zhǔn)制定和推行提供了先天的能力。中星電子資深副總裁兼首席技術(shù)官(CTO)張韻東表示,中星電子于標(biāo)準(zhǔn)制定過程中是SVAC技術(shù)的主要承擔(dān)者,負(fù)責(zé)技術(shù)開發(fā)的部分,包括安防特殊應(yīng)用的28奈米芯片核心算法、封裝及可實(shí)際應(yīng)用的落實(shí),投入的力度及資金都相當(dāng)龐大。相對(duì)的此舉也給中星電子首推安防國標(biāo)SVAC打下了堅(jiān)實(shí)的基礎(chǔ)。
SVAC標(biāo)準(zhǔn)制定思路:忠實(shí)于場景的高保真視音頻編碼
目前已有的視音頻編解碼標(biāo)準(zhǔn),主要是針對(duì)廣播電視和大眾娛樂方面的應(yīng)用制訂,在安全防范監(jiān)控領(lǐng)域直接采用具有很大的不適應(yīng)性,主要表現(xiàn)在:
1.對(duì)全天候、各種復(fù)雜拍攝環(huán)境下的現(xiàn)場還原性不佳;
2.在壓縮編碼效率和聲音/圖像質(zhì)量之間的平衡不理想;
3.沒有考慮對(duì)智能分析和機(jī)器識(shí)別的支持;
4.缺少對(duì)監(jiān)控專用信息(如絕對(duì)時(shí)間、智能分析結(jié)果等)的支持;
5.對(duì)音視頻內(nèi)容的真實(shí)性、完整性和安全性保護(hù)不足。
。
統(tǒng)一的視音頻編解碼標(biāo)準(zhǔn)有利于大規(guī)模監(jiān)控系統(tǒng)的規(guī)劃和推廣,促進(jìn)安防監(jiān)控產(chǎn)業(yè)的快速發(fā)展,為國內(nèi)構(gòu)建完整的安防產(chǎn)業(yè)鏈奠定了堅(jiān)實(shí)的基礎(chǔ)。
SVAC標(biāo)準(zhǔn)主要技術(shù)創(chuàng)新
中星電子資深副總裁兼首席技術(shù)官(CTO)張韻東指出,SVAC標(biāo)準(zhǔn)的技術(shù)創(chuàng)新主要體現(xiàn)在以下幾點(diǎn):
1、支持高精度視頻數(shù)據(jù),在高動(dòng)態(tài)范圍場景提供更多圖像細(xì)節(jié),減少編解碼環(huán)節(jié)的圖像信息損失。監(jiān)控場景圖像動(dòng)態(tài)范圍往往很大,傳統(tǒng)8比特編碼的低精度視頻數(shù)據(jù)會(huì)導(dǎo)致圖像對(duì)比度下降、圖像細(xì)節(jié)和層次丟失等,而SVAC采用10比特視頻壓縮編碼,具有更大的動(dòng)態(tài)范圍,可以保證在視頻編解碼環(huán)節(jié)盡量減少圖像損失信息,保證存儲(chǔ)的視頻數(shù)據(jù)盡可能真實(shí)完整的保留拍攝場景的信息和細(xì)節(jié)。
2、采用幀內(nèi)4x4預(yù)測與變換、上下文自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC)等技術(shù)提高編碼效率,在獲得更好圖像質(zhì)量的同時(shí)也能獲得更高的編碼效率。
3、支持感興趣區(qū)域(RangeOfInterest,簡稱ROI)變質(zhì)量編碼,定義了宏模塊MAARO(16x16)的排列次序,在網(wǎng)絡(luò)帶寬或存儲(chǔ)空間有限的情況下,提供更符合監(jiān)控需要的高質(zhì)量視頻編碼。碼率受限時(shí),優(yōu)先保證ROI圖像質(zhì)量,支持ROI部分比非ROI部分采用更高碼率且圖像質(zhì)量更好。此功能可與智能分析結(jié)合,更好地應(yīng)用在車牌識(shí)別領(lǐng)域。
4、支持可伸縮視頻編碼(SVC),滿足不同傳輸網(wǎng)絡(luò)帶寬和數(shù)據(jù)存儲(chǔ)環(huán)境的需求,具備更好的網(wǎng)絡(luò)和存儲(chǔ)適應(yīng)性。它通過對(duì)視頻數(shù)據(jù)的分層次壓縮(分為D1畫質(zhì)的“基本層”和720P/1080P的“擴(kuò)展層”),使得一個(gè)編碼器可以輸出不同分辨率/幀率/質(zhì)量的多個(gè)編碼視頻流,比簡單的雙碼流具有更低的總體碼率。
5、支持代數(shù)碼書激勵(lì)線性預(yù)測(ACELP)和變換音頻編碼(TAC)切換的雙核音頻編碼,保證對(duì)人的語音和環(huán)境(背景)聲音均有較好的編碼效果。
它與全帶編碼技術(shù)相比,可以節(jié)省近50%的碼率。
6、支持聲音識(shí)別特征參數(shù)編碼,避免編碼失真對(duì)語音識(shí)別和聲紋識(shí)別的影響。
7、支持監(jiān)控專用信息(絕對(duì)時(shí)間、地理位置、智能分析結(jié)果、報(bào)警信息)與視音頻碼流一起編碼,便于視音頻內(nèi)容的有效管理和綜合利用。特殊監(jiān)控時(shí)間類型及參數(shù)通過專門語法與視音頻壓縮數(shù)據(jù)一起傳輸和存儲(chǔ),便于檢索查詢,對(duì)于大規(guī)模監(jiān)控網(wǎng)絡(luò)數(shù)據(jù)庫更為重要。
8、支持加密和認(rèn)證,保證監(jiān)控?cái)?shù)據(jù)的保密性、真實(shí)性和完整性,同時(shí)具備靈活的可擴(kuò)展性。
SVAC標(biāo)準(zhǔn)制訂的主要思路是:針對(duì)監(jiān)控實(shí)際需求,以“忠實(shí)于場景的高保真視音頻編解碼”為核心思想,解決監(jiān)控視音頻編解碼面臨的實(shí)際問題。所謂“忠實(shí)于場景的視音頻編解碼”,是指在編解碼過程中,要盡量真實(shí)、完整的保留監(jiān)控現(xiàn)場的信息,避免信息的損失,實(shí)現(xiàn)監(jiān)控現(xiàn)場視音頻內(nèi)容的高保真還原,為后續(xù)的綜合分析以及作為法律證據(jù)提供良好的保障。
另外,借鑒融合最先進(jìn)的編碼技術(shù),力圖在保證視音頻質(zhì)量的前提下,提供較高編碼效率;技術(shù)架構(gòu)適合從簡單到復(fù)雜的各種視音頻監(jiān)控應(yīng)用,并保證標(biāo)準(zhǔn)的可擴(kuò)展性;在同等性能的前提下,具體算法優(yōu)先采用具有國內(nèi)自主知識(shí)產(chǎn)權(quán)的方案,避免國外專利陷阱。