飛行試驗是飛行條件為真實、模擬或虛擬的試驗。很多科研人員都會進行一些飛行試驗,本文是一篇核心期刊快速發表范文,主要論述了語音視頻信號混合編碼實時遙測技術。
【摘 要】在飛行試驗中,為了全面掌握試驗機的工作狀態,需要將飛行員的語音信號進行遙測。本文提出一種將語音和視頻信號進行混合編碼遙測傳輸的測試方案,該方案將編碼后的數據流插入到機載測試系統中,通過數據采集單元的PCM數據流傳輸進行遙測發射,地面站接收到遙測信號后,利用軟件對數據流進行實時解碼還原出語音和視頻信號。該方案節省了遙測信號帶寬資源的占用,語音和視頻信號通過一套遙測設備進行發射,具有系統設備使用成本低的優點。
【關鍵詞】語音,視頻,編碼,遙測
1 引言
在飛行試驗中,為了掌握試驗機的人機工作狀態,飛行員與地面指揮員通過無線電臺進行語音交流傳遞信息,這種半雙工的“問、答”式工作方式易分散飛行員注意力,不利于試驗任務的執行。如果將飛行員“全部語音”傳輸到地面,結合“問、答”方式,試飛工程師和地面指揮員就更容易全面的掌握試驗機的工作狀態。
同樣機載測試的模擬視頻遙測是將攝像頭輸出的視頻信號直接調制發射傳輸到地面,一路視頻信號占用一套遙測設備,非常占用資源。
為了解決上述問題,首次將語音視頻信號同時采集,采用基于ADPCM和MPEG-4的數字編碼方式[1],通過IRIG-106標準的PCM數據幀將數據流實時遙測到地面站,地面站接收信號后通過軟件解碼實時還原出語音視頻信號。
2 語音編碼方案
2.1語音編碼的概述
語音編碼的方法有三種:波形編碼、參數編碼和混合編碼。
波形編碼能使重建語音波形保持原語音信號的波形形狀,它具有適應能力強、語音質量好的優點,但所需的編碼速率高,如脈沖編碼(PCM)、自適應差分脈沖編碼調制(ADPCM)等;參數編碼通過對語音信號特征參數的提取及編碼,保持了語音的語意,所需的編碼速率比較低,但合成語音質量較差,如LPC-10、MPE-LPC;混合編碼采用了合成-分析的方法,克服了參數編碼的缺點,在中低速率上獲得了高質量的語音編碼,大大節省了傳輸信道容量及存儲量,為不斷擁擠的通信頻帶提供了一種解決方法,混合編碼有CELP、LD-CELP、ASCELP 等編碼方式。
另外,語音算法的選擇除了壓縮率外, 更應該側重低延時、低復雜度和語音的傳輸質量。
2.2基于ADPCM原理的語音編碼原理
之所以要對語音進行壓縮,因為語音信號本身的A/D轉換會導致存儲容量需求的增加及傳送信道帶寬的增加。如一段44.1KHz,量化精度為16bit的立體聲語音信號,其一分鐘占約10M的存儲容量。如果直接用PCM碼對之進行編碼并存儲和傳輸則存在非常大的冗余度,可對其進行4:1或16:1的壓縮。
脈沖編碼調制(簡稱:PCM)是使用最為廣泛的調制方法。在PCM的調制過程中,將輸入的模擬信號進行取樣,量化和編碼。這種方法通過用脈沖編碼來代表取樣后的模擬信號的幅度。語音信號通過PCM編碼后得到的信號,最能夠保持其真實度,但是其需要的存儲空間及傳輸帶寬也很大,所以就有了ADPCM語音編碼技術,要了解ADPCM語音編碼下面先介紹其他幾種語音編碼原理。(1)差分PCM編碼原理。差分PCM(即DPCM)記錄的不是信號的絕對大小而是相對大小,因為信號的相對大小變化比信號本身要小,碼位用的也比較少。差分系統就是利用這種信息的冗余,不記錄信號的絕對大小,而是記錄相鄰之間差值的大小。差分編碼采用預測編碼技術,從輸入中減去預測值,然后對預測誤差進行量化,最終的編碼就是預測值與實際值之間的差值。解碼器用以前的數據對當前樣值進行預測。這種方法使用的比特數較少,但它的性能決定于預測編碼方法以及它對信號的變化的適應能力。(2)增量調制(DM)編碼原理。增量調制(DM)是一種特殊簡化的DPCM,其只用1bit量化器,因為只用一個量化級來代表樣值的變化,為了跟蹤信號的變化,必須使用高的采樣頻率。在DM中,存在兩類誤差,一種是斜率過載誤差,其產生原因是語音波形幅度發生急劇變化時,譯碼波形不能充分跟蹤這種急劇的變化而產生的失真;另一種是顆粒噪聲,因為在無聲狀態或信號幅值固定式,量化輸出都呈0,1交替序列而產生的。(3)自適應增量調制(ADM)編碼原理。一般情況下,顆粒噪聲對音質的影響比較大,所以要對增量調制的△的幅值取得足夠小,但是△取得足夠小斜率過載失真就會比較大,為了減少失真就需要提高采樣率,這樣就會影響信息壓縮的效果。所以為了解決上述問題,就出現了自適應增量調制(ADM),其原理為:在語音信號的幅值變化不太大的區間內,取小的△值來抑制顆粒噪音;在幅值變化大的地方,取大的△值來減小過載噪音。其具體實現方法為:在顆粒噪音不產生大的影響的前提下,確定最小的△幅值。在同樣的符號持續產生的情況下,將△幅值增加到原來的2倍。即當+ △、+ △這樣持續增加時,如果下一個殘差信號還是相同的符號,那么再將△幅值增加一倍,如此下去,并且確定好某一個最大的△幅值上限,只要在這個最大的△幅值以內同樣的符號持續產生,就將△幅值繼續增加下去。如果相反,殘差信號值為異號時,就將前面的幅值△設為原來的1/2,重新以△/2為幅值。
2.3 基于ADPCM原理的語音編碼原理
自適應差分脈沖編碼調制(簡稱為:ADPCM)用預測編碼來壓縮數據量。它結合了ADM 的差分信號與PCM的二進制碼的方法,是一種性能比較好的波形編碼。其根據語音信號具有短時平穩性的非平穩隨機過程及相鄰樣點間有著很強相關性的特點,采用自適應量化和自適應預測技術對語音信號進行編碼。它的一個重要特點就是可以在較低的數據率的情況下,獲得較高質量的重構語音。
其核心思想為:(1)利用自適應的思想改變量化階的大小,即使用小的量化階去編碼大的差值;(2)使用過去的樣本值去估算下一個輸入樣本的預測值, 使實際樣本值和預測值之間的差值總是最小。編碼器和譯碼器都是根據前面出現的PCM 抽樣值對下一個PCM抽樣進行預測,然后在接受端再恢復成先前的PCM信號。所以,發送端只需要向接受端發送預測值與實際值的誤差。由于正常情況下,這些誤差的幅度要比原始信號的幅度小很多,所以,對此誤差進行編碼所需代碼的位數要比對原始信號系統編碼所需要的位數少很多,從而達到壓縮的目的。 ADPCM編碼方法之所以是一種比較好的編碼,因為其雖然有著較好壓縮率,但其音質也比較好(MOS值達到4.1,最好標準為5)。另外其算法延遲較小,實現簡單,成本較低。
3 視頻編碼方案
視頻編碼技術是基于MPEG標準,MPEG標準的視頻壓縮編碼技術主要利用了具有運動補償的幀間壓縮編碼技術以減小時間冗余度,利用DCT技術以減小圖像的空間冗余度,利用熵編碼以減小信息表示方面的統計冗余度。這幾種技術的綜合運用,大大增強了壓縮性能。
MPEG標準主要有以下五個:MPEG-1, MPEG-2, MPEG-4, MPEG-7和MPEG-21等。這些編碼技術都是很成熟的技術,在我們的方案中,對具體原理部分我們就不加以敘述,我們會比較下各種編碼的優缺點,然后選擇一種編碼方案作為我們系統的編碼方案。
3.1 基于MPEG-4視頻壓縮
在本系統中,我們選擇MPEG-4編碼技術作為我們的視頻編碼方案,因為在之前的MPEG-1,MPEG-2等都是采用第一代壓縮編碼技術,著眼于圖像信號的統計特性來設計編碼器,第一代壓縮編碼方案把視頻序列按時間先后分為一系列幀,每一幀圖像又分成宏塊以進行運動補償和編碼,這種編碼方案存在以下缺陷:(1)將圖像固定地分成相同大小的塊,在高壓縮比情況下會出現嚴重塊效應,即馬賽克效應;(2)不能對圖像內容進行訪問,編輯和回放等操作;(3)未充分利用人類視覺系統特性。
MPEG-4采用了新一代視頻編碼技術,它在視頻編碼發展史上第一次把編碼對象從圖像幀拓展到具有實際意義的任意形狀視頻對象,從而實現了從基于像素的傳統編碼向基于對象和內容的現代編碼的轉變,其核心編碼技術是基于AV對象(AVO,Audio visual object)的編碼、存儲、傳輸和組合。
3.2 MPEG-4視頻壓縮關鍵技術
MPEG-4除采用第一代視頻編碼的核心技術外,還提出了一些新的有創建性的關鍵技術,并在第一代視頻編碼技術基礎上進行了卓有成效的完善和改進,其關鍵技術有:(1)視頻對象提取技術:MPEG-4實現基于內容交互的首要任務就是把視頻/圖像分割成不同對象或者把運動對象從背景中分離出來,然后針對不同對象采用相應編碼方法,以實現高效壓縮,因此視頻對象提取即視頻對象分割,是MPEG-4視頻編碼關鍵技術,也是新一代視頻編碼的研究熱點和難點。(2)VOP視頻編碼技術:VOP(視頻對象平面)是MPEG-4編碼的核心概念,其在編碼過程中,針對不同VO采用不同的編碼策略,即對前景VO的壓縮盡可能保留細節和平滑,對背景VO采用高壓縮率的策略。這種方法不但克服第一代視頻壓縮中的方塊效應,也提高了壓縮比。(3)運動估計與運動補償技術:MPEG-4采用I-VOP,P-VOP,B-VOP三種幀格式來表征不同的運動補償類型。它采用了H.263中的半像素搜索技術和重疊運動補償技術,同時又引入重復填充技術和修改塊(多邊形)匹配技術以支持任意形狀的VOP區域。
4 語音視頻實時遙測系統的實現
通過上面的敘述,我們知道原始語音信號和視頻信號的實時遙測非常占用資源,所以我們需要對其進行編碼并壓縮。在本方案中,視頻壓縮支持三路復合視頻中的一路或者一路S-端子視頻輸入信號進行采樣編碼成數字信號,然后利用MPEG-4編碼模塊進行視頻信號的壓縮。同時可以接受另外一路通過ADPCM編碼原理進行壓縮的語音信號,以實現語音視頻編碼的混合。
MPEG-4視頻信號和ADPCM語音信號同時進入到MPEG-2模塊形成一個MPEG-2傳輸流,一個MPEG-2傳輸流是某些固定長度(188字節)的數據包。將這些數據包按照數據采集單元的底板接口通信協議分解成16位字,以參數形式插入到標準的IRIG-106 PCM數據幀中并進行遙測。
地面接收站接收到遙測信號后,通過地面解調設備和軟件將語音信號和視頻信號從PCM流中實時解調還原出來供地面人員監控。其系統框圖如圖1所示。
5 結語
通過對語音視頻信號進行數字編碼,經機載測試系統的遙測發射機進行遙測發射,這樣既減小了帶寬,又能使多路視頻信號通過一條PCM流遙測下來;且語音信號的ADPCM碼可以加入到視頻信號的MPEG-2流中,進行混合編碼,這樣大大提高了效率,也節省了硬件資源。
按現有飛機的實施方案,1路語音加視頻信號進過PCM編碼后的位速率1.5Mb/s左右,而現有的機載測試系統PCM遙測發射機的遙測帶寬有10Mb/s,這樣1路遙測系統可以遙測6路視頻加語音信號,如果用傳統模擬視頻發射機就需要6路遙測系統,且飛行員語音還要單獨外通過無線電臺方式與地面交流。
該方案經過系統調試和飛行試驗,能夠實現語音和視頻信號的同步。采用該方案,使用一套PCM遙測系統可以遙測多路語音視頻,大大節約了硬件資源和成本。
參考文獻:
[1]廖廣銳,劉萍.基于ADPCM語音壓縮算法研究[J].計算機與數字工程,2007,第7期.
[2]林志鋒,黃華燦,李學等.ADPCM語音壓縮編解碼器的FPGA實現[J].數字信號處理,2009,第33卷第5期.
[3]戚曉晶,李治國.視頻實時傳輸中MPEG-4技術的應用[J].科技創新與應用,2012,2月(上).
科技類核心期刊推薦《中國科技博覽》辦刊宗旨:本刊堅持國家科技創新、教育創新方針,傳播科技理念、報道科技動態、倡導科技創新、促進科技進步;廣泛探討交流科技、教育工作成果;多方位、多層次介紹科教創新的前沿性內容。征稿對象:全國教科研工作者、廣大教師、各級科技與教育管理部門領導、科研院所、科技教育人員、科教領域管理人員、各大院校的在讀博士生、碩士生及社會各界關心科教工作的人士。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >