所謂的VoIP是以IP分組交換網絡為傳輸平臺,對模擬的語音信號進行壓縮、打包等一系列的特殊處理,使之可以采用無連接的UDP協議進行傳輸。
通過因特網進行語音通信是一個非常復雜的系統工程,其應用面很廣,因此涉及的技術也特別多,其中最根本的技術是VoIP (Voice over IP)技術,可以說,因特網語音通信是VoIP技術的一個最典型的、也是最有前景的應用領域。本文主要介紹VOIP的基本傳輸過程。
傳統的電話網是以電路交換方式傳輸語音,所要求的傳輸寬帶為64kbit/s。而所謂的VoIP是以IP分組交換網絡為傳輸平臺,對模擬的語音信號進行壓縮、打包等一系列的特殊處理,使之可以采用無連接的UDP協議進行傳輸。
為了在一個IP網絡上傳輸語音信號,要求幾個元素和功能。最簡單形式的網絡由兩個或多個具有VoIP功能的設備組成,這一設備通過一個IP網絡連接。VoIP模型的基本結構圖如圖1所示。可以發現VoIP設備是如何把語音信號轉換為IP數據流,并把這些數據流轉發到IP目的地,IP目的地又把它們轉換回到語音信號。
兩者之音的網絡必須支持IP傳輸,且可以是IP路由器和網絡鏈路的任意組合。因此可以簡單地將VoIP的傳輸過程分為下列幾個階段。
1、 語音-數據轉換
語音信號是模擬波形,通過IP方式來傳輸語音,不管是實時應用業務還是非實時應用業務,道貌岸首先要對語音信號進行模擬數據轉換,也就是對模擬語音信號進行8位或6位的量化,然后送入到緩沖存儲區中,緩沖器的大小可以根據延遲和編碼的要求選擇。許多低比特率的編碼器是采取以幀為單位進行編碼。
典型幀長為10~30ms。考慮傳輸過程中的代價,語間包通常由60、120或240ms的語音數據組成。數字化可以使用各種語音編碼方案來實現,目前采用的語音編碼標準主要有ITU-T G.711。源和目的地的語音編碼器必須實現相同的算法,這樣目的地的語音設備幫可以還原模擬語音信號。
2、 原數據到IP轉換
一旦語音信號進行數字編碼,下一步就是對語音包以特定的幀長進行壓縮編碼。大部份的編碼器都有特定的幀長,若一個編碼器使用15ms的幀,則把從第一來的60ms的包分成4幀,并按順序進行編碼。每個幀合120個語音樣點(抽樣率為8kHz)。編碼后,將4個壓縮的幀合成一個壓縮的語音包送入網絡處理器。
網絡處理器為語音添加包頭、時標和其它信息后通過網絡傳送到另一端點。語音網絡簡單地建立通信端點之間的物理連接(一條線路),并在端點之間傳輸編碼的信號。IP網絡不像電路交換網絡,它不形成連接,它要求把數據放在可變長的數據報或分組中,然后給每個數據報附帶尋址和控制信息,并通過網絡發送,一站一站地轉發到目的地。
3、 傳送
在這個通道中,全部網絡被看成一個從輸入端接收語音包,然后在一定時間(t)內將其傳送到網絡輸出端。t可以在某全范圍內變化,反映了網絡傳輸中的抖動。網絡中的同間節點檢查每個IP數據附帶的尋址信息,并使用這個信息把該數據報轉發到目的地路徑上的下一站。網絡鏈路可以是支持IP數據流的任何拓結構或訪問方法。
4、 IP包-數據的轉換
目的地VoIP設備接收這個IP數據并開始處理。網絡級提供一個可變長度的緩沖器,用來調節網絡產生的抖動。該緩沖器可容納許多語音包,用戶可以選擇緩沖器的大小。小的緩沖器產生延遲較小,但不能調節大的抖動。其次,解碼器將經編碼的語音包解壓縮后產生新的語音包,這個模塊也可以按幀進行操作,完全和解碼器的長度相同。
若幀長度為15ms,,是60ms的語音包被分成4幀,然后它們被解碼還原成60ms的語音數據流送入解碼緩沖器。在數據報的處理過程中,去掉尋址和控制信息,保留原始的原數據,然后把這個原數據提供給解碼器。
5、 數字語音轉換為模擬語音
播放驅動器將緩沖器中的語音樣點(480個)取出送入聲卡,通過揚聲器按預定的頻率(例如8kHz)播出。 簡而言之,語音信號在IP網絡上的傳送要經過從模擬信號到數字信號的轉換、數字語音封裝成IP分組、IP分組通過網絡的傳送、IP分組的解包和數字語音還原到模擬信號等過程。