1 軟交換測試概述
軟交換作為NGN/VoIP網絡中的核心設備,具有接口豐富、協議復雜、性能要求高等特點,因此也成為設備制造商和運營商進行實驗室測試或網絡驗收測試的關注焦點。軟交換一般處于網絡的中心位置,與PSTN互通需要SIGTRAN接口,與中繼媒體網關互通需要H.248控制接口,與IP終端互通需要sip/H.323/mgcp/H.248接口,與其他軟交換互通需要sip/sip-I/sip-T/BICC接口。這其中的任何一個接口出現問題,都將成為制約系統性能的瓶頸,嚴重的時候甚至造成NGN/VoIP網絡癱瘓。因此,軟交換性能的高低,成為運營商考察NGN系統好壞與否的關鍵指標。
基于上述原因,如何在一個復雜的網絡環境中,有效地驗證軟交換設備的各個接口功能的性能及穩定性,成為NGN/VoIP測試領域一個重要的研究課題。思博倫通信長期關注于通信領域的測試技術,憑借強大的研發團隊和多年的現網測試經驗,為客戶提供完善的軟交換系統測試方案,成為運營商和設備商NGN領域測試的必然選擇。
2 軟交換常見測試方法
軟交換作為一個復雜的核心控制設備,可供選擇的測試方法也多種多樣。常見的測試方法按不同分類方式,有以下幾種:
●按組網方式分:單節點全包圍測試、多個網元互通測試、端到端系統測試
●按測試的功能分:C4匯接局功能測試,C5本地端局功能測試
●按測試指標分:峰值壓力測試,最大同時會話能力測試,穩定性測試,長時間通話測試,過載保護測試,CDR準確性測試。
下面我們對這些不同的測試方法進行詳細介紹。
2.1 單節點全包圍測試
單節點全包圍測試一般用于驗證單個設備是否存在性能瓶頸。通過測試儀表仿真該節點周圍的所有接口,模擬出該設備周圍的所有網絡環境,從而杜絕其他設備對測試環境造成的影響,精確驗證被測設備的性能。
圖1所示是一個對軟交換做全包圍測試的例子。儀表通過Sigtran(M2UA或者M3UA)協議仿真信令網關,通過H.248協議仿真中繼網關,通過sip/H3.23/H.248/MGCP等協議仿真IP Phone,然后模擬從PSTN往IP網絡側的大量語音呼叫,實現對中間軟交換設備的性能測試。
2.2 多個網元互通測試
這種測試一般用于在一定的、可控的環境內,對由多個節點組成的有限系統做性能測試,用于發現各個網元之間的互通問題,確定在互操作過程中是否有新的性能問題引入。
例如,運營商在部署VoIP網絡時,有可能會采用A廠家的軟交換和B廠家的接入網關設備,如何確認這兩家的設備在一起互通時沒有性能上的問題?這時可以采用儀表仿真接入網關下面的模擬線終端,往網關和軟交換側發起呼叫,再由軟交換將呼叫路由回網關再到終端。通過這種方式,由儀表發起成千上萬的呼叫經過接入網關和軟交換,可以有效地驗證這兩種設備在互通的時候有沒有性能和穩定性問題。
2.3 端到端系統測試
端到端系統測試一般用于對一個完整的系統進行功能及性能驗證,或針對運營網絡的分布式測試。如圖2所示,一般將儀表部署于系統或網絡中的不同分支節點,仿真系統中涉及的各種不同終端,然后不同終端之間發起大量的呼叫進行測試。通過這種方式,不僅可以驗證系統性能,甚至可以對網絡端到端的時延、網絡傳輸質量進行測試。
2.4 C4匯接局功能測試
軟交換作為NGN網絡中的控制設備,既有匯接局的功能,也有做本地端局的功能。當軟交換作為匯接局使用時,一般是用于匯接PSTN或者長途過來的語音話務,或者用于匯接其他局過來的話務,因此測試匯接局功能時,有以下幾種組網方式:
●通過儀表的E1/STM-1接口仿真PSTN端局,通過傳統的No.7信令發起從PSTN往VoIP側的語音呼叫(見圖3)。
●通過儀表的IP接口仿真信令網關+中繼媒體網關,通過Sigtran協議發起從PSTN往VoIP網絡的語音呼叫(見圖4)。
●通過儀表仿真另外一個軟交換實現的匯接局,通過sip-T/BICC協議發起從一個匯接局到另外一個匯接局的語音呼叫。
這3種方案中,第1種方案在測試軟交換的同時,可以驗證SG和TG的性能。而第2和第3種方案,因為直接通過IP接口仿真流量,可以實現非常高的性能,另外可以省去大量的E1或者STM-1線路連接的麻煩。
2.5 C5本地端局功能測試
當軟交換作為NGN網絡中的本地端局使用時,一般用于控制終端用戶的話務接續,并提供各種補充業務。因此,測試端局功能時,需要儀表通過模擬接入網關下的用戶或者IP終端用戶,實現本地話務的仿真。圖5所示,在實際測試時,可以根據情況,配置基于SIP,H.323,Megaco或者MGCP各種協議的終端設備,實現同種協議終端之間或者不同協議之間大話務量的呼叫測試。
2.6 峰值壓力測試
峰值壓力測試一般用于驗證被測設備在系統最高負荷的時候每秒能夠處理呼叫的能力,往往通過BHCA或CPS兩種指標來考察被測設備,即系統每小時或每秒處理呼叫的個數。實際測試時,一般通過儀表每秒鐘產生一定的呼叫量來精確驗證系統能力,通過更改呼叫保持時間和呼叫間隔時間來調整壓力,測試時間一般超過1h,甚至達到24h或48h;呼損不能超過萬分之一。
2.7 最大同時會話能力測試
最大同時會話能力測試一般用于測試被測設備在某一個特定時間能夠同時保持的會話數目。相對于BHCA和CPS,最大會話保持數也是一項重要的指標。這種測試一般通過儀表仿真一定數目的呼叫,然后將呼叫保持時間設置的足夠長,觀察在一定的時間段內,這些同時保持的話務有沒有掉話、異常中斷等各種情況。體現在呼損數值上,不能超過萬分之一。
2.8 穩定性測試
穩定性測試一般用于驗證系統長時間穩定運行,無故障處理話務的能力。一般通過儀表仿真占系統一定負荷的話務量(如系統最大能處理CPS的80%),然后將每個呼叫的保持時間設置為現網平均呼叫保持時間(如2~3min),要求系統穩定運行至少24h,有時甚至超過48h以上,呼損率不能超過萬分之一。
2.9 長時間通話測試
長時間通話測試一般用于驗證系統處理超長時間通話的能力。這類測試一般不要求很高的性能,往往使用儀表仿真幾十路的語音呼叫,將每一路的呼叫保持時間設置為至少24h以上,觀察測試過程中有無掉話、異常中斷、語音異常等現象。另外,還會觀察軟交換對于這種超長話單產生的精確程度、有無話單丟失、時長計費是否準確等現象。
2.10 過載保護測試
軟交換一般都具有過載保護功能,當話務量超過最大負荷或者系統CPU負荷已經到達100%時,主動拒絕后續的呼叫,避免過量的呼叫占用系統資源造成系統癱瘓。過載保護測試用于驗證軟交換系統遇到突發話務流量超過系統最大負荷時,有效控制話務,避免系統癱瘓的能力。這類測試一般通過儀表逐級、逐量地仿真系統話務負荷,例如分別仿真占系統80%,100%,120%的話務量,要求系統在80%,100%負荷的時候呼損率不應超過萬分之一,在120%話務量的時候,可以允許有大量的呼損,但是每秒鐘成功接續的呼叫數應該維持在系統可以處理的最大CPS左右,另外不能有系統癱瘓、板卡重啟、消息沒有響應等現象發生。
2.11 CDR準確性測試
CDR準確性測試用于驗證軟交換系統在處理大量呼叫的同時,生成的話單的準確性。一般通過儀表仿真大量的呼叫,維持一段時間(例如幾個小時以上)。然后在測試結束后,對比儀表統計給出的話單總數和軟交換系統給出的話單總數,檢查軟交換有無掉話單的現象。一般要求話單差錯率不能超過萬分之一。
3 關鍵參數統計及性能測試結果分析
軟交換設備因為其接口多、協議豐富、性能高等原因,成為NGN測試領域中最為復雜的一個被測設備,因此測試涉及的統計指標也多種多樣。如何從復雜的測試數據中,過濾觀察關鍵的測試參數、有效地分析性能測試結果的好壞、檢查出系統存在的性能瓶頸等,將是本節中我們將要探討的內容。
(1)BHCA/CPS/呼損率等關鍵指標的統計與分析
在軟交換性能測試中,BHCA/CPS與呼損率是兩個很重要的相互關聯的指標。我們進行大量的測試就是為了找出在沒有呼損或者呼損率小于規定值(如萬分之一)的時候系統最大能支持的BHCA/CPS。一般使用2分法去精確查找出系統的無故障平衡點。這時候如果加上軟交換系統的CPU和內存占有率的觀察,則可以幫助測試人員更加方便地判斷系統負荷是否已經到了瓶頸。一般隨著儀表產生的BHCA/CPS的逐漸增高,系統在接近性能瓶頸的時候,往往伴隨著CPU占有率或者內存占有率的突然陡增,并接近最大值;如果這個時候呼損大量增加,則可以很確定地判斷是由于系統負荷到了瓶頸造成大量呼損而并不是由于網絡等其他原因。
(2)信令時延統計對于性能測試的重要性
信令時延是考察軟交換系統對于信令消息處理快慢程度的一項指標,在查找系統無故障平衡點的時候,該指標的統計也是非常重要的一項考察內容。對于VoIP信令來講,信令時延主要包括Response Time,Post Dial Delay,Call Setup Time,Tear Down Time幾項具體的指標。
●Response Time
從終端發起呼叫建立請求消息到收到臨時響應消息之間的時間間隔。以Sip為例,一般是指Invite消息和100 Trying消息之間的時延。
●Post Dial Delay
從終端發起呼叫建立請求消息到收到振鈴響應消息之間的間隔。如果是Sip信令,一般是指Invite消息和180 ringing消息之間的時延;如果是模擬線信令,一般是從摘機撥完號碼到收到回鈴音之間的時延。
●Call Setup Time
從終端發起呼叫建立請求消息到收到呼叫建立確認消息之間的間隔。Sip信令中一般是指Invite消息和200 OK消息之間的時延。
●Tear Down Time
從終端發起會話釋放請求消息到收到對端拆線確認消息之間的間隔。Sip信令中一般是指Bye消息和200 OK消息之間的時延。
信令時延統計是用于判斷和分析軟交換性能的一個重要輔助手段。因為這些時延的統計指標往往代表著用戶實際通話過程中的切身感受。例如,Post Dial Delay代表著用戶撥完號碼之后需要等多久聽到回鈴音,如果這些指標超過標準值,則意味著軟交換的服務質量已經下降,此時就算系統能夠正常建立呼叫,呼損率為零,但是其實當前負荷下的軟交換性能已經不能滿足實際運營的要求。
運營商和標準組織往往對于信令時延都有著相應的規范要求,比如中國規范要求輕載情況下Post Dial Delay要小于1s,重載情況下要小于2s。因此,在確定軟交換系統無故障平衡點的同時,觀察信令時延統計非常重要。
圖6是一個軟交換性能測試過程中CPS和PDD指標的統計示意圖。我們可以看到,一開始在CPS比較小的時候,Post Dial Delay指標比較穩定。當CPS數值爬升到一定階段時,Post Dial Delay開始明顯上升。當CPS=200達到峰值時,PDD=3S。我們在測試的時候如果不綜合考察各項指標,往往會簡單認為該系統的最大CPS指標為200。然而實際情況是,200 CPS時候的PDD指標已經達不到運營要求,因此實際、合理的系統最大CPS應該為PDD<2s時候的CPS值,即180 CPS左右。
從這個例子我們也可以看到,綜合考察各項重要指標對于性能測試分析的重要性。
(3)故障定位分析
當軟交換測試碰到故障(如大量異常呼損、消息沒有響應等問題)時,我們需要有效的手段來定位分析原因,究竟是軟交換設備工作異常,還是承載網絡不穩定造成消息丟失?這種情況下,我們可以采取幾種輔助定位的手段來做進一步的分析。
●通過修改呼叫模型來分析故障原因
以上一節提到的CPS VS PDD的例子為例,當系統負荷增加,Post Dial Delay大幅增長的時候,我們可以適當降低話務量(例如減到原來的一半), 再觀察Post Dial Delay的統計值是否隨之大幅降低。如果有明顯降低,說明消息響應緩慢確實是跟軟交換設備的話務負荷有關系;如果該值沒有明顯降低,說明消息響應緩慢可能是跟網絡有關系,例如網絡傳輸時延過大造成消息響應緩慢。
●通過儀表提供的網絡層參數的統計來觀察網絡情況的好壞
在仿真呼叫發送信令及語音的同時,Abacus可以測試并統計如下參數:丟包、時延、抖動、亂序,并且可以輸出統計值對應不同時間段的圖表。當測試碰到問題時,可以通過上述這些參數的統計,判斷網絡是否出現問題。例如,圖7所示的One Way Delay的統計圖可以看到,儀表統計到14:10和14:30的時候,分別出現One Way Delay大幅增長的情況,如果這時出現系統呼損的情況,我們就有理由相信系統的呼損很大可能是由于網絡原因造成。還可以結合丟包、抖動、亂序等其他因素,綜合判斷是否問題是由于承載網性能不好引起的。
●利用儀表的抓包監控功能分析信令流程判斷故障原因
Abacus儀表在仿真呼叫的同時,可以將有問題的呼叫過程中的信令全部記錄下來。另外,思博倫公司還提供一款名為Clearsight的監控儀表,可以將流經IP網絡的所有VoIP呼叫全部監控并記錄下來。這樣,結合Abacus,Clearsight以及軟交換本身提供的信令日志功能,可以很方便地檢查并對比儀表輸出的消息日志和網絡上捕捉到的消息日志以及軟交換的消息日志,從而發現究竟錯誤消息或者消息丟失等故障是產生于哪一個節點。