安保對視頻的依賴性特別大。監(jiān)控系統(tǒng)中的音頻功能應(yīng)用一直未引起重大關(guān)注。然而,將音頻集成為監(jiān)控系統(tǒng)的一部分可以帶來更加廣泛的潛在價值。具有雙向音頻功能的監(jiān)控系統(tǒng)不僅可以提高用戶檢測和說明事件的能力,而且使用戶能夠向訪客或入侵者傳遞要求或命令。
可通過兩種方式在集成解決方案中應(yīng)用音頻監(jiān)控。其中一種是使用音頻輸入作為報警或監(jiān)視觸發(fā)器。Basler公司項目經(jīng)理Bj?rnWeber說:“一旦超過一定的音頻電平,監(jiān)控攝像機將被引向聲源處”。另外一種方式是使用音頻數(shù)據(jù)作為證據(jù);在這種情況下,同步保存視頻數(shù)據(jù)和音頻數(shù)據(jù)是非常重要的。
真正的需求
賭場
在賭場中,大量的金錢成為重點保護對象,賭場老板總是希望最大程度地降低對賭博區(qū)的“干擾”。例如在英國,在賭場進行音頻記錄是合法的,而且此項功能使經(jīng)營者能夠聽到賭桌上的情況,從而在可疑的情況中可提供更多的證據(jù)。
一些內(nèi)置麥克風的網(wǎng)絡(luò)攝像機可提供基本的視頻/音頻解決方案。然而,具有更大音頻需求的用戶發(fā)現(xiàn)外部麥克風更合適。
在一些情況下,監(jiān)控攝像機的安裝位置不利于進行音頻捕獲,這時候就需要視頻和音頻監(jiān)控供應(yīng)商進行密切合作。Barix公司首席執(zhí)行官JohannesRietschel說:“賭場就是這樣一個例子,安裝攝像機以提供視頻監(jiān)控,同時在賭桌之類的位置安裝麥克風進行音頻監(jiān)控”。
執(zhí)法機構(gòu) 金融領(lǐng)域
執(zhí)法機構(gòu)、銀行和自動取款機有著采用集成視頻/音頻解決方案的強烈趨勢。Rietschel說:“北美銀行和自助取款機采用的視頻/聲音監(jiān)控應(yīng)用軟件已應(yīng)用這種集成解決方案。這里的立法機構(gòu)要求提供具體的聲音分析方法,從而接受聲波探測器作為法庭證據(jù)”。然而,在這些場所使用音頻數(shù)據(jù)作為證據(jù)時,與地方當局進行確認是非常重要的,因為他們可能要求一定的壓縮格式和視頻/音頻數(shù)據(jù)同步。可能還會需要未經(jīng)處理的音頻,例如作法庭辯論和證據(jù)之用。
“復制的信號絕不能丟失任何信息,這意味著對原始信號的盡可能最佳復制。諸如MP3格式之類的有損壓縮會改變信號,以至于所提供的證據(jù)將是無效的”。 公共交通
公共場所的視頻/音頻監(jiān)控系統(tǒng)應(yīng)用不僅可以加強安全,而且可以發(fā)揮緊急呼叫站的作用。Zenitel公司產(chǎn)品副總裁ThomasH?gh說:“監(jiān)聽技術(shù)通常采用雙向音頻通訊,而且我們看到雙向語音技術(shù)正不斷被采用。盡管大多數(shù)情況下安全系統(tǒng)的設(shè)計使警衛(wèi)能夠聽到來自攝像機終端的聲音信號,但中央控制站和火車站對閉路電視和PA/傳呼相結(jié)合的解決方案有著強烈需求。警衛(wèi)人員可以充分利用閉路電視和PA集成方案,在緊急情況下確認人群是否按照疏散指令進行疏散”。
在過去,對講機和攝像機企業(yè)的性質(zhì)和重點是分散的:對講機企業(yè)專注于音頻通信,而攝像機企業(yè)專注于視頻。這兩種類型的企業(yè)現(xiàn)在均提供集成視頻/音頻解決方案。H?gh補充說:“我們將推出一系列新型對講站,其中的很多對講站將具有視頻功能。這一功能特別適用于需要視頻監(jiān)控但提供單獨的閉路電視攝像機可能不合算的場所”。
街道監(jiān)控
集成視頻/音頻監(jiān)控系統(tǒng)的部署同時還用于監(jiān)測城市活動。例如,警察和執(zhí)法機構(gòu)非常熱衷于使用音頻分析和視頻監(jiān)控來提供有關(guān)槍聲和爆炸的實時信息。通過這種方式,將能夠更加有效應(yīng)對槍支暴力并展示更完整的犯罪畫面。
廣域聲響傳感器與一種音頻分析軟件進行匹配,這種軟件能夠識別獨特的槍聲、響亮的爆炸聲、尖叫聲、玻璃破碎聲、汽車報警聲和涂鴉聲音信號,SoundIntelligence公司首席執(zhí)行官DerekvanderVorst說。“我們的技術(shù)采用了一種動態(tài)的前景/背景分離算法,在白天時間內(nèi)自動適應(yīng)背景噪音水平。此外,我們還具有針對不同室內(nèi)和室外聲環(huán)境的大量聲學模板”。
一些音頻分析解決方案供應(yīng)商急切地與攝像機制造商或VMS供應(yīng)商進行合作,以制造集成視頻/音頻系統(tǒng)。這些是對系統(tǒng)檢測和說明事件及緊急情況功能的一個有益補充,例如檢測攝像機范圍之外的區(qū)域或者檢測任何照明條件下的事件。AudioAnalytic公司首席執(zhí)行官ChristopherMitchel說:“我們的核心功能設(shè)計是輕便,以便它們可以在設(shè)備(如現(xiàn)代IP攝像機)的網(wǎng)絡(luò)邊緣運行。通過合并視頻/音頻功能,在一系列應(yīng)用中是有益的,如入侵檢測、攻擊檢測、汽車報警檢測或密碼檢測”。
衛(wèi)生保健和懲教設(shè)施
集成視頻/音頻解決方案在精神衛(wèi)生機構(gòu)中的應(yīng)用日益增加,因為精神衛(wèi)生保健中的臨床實踐確實認識到了在患者干預的控制和護理之間保持平衡的難度。
具有嚴重心理健康問題的患者可能更具暴力傾向。當他們犯病需要住院治療時,大多數(shù)情況是他們的決策和獨立生活能力將喪失。Vorst說:“工作人員總是面臨這樣的困境:兼顧病人和秩序的混亂狀態(tài)。通過聲監(jiān)控,可對病人的健康狀況進行監(jiān)控。通過音頻分析,工作人員可以判斷病人是否病情發(fā)作或發(fā)生窒息,或者他們只是假裝”。
這種部署使工作人員能夠安全進行例行觀察,因為工作人員不必再進入病房進行觀察。雖然目前采用閉路電視攝像機對暴力事件進行控制,但另一方面,集成視頻/音頻解決方案也可用來對心理健康問題獲取更好的臨床認知。
除了精神病醫(yī)院,處理攻擊和暴力事件也是監(jiān)獄工作的一部分。攻擊檢測是一種有效的音頻功能,使監(jiān)獄管理人員能夠積極關(guān)注攻擊和暴力事件,防止情況惡化,Vorst說。“90%的身體攻擊事件都是由言語攻擊引起的。我們的解決方案可以記錄人類攻擊行為的典型聲音特征,憤怒或者恐懼。在言語攻擊演變?yōu)楸┝κ录坝兴煊X,可為保安人員提供寶貴的時間并能夠及時介入”。
視頻和音頻同步
許多網(wǎng)絡(luò)攝像機提供音頻支持,無論是內(nèi)置麥克風和/或麥克風/線路輸入插孔。音頻信號通過網(wǎng)絡(luò)進行傳輸,視頻數(shù)據(jù)的傳輸亦是如此。在數(shù)字系統(tǒng)中,音頻和視頻數(shù)據(jù)以單獨的數(shù)據(jù)包進行發(fā)送。為了實現(xiàn)完美同步,音頻和視頻數(shù)據(jù)包必須進行時間標記。視頻/音頻同步發(fā)生在位級。IndigoVision公司產(chǎn)品營銷經(jīng)理KarenMcCarrison說:“通過使用內(nèi)部開發(fā)的硬件編碼,我們嚴格控制視頻和音頻壓縮。編碼與解碼控制可協(xié)助同步,正如按照公認的標準(如RTP)進行傳遞,而不是‘推倒重來’”。
Fermax公司品牌經(jīng)理ElenaRavello認同公認標準的重要性。“音頻和視頻同步的一個關(guān)鍵因素是采用實時協(xié)議(RTP),以確保同時收到音頻和視頻信號。用戶數(shù)據(jù)報協(xié)議(UDP)也有利于降低傳輸過程中同步插入數(shù)據(jù)的重量”。
McCarrison說:“為了確保視頻編碼不受到任何其它處理能力要求的影響,我們的每臺發(fā)送器/攝像機均包括兩個處理器:用于視頻編碼的FPGA處理器和用于連網(wǎng)要求及板載分析的處理器”。
由于芯片是監(jiān)控攝像機的關(guān)鍵組成部件,因此壓縮效率是我們的評定標準之一,Vivotek公司品牌業(yè)務(wù)總監(jiān)WilliamKu說。“我們的芯片檢驗流程相當長,因為這些系統(tǒng)級芯片對于壓縮來說至關(guān)重要。我們必須測試和檢驗其效率、信號流大小和延遲。來自芯片廠商的技術(shù)支持也是至關(guān)重要的,因為我們必須交叉檢驗邏輯正確性和錯誤。這些測試需要幾個月的時間”。 超出所有部件的功能之和
麥克風
音響質(zhì)量在很大程度上取決于各組成部件。麥克風性能并不能決定一切,但它關(guān)系到耐用性和干擾性。與駐極體麥克風相比,“MEMS麥克風對于溫度變化、振動和電磁兼容性(EMC)具有較高的耐受度和穩(wěn)定性”,H?gh說。“如今,許多對講機制造商采用駐極體麥克風。這些麥克風向HW編碼譯碼器提供一種模擬音頻信號,HW編碼譯碼器執(zhí)行模擬到數(shù)字轉(zhuǎn)換。另一方面,數(shù)字MEMS麥克風為用戶提供直接采樣為96kHz的數(shù)字音頻,達到雙倍的CD質(zhì)量”。
MEMS麥克風的另一個優(yōu)點是其微小的尺寸。H?gh補充說:“MEMS麥克風膜直徑僅為0.1毫米。這一減小的尺寸降低了跨越麥克風膜的振動,有效降低了音頻失真,從而提供顯著改善的音頻質(zhì)量”。
電路板設(shè)計
所有電氣系統(tǒng)都會制造一些噪音。如果未對系統(tǒng)性能造成干擾,這些噪音是沒有問題的。設(shè)計配置時較少考慮電磁干擾問題的工程師們發(fā)現(xiàn),他們的設(shè)計并不符合規(guī)范要求或者根本不能正常運行。相比芯片組的選擇,相機電路板的智能設(shè)計在消除干擾方面更為重要,Weber表示。“智能設(shè)計意味著組件的合理布置以及正確組件的合理選擇。如果放置在不適當?shù)奈恢茫@些組件可導致電磁兼容性問題,從而在另一端產(chǎn)生噼里啪啦的噪音”。
編碼譯碼器
同視頻編碼譯碼器一樣,音頻編碼譯碼器也發(fā)揮著重要作用,因為它們決定著壓縮級別和音質(zhì)。Ravello表示,通過采用適當?shù)囊纛l和視頻編碼譯碼器以及動態(tài)壓縮(可根據(jù)可用帶寬進行調(diào)整),可進行帶寬優(yōu)化。
然而,相比視頻帶寬,音頻帶寬非常低而且?guī)拵缀鯓?gòu)不成問題,Weber補充說。
就集成視頻/音頻解決方案而言,“對于通訊系統(tǒng)來說,最重要的方面是使用開放協(xié)議,以確保與其它系統(tǒng)的互操作性”。這就是為什么我們“致力于支持SIP以及其它開放IP協(xié)議”的原因,H?gh表示。
使用許多系統(tǒng)均支持的VoIP編碼譯碼器非常重要,以便在發(fā)生延遲和失真時減少轉(zhuǎn)碼的需要。“如果在兩個系統(tǒng)之間發(fā)送了一個語音包,則必須確保在兩個系統(tǒng)中使用同一語音編碼譯碼器。如果需要在G.722至G.711之間進行重新編碼,這通常會導致大約20-40毫秒的延遲”,H?gh補充說。“所有VoIP系統(tǒng)均支持G.711。但是,G.711為一種窄帶編碼譯碼器(3.4kHz),提供的質(zhì)量顯著低于G.722。如今,G.722已成為所有高清語音系統(tǒng)均支持的一種編碼譯碼器。通過利用這種開放的高清編碼譯碼器,系統(tǒng)將提供完整的、終端到終端的語音頻譜,無任何重新編碼需要或失真。另一種編碼譯碼器是AAC,而且我們看到這樣一種趨勢:AAC可能會變得日益流行”。
認識到以下這一點很重要:并非所有的視頻編碼譯碼器均支持時間標記的視頻/音頻同步,安訊士(AxisCommunications)網(wǎng)絡(luò)通訊公司高級顧問PhilipSiow表示。“在很多情況下,同步音頻并不太重要,甚至是不需要;例如,如果只需對音頻進行監(jiān)測,而不是記錄時。在網(wǎng)絡(luò)攝像機中,并不總是支持MotionJPEG壓縮視頻包的時間標記。如果是這種情況,而且需要同步視頻和音頻時,應(yīng)該選擇的視頻格式為MPEG-4或H.264”。