網絡上的數據量正在以指數級的速度增長,很快將達到現有網絡基礎設施所能承載的極限。如何才能以可持續的方式,保證網絡在海量數據重壓下不至于崩潰?貝爾實驗室基礎研究院的負責人指出,我們必須對網絡處理信息的方式進行根本性變革。
采訪:拉里 格林邁耶(Larry Greenemeier)
到今年年底,智能手機、平板電腦以及其他各種聯網數碼設備的總數,將超過地球人口總數。但或許更值得注意的是,隨著速度更快、功能更強大的移動設備不斷涌入市場,它們所產生和消費的內容將達到史無前例的水平。網絡產品制造商思科公司(Cisco)不久前的一項報告稱,2012年,全球移動數據增長了70%。然而,全世界網絡基礎設施的承載能力終究是有限的,因此許多人想知道,我們何時會碰到網絡能力的極限;而一旦發生這種情況,我們又該怎么辦。
當然,有許多辦法可以增強網絡基礎設施的承載能力,比如鋪設更多光纜,在光纜中塞進更多用于數據傳輸的光纖,以及利用較小的衛星網絡分擔部分數據傳輸,但這些方法都是治標不治本,只不過推遲了到達那個無法避免的極限的時間。根本的解決方案,在于提高整個網絡基礎設施的智能水平。兩大方面的改進必不可少:一方面,電腦及其他設備在將數據傳上網絡之前,應該對內容進行預處理,并盡可能地過濾或整合內容;另一方面,網絡應該對如何處理這些內容有更好的理解,而不是呆板麻木地將其視為一串無窮無盡、千篇一律的比特流和字節流。
為了了解如何取得這些重大進展,《科學美國人》采訪了貝爾實驗室基礎研究院(Bell Labs Research,位于美國新澤西州默里山市)的負責人馬庫斯 霍夫曼(Markus Hofmann)。這個研究院是阿爾卡特–朗訊公司的研發機構,它和它的前身在科技史上立下了諸多功勞,包括發明晶體管、激光器、電荷耦合器件,以及上個世紀一連串開創性的技術。1998年,霍夫曼于離開德國卡爾斯魯厄大學,加入了貝爾實驗室。他的團隊認為“信息網絡化”(information networking)是未來的發展方向,這種技術有望通過提高互聯網的智能,增強其信息傳輸能力。
《科學美國人》:我們怎么知道通信網絡的傳輸能力已接近極限?
霍夫曼:這方面的跡象的確不易察覺,但無疑是存在的。以我個人的親身經歷為例,當我通過Skype,向遠在德國的父母發送孩子們玩曲棍球的實時視頻時,畫面有時會在播放到最精彩的瞬間時出現卡頓。雖然總的說來,這種現象不是經常發生,但它最近出現得更頻繁了。這表明,在用戶要求必須傳送大量數據的重壓之下,網絡開始有點力不從心了。
我們知道,大自然給我們設定了某些限制——在一定的通信信道上所能傳輸的信息量是有限的。這一現象稱為“非線性香農極限”(nonlinear Shannon limit),是以貝爾電話實驗室的數學家克勞德 香農(Claude Shannon)的名字命名的。這一極限告訴我們,運用現今的技術我們可以走多遠。
我們已經非常接近這一極限,大約達到極限值的50%以上。換言之,如果我們讓現今的網絡通信量翻一番——這種情況可能在今后四五年內出現,就會超過香農極限。
這就是說,我們面臨著一個根本性的障礙。超越這一極限是不可能的,就像我們絕不可能超越光速一樣。因此,我們必須在這些限制條件之內開展工作,并尋找各種解決辦法,應對網絡通信量持續的增長。
《科學美國人》:如何讓互聯網避免碰到“這個極限”?
霍夫曼:最簡單的辦法就是鋪設更多的光纖以增加帶寬。例如,現在只有一條橫跨大西洋的光纜,將來,我們可以鋪設兩條、五條乃至十條。這是一種只靠蠻力解決問題的辦法,當然也是最燒錢的辦法——你得挖開地面,鋪設光纖,還要成倍地增設光放大器、發射器、接收器等。
為了使這一方案經濟可行,我們不僅需要將多個頻道整合到一根光纖內,還必須借助光子集成(photonic integration)等新技術,把多個發射器和接收器“堆疊起來”。這種方案稱為“空分復用”(spatial division multiplexing)。
然而,只是強化現有的網絡基礎設施,并不足以滿足日益增長的通信需求。我們所需要的網絡基礎設施,不應該一直把原始數據只是當作比特或字節,而應該把它們視為與電腦或智能手機用戶緊密相關的信息片段。試想一下,在某一天,你是想知道溫度、風速和氣壓,還是只想知道該如何穿著?這就需要“信息網絡化”。
《科學美國人》:“信息網絡化”與當前的互聯網有何不同?
霍夫曼:許多人把互聯網稱作“傻”網,不過我并不喜歡這種叫法。互聯網最初的崛起,得益于文件與數據非實時共享的推動。當時,對互聯網這個系統最大的要求是“彈性”(resiliency)——即使其中一個或多個節點(電腦、服務器等)停止工作,整個系統也必須能繼續運行。此外,從最初的設計上,互聯網就是僅僅把數據視為數字流,而不會對這些數據的意義進行解讀。
如今,我們使用互聯網的許多方式都對實時性有一定要求,無論是觀看流式視頻,還是打電話。與此同時,我們產生的數據量也比以前大很多。網絡必須對它所傳送的信息有更多的了解,以便更好地安排信息傳送的優先級,并提高運行效率。舉例來說,如果我正在自己的辦公室開視頻會議,突然有人走了進來,于是我轉過頭與他交談,而不再盯著屏幕,那么此時視頻會議的設置就應該意識到我的注意力已經轉移到別的事情上了,因此,它應該停止傳送視頻,直到我的注意力重新返回屏幕。
《科學美國人》:如何打造一個可以更好地理解它所傳送的信息的網絡?
霍夫曼:有多種方法。如果你想對網絡上傳輸的數據(例如將用戶訪問網頁的請求發送到最近的服務器)有更多了解,那么你可以利用軟件來探查相應地數據包,這種技術叫做“深度數據包檢測”(deep-packet inspection)。設想一下,你要寄出一封實體信件,你把信件裝進信封里,寫上地址,然后通過郵局寄出去。郵局并不關心信件里寫的是什么,它只會對信封上寫的地址感興趣。其實,現今的互聯網處理數據時也是類似的。但是利用深度數據包檢測技術,軟件就會讓網絡打開封裝數據的“信封”,至少會查看其中的部分內容。不過,通過這種方法,你只能獲得非常有限的一小部分關于這些數據的信息,而且需要耗用大量數據處理能力。此外,如果數據包內的信息是加密過的,那深度數據包檢測也無法解讀其中的內容。
一個更好的方案是對數據作標記,并向網絡發出指令,告訴它應該如何處理不同類型的數據。比如可以規定視頻流比電子郵件的優先級更高,但你不必詳細說明視頻流或電子郵件中究竟是什么內容。這樣,網絡就可以只根據這些數據標記,對如何安排數據傳送做出決策。
《科學美國人》:互聯網上傳送的數據已經有許多標識性的標記了,為什么不能用這些標記呢?
霍夫曼:這完全取決于在什么層次上使用這些標記。例如,使用互聯網協議(Internet protocol,縮寫即是IP)的數據包,都有一個包含源地址和目標地址的報頭。這些地址就可以看作是“標記”,但是,它們所提供的信息極為有限。它們沒有指出用戶請求訪問的是哪個網站,也沒有說明數據包是不是某個實時視頻流的一部分,或者能否對它們進行批處理。我所說的標記,是指意義更豐富、更高層次的標記,或者說元數據(meta-data),它們所包含的部分信息可以拆解為那些低層次的標記。
《科學美國人》:根據數據流所包含的信息來安排傳送數據流的優先級,是否會導致網絡偏愛某些類型的數據流,而歧視其他類型的數據流呢?
霍夫曼:其實這和我們在現實中——比如公路與街道上——已經見到的情形沒有什么不同。當我們聽到急救車拉著警笛飛馳而來時,我們都會自覺地靠向路邊行駛,以便騰出路來讓急救車盡可能順利地迅速通過,這或許能救人一命。在這一場景中,“警笛”就是標記——只要我們意識到出現了緊急狀況,我們就無須知道救護車拉的是誰,也不用了解他出了什么事,按規矩行事即可。在緊急情況下,我們是否也應該讓某些網絡數據包享有優先通行權呢?其實,這就是一個透明度和公認行為準則的問題,在道路上是如此,在網絡上亦是如此。
《科學美國人》:即使互聯網變得更聰明,能夠更智能地傳送數據,內容以指數級速度迅猛增長的情形也不會緩解。如何壓縮網絡需要處理的數據量?
霍夫曼:我們的智能手機、電腦及其他裝備都在不斷產生大量原始數據,這些數據隨后被傳送到數據中心,以便進行處理并存儲起來。將全球產生的所有數據都發送到一個集中式處理中心進行處理的做法,在將來是不可能持續下去的。我們或許會轉變成另一種模式,對數據作出某些判定之后,再將它們傳送到網絡上。例如,如果你在機場安裝了一個監控攝像頭,你就要對這個攝像頭或者控制著多個攝像頭的一臺小型電腦服務器進行設置,使其根據存儲在攝像頭或服務器中的數據庫執行本地面部識別任務,然后再把經過處理的信息發布到網絡上。
《科學美國人》:信息網絡化如何處理隱私問題?
霍夫曼:就目前來說,隱私問題基本只能“二選一”——要么你嚴密保護自己的隱私,要么就不得不幾乎完全放棄隱私,以便獲取某些個性化服務,例如音樂推薦或網上優惠券。但是,還應該有介于這兩者之間的選擇,讓用戶能夠自己掌控自己的信息。
最大的問題是,必須讓用戶覺得操作起來夠簡單。看看現在社交網絡上管控自己的隱私有多么復雜。到頭來,你會發現自己的照片混在一堆你甚至完全不認識的人的照片中。網絡應該提供一種相當于旋鈕的數字功能,讓用戶可以在隱私與個性化服務之間選擇一個適當的平衡點。有關個人的信息披露得越多,得到的服務就能更有針對性地滿足個人需求。當然,我也可以把旋鈕調回去——如果我只愿意披露比較簡略的個人信息,那么仍可獲得某些個性化服務,只不過服務的針對性稍差一些而已。
《科學美國人》:網絡攻擊通常都是利用了互聯網的開放性,因此安全問題很大程度上是留給電腦和其他各種聯網設備來應付。信息網絡化對互聯網安全會有什么樣的影響?
霍夫曼:信息網絡化旨在使所有網絡基礎設施對網絡信息流有更多了解,這或將有助于識別并緩解某些類型的網絡攻擊。不過,其他一些因素也可能使這個問題復雜化。我預計——并且期望——數據流將越來越多地采用加密的形式,以利于實現真正的安全和隱私保護。當然,一旦數據被加密,就很難再從其中提取出任何信息。這是一項頗具挑戰性的研究課題,它要求采用新的加密方案,以便在實現保密的同時,也允許對加密后的數據進行某些數學運算。
例如,假設某地區每個家庭的收入數據經過加密后,存儲在云端的服務器上,任何人——除了獲得授權的數據擁有者之外——都無法讀取代表家庭收入的真實數字。其實更好的方式可能是,采用適當的方法給這些數據加密,使得在云端運行的軟件能夠計算出該地區平均家庭收入,而軟件只會對加密數據進行計算,而不會去識別任何一個家庭的真實身份。
另外一種可能的思路是,開發一些巧妙的方法來管理密鑰,以使得密鑰可以共享而又不影響安全。只要方法得當,此類措施應該不會給用戶增加任何負擔。這既是關鍵,也是挑戰。想想看,現在有多少用戶會真的對他們的郵件加密——幾乎連一個都沒有,因為現在的情況下對郵件加密就必須做很多額外工作。
人物
馬庫斯 霍夫曼(Markus Hofmann)
職位
計算機科學家、工程師
工作單位
貝爾實驗室基礎研究院(美國新澤西州默里山市)
研究方向
更智能的通信網絡是否有助于互聯網走出日益嚴峻的困境?
重要觀點
互聯網以及支撐它的基礎設施,必須盡力容納下由移動設備和多媒體內容帶來的日益龐大的數據通信量。