“清華大學校園里面,有兩萬的用戶,僅僅是清華大學的學生和老師來用,對其他人不給用,因為我們不像新浪這么大的全球用戶,但數據量已經的100T了。”清華大學教授武永衛表示。
數據社交核心問題就是數據量比較大,如果只是消息的話,建議大家用新浪,我們以大數據量為核心。
所謂的數據社交是什么?就是希望認識的是一些志同道合的人。武教授介紹:在清華這種需求很強烈:有的同學對Mac開發程序感興趣,他們希望互相交流,代碼貢獻出來。對Mac沒有開發的程序,暴露出來無非就是一個垃圾,但是對有興趣的人,這就是一個寶貝。所以具有真實的社會關系或者具有共同的特征。
真實的社會關系,如每個家庭分享各自的旅游照片。武教授興致勃勃地說到:“現在一張照片5到10兆、幾百兆,怎么給父母看?只能抱著一個電腦,插上U盤來進行觀看。如果父母在外地的話,這件事情就麻煩了,幾百G的東西沒有很快進行共享。我們說的就是 數據創造,創造出數據,然后把數據分享給別人,跟別人共同分享為核心,這就是數據社交。我剛剛說了清華的Mac編程,還有一個清華的跳水隊,用我們的社區概念。就是在我們社區放500G的東西,我們偷偷的看了一下,我也沒有看到他們的數據,也偷偷看了一下,為什么放這么多數據,跳水動作的照片, 還有視頻內容,到跳水館,拿一個Pad一播,就給他們看一下,糾正跳水的問題。一拍一上傳,隊員在宿舍里面各自又可以看這些照片了,他們就是做這個事情。”
當一個數據平臺做好的時候,上面的應用可以很多,打游戲也罷,我非常吃驚的一點,去年不知道康熙來了,去年才知道,這個節目看的人很多,有的人天天把 康熙來了放上去,就在安卓手機上開發這樣的應用,在校園網通過Wi-Fi,3G也可以看,就可以看里面的頻道。這個東西每天有300個人看,就是300次的 觀看,在校園網。這是最高的,挺好玩的,就看了一下,當你有了數據,有了對外開發的接口,網絡的系統暴露出來,開發出來的App可以有很多。照相機做一個插件,照的照片可以上傳上來,應用做到成千上萬,Appstore很多。
大的數據量修改也有關系。客戶端都是分布的,大家在不同的渠道到一個地方,訪問數據中心的地方,數據中心的地方是瓶頸,數據中心的地方解決這個瓶頸的時候,只有兩個辦法。第一,多放數據服務器,為什么說廣泛分布,多放數據服務器,每一個服務器對外都是千兆帶寬。第二,每一個服務器都有光纖的出口很好,清華都是光纖,其他學校做不到,也沒有辦法。廣泛分布之后,帶來的問題也非常簡單,一致性、維護拷貝等所有都要搞定。廣泛分布以后,怎么管理好,怎么讓大家不經過中間這一塊,登錄之后直接獲取服務器的數據,進行修改和讀取,技術的改變,在中間都要記錄下來,沒有中間這一塊,用戶正在讀取數據,中間機器宕了,也沒有問題。或者就是修改和讀取的數據沒有記錄下來,希望通過客戶端里面加一些內容,比如說做了哪些做了修改注冊以后,收尾的時候,告訴服務器,修改哪些數據,然后再做原數據的搜索。原數據的管理,是做我們這個廣泛分布系統的核心,也是最難的地方。我們大概有幾百個問題。