2014百度世界大數(shù)據(jù)論壇在北京大飯店舉行,百度基礎(chǔ)架構(gòu)部高級(jí)總監(jiān)劉煬對(duì)百度在開(kāi)放云這個(gè)領(lǐng)域的進(jìn)展情況進(jìn)行了介紹。
劉煬
以下為百度高級(jí)總監(jiān)劉煬演講實(shí)錄
劉煬:各位嘉賓下午好,非常高興今天有機(jī)會(huì)在這里給大家匯報(bào)一下百度在開(kāi)放云這個(gè)領(lǐng)域的一些進(jìn)展。大家都知道,今天有幾個(gè)特別熱的詞語(yǔ):創(chuàng)新,互聯(lián)網(wǎng),大數(shù)據(jù),這些幾乎是所有公司今天都在追求的,不管是創(chuàng)新公司還是傳統(tǒng)企業(yè),都在追求這樣的創(chuàng)新:怎么樣跟互聯(lián)網(wǎng)進(jìn)行結(jié)合,怎么樣跟大數(shù)據(jù)結(jié)合,運(yùn)用大數(shù)據(jù)來(lái)提升整個(gè)公司的能力。這也是我們?yōu)槭裁匆鲩_(kāi)放云的原因。
三個(gè)熱詞
首先我們來(lái)看”創(chuàng)新”,創(chuàng)新有什么煩惱?創(chuàng)新是每個(gè)人都想要的東西,但是說(shuō)實(shí)話(huà)創(chuàng)新不容易,創(chuàng)新往往需要很多的投入:要買(mǎi)機(jī)器,要買(mǎi)軟件,要進(jìn)行大規(guī)模的投入,IT成本非常高。錢(qián)還是小事情,時(shí)間才是大問(wèn)題。也就是Time to marketing?,F(xiàn)在有個(gè)講法,idea is cheap,他有一個(gè)idea,我有一個(gè)idea,誰(shuí)快誰(shuí)成功?;ヂ?lián)網(wǎng)一定是快速的試錯(cuò),快速的迭代。我怎么樣減少投入,怎么樣快速迭代,成為了一個(gè)至關(guān)重要的問(wèn)題。
第二個(gè)熱門(mén)的詞“互聯(lián)網(wǎng)”,今天大家都在想做互聯(lián)網(wǎng)。為什么?互聯(lián)網(wǎng)將你的商業(yè)和用戶(hù)直接聯(lián)系起來(lái)。就像陳總剛剛講的,過(guò)去可能要通過(guò)渠道商或者各種各樣的方法接觸用戶(hù),今天看來(lái)這種方法是低效的,所以必須要打破瓶頸,去第一時(shí)間直接接觸用戶(hù),了解用戶(hù)想要什么。互聯(lián)網(wǎng)幫你直接接觸客戶(hù)。這個(gè)商業(yè)模式需要非常多的技術(shù)做支撐,我列了一堆名詞,都是互聯(lián)網(wǎng)技術(shù)。大家說(shuō)互聯(lián)網(wǎng)技術(shù)很簡(jiǎn)單,搞一個(gè)LAMP就是互聯(lián)網(wǎng)了,但是今天并非如此,需要非常多的技術(shù),而這些技術(shù)恰恰是小公司面臨的難題。
第三個(gè)熱門(mén)詞是“大數(shù)據(jù)”,大數(shù)據(jù)首先是大流量。今天促銷(xiāo),站點(diǎn)流量可能是平時(shí)的幾十倍幾百倍,但這樣的大流量可能并沒(méi)有得到好的技術(shù)支撐,我們看到facebook早期的很多競(jìng)爭(zhēng)對(duì)手都失敗了,為什么?當(dāng)流量太龐大進(jìn)而扛不住的話(huà),用戶(hù)就會(huì)離開(kāi)。同時(shí)流量意味著數(shù)據(jù),所以還會(huì)有非常多的數(shù)據(jù)產(chǎn)生出來(lái),往往是PB的數(shù)量規(guī)模,這些數(shù)據(jù)有沒(méi)有好的技術(shù)架構(gòu)存下來(lái)?存下來(lái)還不夠,關(guān)鍵是你怎么把有價(jià)值的數(shù)據(jù)提煉出來(lái),沒(méi)有提煉的數(shù)據(jù)就只是一個(gè)負(fù)債,是死數(shù)據(jù)。怎么樣把死數(shù)據(jù)變成活數(shù)據(jù),變成資產(chǎn),這就需要非常強(qiáng)大的數(shù)據(jù)處理能力。
我們看到的創(chuàng)新、互聯(lián)網(wǎng)、大數(shù)據(jù),其實(shí)都面臨非常大的挑戰(zhàn),不是拍腦袋想一想就能做出來(lái),這里面的技術(shù)難度是非常高的。這也是為什么百度要去做開(kāi)放云。百度開(kāi)放云希望為客戶(hù)提供開(kāi)放的云服務(wù)和完整的解決方案,只需要點(diǎn)一下按鈕,即可部署,而且是按需付費(fèi),不用一次性投入太高的成本。另外開(kāi)放云提供豐富且有特色的服務(wù),可以把這些服務(wù)像積木一樣搭建起來(lái),同時(shí)搭配百度自動(dòng)化的智能運(yùn)維工具,提供了完整的解決方案,幫助企業(yè)在競(jìng)爭(zhēng)獲得更大的優(yōu)勢(shì)。
開(kāi)放云結(jié)合大數(shù)據(jù)
今天的主題是開(kāi)放云和大數(shù)據(jù),那開(kāi)放云怎么樣和大數(shù)據(jù)結(jié)合?不管是什么業(yè)務(wù)一定有大數(shù)據(jù)存儲(chǔ),數(shù)據(jù)存儲(chǔ)在開(kāi)放云里,涉及非常多的業(yè)務(wù),可以是互聯(lián)網(wǎng)應(yīng)用,可以是一個(gè)mobile App,可以是后臺(tái)的數(shù)據(jù)處理,以及后臺(tái)的ERP流程。當(dāng)所有的業(yè)務(wù)和數(shù)據(jù)都跑在云上的時(shí)候,可以讓數(shù)據(jù)存儲(chǔ)更容易,跟大數(shù)據(jù)能力進(jìn)行更好地對(duì)接,同時(shí)把大數(shù)據(jù)處理結(jié)果進(jìn)行應(yīng)用也更容易。所以這是我們?yōu)槭裁醋鲩_(kāi)放云的原因。
百度一直堅(jiān)持走開(kāi)放的道路,在SaaS服務(wù)上面我們提供高級(jí)服務(wù),比如地圖導(dǎo)航,應(yīng)用統(tǒng)計(jì),語(yǔ)音識(shí)別,人臉識(shí)別,視頻轉(zhuǎn)碼等等,在PaaS層也在提供BAE,輕應(yīng)用等很多服務(wù)。百度在未來(lái)會(huì)開(kāi)放更多的服務(wù)。
今天百度將推出“百度開(kāi)放云-云引擎beta版”。剛剛說(shuō)SaaS/PaaS都是上層服務(wù),今天我們推出的“云引擎”,將覆蓋IaaS – Infrastructure as a Service,也就是我們將要開(kāi)放出來(lái)的新能力。百度為什么要開(kāi)放這個(gè)IaaS?很重要的一點(diǎn),今天大家都知道我們的企業(yè)其實(shí)需要的不僅僅是高大上的東西,也需要完整的IT解決方案,這個(gè)解決方案既包括上層的服務(wù)應(yīng)用,也包括基本的網(wǎng)絡(luò)存儲(chǔ)等基礎(chǔ)設(shè)施服務(wù)。從我們跟很多企業(yè)的溝通來(lái)看,他們就有非常多的類(lèi)似需求,我們希望借助百度開(kāi)放平臺(tái),為客戶(hù)提供一個(gè)完整的云到端的解決方案。大家看到,今天的百度在不斷地創(chuàng)新和開(kāi)放新的東西,從設(shè)備端到云端,在云端更是從SaaS到PaaS再到IaaS。百度云引擎,大家今天就可以開(kāi)始注冊(cè)試用。
百度云引擎
提到百度云引擎,提到百度基礎(chǔ)架構(gòu)技術(shù),我們有非常多的技術(shù)積累。百度為什么成為這么大的搜索引擎?大家知道百度1999年開(kāi)始做搜索引擎,在2003年我們已經(jīng)將搜索技術(shù)全部換到了最先進(jìn)的分布式計(jì)算系統(tǒng),真正系統(tǒng)自動(dòng)地進(jìn)行分布式的調(diào)度,能做到這一點(diǎn)靠的是不斷的技術(shù)沉淀。從2008年開(kāi)始,我們?cè)诨A(chǔ)架構(gòu)技術(shù)的投入加速,不斷推出更多的新成果。比如,剛剛余老師提到,我們的機(jī)器學(xué)習(xí)模型支持百億級(jí)的特征量;我們的數(shù)據(jù)中心能夠做到中國(guó)最好的PUE1.32;我們?cè)谧稣麢C(jī)柜;我們的集群規(guī)模過(guò)萬(wàn)臺(tái);等等。通過(guò)這些大家可以看到百度在基礎(chǔ)技術(shù)方面積累非常多,未來(lái)百度會(huì)一個(gè)一個(gè)逐步開(kāi)放,讓大家享受到百度最底層的技術(shù)所帶來(lái)的便利。
今天,百度的規(guī)模已經(jīng)非常大,所有規(guī)模數(shù)字下面都是非常多的機(jī)器,非常多的系統(tǒng),非常多的研發(fā)人員的汗水。今天百度總?cè)萘恳呀?jīng)達(dá)到千P,每天新增的數(shù)量級(jí)都有1個(gè)P,每天處理的數(shù)據(jù)超過(guò)50個(gè)P,峰值處理每秒達(dá)50個(gè)GB,更重要的是,百度的業(yè)務(wù)非常復(fù)雜,各種類(lèi)型的應(yīng)用,各種各樣的數(shù)據(jù),都在我們的系統(tǒng)上跑。所以我們有信心,在座各位的復(fù)雜業(yè)務(wù)也一定可以在我們開(kāi)放云上面跑起來(lái)。
用百度云引擎你可以做什么呢?這是我下面要介紹的。百度云引擎有非常多的特點(diǎn),今天因?yàn)闀r(shí)間關(guān)系我不可能一一介紹,下面主要講三個(gè)特點(diǎn):安全可靠,高性能,高擴(kuò)展性。
我們先來(lái)看看安全可靠。百度開(kāi)放云上將會(huì)使用百度云安全作為安全防護(hù)的系統(tǒng)。百度云安全提供WEB防火墻,百度業(yè)務(wù)都在百度云安全的保護(hù)之下,所以在百度云里面會(huì)非常安全。同時(shí)我們使用了非常高可靠的安全認(rèn)證系統(tǒng),所有的行為都會(huì)需要認(rèn)證,審計(jì)和應(yīng)用也都非常嚴(yán)格。百度開(kāi)放云的內(nèi)容分發(fā)網(wǎng)絡(luò)也是全中國(guó)部署,可以支撐百G量級(jí)的DDoS攻擊,當(dāng)有攻擊來(lái)的時(shí)候可以靈活調(diào)動(dòng)化解攻擊。百度開(kāi)放云還提供數(shù)據(jù)庫(kù)服務(wù),大家知道云應(yīng)用都離不開(kāi)數(shù)據(jù)庫(kù),百度內(nèi)部數(shù)據(jù)庫(kù)應(yīng)用非常廣,有超過(guò)1萬(wàn)個(gè)database的實(shí)例。開(kāi)放云上的數(shù)據(jù)庫(kù)服務(wù)主從實(shí)時(shí)同步,可進(jìn)行秒級(jí)的快速切換,而且系統(tǒng)會(huì)定時(shí)自動(dòng)備份,所以是一個(gè)非??煽康沫h(huán)境。
當(dāng)然光要安全可靠還不夠,還需要高性能的環(huán)境。百度對(duì)性能一直放在非常重要的優(yōu)先級(jí),比如我們的云磁盤(pán),我們?cè)谛枰阅艿牡胤绞褂肧SD技術(shù),速度非???。不但快,我們的云磁盤(pán)都是三副本存儲(chǔ),不會(huì)出現(xiàn)磁盤(pán)出了問(wèn)題數(shù)據(jù)就丟掉的情況,一個(gè)磁盤(pán)壞了,還有存儲(chǔ)在別的磁盤(pán)的副本。而且既使是云磁盤(pán)它可能比你本地磁盤(pán)速度還是要快很多,可以保證有更高讀寫(xiě)速度服務(wù)的需求。百度的云磁盤(pán)可以?huà)煸谠浦鳈C(jī)上,也就是云服務(wù)器。我們百度的云服務(wù)器是非常快的,我們對(duì)虛擬機(jī)一直通過(guò)深度的內(nèi)核優(yōu)化來(lái)提高速度。剛剛也提到百度內(nèi)網(wǎng),我們使用萬(wàn)兆的交換機(jī),內(nèi)網(wǎng)是非常非??斓?,在開(kāi)放云中訪(fǎng)問(wèn)百度的服務(wù)非常快,你自己的機(jī)器或服務(wù)之間訪(fǎng)問(wèn)也非??臁i_(kāi)放云的外網(wǎng)是公網(wǎng)高速的BGP,你也不用再擔(dān)心南北互聯(lián)的問(wèn)題。所以這些都是幾個(gè)例子都說(shuō)明我們?cè)谛阅苌戏浅5仃P(guān)注。
如果你有好的系統(tǒng),你有好的數(shù)據(jù),你怎么獲得業(yè)務(wù)擴(kuò)展?我們相信在互聯(lián)網(wǎng)時(shí)代,流量變動(dòng)非常大,互聯(lián)網(wǎng)時(shí)代要想活的好,一定是要有非常好的可擴(kuò)展性。大家知道百度有云網(wǎng)盤(pán),百度在云網(wǎng)盤(pán)是里面有幾百P的數(shù)據(jù),開(kāi)放云使用相同的存儲(chǔ)技術(shù),所以在開(kāi)放云存儲(chǔ)方面我們是具有非常高的可擴(kuò)展性,支持EB級(jí)別的存儲(chǔ)。百度MapReduce兼容Hadoop,你以前的程序不需修改就可以跑在百度開(kāi)放云上,同時(shí)百度MapReduce也有非常好的可擴(kuò)展性。我們的負(fù)載均衡也有非常好的橫向水平伸縮能力。當(dāng)你的流量大時(shí),我們可以幫你增加資源,當(dāng)你流量小的時(shí)候,我們可以幫你釋放資源。
未來(lái)百度還會(huì)提供更多的產(chǎn)品在百度云引擎上面。
最后我再一次邀請(qǐng)大家來(lái)試用我們的百度云引擎,大家可以通過(guò)bce.baidu.com來(lái)申請(qǐng),另外大家也可以?huà)呙瓒S碼,直達(dá)bce.baidu.com。我們希望為中國(guó)互聯(lián)網(wǎng)提供一個(gè)性能更高,安全更好,彈性更好,以及更便宜的IT服務(wù)鏈,謝謝大家!