摘要 : 百度要做好搜索,要落地自己的大數(shù)據(jù)戰(zhàn)略,最需要政府的大數(shù)據(jù)。在技術(shù)上的積累,在網(wǎng)民大數(shù)據(jù)上的積累,以及互聯(lián)網(wǎng)入口的地位,讓百度有機(jī)會(huì)利用好政府大數(shù)據(jù),享受這一個(gè)開放紅利。
李克強(qiáng)總理在兩會(huì)上明確表態(tài):政府應(yīng)該盡量的公開非涉密的數(shù)據(jù),以便利用這些數(shù)據(jù)更好的服務(wù)社會(huì),也為政府決策和監(jiān)管服務(wù)。這已不是政府第一次關(guān)注并支持大數(shù)據(jù)。早在2012年,國(guó)務(wù)院副總理,時(shí)任廣東省委書記的汪洋,便向廣東省財(cái)政廳官員推薦了《大數(shù)據(jù)》一書,并詳細(xì)闡述了自己對(duì)大數(shù)據(jù)的理解。2013年底,“七常委”第九次集體學(xué)習(xí)之時(shí),聽取了百度CEO李彥宏關(guān)于大數(shù)據(jù)發(fā)展的匯報(bào)講解。政府對(duì)大數(shù)據(jù)一直積極關(guān)注,這一次李克強(qiáng)總理在兩會(huì)上明確表態(tài),大數(shù)據(jù)正在上升到國(guó)家級(jí)戰(zhàn)略層面,政府開放大數(shù)據(jù)已是板上釘釘。
對(duì)于這一消息,最高興的應(yīng)該是百度,我想百度應(yīng)該一直在等待這個(gè)時(shí)間節(jié)點(diǎn)。2013年底李彥宏充當(dāng)大數(shù)據(jù)義務(wù)宣傳員向國(guó)家高層介紹匯報(bào)大數(shù)據(jù);2014年兩會(huì),李彥宏在政協(xié)記者會(huì)上表示,政府應(yīng)該把更多和人民生活有關(guān)的數(shù)據(jù)資料,公開的放到網(wǎng)絡(luò)上;2015年兩會(huì),李彥宏的“中國(guó)大腦”提案之中同樣包括建議政府聚焦大數(shù)據(jù)這部分。在推動(dòng)政府大數(shù)據(jù)開放上,百度如此積極在于,百度有能力,也有動(dòng)機(jī)利用好政府大數(shù)據(jù)。政府大數(shù)據(jù),對(duì)于百度而言是求之不得的寶貴外部資源。
百度需要政府大數(shù)據(jù)做好搜索本身
搜索為核心業(yè)務(wù)的百度,本質(zhì)上是一家搜索公司,搜索做的事情,實(shí)際上是對(duì)數(shù)據(jù)的處理和信息的連接。理論上來(lái)說(shuō),百度、Google們是最具“大數(shù)據(jù)基因”的公司。搜索引擎在移動(dòng)互聯(lián)網(wǎng)時(shí)代正在經(jīng)歷一個(gè)前所未有的轉(zhuǎn)型:即搜索的內(nèi)容從WEB數(shù)據(jù),升級(jí)到所有數(shù)據(jù);搜索引擎的功能定位則從信息與人的連接者,轉(zhuǎn)型為服務(wù)與人的連接者。
移動(dòng)互聯(lián)網(wǎng)上,App所造成的信息孤島效應(yīng)、企業(yè)服務(wù)背后的海量結(jié)構(gòu)化數(shù)據(jù)、政府正在開放的高價(jià)值民生數(shù)據(jù),對(duì)于搜索引擎而言都具有巨大價(jià)值。以政府為例,交通、健康、衛(wèi)生、環(huán)保、氣象,諸多數(shù)據(jù)其實(shí)承載的是政府的服務(wù)。百度要幫助用戶連接各種服務(wù),自然不會(huì)少了政務(wù)服務(wù)。如何將政府開放的數(shù)據(jù)以及背后的服務(wù)集成到百度搜索,是百度面臨的新的挑戰(zhàn)。
在過(guò)去的幾年里,百度已經(jīng)意識(shí)到這一趨勢(shì)并嘗試接入政府大數(shù)據(jù)。主要是通過(guò)點(diǎn)對(duì)點(diǎn)項(xiàng)目的方式,先后與國(guó)家知識(shí)產(chǎn)權(quán)局專利中心、藥監(jiān)局、北京市衛(wèi)生部門達(dá)成合作,接入其數(shù)據(jù)整合到百度搜索之中。百度還上線了政府網(wǎng)站搜索,整合了龐大政府信息網(wǎng)頁(yè)庫(kù),幫助用戶搜索各類政府公文、政策法規(guī)等政府信息。另外在《穹頂之下》讓全民關(guān)注環(huán)保問(wèn)題之時(shí),百度還推出了“污染地圖”整合了環(huán)部門相關(guān)數(shù)據(jù)。總之,要做好搜索,滿足網(wǎng)民訴求,整合政府大數(shù)據(jù),以及背后的服務(wù),是必須要做的事情。
政府大數(shù)據(jù)給百度帶來(lái)新的業(yè)務(wù)空間
百度未來(lái)的業(yè)務(wù)版圖里面,大數(shù)據(jù)一方面為搜索服務(wù),一方面又將誕生出新的業(yè)務(wù)板塊。
2014年一個(gè)重點(diǎn)業(yè)務(wù)便是百度預(yù)測(cè)。搜索解決的是從海量數(shù)據(jù)和服務(wù)中找到所求的問(wèn)題;而預(yù)測(cè)則是基于大數(shù)據(jù)分析的未來(lái)趨勢(shì)變化,可被應(yīng)用在氣象、人流、物流、經(jīng)濟(jì)、房?jī)r(jià)諸多預(yù)測(cè)上,服務(wù)于生活和生產(chǎn)。統(tǒng)計(jì)局曾公布其基于百度搜索數(shù)據(jù)預(yù)測(cè)不同城市的房?jī)r(jià)變化,效果良好。旅游預(yù)測(cè)可以幫助旅游管理部門和景區(qū)做好預(yù)案規(guī)劃,交通預(yù)測(cè)有助于交通規(guī)劃部門和鐵路民航公路做好客流物流疏導(dǎo),流感預(yù)測(cè)可以提供給衛(wèi)生部門做好疫情防控,大數(shù)據(jù)預(yù)測(cè)有著巨大的應(yīng)用前景。
基于大數(shù)據(jù)的應(yīng)用,預(yù)測(cè)只是其中一種?;诖髷?shù)據(jù)挖掘的精準(zhǔn)個(gè)體追蹤可被應(yīng)用在精準(zhǔn)營(yíng)銷上,對(duì)于政府管理有參考價(jià)值;基于大數(shù)據(jù)的規(guī)律發(fā)現(xiàn)和統(tǒng)計(jì)學(xué)應(yīng)用,則可以幫助政府以及相關(guān)機(jī)構(gòu)做好社會(huì)調(diào)研,比如成為統(tǒng)計(jì)局的數(shù)據(jù)源;基于大數(shù)據(jù)的百度指數(shù)、百度統(tǒng)計(jì)等已普及應(yīng)用,可適用在政府輿情監(jiān)控等領(lǐng)域。美國(guó)政府大數(shù)據(jù)平臺(tái)DATA.GOV上除了政府開放的數(shù)據(jù)之外,還有第三方開發(fā)的各種大數(shù)據(jù)應(yīng)用,中國(guó)政府大數(shù)據(jù)開放后的應(yīng)用,百度同樣可以開發(fā),甚至整合到百度平臺(tái)——過(guò)去幾個(gè)案例正是這樣做的。
總之,百度需要大數(shù)據(jù)做好搜索,同時(shí)可以基于政府大數(shù)據(jù)研發(fā)更多潛在應(yīng)用,這些應(yīng)用要么可產(chǎn)生商業(yè)價(jià)值,要么將具有社會(huì)公益價(jià)值,都將給百度帶來(lái)新的業(yè)務(wù)空間。
百度憑什么享受政府大數(shù)據(jù)紅利?
我曾分析過(guò),中國(guó)政府開放大數(shù)據(jù),在標(biāo)準(zhǔn)化的統(tǒng)一數(shù)據(jù)開放平臺(tái)建立起來(lái),必然也只能選擇大公司優(yōu)先的方式。這里的大公司,其實(shí)備選名單并不多。中國(guó)在大數(shù)據(jù)技術(shù)上最有作為的公司,有兩家:一家是百度,另一家是阿里。
百度在技術(shù)上有過(guò)人之處,正如前文所提及,百度一直做的事情就是處理數(shù)據(jù),最具“大數(shù)據(jù)基因”,百度在大數(shù)據(jù)上投入力度也相對(duì)較大,成立了大數(shù)據(jù)實(shí)驗(yàn)室、深度學(xué)習(xí)實(shí)驗(yàn)室和人工智能實(shí)驗(yàn)室,廣納海內(nèi)外頂尖人才。百度大數(shù)據(jù)引擎是首個(gè)開放的大數(shù)據(jù)處理平臺(tái),百度大腦為大數(shù)據(jù)挖掘和預(yù)測(cè)等業(yè)務(wù)提供基礎(chǔ)支持,深度學(xué)習(xí)是大數(shù)據(jù)產(chǎn)業(yè)的關(guān)鍵基礎(chǔ)型技術(shù),多媒體識(shí)別、自然語(yǔ)言處理則是大數(shù)據(jù)的上層實(shí)踐應(yīng)用。大數(shù)據(jù)這個(gè)概念是比較新,但對(duì)數(shù)據(jù)的挖掘和相關(guān)的技術(shù)積累,百度基礎(chǔ)扎實(shí);而基于深度學(xué)習(xí)的大數(shù)據(jù)技術(shù)則讓百度走得稍稍快了一些。
百度是信息和服務(wù)的入口,它連接人與信息、人與服務(wù)。它具備媒體屬性,因?yàn)槭切畔⑷肟?;它是服?wù)平臺(tái),通過(guò)阿拉丁計(jì)劃百度搜索結(jié)果頁(yè)已經(jīng)豐富多樣,承載了不同的服務(wù)包括政務(wù)服務(wù)。手機(jī)百度的服務(wù)風(fēng)格更是愈加明顯。政務(wù)服務(wù)上網(wǎng),在線政務(wù)信息和在線政務(wù)服務(wù)需要通過(guò)百度輸出,百度在這個(gè)過(guò)程中就拿到了部分政府大數(shù)據(jù)。
還有一點(diǎn)是百度本身便擁有政府部門所需的民間大數(shù)據(jù),可以與政府部門形成雙贏合作。百度擁有最全最龐大的WEB數(shù)據(jù),來(lái)自于網(wǎng)絡(luò)爬蟲時(shí)時(shí)刻刻的爬取解析索引;用戶搜索則是表征著網(wǎng)民此時(shí)此刻想什么想要什么;移動(dòng)App則收集著海量用戶的位移、聲音等數(shù)據(jù);在物聯(lián)網(wǎng)上的布局還可以拿到視頻數(shù)據(jù)比如景點(diǎn)直播。這些數(shù)據(jù)實(shí)時(shí)傳遞并存儲(chǔ)到云端,對(duì)于政府部門開展工作具有一定價(jià)值。百度為政府部門提供所需的大數(shù)據(jù),還可以基于自己的數(shù)據(jù)與政府開放的數(shù)據(jù)交叉分析,讓數(shù)據(jù)產(chǎn)生更大價(jià)值。
因此,政府開放大數(shù)據(jù),最開心的應(yīng)該是百度。百度要做好搜索,要落地自己的大數(shù)據(jù)戰(zhàn)略,最需要政府的大數(shù)據(jù)。在技術(shù)上的積累,在網(wǎng)民大數(shù)據(jù)上的積累,以及互聯(lián)網(wǎng)入口的地位,讓百度有機(jī)會(huì)利用好政府大數(shù)據(jù),享受這一個(gè)開放紅利。