5月22日,在第六屆中國云計算大會大數據核心技術與應用論壇上,百度大數據部總監李鋼江指出,行業擁抱大數據正遭遇三大技術挑戰,即數據智能技術缺失、數據管理與挖掘技術缺乏,以及數據存儲與計算規模瓶頸。大數據的發展離不開數據智能技術和管理平臺的支撐,只有充分發掘數據的價值規模,才能滿足各行業的不同需求。
演講中,李鋼江還分享了百度大數據引擎,它包括開放云、數據工廠、百度大腦三大核心組件。最底層是開放云,是大數據引擎運行的基礎構件,通過分布各地的數據中心提供數據存儲和分布式計算。中間部分是數據工廠,提供數據管理和分析能力。最上層是百度大腦,用來實現智能數據分析及預測功能。百度大腦融合了全球領先的深度學習算法、數據建模、大規模GPU并行化平臺等技術,實現了無時無刻都在學習與成長,它擁有200億個參數,構造起世界上最大的深度神經網絡。
另外,李鋼江特別介紹了百度的大數據預測。今年春節期間,中央電視臺《晚間新聞》與百度合作,首次啟用百度地圖定位可視化大數據播報了國內春節人口遷徙情況,該報道建立在百度推出的人口遷徙產品上。百度遷徙利用百度后臺每天數十億次基于地理位置的服務定位數據進行計算分析,展現了春節前后人口大遷徙的軌跡與特征。中國疾病預防控制中心與百度開展大數據合作,結合疾控大數據與百度大數據,借助大數據引擎的技術力量,建成中國首個流感預測系統,對流感進行預測,服務民生。而即將發布的百度高考預測,通過對近年高考作文題目及社會熱點話題的分析,幫助考生預測高考題目,指導考生作文備戰方向。
作為一家具備大數據基因的公司,百度自成立之初就開始就收集互聯網數據。據悉,百度目前已在全國建立了多個大型數據中心,其中,北京、山西和內蒙三地數據處理器超過十萬臺,擁有70萬個CPU和4000臺舞臺服務器,其數據中心位居亞洲首位。