當下的互聯(lián)網(wǎng)領(lǐng)域,云計算、大數(shù)據(jù)、人工智能成為最熱詞匯。互聯(lián)網(wǎng)da咖阿里云“為了無法估算的價值”將中國的計算觸角伸向海外,百度首次向外界展示“百度大腦”的科技成果。移動互聯(lián)網(wǎng)利用人口紅利帶來的增長已經(jīng)逐漸見頂,互聯(lián)網(wǎng)正在進入“下一幕”智能時代,云計算、大數(shù)據(jù)、人工智能將使全社會迎來變革性的發(fā)展。
無論是計算機行業(yè),還是汽車領(lǐng)域,技術(shù)形態(tài)的成熟是一個必然的要素。如果某個所謂的時代在技術(shù)上、硬件上沒有達到產(chǎn)業(yè)的要求,數(shù)據(jù)庫和平臺都是非完整和非穩(wěn)定的,時代的產(chǎn)業(yè)基礎(chǔ)也就十分薄弱。從產(chǎn)業(yè)的政策角度分析,當技術(shù)累積到一定層次,產(chǎn)業(yè)政策的出臺是必然的。為了激活云計算的發(fā)展,國務院在2015年就出臺了《關(guān)于促進云計算創(chuàng)新發(fā)展培育信息產(chǎn)業(yè)新業(yè)態(tài)的意見》、《云計算白皮書2016》等,這些政策的出現(xiàn)并非偶然,在其背后有很多云計算服務商多年默默的技術(shù)耕耘。
技術(shù)和政策的形態(tài)達到一定的地步,真正的產(chǎn)業(yè)化和市場化是否也已經(jīng)達到?
等待入局者必須考慮幾個重要因素:
一、目的是什么(為了降低成本、提高效率,還是在渠道上更接近用戶);
二、企業(yè)是否愿意使用(產(chǎn)品同質(zhì)化嚴重,如何體現(xiàn)差異化);
三、是否有助于提高社會福利(消費者福利、管理效率)。
如果這些問題得到肯定的答案,云計算與時代的發(fā)展需求相契合,真正的時代大門就會開啟。
大數(shù)據(jù)本身除了要有數(shù)據(jù)、采集、匯聚一定量的數(shù)據(jù)之外,更重要的是數(shù)據(jù)的處理、挖掘、分析、可視化、應用這樣一整套的過程。
關(guān)于大數(shù)據(jù)的話題,基本圍繞三個問題展開:
一是數(shù)據(jù)從哪里來;
二是數(shù)據(jù)如何進行分析;
三是數(shù)據(jù)如何進行商品化。
任何大數(shù)據(jù)都是以應用為主的,在未來,通過多維度、多復合的大數(shù)據(jù)的精準挖掘,最終提供出優(yōu)質(zhì)的商務解決方案才是最關(guān)鍵的。
數(shù)據(jù)的三個來源分別是政府、企業(yè)行業(yè)和個人消費。
政府數(shù)據(jù)做了授權(quán),但由于法律和其他方面的不健全,政府數(shù)據(jù)被濫用。消費者數(shù)據(jù)來源于電信、金融或類似BAT大企業(yè),流量入口處的數(shù)據(jù)將被自動抓取,數(shù)據(jù)提供商可以提供所有維度的數(shù)據(jù),但每一個都是局部。數(shù)據(jù)優(yōu)化商在大數(shù)據(jù)產(chǎn)業(yè)鏈里要想長久發(fā)展,必須精通大數(shù)據(jù)的模型、算法以及數(shù)據(jù)特征,同時對行業(yè)及生態(tài)要有明顯的敏感性。而算法提供商如果僅僅依賴單純算法,未來將成為成長軟肋。應用提供商最貼近客戶、最熟悉客戶需求,同時做的是最后的數(shù)據(jù)整合,在產(chǎn)業(yè)鏈上可能發(fā)展空間更大。
中國具有高達7.22億的大規(guī)模網(wǎng)民群體,目前國內(nèi)僅有3萬個機柜,對比美國的3億群體2.4萬個機柜可以看出,中國的數(shù)據(jù)市場規(guī)模還遠未達到平衡點,未來將保持高速增長的態(tài)勢。另一個方面,由于企業(yè)客戶運營模式的改革,企業(yè)的云化增加了對大數(shù)據(jù)及專業(yè)數(shù)據(jù)中心的需求。
未來云計算產(chǎn)業(yè)和大數(shù)據(jù)產(chǎn)業(yè)將呈現(xiàn)規(guī)模化發(fā)展趨勢,市場紅利可觀,創(chuàng)新、服務、合作、技術(shù)將推動互聯(lián)網(wǎng)科技企業(yè)走得更高、更遠。大數(shù)據(jù)時代已經(jīng)到來,想要快速掌握這門高薪前景的技術(shù)該如何學習呢?
Linux基礎(chǔ)和分布式集群技術(shù)
學完此階段可掌握的核心能力:熟練使用Linux,熟練安裝Linux上的軟件,了解熟悉負載均衡、高可靠等集群相關(guān)概念,搭建互聯(lián)網(wǎng)高并發(fā)、高可靠的服務架構(gòu);學完此階段可解決的現(xiàn)實問題:搭建負載均衡、高可靠的服務器集群,可以增大網(wǎng)站的并發(fā)訪問量,保證服務不間斷地對外服務;學完此階段可擁有的市場價值:具備初級程序員必要具備的Linux服務器運維能力。
學習大數(shù)據(jù)處理需要的語言:
javaMR語言這種語言產(chǎn)生很早了,大家也或多或少的接觸過,但是在大數(shù)據(jù)中使用已經(jīng)有的原型進行構(gòu)建龐大系統(tǒng),是一種基本的選擇。
Scala語言以java為基礎(chǔ)的語言,和java很像,對任何想要進行大規(guī)模的機械學習或是建立高階的算法,Scala是逐漸興起的工具,善于呈現(xiàn)且擁有建立可靠系統(tǒng)的能力。
Hadoop在以java為基礎(chǔ)的大數(shù)據(jù)處理當中,Hadoop為作一批數(shù)據(jù)處理,發(fā)展以java為基礎(chǔ)的架構(gòu)關(guān)鍵。相對于其他處理工具而言,Hadoop慢許多,但是無比的準確可被后端數(shù)據(jù)庫分析廣泛使用。
Kafka andStorm它是一個特別快速的查詢信息系統(tǒng),但是因為太快了在實施操作時會犯錯,有時候會漏掉東西。
Pythom語言Python擁有R語言處理復雜數(shù)據(jù)的能力及更務實的語言特質(zhì),更簡單和直觀,在近幾年的成長很快。在數(shù)據(jù)處理范疇內(nèi),通常在規(guī)模與復雜之間要有個選擇,Python無疑當選。
學習一門課程,掌握好的學習方法至關(guān)重要,大數(shù)據(jù)云計算發(fā)展趨勢非常好,現(xiàn)在學習好這門技術(shù),未來的就業(yè)和選擇會更多。