精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

助力經濟轉型 大數據發展還需邁過幾道坎

責任編輯:editor006

作者:孟珂

2016-04-06 17:41:51

摘自:海外網

馬云曾說,“我們還沒搞懂PC互聯網的時候,移動互聯網來了。數據科學家被認為是大數據人才的一個培養方向,但是沈艷認為這還遠遠不夠,大數據在具體行業的應用有賴于既懂關鍵技術又懂專業領域的跨界人才。

  北京大學國家發展研究院教授沈艷接受海外網采訪

馬云曾說,“我們還沒搞懂PC互聯網的時候,移動互聯網來了。我們還沒搞懂移動互聯網的時候,大數據來了。”現在我們似乎正處于還沒搞懂大數據的時候。

作為近幾年來最熱門的IT概念之一,大數據在多個領域的落地顯示出其巨大優勢,如出行類APP在擁塞的城市中為用戶提供快速的車輛調度,谷歌智能系統AlphaGo在人機圍棋大戰中獲勝。然而大數據應用的喜憂參半亦是事實,曾作為大數據具備革命性潛力證明的谷歌流感趨勢近幾年的預測結果并不盡如人意。

大數據是否被過度熱炒?現行大數據分析是否可靠?這些疑問在大數據已作為國家戰略被寫進“十三五”規劃綱要、被期助力產業轉型升級和社會治理創新的當下迫切需要得到解答。北京大學國家發展研究院教授沈艷在接受海外網財經專訪時表示,大數據并非萬能,所得結論需要交叉驗證;也并非對所有企業而言都可能實現,其分析具有門檻,而優秀人才緊缺。她強調,在明確大數據局限性和可行性的基礎上,大數據產業才能夠扎實發展。

警惕大數據應用陷阱

盡管時至今日大數據的定義仍見仁見智,但其海量的數據規模、動態的數據體系、多樣的數據類型具備共識。沈艷表示,大數據能夠以前所未有的精細度描畫世界,如運用得當,能夠幫助人們快速刻畫新舊經濟更替,給予產業發展方向以可視化指導,并為政府決策提供一定參考,但是,大數據應用也面臨陷阱。

“一種對于大數據優越性的看法是,有了大數據就有了總體,就不再需要科學抽樣了,似乎只要數據量足夠大,通常利用有限信息來推測真實狀況的不確定性就可以迎刃而解。”沈艷表示,這種“大數據自大”的傾向之所以值得警惕,一方面在于,數據反映的信息可能只是總體的一部分;另一方面,總體可能會隨著時間推移發生變化。例如,“使用谷歌搜索流感相關信息的用戶”和“美國流感人群”這個總體并不完全重合,因此用后者預測流感趨勢存在先天不足。

此外,只關心相關關系而不注重因果關系的傾向也值得關注。一般而言,利用相關關系總結規律是研究人員在難以得出因果關系時退而求其次的選擇,但它卻大量存在于目前的大數據分析中,現象背后的機制往往被忽視。“相關關系成立是有假設的,對于大數據而言即是機器學習時所用的樣本和未來經濟的樣本非常接近,但實際數據生成規律的變化并非罕見。”沈艷舉例說,在經濟繁榮期表現良好的模式可能在衰退期帶來極大損失,因為機器學習缺少關于經濟衰退的知識,算法沒有為探測經濟變化做預備。

這些陷阱的出現與大數據的收集方式息息相關。沈艷指出,傳統數據或者來自問卷調查,或者即便是經營活動留下的數據,也往往有規范標準,使得數據含義前后可比。而大數據更多是生產經營等各類活動的附屬產品,當服務于主營業務的系統架構不斷變化,數據生成規律將隨之變化。而數據分析方很可能對此全然不知或者不能深刻體會,沿用以往的分析方法,就很容易產生結論的偏差。

“當新技術來臨,尤其是面對經濟新舊轉型,我們迫切需要新的增長點,很容易尚未經過深究就相信新技術的力量。但實際上只有在清晰地知道它各種各樣的局限的基礎上,我們才能去用它。”沈艷說道。

大數據分析:被忽視的關鍵一環

遺憾的是,當大數據時代帶來數據收集方式的深刻變革,數據分析過程卻普遍成為“黑箱”:目前流行的大數據分析往往直接告知結論,對數據來源和處理方式不做說明,外界難以驗證數據使用效果的好壞。這體現出大數據使用的不透明,更折射出大數據分析被忽視的尷尬。

對比美國大數據產業圖景(分為架構、分析、應用三部分),沈艷發現,“十三五”規劃中大數據戰略的內容集中在架構和應用部分,比如加快政府數據開放共享,進行海量數據采集、存儲、清洗、分析發掘、可視化等領域關鍵技術攻關,對分析部分的強調有待加強。

“目前大數據分析方法的核心還是數據挖掘方法,但存在神話大數據分析的傾向。”沈艷指出。她曾撰文提出大數據分析五步法,強調大數據只是解決問題的一個元素,不是全部,也絕非必需。五步法的首要步驟即是問題識別,其次是數據可行性分析。“無論是進行學術研究還是產品開發,都要回歸問題本源,然后考慮需要的數據類型。”她解釋說,如果小數據(即包括抽樣數據等在內的傳統數據)可以解決問題,就無需用大數據;如果大數據被證明質量足夠好,可以采取大數據和小數據結合的方式;即便不得不單獨使用大數據,交叉驗證也必不可少。

事實上,也并非所有企業都有能力進行大數據分析。“數據分析具有門檻,要防止一哄而上、不管是否適合自己都要趕上潮流。”沈艷表示。

她同時坦言,即便沒有遵循科學規范的分析方法,一些大數據產品也能夠在一定程度上解決問題,但是其商業模式是否真正可行、是否能夠持續很難確認。而且若導致重要領域出現問題,可能產生重大損失。她呼吁大家關注大數據分析,理解大數據的局限性和可行性,在產業發展之初夯實基礎,促進產業健康發展。

人才供給成大數據產業瓶頸

與大數據概念和應用熱潮不相符的是,大數據人才在現階段極為緊缺。資料顯示,未來5到10年,我國大數據市場規模增長年均增速將超過30%;據國內大數據專家估算,5年內,大數據人才缺口將高達130萬左右。在沈艷看來,解決人才供給問題需要國家政策引導。

沈艷在采訪中多次提及大數據產業發展中多個環節對數據人才的需求:由于數據的不客觀真實存在,比如搜索引擎顯示結果中付費和未付費信息混雜,需要判斷數據質量,甄別信息是否可靠;避免大數據應用陷阱,需對系統算法變化和由此帶來的數據生成機制變化有所洞察;改變信息孤島狀況,打通單位部門之間和單位之間的數據壁壘,要了解現有數據標準之間的異同,從而確定哪些數據能夠合并而哪些不能……

“國家政策目前已經對大數據研究有所著力,但是我們還需明確,不只是硬件和軟件的開發重要,人才的培養更是重要,它觸及產業健康發展的核心。”沈艷強調。

數據科學家被認為是大數據人才的一個培養方向,但是沈艷認為這還遠遠不夠,大數據在具體行業的應用有賴于既懂關鍵技術又懂專業領域的跨界人才。她表示,高校的相關課程、配備還需加強。在培養大批專業人士之外,國家還需對決策者和民眾也有相應的培訓投入。

“過去三十年間快速積累的人力資本為技術創新提供動力,這些技術創新能夠使許多過去無法收集的數據,可以用相對低廉的成本、在短期內被收集。而今,只有滿足了大數據產業對人才的需求,這個產業的發展才能夠扎實。”沈艷表示。

她對大數據產業在我國的發展前景很有信心,希冀其健康發展幫助中國的新經濟成長起來,讓中國持續成為世界經濟的引擎。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 西畴县| 南通市| 南澳县| 景德镇市| 涪陵区| 德兴市| 云阳县| 赤城县| 南皮县| 柳河县| 云林县| 临湘市| 保康县| 九龙城区| 紫金县| 伊金霍洛旗| 武夷山市| 尼玛县| 新郑市| 仲巴县| 西盟| 肇源县| 通海县| 昔阳县| 枝江市| 金湖县| 靖宇县| 桦甸市| 河东区| 伊宁县| 固安县| 斗六市| 炎陵县| 莆田市| 杭州市| 贵州省| 垣曲县| 牙克石市| 高州市| 阿图什市| 沿河|