摘要:
如今,美國國家數據科學協會指導委員會成為了一個積極的和不斷發展的組織。美國國家數據科學協會指導委員會主席斯坦·阿豪特將討論大數據將如何發展,為什么會以應運而生。斯坦·阿豪特博士是RENCI計算研究所所長,北卡羅萊納大學教堂山分校的計算機科學教授,還是美國數據科學協會指導委員會(NCDS)主席。
斯坦·阿豪特博士
大數據是一個熱門話題,從科學雜志到大眾媒體,終于不再描述什么是“大”。,而大數據面臨的挑戰和機遇問題越來越多,通過大數據進行數據排序就是人們面臨的挑戰之一。
討論問題是一個很好的開始,但采取行動則更好。2013年,主要就職于北卡羅萊納州的三角研究園區的少數幾位學術研究人員和業務的專業人才牽頭,共同開發所使用的大數據對于科學,商業和教育最大的作用和影響,以及實際項目的策略。如今稱之為美國全國聯合會數據科學,或NCDS。
早在2012年,斯坦·阿豪特是NCDS的一個主要支持者,他曾經花費大量時間與那些在工作中創造數據的人進行溝通,這些工作人員使用數據來開發產品,進行研究,并了解他們的客戶;還有那些建立收集、共享、分析和管理數據的技術專家。阿豪特的信息很簡單:要數據豐富的世界中,大多數將需要特定領域的研究項目和孤立的產品開發工作。而企業和政府的世界必須被推翻那些科學領域和孤立的研究之間的阻礙。利用海量數據,并從數據收集真實的知識必須具有廣泛基礎和戰略的努力,并必須解決一切問題。這些都來自數據專家的想法,要將數據研究快速轉化為突破性的產品和服務。
對于許多人來說,這一信息是真實的,他們從不同的角度看數據的挑戰。因此,如今的NCDS成為了一個積極的和不斷增長的組織,其成員包括美國研究型大學(包括北卡羅來那大學校園、卓克索大學、德克薩斯A&M,UNC總署),大型企業(Cisco,德勤、EMC、GE、IBM公司),以及政府機構和非營利組織(RTI國際,MCNC,以及美國環境保護局)。
人們的成功很可能與不耐煩有關。人們沒有為利用大數據的所有問題的答案,但我們知道行動是必要的,或者數據的破壞力一直困擾著人們。因此由北卡羅萊納州教堂山分校一個專業團隊的計算研究所(RENCI)選擇了行動。在第一年中邊學邊做。并不是所有的事情都像人們所預料的那樣被證明,但卻成功地建立了一個由不同成員組成的組織,有著不同的議程。我們也開始了解如何定義可以對重要數據的挑戰影響最大。經過專家、學生、數據的勞動力,以及數據的研究人員艱苦的努力,以及在計劃和活動的發展,人們學到以下幾點:
·尋找解決數據共享,分析,管理和長期策展的挑戰,需要認識到數據科學等同于任何其他領域的科學。NCDS定義了數據科學的流程、管理系統的研究和分析,使數字數據和數據驅動的經濟得以研究、發現,以及決策。
·而數據科學家的感覺是敏銳的,谷歌公司首席經濟學家哈爾·瓦里安早在2009年表示:對于數據的能力,要能理解它,處理它,從中提取價值,對其進行可視化和進行溝通,這將是一個在未來的幾十年的非常重要的技能。
麥肯錫全球研究所估計,到2018年,僅美國就可能面臨14萬 19萬人深度分析能力不足的問題。但是,盡管如今數據科學和分析高級學位課程泛濫,但數據的科學課程還沒有一個標準,另外這些方案是否能滿足在商業世界中的數據專家的需求,目前還不清楚。這就是為什么NCDS贊助商需要挖掘那些在分析、信息科學、數據驅動的科學領域中有才華的學生的主要原因。這也是為什么組成的教師和企業新成員發展數據科學課程計劃團隊的原因,以及為什么正在努力建立一個數據觀測站點,為學生提供面對和處理非常大的數據集的機會與現實。
數據的挑戰無處不在,并且是普遍的,這意味著解決方案必須打破科學領域之間以及公共和私營部門之間的壁壘。企業資助大學的研究人員研究其感興趣的調查數據科學問題,這是比較簡單的。而更難的是,將大學的研究人員、軟件和硬件專家,以及專業人士在多個業務部門并肩努力工作的成果,即把數據轉換成知識和產品,獲得一個更好的生活質量。這種工作需要彌合文化上的障礙,找到共同點,學習新詞匯,要相互適應,有時候還需要妥協。
在NCD的工作組中,其中包括來自工業界,學術界和非營利部門的成員。他們的數據伙伴有具有長期職業生涯的研究員,還有解決有趣的數據科學問題的教師,而這些人希望將他們的工作成盯轉化為商品。這種合作還比較少見,但必須找到大數據解決方案,這可以創建個性化的醫療保健服務,了解產品開發,并基于最新數據進行實時決策。
對于NCDS來說,近兩年來一直在忙,有時結果令人沮喪,但有時也很有趣,而且往往令人振奮。他們并不要求對于艱巨的數據管理問題獲得所有的答案,也沒有想出如何確保全球具有數據素養的員工隊伍的方法,而這需要在未來解決。
但是,他們已經了解到,數據解決方案必須由來自不同背景的一起工作的人共同面對。他們相信已經創造了關鍵面向行動的一個合作框架。