企業網D1Net 2012年4月12日 大數據的迅速發展正在改變科學家進行研究的方式,而且,它還使白宮的大數據研發展機構開始注重起對大數據的研究。
據報道,白宮的大數據研發機構開始注重刺激軍事、生物醫學、計算機和環境等方面的數據技術需求。在過去的幾年中,研究人員常用的工具只在他們各自的領域里才發揮重要作用,但這些工具逐漸被計算機和大數據集所取代。
最近,白宮宣布了一項2億美元的大數據發展計劃,通過分析大量的可用數據來提高科研水平,從而創造出發展大數據技術的工具。但白宮也表示,這項計劃還需要提高分析和整理大量的復雜數據資料的技術。
白宮科學技術政策辦公室主任約翰•霍爾德倫(John Holdren)在一份聲明中指出:“我們今天推出的這一舉措有望提升大數據應用于科學研究、環境與生物醫學研究、教育和國家安全方面的能力。” 啟動助學金和研究項目旨在提高管理加工大數據集、利用大數據加速科學研究、鼓勵大學培養出更多高質量的數據科學家和工程師的核心技術水平。
一般而言,人們對大數據技術的需求不僅包括計算機領域的,而且也包括科學領域的。通過人們對大型數據集的微調查和深入分析,數據科學興起熱潮,并改變了科學研究的方向和速度。例如,針對部分帶有特定遺傳標記的患者群的醫學研究,正在從廣泛的基礎治療領域轉向針對性強的醫療測試領域。
大數據健康護理啟動Kyruus首席數據科學家兼前物理學家普尼特•巴特拉(Puneet Batra)表示:“科學家們已經使用了很長一段時間的大數據。目前的新形勢是,數據發展規模急劇膨脹,而這又是對基礎設施的挑戰。”科學的某些領域十分倚重大數據集,比如高能粒子物理或核聚變研究。
IBM機器學習部門的經理理查德•勞倫斯(Richard Lawrence)表示,由于有來源于不同渠道的可利用信息,大量數據的收集與分析已然在研究和商業等領域越來越普遍了。他還指出,“大數據直接把焦點從某些科學學科轉移到那些基礎設施齊全的大型企業和民營企業上,是因為大數據正變得越來越普遍化和社會化了”。而氣候科學的研究人員現在有許多來自傳感器的觀測數據,這有利于更好地創建模型來預測氣候變化的影響。
數據科學
美國科學發展協會與科學和技術政策辦公室、國家科學基金會、美國國立衛生研究院、國防部和能源部、 DARPA部門,以及美國地質調查所于今天下午共同舉辦新聞發布會,會上討論了關于大數據研究的挑戰和可能性。雖然不同機構的目標不同,但所有的研究計劃都旨在提高人們收集和使用大量信息的能力。
國防部已在新的研究項目上投資了60萬美元,這項研究的主要目標是分析不同語言的文字和改善自治系統,比如說可以收集遙感數據并進行現場操作的機器人。與此同時,國家衛生研究院建立了一個200 TB數據的人類遺傳變異網站,其數據存儲在Amazon Web服務器上,并且允許研究人員免費查詢和分析。但現在,研究人員需要一種大型數據集,這種大型數據集要求有最先進的軟件工具和高性能的計算。
Kyruus的工作人員巴特拉稱:“數據密度已發生改變。你從機器、個人或頻繁的時間間隔內的物理現象中去收集信息,從而使數據規模變大。因此有了這個工具后,你就能開始分析它。”