大數(shù)據(jù)有可能從根本上改善所有美國(guó)人的生活。為了從資源豐富的大數(shù)據(jù)中獲得最大的效益,奧巴馬政府于2012年3月29日推出了“大數(shù)據(jù)研究與開(kāi)發(fā)計(jì)劃”。在此基礎(chǔ)上,美國(guó)又于2016年5月發(fā)布了《聯(lián)邦大數(shù)據(jù)研究與開(kāi)發(fā)戰(zhàn)略計(jì)劃》(以下簡(jiǎn)稱“計(jì)劃”),其目標(biāo)是對(duì)聯(lián)邦機(jī)構(gòu)的大數(shù)據(jù)相關(guān)項(xiàng)目和投資進(jìn)行指導(dǎo)。該“計(jì)劃”主要圍繞代表大數(shù)據(jù)研發(fā)關(guān)鍵領(lǐng)域的七個(gè)戰(zhàn)略進(jìn)行,包括促進(jìn)人類對(duì)科學(xué)、醫(yī)學(xué)和安全所有分支的認(rèn)識(shí);確保美國(guó)在研發(fā)領(lǐng)域繼續(xù)發(fā)揮領(lǐng)導(dǎo)作用;通過(guò)研發(fā)來(lái)提高美國(guó)和世界解決緊迫社會(huì)和環(huán)境問(wèn)題的能力。
戰(zhàn)略1:
利用新興的大數(shù)據(jù)基礎(chǔ)、技巧和技術(shù)來(lái)創(chuàng)造下一代能力。計(jì)算和數(shù)據(jù)分析的進(jìn)步將提供新的抽象概念來(lái)處理復(fù)雜的數(shù)據(jù),并能夠簡(jiǎn)化可擴(kuò)展性和并行系統(tǒng)的編程,與此同時(shí)還可以實(shí)現(xiàn)最大的性能。計(jì)算機(jī)科學(xué)、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)領(lǐng)域的根本性進(jìn)步將促進(jìn)靈活、迅速響應(yīng)和預(yù)測(cè)性的數(shù)據(jù)分析系統(tǒng)的發(fā)展。深入研究眾包、公民科學(xué)和集體分布式任務(wù)等社會(huì)計(jì)算將有助于發(fā)展可以使人類進(jìn)行可能超出計(jì)算機(jī)能力范圍的任務(wù)。與數(shù)據(jù)交互和數(shù)據(jù)可視化的新技術(shù)和方法將強(qiáng)化“人類—數(shù)據(jù)”的聯(lián)系(接口)。
戰(zhàn)略2:
支持研發(fā),以更好地探索和理解數(shù)據(jù)和知識(shí)的可信度,實(shí)現(xiàn)更佳決策,促進(jìn)突破性發(fā)現(xiàn)并采取有信心的行動(dòng)。在數(shù)據(jù)驅(qū)動(dòng)型決策中提高透明度需要提供技術(shù)和工具支持,包括可以在決策過(guò)程中顯示詳細(xì)審計(jì)信息的工具。另外,還需要對(duì)元數(shù)據(jù)框架進(jìn)行研究以保證數(shù)據(jù)的可信性,包括記錄上下文和語(yǔ)義數(shù)據(jù)。在使用機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)型決策和發(fā)現(xiàn)系統(tǒng)時(shí),跨學(xué)科研究是必要的,這樣才能研究清楚如何才能最有效地使用數(shù)據(jù)來(lái)支持和提高人類的判斷力。
戰(zhàn)略3:
建立和加強(qiáng)對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的研究,使大數(shù)據(jù)創(chuàng)新可以為機(jī)構(gòu)使命提供支持。共同的基準(zhǔn)、標(biāo)準(zhǔn)和指標(biāo)對(duì)于一個(gè)運(yùn)作良好的網(wǎng)絡(luò)基礎(chǔ)設(shè)施生態(tài)系統(tǒng)來(lái)說(shuō)是必不可少的。參與式設(shè)計(jì)也是不可或缺的,它可以被用于優(yōu)化基礎(chǔ)設(shè)施的實(shí)用性并能將其影響降到最低。教育和培訓(xùn)對(duì)于個(gè)人能力的構(gòu)建來(lái)說(shuō)也是至關(guān)重要的:用戶必須得到正確的教育和培訓(xùn),這樣才能充分利用提供給他們的工具。
戰(zhàn)略4:
通過(guò)促進(jìn)數(shù)據(jù)共享和管理政策來(lái)提高數(shù)據(jù)的價(jià)值。大數(shù)據(jù)的規(guī)模和異質(zhì)性為數(shù)據(jù)共享帶來(lái)了巨大挑戰(zhàn),因此需要鼓勵(lì)共享源數(shù)據(jù)、接口、元數(shù)據(jù)和標(biāo)準(zhǔn),鼓勵(lì)相關(guān)基礎(chǔ)設(shè)施提高互操作性,提高現(xiàn)有數(shù)據(jù)的可訪問(wèn)性和價(jià)值,并增強(qiáng)結(jié)合數(shù)據(jù)集進(jìn)行新的分析的能力。研究“人類—數(shù)據(jù)”的聯(lián)系(接口)來(lái)說(shuō)是必要的,研究可以支持靈活、高效和可用的數(shù)據(jù)接口的發(fā)展,適應(yīng)不同的用戶群體的特定需求。
戰(zhàn)略5:
了解大數(shù)據(jù)的收集、共享和使用方面的隱私、安全和道德問(wèn)題。隱私、安全和道德問(wèn)題是大數(shù)據(jù)創(chuàng)新生態(tài)系統(tǒng)中的關(guān)鍵因素。對(duì)于保護(hù)隱私和澄清數(shù)據(jù)所有權(quán)來(lái)說(shuō),新的政策解決方案可能也是必要的。當(dāng)高度分布式的網(wǎng)絡(luò)在大數(shù)據(jù)的應(yīng)用場(chǎng)景變得越來(lái)越普遍時(shí),技術(shù)和工具也需要被用于輔助評(píng)估數(shù)據(jù)的安全性和數(shù)據(jù)保護(hù)。國(guó)家必須在大數(shù)據(jù)中提倡道德觀念,確保技術(shù)不會(huì)傳播錯(cuò)誤或?qū)δ承┤后w造成不利(無(wú)論是明示或暗示)。探索道德問(wèn)題的大數(shù)據(jù)研究,將使各方利益相關(guān)者在關(guān)注大數(shù)據(jù)創(chuàng)新的效用、風(fēng)險(xiǎn)和成本的同時(shí),更好地考慮價(jià)值和社會(huì)倫理。
戰(zhàn)略6:
改善全國(guó)的大數(shù)據(jù)教育和培訓(xùn)局面,以滿足對(duì)更廣泛勞動(dòng)力深層分析型人才和分析能力日益增長(zhǎng)的需求。制定一個(gè)全面的教育戰(zhàn)略是必要的,這可以滿足大數(shù)據(jù)領(lǐng)域?qū)趧?dòng)力不斷增長(zhǎng)的需求,還能確保美國(guó)保持經(jīng)濟(jì)競(jìng)爭(zhēng)力。隨著科學(xué)研究領(lǐng)域的數(shù)據(jù)越來(lái)越豐富,科學(xué)家需得到機(jī)會(huì)進(jìn)一步完善自身的數(shù)據(jù)科學(xué)技能。所有部門的員工和管理人員都需要參加各種培訓(xùn),包括“新兵訓(xùn)練營(yíng)”、專業(yè)研討會(huì)和證書(shū)課程,以學(xué)習(xí)與工作相關(guān)的大數(shù)據(jù)知識(shí)。還需要開(kāi)設(shè)更多的基礎(chǔ)性大學(xué)課程和其他短期培訓(xùn)來(lái)幫助將更多民眾改造成為具備數(shù)據(jù)能力的公民。數(shù)據(jù)科學(xué)訓(xùn)練應(yīng)該通過(guò)在線課程、公民科學(xué)項(xiàng)目與中小學(xué)教育覆蓋到所有人。
戰(zhàn)略7:
創(chuàng)建和加強(qiáng)國(guó)家大數(shù)據(jù)創(chuàng)新生態(tài)系統(tǒng)的聯(lián)系。應(yīng)該建立持續(xù)的機(jī)制來(lái)提高聯(lián)邦機(jī)構(gòu)在大數(shù)據(jù)領(lǐng)域進(jìn)行合作的能力。第一種可能的機(jī)制是建立跨機(jī)構(gòu)“開(kāi)發(fā)沙盒”或測(cè)試平臺(tái),它們可以幫助聯(lián)邦機(jī)構(gòu)合作開(kāi)發(fā)新技術(shù),并實(shí)現(xiàn)研發(fā)成果的產(chǎn)業(yè)化。第二種機(jī)制是制定政策,允許數(shù)據(jù)進(jìn)行跨部門邊界的快速和動(dòng)態(tài)共享,以應(yīng)對(duì)緊急優(yōu)先事項(xiàng),如國(guó)家災(zāi)害。第三種機(jī)制是建立大數(shù)據(jù)“基準(zhǔn)中心”,專注于重大挑戰(zhàn)的應(yīng)用,并幫助確定必要的數(shù)據(jù)集、分析工具和互操作性要求,以此來(lái)實(shí)現(xiàn)關(guān)鍵的國(guó)家優(yōu)先目標(biāo)。第四,需要建立一個(gè)由各聯(lián)邦機(jī)構(gòu)從業(yè)者組成的強(qiáng)有力團(tuán)體,以此來(lái)促進(jìn)快速創(chuàng)新,為研究投資帶來(lái)最大的回報(bào)。
美國(guó):大數(shù)據(jù)國(guó)家戰(zhàn)略
“數(shù)據(jù)是一項(xiàng)有價(jià)值的國(guó)家資本,應(yīng)對(duì)公眾開(kāi)放,而不是把其禁錮在政府體制內(nèi)。”
——美國(guó)聯(lián)邦政府
作為大數(shù)據(jù)的策源地和創(chuàng)新引領(lǐng)者,美國(guó)大數(shù)據(jù)發(fā)展一直走在全球最前面。
此中關(guān)鍵:
1、動(dòng)力
首先是多年的技術(shù)沉淀和創(chuàng)新積累,包括從計(jì)算機(jī)革命開(kāi)始以來(lái)的硅谷創(chuàng)新力和影響力,以及一大批的領(lǐng)軍企業(yè),包括谷歌、微軟、EMC、SAP、微軟這樣的巨頭,也包括像Facebook、Splunk、Teradata這些創(chuàng)新的公司,硅谷精神和創(chuàng)新力量在美國(guó)大數(shù)據(jù)發(fā)展方面的作用,是任何其他國(guó)家短期都無(wú)法復(fù)制和匹敵的巨大力量。
而且,自上世紀(jì)以來(lái)美國(guó)國(guó)會(huì)、政府先后出臺(tái)一系列法規(guī),對(duì)數(shù)據(jù)的收集、發(fā)布、使用和管理等諸環(huán)節(jié)都做出了具體的規(guī)定。經(jīng)過(guò)幾十年的修改完善,如今美國(guó)數(shù)據(jù)、信用和隱私已形成較為成熟的法律框架和道德規(guī)范。2010年,美國(guó)國(guó)會(huì)通過(guò)更新法案,進(jìn)一步提高了數(shù)據(jù)采集精度和上報(bào)頻度,使得美國(guó)數(shù)據(jù)采集和匯聚體系更加成熟。
美國(guó)企業(yè)也擁有對(duì)于數(shù)據(jù)重視和應(yīng)用的歷史傳統(tǒng),IT基礎(chǔ)設(shè)施的完善,以及各種精準(zhǔn)營(yíng)銷理論和實(shí)踐美國(guó)都是走在世界前列,比如基于消費(fèi)數(shù)據(jù)、信用卡數(shù)據(jù)挖掘的精準(zhǔn)營(yíng)銷等,還有電話、DM印刷品和郵件營(yíng)銷在美國(guó)都很興盛,隨著互聯(lián)網(wǎng)興起,谷歌、IBM、YAHOO等美國(guó)企業(yè)對(duì)基于網(wǎng)絡(luò)的精準(zhǔn)營(yíng)銷又是走在全球的前列。因而大數(shù)據(jù)最典型案例中,就包括傳統(tǒng)企業(yè)沃爾瑪“啤酒+尿布”案例,以及谷歌公司通過(guò)大數(shù)據(jù)分析成功地預(yù)測(cè)流感爆發(fā)等。
更加重要的是美國(guó)政府?dāng)?shù)據(jù)開(kāi)放和支持力量。美國(guó)政府的數(shù)據(jù)開(kāi)放一直是走在全球前列的,尤其是在奧巴馬政府簽署《透明和開(kāi)放的政府》文件之后。2012年5月美國(guó)數(shù)字政府戰(zhàn)略發(fā)布,更是提出要通過(guò)協(xié)調(diào)化的方式,以信息和客戶為中心,改變聯(lián)邦政府工作方式,為美國(guó)民眾提供更優(yōu)公共服務(wù)。其中關(guān)鍵,就是政府必須保證美國(guó)民眾可以隨時(shí)隨地通過(guò)任何平臺(tái)或設(shè)備獲取政府信息和公共服務(wù)。
2、數(shù)據(jù)開(kāi)放
美國(guó)最重要的數(shù)據(jù)開(kāi)放平臺(tái)就是奧巴馬政府在2009年推出的Data.gov,Data.gov 也是美國(guó)“開(kāi)放政府”承諾的關(guān)鍵部分。依照原始、地理數(shù)據(jù)和數(shù)據(jù)工具三個(gè)門類,截至2012年11月,Data.gov共開(kāi)放出了388529項(xiàng)原始數(shù)據(jù)和地理數(shù)據(jù),涵蓋了農(nóng)業(yè)、 氣象、金融、就業(yè)、人口統(tǒng)計(jì)、教育、醫(yī)療、交通、能源等大約50個(gè)門類,匯集了“從家庭和企業(yè)能耗趨勢(shì)分析到全球?qū)崟r(shí)地震通知等,甚至還可以查詢從好奇號(hào)火星漫步者發(fā)回來(lái)的數(shù)據(jù)中得知火星的天氣情況”。為方便公眾使用和分析,Data.gov平臺(tái)還加入了數(shù)據(jù)的分級(jí)評(píng)定、高級(jí)搜索、用戶交流以及和社會(huì)交網(wǎng)站互動(dòng)等新功能,比如在Data.gov上提供的白宮訪客搜索工具,不僅能夠搜索到訪客信息,并可以將白宮訪客與其他微博、社交網(wǎng)站等進(jìn)行關(guān)聯(lián),進(jìn)一步增加了訪客的透明度。
為了更方便民眾使用,方便應(yīng)用領(lǐng)域的開(kāi)發(fā)者可以利用這些數(shù)據(jù)開(kāi)發(fā)應(yīng)用滿足公共需求或者進(jìn)行創(chuàng)業(yè),Data.gov還匯集了1264個(gè)應(yīng)用程序和軟件工具、103個(gè)手機(jī)應(yīng)用插件。另外,Data.gov還發(fā)布了政府API索引,使得這些資源可以更易找到和便于使用。通過(guò)開(kāi)放API接口,Data.gov讓政府的信息和服務(wù)交付更加便捷,也讓公眾和企業(yè)家在構(gòu)建更佳政府、提升服務(wù)的過(guò)程中成為合作伙伴。美國(guó)政府也希望并鼓勵(lì)公眾(開(kāi)發(fā)者、創(chuàng)業(yè)者和企業(yè)家)能夠積極加入進(jìn)來(lái),成為這一進(jìn)程中的一部分。據(jù)報(bào)道有很多的公司已經(jīng)利用data.gov上提供的氣象信息來(lái)提供服務(wù),另外一些公司則基于data.gov上的地理位置信息,提供基于位置的服務(wù)來(lái)盈利。
今年起美國(guó)還和印度一道,對(duì)data.gov實(shí)行了開(kāi)源,把代碼托管到GitHub上以供各國(guó)的開(kāi)發(fā)者使用或者根據(jù)需要修改。通過(guò)構(gòu)建OGPL平臺(tái),提供開(kāi)源的政府平臺(tái)代碼并允許任何城市、組織或者政府機(jī)構(gòu)創(chuàng)建開(kāi)放站點(diǎn),美國(guó)政府可以進(jìn)一步推動(dòng)數(shù)據(jù)開(kāi)放運(yùn)動(dòng)進(jìn)程。美國(guó)政府還成立了“數(shù)字服務(wù)創(chuàng)新中心”,開(kāi)發(fā)了Sites.USA.Gov網(wǎng)站來(lái)幫助各機(jī)構(gòu)建設(shè)即插即用型網(wǎng)站,同時(shí)政府出臺(tái)移動(dòng)應(yīng)用程序開(kāi)發(fā)項(xiàng)目,幫助各機(jī)構(gòu)對(duì)移動(dòng)應(yīng)用程序進(jìn)行規(guī)劃、測(cè)試、開(kāi)發(fā)和發(fā)布,確保更加安全和高效。
美國(guó)政府提出,數(shù)據(jù)是一項(xiàng)有價(jià)值的國(guó)家資本,應(yīng)對(duì)公眾開(kāi)放,而不是把其禁錮在政府體制內(nèi)。例如在美國(guó)www.fedspending.org網(wǎng)站上,公眾能夠逐條跟蹤、記錄、分析聯(lián)邦政府每一筆財(cái)政支出。另外,美國(guó)政府?dāng)?shù)據(jù)開(kāi)放也跟美國(guó)民眾對(duì)于個(gè)人隱私和自由的重視和立法分不開(kāi)的,正如涂子沛在《大數(shù)據(jù)》一書(shū)中所指出的,和美國(guó)人“用納稅人的錢收集的數(shù)據(jù)應(yīng)該免費(fèi)提供給納稅人使用”觀念也密切相關(guān)。
3、數(shù)據(jù)服務(wù)
為了確保美國(guó)民眾能方便快捷地找到政府服務(wù)欄目,美國(guó)在各聯(lián)邦政府層面實(shí)施了“數(shù)字分析項(xiàng)目”。“這是政府IT部門第一次摸清公眾都在網(wǎng)站上尋找什么信息、在哪里尋找這些信息,以及他們是否能夠順利找到信息等情況。”政府IT部門還對(duì)聯(lián)邦政府網(wǎng)站在移動(dòng)設(shè)備上的使用進(jìn)行了優(yōu)化,并開(kāi)發(fā)了移動(dòng)應(yīng)用程序,確保美國(guó)公民隨時(shí)、隨地、通過(guò)任何設(shè)備都能獲取政府信息。例如,美國(guó)人力管理辦公室開(kāi)發(fā)的USA Jobs應(yīng)用程序,可以方便求職者通過(guò)移動(dòng)設(shè)備查找和申請(qǐng)職位;交通部開(kāi)發(fā)的Safer Bus應(yīng)用程序,可以讓老百姓查詢到公交公司的安全行駛記錄,也可通過(guò)手機(jī)提交投訴建議。
佛羅里達(dá)州邁阿密戴德縣將數(shù)十種關(guān)鍵縣政工作和邁阿密市緊密聯(lián)系起來(lái),幫助政府在制定治理水資源、減少交通擁堵和提升公共安全等方面決策時(shí)提供了更好的信息支撐;美國(guó)中央情報(bào)局的首席技術(shù)官格斯·漢特在舊金山舉行的一次討論會(huì)上解釋的大數(shù)據(jù)技術(shù)對(duì)追蹤恐怖分子和監(jiān)控社會(huì)情緒的作用。漢特認(rèn)為,就像可口可樂(lè)等消費(fèi)公司借助數(shù)據(jù)分析掌握消費(fèi)者習(xí)慣一樣,中情局也通過(guò)大數(shù)據(jù)技術(shù)來(lái)尋找恐怖分子的蹤跡。西雅圖兒童醫(yī)院通過(guò)應(yīng)用可視化數(shù)據(jù)分析技術(shù),有效減少了醫(yī)療事故,幫助醫(yī)院節(jié)省了300萬(wàn)美元的供應(yīng)鏈成本。華爾街“德溫特資本市場(chǎng)”公司則通過(guò)分析3.4億微博賬戶的留言,判斷民眾情緒,并依據(jù)人們高興時(shí)買股票、焦慮時(shí)拋售股票的規(guī)律,決定公司買賣股票的時(shí)機(jī),從而獲取盈利。這些都是美國(guó)大數(shù)據(jù)各個(gè)領(lǐng)域應(yīng)用的典型案例。
4、推進(jìn)
開(kāi)放數(shù)據(jù)、創(chuàng)新驅(qū)動(dòng)以及技術(shù)研發(fā)支持下,美國(guó)大數(shù)據(jù)的研究和應(yīng)用已是走在全球前列。2013年5月,奧巴馬政府更是宣布了“大數(shù)據(jù)的研究和發(fā)展計(jì)劃。”提出“通過(guò)提高我們從大型復(fù)雜的數(shù)字?jǐn)?shù)據(jù)集中提取知識(shí)和觀點(diǎn)的能力,承諾幫助加快在科學(xué)與工程中的步伐,加強(qiáng)國(guó)家安全,并改變教學(xué)研究”。根據(jù)這一計(jì)劃,美國(guó)希望利用大數(shù)據(jù)技術(shù)在多個(gè)領(lǐng)域?qū)崿F(xiàn)突破,包括科研教學(xué)、環(huán)境保護(hù)、工程技術(shù)、國(guó)土安全、生物醫(yī)藥等,具體的研發(fā)計(jì)劃涉及了美國(guó)國(guó)家科學(xué)基金會(huì)、國(guó)家衛(wèi)生研究院、國(guó)防部、能源部、國(guó)防部高級(jí)研究局、地質(zhì)勘探局等6個(gè)聯(lián)邦部門和機(jī)構(gòu)。在斯坦福這樣的大學(xué)里也開(kāi)始開(kāi)設(shè)諸如機(jī)器學(xué)習(xí)這樣全新的課程,培養(yǎng)下一代的“數(shù)據(jù)科學(xué)家”。伯克利加州大學(xué)、迪肯大學(xué)等大學(xué)也專門開(kāi)設(shè)了研究大數(shù)據(jù)的相關(guān)課程。如今,美國(guó)不僅是全球首個(gè)將大數(shù)據(jù)從商業(yè)行為上升到國(guó)家意志和國(guó)家戰(zhàn)略的國(guó)家,也是數(shù)據(jù)科學(xué)家和面向未來(lái)的大數(shù)據(jù)人才儲(chǔ)備啟動(dòng)最早的國(guó)家。
2013年2月27日,由 TechAmerica Foundation 發(fā)布的一項(xiàng)新研究顯示,87%的聯(lián)邦政府 IT官員以及75%的州政府IT官員均認(rèn)為,大數(shù)據(jù)對(duì)政府工作發(fā)揮著立竿見(jiàn)影的實(shí)際作用。而由民意調(diào)查機(jī)構(gòu)Penn Schoen Berland進(jìn)行的調(diào)查顯示,在受訪的近200位聯(lián)邦I(lǐng)T官員中,有83%的聯(lián)邦政府IT官員表示“大數(shù)據(jù)解決方案可幫助政府削減至少10%的聯(lián)邦預(yù)算”,這些受訪官員還相信,“大數(shù)據(jù)還能通過(guò)改善醫(yī)療服務(wù),創(chuàng)造挽救生命的奇跡,并可以降低犯罪率并提高生活品質(zhì)”。
美國(guó)商務(wù)部CIO Simon Szykman表示:“(在美國(guó))我們不存在挑戰(zhàn)的領(lǐng)域之一就是我們生成數(shù)據(jù)的能力。我們生成數(shù)據(jù)的基本能力提升很大,從很大程度上講,這一能力已超越了我們處理數(shù)據(jù)、管理數(shù)據(jù)和轉(zhuǎn)移數(shù)據(jù)的能力。” 他認(rèn)為如何管理數(shù)據(jù),并將數(shù)據(jù)從一點(diǎn)轉(zhuǎn)移到另一點(diǎn),將是美國(guó)政府面臨的一大挑戰(zhàn)。而對(duì)全球來(lái)說(shuō),如何加工數(shù)據(jù),從數(shù)據(jù)中提煉出知識(shí),將數(shù)據(jù)轉(zhuǎn)化生產(chǎn)力都是最大的挑戰(zhàn)。