美國教育部教育技術(shù)辦公室表示:“大數(shù)據(jù)分析能夠發(fā)現(xiàn)學(xué)習(xí)在線課程的學(xué)生是否走入誤區(qū),并幫助他們調(diào)整方向。這些先進(jìn)分析還有可能根據(jù)按鍵點(diǎn)擊模式判斷學(xué)生是否對(duì)當(dāng)前課程感到無聊,然后重新獲取他們的注意力。
波士頓馬拉松爆炸案的偵辦就是很好的例子。大數(shù)據(jù)技術(shù)讓警方得以快速分析48萬多幅圖像。這些圖像即為非結(jié)構(gòu)化數(shù)據(jù)。對(duì)嫌疑犯的詳細(xì)描述使分析人員可以撰寫代碼和算法,對(duì)圖像進(jìn)行迅速分析,尋找異常情況和特定模式。從傳感器信息中自動(dòng)篩查犯罪行為令實(shí)時(shí)分析得以實(shí)現(xiàn),縮短了決策時(shí)間,減少了接觸敏感數(shù)據(jù)的人員或系統(tǒng)數(shù)量。
原文翻譯:
在采用大數(shù)據(jù)策略方面,雖然私營部門發(fā)揮了模范帶頭作用,但公共部門也做出了不少成績。本文列舉了美國聯(lián)邦機(jī)構(gòu)和地方政府機(jī)構(gòu)制定和運(yùn)用大數(shù)據(jù)策略的幾個(gè)例子,涵蓋欺詐檢測(cè)、金融市場(chǎng)分析、健康研究、政府監(jiān)督、教育、犯罪學(xué)、環(huán)保和能源勘探等領(lǐng)域。
引言
本文是一組系列博客的第四篇文章。這組文章探討的是政府在實(shí)施大數(shù)據(jù)策略時(shí)所面臨的若干問題。第一篇文章解釋了數(shù)據(jù)的“大”為什么應(yīng)該按照復(fù)雜性而不僅僅是體量來定義。第二篇和第三篇文章講述了大數(shù)據(jù)策略為公共機(jī)構(gòu)擺出的四個(gè)挑戰(zhàn)。
以下是美國聯(lián)邦機(jī)構(gòu)和非聯(lián)邦機(jī)構(gòu)積極制定和運(yùn)用大數(shù)據(jù)策略的幾個(gè)例子。希望這些例子能啟發(fā)大家利用自己手中的新一代分析工具探索各種可能性。
例 1 :大數(shù)據(jù)技術(shù)如何助力欺詐檢測(cè)和金融市場(chǎng)分析
· 美國社會(huì)保障局 (SSA)利用大數(shù)據(jù)策略來分析大量的非結(jié)構(gòu)化 傷殘索賠 數(shù)據(jù)。SSA現(xiàn)在能夠更快、更高效地處理醫(yī)學(xué)分類和預(yù)期診斷,重塑整個(gè)決策過程,更好地識(shí)別可疑的不實(shí)索賠。
· 美國聯(lián)邦住房管理局 (FHA)在利用大數(shù)據(jù)分析來管理正向現(xiàn)金流基金方面擁有23年的經(jīng)驗(yàn)。在房地產(chǎn)泡沫破裂期間,F(xiàn)HA是唯一一家不需要救助的次貸保險(xiǎn)機(jī)構(gòu)。他們運(yùn)用大數(shù)據(jù)分析來幫助 預(yù)測(cè)違約率 、償還率和索賠率。另外,他們還利用大數(shù)據(jù)技術(shù)為可能出現(xiàn)的場(chǎng)景構(gòu)建現(xiàn)金流模型,以確定維持正向現(xiàn)金流所需的保費(fèi)。
· 美國證券交易委員會(huì) (SEC)運(yùn)用大數(shù)據(jù)策略來監(jiān)督金融市場(chǎng)活動(dòng)。他們利用自然語言處理程序和網(wǎng)絡(luò)分析來幫助 識(shí)別違規(guī)交易活動(dòng) 。
例 2 :大數(shù)據(jù)技術(shù)如何助力健康相關(guān)研究
· 美國食品藥物管理局 (FDA)在全國各地的很多測(cè)試相關(guān)實(shí)驗(yàn)室里都部署了大數(shù)據(jù)技術(shù),以便研究 食源性疾病的模式 。這套數(shù)據(jù)庫屬于該機(jī)構(gòu)的技術(shù)轉(zhuǎn)讓項(xiàng)目,能讓FDA更快地對(duì)進(jìn)入食品供應(yīng)的受污染產(chǎn)品作出反應(yīng),這類產(chǎn)品在美國導(dǎo)致每年有32.5萬人因食源性疾病住院治療,3,000人死亡。
· 美國國立衛(wèi)生研究院 (NIH)在2012年啟動(dòng)了“從大數(shù)據(jù)到知識(shí)”(BD2K)計(jì)劃。BD2K是一項(xiàng)不僅限于該院的計(jì)劃,旨在使 生物醫(yī)學(xué)研究 成為一項(xiàng)數(shù)字研究事業(yè),促進(jìn)新知識(shí)的發(fā)現(xiàn)和運(yùn)用,最大程度地提升社會(huì)參與度。從生物醫(yī)學(xué)大數(shù)據(jù)中獲取豐富信息的能力,將增進(jìn)我們對(duì)人類健康和疾病的了解。然而,適當(dāng)工具的匱乏、糟糕的數(shù)據(jù)可達(dá)性和培訓(xùn)的不足妨礙了我們有效地整合研究力量。BD2K將幫助NIH應(yīng)對(duì)這個(gè)挑戰(zhàn)。
· 美國醫(yī)學(xué)研究所 (IOM)和 衛(wèi)生及公共服務(wù)部 (HHS)在2010年3月召集了一小群來自白宮、聯(lián)邦機(jī)構(gòu)、學(xué)術(shù)界、社會(huì)部門、公共衛(wèi)生團(tuán)體、信息技術(shù)公司、大企業(yè)和醫(yī)療服務(wù)系統(tǒng)的領(lǐng)導(dǎo)者,商討新的 社區(qū)健康數(shù)據(jù)計(jì)劃 的建立事宜。2010年6月,IOM和HHS舉辦了“社區(qū)健康數(shù)據(jù)論壇:利用信息的力量來改善健康”。此次公共論壇的目的是進(jìn)一步推動(dòng)創(chuàng)新者對(duì)社區(qū)健康數(shù)據(jù)的使用,讓個(gè)人和社區(qū)都能為自身的健康做出明智的選擇。這些初始會(huì)議現(xiàn)在已經(jīng)發(fā)展成為正式的全國性大會(huì)HealthDatapalooza,致力于開放健康數(shù)據(jù),將企業(yè)、初創(chuàng)公司、學(xué)者、政府機(jī)構(gòu)和個(gè)人聯(lián)合起來,通過對(duì)健康數(shù)據(jù)的開創(chuàng)性和有效利用,改善患者的健康狀況。
例 3 :大數(shù)據(jù)技術(shù)如何助力政府監(jiān)督和教育
· 通告和評(píng)論項(xiàng)目 (Notice andComment project)使公眾可以方便快捷地查看400多萬份政府文件,包括《聯(lián)邦公報(bào)》(FederalRegister)發(fā)表的聯(lián)邦法規(guī)和地方政府發(fā)布的通告。該項(xiàng)目利用先進(jìn)分析和自然語言處理來攝取政府文件, 追蹤政策、法律和規(guī)章的變化 。用戶可以輕而易舉地對(duì)擬訂中的聯(lián)邦法規(guī)進(jìn)行評(píng)論或投票。網(wǎng)站數(shù)據(jù)每天都會(huì)更新,實(shí)時(shí)顯示新的提案和趨勢(shì)。在提案變成法律之前,用戶可以利用網(wǎng)站內(nèi)部集成的社交媒體和網(wǎng)上的最佳寫作技巧來有效地宣揚(yáng)他們的觀點(diǎn),尋求其他人的支持。
· 美國 教育部 利用大數(shù)據(jù)挖掘和學(xué)習(xí)分析來 改善教學(xué) 。美國教育部教育技術(shù)辦公室表示:“大數(shù)據(jù)分析能夠發(fā)現(xiàn)學(xué)習(xí)在線課程的學(xué)生是否走入誤區(qū),并幫助他們調(diào)整方向。這些先進(jìn)分析還有可能根據(jù)按鍵點(diǎn)擊模式判斷學(xué)生是否對(duì)當(dāng)前課程感到無聊,然后重新獲取他們的注意力。由于這些數(shù)據(jù)是實(shí)時(shí)收集的,因此很有希望通過多個(gè)反饋回路實(shí)現(xiàn)持續(xù)改善。這些反饋回路的時(shí)間跨度不一——對(duì)學(xué)生來說是立刻思考下一個(gè)問題,對(duì)老師來說是每天安排第二天的教學(xué),對(duì)校長來說是每月評(píng)估進(jìn)展,對(duì)地方官員來說是每年評(píng)估總體的學(xué)校教育改善情況。”
例 4 :大數(shù)據(jù)技術(shù)如何助力打擊犯罪
· 美國國土安全部 (DHS)是證明公共部門需要大數(shù)據(jù)策略的好例子。該機(jī)構(gòu)的組織形式突顯了在許多政府機(jī)構(gòu)之間進(jìn)行數(shù)據(jù)互通和整合的必要性。DHS不僅提供了很多如何進(jìn)行有效整合的例子,也提供了很多如何更加成功地實(shí)現(xiàn)數(shù)據(jù)互通的經(jīng)驗(yàn)教訓(xùn)。
· 美國各地的州和地方執(zhí)法部門在運(yùn)用大數(shù)據(jù)策略方面有不少亮點(diǎn)。 波士頓馬拉松爆炸案 的偵辦就是很好的例子。大數(shù)據(jù)技術(shù)讓警方得以快速分析48萬多幅圖像。這些圖像即為非結(jié)構(gòu)化數(shù)據(jù)。對(duì)嫌疑犯的詳細(xì)描述使分析人員可以撰寫代碼和算法,對(duì)圖像進(jìn)行迅速分析,尋找異常情況和特定模式。從傳感器信息中自動(dòng)篩查犯罪行為令實(shí)時(shí)分析得以實(shí)現(xiàn),縮短了決策時(shí)間,減少了接觸敏感數(shù)據(jù)的人員或系統(tǒng)數(shù)量。
例 5 :大數(shù)據(jù)技術(shù)如何助力環(huán)保和能源勘探
· 美國國家航空航天局 (NASA)和 美國林務(wù)局 (U.S. Forest Service)幾年來一直在努力 加強(qiáng)數(shù)據(jù)互通 和研究合作,讓自己可以更準(zhǔn)確地預(yù)測(cè)天氣、土壤狀況和森林火險(xiǎn)。這項(xiàng)努力在數(shù)據(jù)要求和數(shù)據(jù)治理的協(xié)調(diào)方面事先下了很大功夫。除了先進(jìn)的技術(shù)以外,還需要相關(guān)人員更好地理解問題和協(xié)調(diào)可用數(shù)據(jù)的使用,以制定出一套整體策略。
· 深水地平線 (Deep WaterHorizon)鉆井平臺(tái)漏油事故的應(yīng)對(duì)措施就是依靠大數(shù)據(jù)互通來阻止原油泄漏,遏制污染物,對(duì)損害作出響應(yīng)。私營部門和公共部門合作,在兩周內(nèi)就完成了數(shù)據(jù)的整合,使各個(gè)工作組可以分析天氣、海洋和植物數(shù)據(jù)。大數(shù)據(jù)技術(shù)被用來預(yù)測(cè)哪些區(qū)域可能受到影響,并幫助確定應(yīng)該向哪里派遣清理人員。
· 美國國家大氣研究中心 (NationalCenter for Atmospheric Research)制定了一套大數(shù)據(jù)策略,將公用事業(yè)單位、大學(xué)和能源業(yè)的研究和數(shù)據(jù)整合起來,以便更準(zhǔn)確地預(yù)報(bào)天氣和 預(yù)測(cè)能源的供應(yīng)與需求 。通過研究天氣和大氣模型,分析師可以讓可再生能源的生產(chǎn)和使用變得更加可靠和高效。他們把數(shù)據(jù)納入天氣實(shí)時(shí)分析模型,揭示能源生產(chǎn)和能源需求的重要信息。
原文:Five Examples of How Federal Agencies Use Big Data
來源:http://www.businessofgovernment.org/BigData3Blog.html