精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

歷史給的教訓:大數據時代的再次迷思

責任編輯:王李通

2013-06-15 22:32:06

摘自:太平洋電腦網

最近NSA竊聽門惹怒了全美人民,翻看新聞10條有7條是在跟進這個事情,雖然從我們的處境,看美國政府好戲有點阿Q精神。

最近NSA竊聽門惹怒了全美人民,翻看新聞10條有7條是在跟進這個事情,雖然從我們的處境,看美國政府好戲有點阿Q精神,但我們也應該思考一下為什么不能讓政府打著國家安全的旗幟任意行事。其實道理很簡單:誰都會犯錯,但如果政府犯錯,就必鑄成大錯。

「大數據」時刻準備著改造社會,從看病,到教娃,甚至可以教會汽車自己上路。數據正成為新的經濟推動力,和重要的生產資料。企業,政府,誰都能通過數據,給看著不得勁的東西來個優化。

但,凡事總有兩面性。「大數據」蠶食個人隱私。特別是,老子不就淘寶上搜了一下志玲姐嘛,連網易都給我推薦各種仿真玩具。這讓一個老問題顯得更加嚴重:看數據,拍腦袋的決策,往往錯誤百出。沒有比羅伯特?麥克馬拉的故事更適合說明這一點的了。

麥克馬拉是個數據狂。他在1960年代越戰戰事趨緊時,被任命為美國國防部長。他熱衷于收集任何他能得到的一切數據。通過嚴謹的統計學分析,他堅信可以從紛繁的復雜局勢中,得到正確的決策。世界在他的眼里就是一鍋混沌的數據湯,但通過描述,歸類,篩選,定量,最終能被人的意志所馴服。麥克馬拉尋找著真相,而真相就藏在數據中。他所收集的數據,其中就包括了「敵軍陣亡數字統計」(wiki)。

麥克馬拉在哈佛商學院念書的時候就培養了對數字的迷戀,而且他在24歲就成為了助教。二戰中,他在五角大樓挑選的精英團隊里找到了施展才華的機會,在一個叫做「統計控制」小組,他們分析從戰場獲得的數據,進而為世界上最大的官僚機構提供決策建議。在此之前,軍隊如若眼盲。比如,軍隊不知道機場的數量,發布,位置的情況。數據分析幫了大忙,從而使彈藥補給更有效率,在1943年就幫助節省了3.6億美元軍費開支。現代戰爭需要物資的合理高效分配,而麥克馬拉所在的團隊成就斐然。

戰后,這個團隊的成員,繼續在美國經濟領域施展才華。當時福特汽車正深陷危機之中,陷入絕境的亨利?福特二世把爛攤子交給他們。就和他們雖然不懂打仗,但也能幫了盟軍大忙一樣,他們對造車同樣一竅不通。但,他們仍然如魔法神童一般,硬是把福特汽車從倒閉邊緣救了回來。

麥克馬拉很快地位飛升,開始插手福特生產的各個方面。強迫工廠經理按照他的計劃生產,無論他的計劃是對是錯。當他命令所有庫存的同一型號的汽車零件,必須在新型號開始生產之前用完,憤怒的生產線經理干脆把老的零件就近扔到河里。工廠里開玩笑說,被扔在河里的50年代的老車,多到都可以讓人列隊過河了。

麥克馬拉在福特執政期間,曾強勢給福特汽車標配安全帶,但市場反響一般讓福特又回到了動力至上的老路。

麥克馬拉就是把理性和對數據的依賴置于直覺判斷之上的典型,他會用他的定量技巧去改造任何工業部門。1960年,他被任命為福特汽車主席,但這個位置干了沒幾周,他就被肯尼迪點將,成為美國防部長。

1960年,當麥克馬拉(肯尼迪身后)被任命為國防部長的時候,他自謙:我完全不勝任。

越南戰事逐步升級,美軍火燒屁股的時候,這場戰爭很明顯已經成為一場「面子戰爭」,而不是為了什么國家利益。美國的策略就是想逼迫越南土共回到談判桌上來。然而,衡量達到這個目的的進展,就是看敵軍陣亡數。越共陣亡數字每天都見報。對于鷹派來說,數字就是進展;對于反對派,這就是這場非正義戰爭的證據。陣亡數字成了定義那個時代的標志。

麥克馬拉依賴和迷戀這些。他梳著完美的大包頭,系著一絲不茍的領帶,覺得自己瞪著報表就能對千里之外的戰況了如指掌,好像靠這些計算和圖列,就能讓他得到堪比上帝般的,接近事實的標準方差。

1977年,也就是越戰結束后兩年。前駐西貢大使,Douglas Kinnard將軍,出版了一本意義重大的報告,叫做《戰爭經理人》,披露了數據量化決策的陷阱。僅有2%的美國將領認為「敵軍陣亡統計」能代表戰爭進展。「純屬扯淡!」書中寫道,「就是公然撒謊,部隊故意夸張數字,目的就是取悅那位無比熱衷于數字的麥克馬拉。」

美軍在越戰中對于數據的錯誤迷信,誤判,和對于信息的局限性的教訓,對即將到來的大數據時代是個很好的前車之鑒。我們手里的數據可能是很不可靠的,數據可能帶有主觀偏見,可能被錯誤的分析和使用。更糟糕的是,數據可能沒呈現它本該呈現的。

我們比想象地更容易被弊大于利的「數據執政」所統治。這種恐懼來自于,我們被無意識地被綁架在數據分析上,就算我們有理由相信有些分析根本就是錯的。想知道低收入家庭孩子的教育情況?用標準化測驗來衡量老師的表現,然后處罰老師和學校就行了。想預防恐怖主義襲擊?簡單,搞一張監視名單和禁止入境名單來管住領空就行了。想減肥,沒問題,下載一個App算一下消耗的卡路里,連健身房都不用去。

就算在大數據執政里,一些行家里手也常掉入陷阱。Google的一切都是基于數據。基于數據的戰略使他們走向今天的成功。但也時不時地給Google下套。兩位創始人,Larry Page和Sergey Brin,長期堅持對應聘者提供高考成績和畢業平均成績。他們認為,高考成績代表了一個人的發展潛力,而畢業成績代表他們所取得的成就。就算40多歲的老江湖也被要求提供相關成績,這讓他們徹底懵了。Google堅持這樣做,直到內部調查顯示,學校成績和工作業績之間沒有任何必然的關系為止。

Google應該多長個心眼。數據沒有留給個人在一生中做出改變的空間。數據把數據的增長當做智慧的拓展。但數據根本無法體現人性的復雜,衡量一個人的能力要比科學工程計算難得多。Google的兩位創始人也是從采取強調獨立性,而不是成績的蒙臺梭利教育方法(wiki)的學校出來的才子,用基于數據招聘的方法顯得很奇怪,因為照這樣的標準,從比爾?蓋茨到扎克伯格,就算是喬布斯也不可能被錄用,因為他們拿不出像樣的成績單。

Google嗑數據已經走火入魔。前Google高管Marissa Mayer來到Yahoo后,竟然要求員工測試41種不同的藍色,以決定哪種藍色是人們最常用的,并用在自己的網站的工具欄上。2009年,Google的頂級設計師 Douglas Bowman 憤然辭職,因為他沒法給所有事情定下明確的標準。

他說:「我最近的爭執,是關于一個邊框應該是3,4,還是5個像素寬,然后非要我證明。在這樣的環境里,我真的沒法干了。」他寫了篇博客宣布了他的辭職決定,「當一家公司被工程師執掌的時候,濃郁的工程師文化決定了問題的解決方式,就是把所有問題都拆分成一個個瑣碎的簡單邏輯。所有事情都需要有數據支持,最后搞殘了公司。」

這就是數據執政。這不得不讓我們想起美國在越戰的困境,「敵軍陣亡統計」的片面性,和不是基于更嚴肅全面的評估,對越戰的失敗負有部分責任。1967年,當國內的反戰浪潮高起,麥克馬拉承認道:「事實就是,關于人的復雜處境,是無法用圖表,小數點和負債表所能完全表現出來的。但,真相是可以通過縝密分析獲得的。如果不去分析可以分析的對象,就是只滿足于得到不完整的洞見。」如果正確的數據用在正確的地方,不相信數據就是有病了。

麥克馬拉后來在1970年代掌管世界銀行,在1980年代,他成一個鴿派,不但聲討核武器,而且是環境保護的支持者。晚年又出版了一本回憶錄,在回憶中,他深刻檢討了自己在任國防部長期間的戰爭思想和決策,他說:「我們錯了,大錯特錯。」他逝世于2009年,享年93歲。但他對包括數據質疑,特別是「敵軍陣亡統計」上,他堅持己見。他承認,一些數據統計可能出錯,但他認為,如果事物可以被統計,那就應該被統計上來,陣亡數字只是其中之一。

大數據可以成為改善藥物生產,學習方式,個人行為的基礎。但它具有的意料之外的力量,會讓我們犯和麥克馬拉一樣的錯誤。使我們變成數據的奴隸,癡迷于數據的推論,而忽視了數據的誤導性。 

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 内江市| 台山市| 水城县| 涪陵区| 云浮市| 濮阳县| 岐山县| 汾西县| 衡阳市| 慈利县| 日土县| 达尔| 深泽县| 新平| 遵义市| 庆元县| 岢岚县| 彭州市| 西峡县| 孙吴县| 泽库县| 贺州市| 峨山| 安徽省| 巴南区| 山丹县| 阿克陶县| 德化县| 通海县| 澄城县| 贡觉县| 巴青县| 绥阳县| 阳西县| 夏邑县| 中阳县| 虞城县| 达日县| 曲阳县| 吉安县| 元朗区|