精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

AlphaGo Zero的啟示:我們的創新究竟出了什么問題?

責任編輯:editor006

作者:蘇一

2017-12-11 15:53:59

摘自:INFOQ

AlphaGo Zero這種從零開始的自我驅動的強化學習機制,使機器嘗試了各種可能性,打破了基于人類知識的固化思維,反而獲得了更優解。

我們很難不對人工智能產生深刻印象,甚至有點兒警惕。1997年,當IBM的超級計算機“深藍”(Deep Blue)擊敗了當時世界上最偉大的國際象棋選手加里·卡斯帕羅夫(Garry Kasparov)時,它還只是一件需要人類密切關照和指導的昂貴硬件設備。但如今,快速發展的人工智能已經在很多領域遠超人類。

對計算機來說,圍棋是一種比象棋更難掌握的游戲。然而,2016年低調出現的AlphaGo,經過短短幾個月的訓練后,就輕松地擊敗了世界上最好的圍棋選手。今年10月,人工智能企業DeepMind推出了運行速度更快、使用硬件更少的AlphaGo Zero。通過72小時的自我學習和訓練,AlphaGo Zero以10比0的佳績打敗了它的“前輩”AlphaGo。

這種令人震驚的進步速度,再次引發了人們對機器人將替代人類,導致人類大規模失業的焦慮。但部分人認為,這種焦慮毫無必要。因為AlphaGo Zero并不是我們創造新想法的典型方式,所以和它相關的生產力和技術進步沒有意義。

我們知道,AlphaGo Zero的先進之處在于完全從零開始,不需要參考人類的先驗知識,更不需要任何歷史棋譜的指引,完全依靠自我強化學習,左右互搏來增長棋藝,最終達到百戰百勝。

這種思維方式和國際象棋、AlphaGo等完全不同。此前,很多計算機先驅們都認為,國際象棋也許是個發展人工智能的有意義的領域,但這種期待最終落空了。

因為不管是圍棋還是象棋,在上千年傳承的過程中,雖然不斷有新的突破,但整體的思維或套路依然離不開一個“贏”字。從優化角度來說,利用人類知識進行象棋學習會讓機器掉入和人類思維一致的“陷阱”。

在這種情況下,“優化過程反而阻礙了進化”。這也是卡斯帕羅夫在其新書《深度思考》(Deep Thinking)中所想要表達的觀點。

正如卡斯帕羅夫所描述的那樣,在國際象棋中,在優化思路的影響下,當機器發現通過犧牲皇后可以快速取得勝利,機器便得出結論:如果要贏,必須要犧牲掉皇后。這種認知模式雖然很實用,但問題是,我們的目的是改變世界,讓機器更加智能化,而不是僅僅贏得一場國際象棋比賽。

AlphaGo Zero這種從零開始的自我驅動的強化學習機制,使機器嘗試了各種可能性,打破了基于人類知識的固化思維,反而獲得了更優解。

從國際象棋到基礎科學

但這不僅僅是一個關于國際象棋的警示故事。

這種結果導向的思維方式,不僅僅存在于計算機象棋中,在科學研究中也隨處可見。比如為了更加快速地獲得結果,研究人員選擇了更實用的捷徑,卻忽略了更深入、值得冒更大風險去做的研究。對科學來說,如果僅僅只是關注獲得“勝利”這一結果,往往會本末倒置,走入“死胡同”。

在類似思路的指引下,企業們正在減少對基礎科學研究的投入。此前,企業們曾資助過許多重要的基礎研究。在這些資金的幫助下,曾在索尼和IBM公司工作的江崎玲于奈(Leo Esaki)、德州儀器公司(Texas Instruments)的杰克 基爾比(Jack Kilby)獲得了諾貝爾物理學獎;通用電氣公司的歐文·朗繆爾(Irving Langmuir)摘得了諾貝爾化學獎;而貝爾實驗室更是誕生了數不清的諾貝爾獎得主。可以說,那是個企業們敢于投資基礎科學的時代。

然而,這種情況已經變了。正如Ashish Arora、Sharon Belenzon和Andrea Patacconi三位經濟學家的研究報告所顯示的那樣:企業們仍在大力投資創新,但重點放在了實際應用上,而非基礎科學。基礎研究則通常被外包給了更小的機構,后者的知識產權很容易被買賣。

在這個過程中,企業研究人員創造了更多的專利,但他們在學術期刊上卻越來越不顯眼。正如阿羅拉教授所說的那樣,企業越來越關注開發,而不是研究,而大多數的基礎研究最終也都是為了商業上的用處。

這種思維方式給研究帶來的影響是,研究團隊的規模越來越大,專業化的研究人員越來越多,研究成本也越來越昂貴,但新的想法反而越來越少了。因為在某個“明確目的”的指引下,研究者們從一開始就已經否定了其他的可能性。

KPI陷阱

這種以結果為導向的思維方式,在現代企業中也有一種典型的表現方式,那就是KPI制度。

根據和君咨詢合伙人袁衛平的定義,在現代企業中,KPI主義是企業將短期財務指標(如利潤和銷售收入)作為關鍵績效指標來考核公司高管,并層層向下分解,直至一線的運營維護、產品研發和市場開發人員。指標完成的結果要排序,排名和個人獎金緊密掛鉤,并直接影響工資和職位晉升。財務指標完成不好,排名在后的員工,會受到訓誡乃至解雇。這些被細化和分類的指標,最終是為了實現精確管理,對工作成果進行量化。

在這種完全以目標為導向的體系里,員工在焦慮和恐懼的支配下,在追隨財富的原始欲望驅動下,有時會不擇手段地完成相關指標。這種不擇手段,可能是犧牲企業的信用,可能是犧牲產品的質量,最終都讓KPI變成了一劑毒藥。

2016年,當百度因為“魏則西事件”遭遇史上最大的信任危機時,李彥宏在內部郵件中質問“為什么很多每天都在使用百度的用戶不再熱愛我們?為什么我們不再為自己的產品感到驕傲了?問題到底出在哪里?”

反省的結果是“因為從管理層到員工對短期KPI的追逐,企業價值觀被擠壓變形了,業績增長凌駕于用戶體驗,簡單經營替代了簡單可依賴”,最終與用戶漸行漸遠。李彥宏更進一步警告,“如果失去了用戶的支持,失去對價值觀的堅守,百度離破產只有30天”。

而在百度之前,索尼常務董事就曾撰文稱“績效主義毀了索尼”;王石也曾在其微博中痛呼,“績效主義像企業的膿包”,而小米,直接干脆就“拋棄了KPI”。

除了對員工不擇手段的擔憂,在瞬息萬變的互聯網時代,僅僅只依靠某些量化指標來評判員工的工作量和勤奮程度,有時候并不合理。畢竟隨著技術和市場的快速更迭,工作目標也會隨之不斷調整,在這種情況下,盲目苛求某些量化指標,反而會扼殺企業的創新能力或低估杰出員工的價值等。

比如,當公司以代碼行數作為考核目標,可能會因此鼓勵大量垃圾代碼的產生,而錯過了簡潔優雅的優秀代碼;如果以解決Bug的數量作為評判標準,可能會挫敗優秀程序員的積極性。因為如果程序員因為修復自己項目的Bug數量多而受到賞識,估計就沒有員工愿意一開始就寫出完美無缺的代碼了。諸如此類的例子不勝枚舉。

在互聯網時代,不可否認的是,企業們會有越來越多的情況,需要面對未知的場景,提出顛覆的觀點,創造不曾存在的模式,開發全新的產品。那么,在這一切創新誕生之前,企業們應該以什么樣的KPI去給自己的員工定性呢?是每個月提交報告,還是多做幾個ppt呢?

正如資深 IT 人曹政所說的那樣,KPI的意義在于約束平庸的員工,以提升他們的執行力,而不能用于去規范優秀的人才。如果我們希望誕生“AlphaGo Zero”般的高級人才,如果我們想要不一樣的創新,那么,首先要讓人從既定的目標導向里解脫出來。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 汶川县| 乐平市| 苍山县| 新乡县| 红河县| 松阳县| 习水县| 宁武县| 东山县| 莫力| 汪清县| 乐平市| 于都县| 怀化市| 桐柏县| 二连浩特市| 英德市| 平潭县| 伊吾县| 鹤山市| 涞源县| 湘潭县| 正宁县| 广宁县| 定襄县| 九江县| 吉安县| 宜良县| 天水市| 威宁| 河间市| 根河市| 菏泽市| 勃利县| 安国市| 水富县| 武义县| 堆龙德庆县| 保靖县| 哈密市| 泗阳县|