国产高清在线看免费视频观 ,日韩成人在线网站,日韩精品电影一区亚洲

AlphaGo Zero的啟示：我們的創新究竟出了什么問題？

責任編輯：editor006

作者：蘇一

2017-12-11 15:53:59

摘自：INFOQ

AlphaGo Zero這種從零開始的自我驅動的強化學習機制，使機器嘗試了各種可能性，打破了基于人類知識的固化思維，反而獲得了更優解。

我們很難不對人工智能產生深刻印象，甚至有點兒警惕。1997年，當IBM的超級計算機“深藍”（Deep Blue）擊敗了當時世界上最偉大的國際象棋選手加里·卡斯帕羅夫（Garry Kasparov）時，它還只是一件需要人類密切關照和指導的昂貴硬件設備。但如今，快速發展的人工智能已經在很多領域遠超人類。

對計算機來說，圍棋是一種比象棋更難掌握的游戲。然而，2016年低調出現的AlphaGo，經過短短幾個月的訓練后，就輕松地擊敗了世界上最好的圍棋選手。今年10月，人工智能企業DeepMind推出了運行速度更快、使用硬件更少的AlphaGo Zero。通過72小時的自我學習和訓練，AlphaGo Zero以10比0的佳績打敗了它的“前輩”AlphaGo。

這種令人震驚的進步速度，再次引發了人們對機器人將替代人類，導致人類大規模失業的焦慮。但部分人認為，這種焦慮毫無必要。因為AlphaGo Zero并不是我們創造新想法的典型方式，所以和它相關的生產力和技術進步沒有意義。

我們知道，AlphaGo Zero的先進之處在于完全從零開始，不需要參考人類的先驗知識，更不需要任何歷史棋譜的指引，完全依靠自我強化學習，左右互搏來增長棋藝，最終達到百戰百勝。

這種思維方式和國際象棋、AlphaGo等完全不同。此前，很多計算機先驅們都認為，國際象棋也許是個發展人工智能的有意義的領域，但這種期待最終落空了。

因為不管是圍棋還是象棋，在上千年傳承的過程中，雖然不斷有新的突破，但整體的思維或套路依然離不開一個“贏”字。從優化角度來說，利用人類知識進行象棋學習會讓機器掉入和人類思維一致的“陷阱”。

在這種情況下，“優化過程反而阻礙了進化”。這也是卡斯帕羅夫在其新書《深度思考》(Deep Thinking)中所想要表達的觀點。

正如卡斯帕羅夫所描述的那樣，在國際象棋中，在優化思路的影響下，當機器發現通過犧牲皇后可以快速取得勝利，機器便得出結論：如果要贏，必須要犧牲掉皇后。這種認知模式雖然很實用，但問題是，我們的目的是改變世界，讓機器更加智能化，而不是僅僅贏得一場國際象棋比賽。

AlphaGo Zero這種從零開始的自我驅動的強化學習機制，使機器嘗試了各種可能性，打破了基于人類知識的固化思維，反而獲得了更優解。

從國際象棋到基礎科學

但這不僅僅是一個關于國際象棋的警示故事。

這種結果導向的思維方式，不僅僅存在于計算機象棋中，在科學研究中也隨處可見。比如為了更加快速地獲得結果，研究人員選擇了更實用的捷徑，卻忽略了更深入、值得冒更大風險去做的研究。對科學來說，如果僅僅只是關注獲得“勝利”這一結果，往往會本末倒置，走入“死胡同”。

在類似思路的指引下，企業們正在減少對基礎科學研究的投入。此前，企業們曾資助過許多重要的基礎研究。在這些資金的幫助下，曾在索尼和IBM公司工作的江崎玲于奈(Leo Esaki)、德州儀器公司(Texas Instruments)的杰克基爾比(Jack Kilby)獲得了諾貝爾物理學獎；通用電氣公司的歐文·朗繆爾（Irving Langmuir）摘得了諾貝爾化學獎；而貝爾實驗室更是誕生了數不清的諾貝爾獎得主。可以說，那是個企業們敢于投資基礎科學的時代。

然而，這種情況已經變了。正如Ashish Arora、Sharon Belenzon和Andrea Patacconi三位經濟學家的研究報告所顯示的那樣：企業們仍在大力投資創新，但重點放在了實際應用上，而非基礎科學。基礎研究則通常被外包給了更小的機構，后者的知識產權很容易被買賣。

在這個過程中，企業研究人員創造了更多的專利，但他們在學術期刊上卻越來越不顯眼。正如阿羅拉教授所說的那樣，企業越來越關注開發，而不是研究，而大多數的基礎研究最終也都是為了商業上的用處。

這種思維方式給研究帶來的影響是，研究團隊的規模越來越大，專業化的研究人員越來越多，研究成本也越來越昂貴，但新的想法反而越來越少了。因為在某個“明確目的”的指引下，研究者們從一開始就已經否定了其他的可能性。

KPI陷阱

這種以結果為導向的思維方式，在現代企業中也有一種典型的表現方式，那就是KPI制度。

根據和君咨詢合伙人袁衛平的定義，在現代企業中，KPI主義是企業將短期財務指標（如利潤和銷售收入）作為關鍵績效指標來考核公司高管，并層層向下分解，直至一線的運營維護、產品研發和市場開發人員。指標完成的結果要排序，排名和個人獎金緊密掛鉤，并直接影響工資和職位晉升。財務指標完成不好，排名在后的員工，會受到訓誡乃至解雇。這些被細化和分類的指標，最終是為了實現精確管理，對工作成果進行量化。

在這種完全以目標為導向的體系里，員工在焦慮和恐懼的支配下，在追隨財富的原始欲望驅動下，有時會不擇手段地完成相關指標。這種不擇手段，可能是犧牲企業的信用，可能是犧牲產品的質量，最終都讓KPI變成了一劑毒藥。

2016年，當百度因為“魏則西事件”遭遇史上最大的信任危機時，李彥宏在內部郵件中質問“為什么很多每天都在使用百度的用戶不再熱愛我們？為什么我們不再為自己的產品感到驕傲了？問題到底出在哪里？”

反省的結果是“因為從管理層到員工對短期KPI的追逐，企業價值觀被擠壓變形了，業績增長凌駕于用戶體驗，簡單經營替代了簡單可依賴”，最終與用戶漸行漸遠。李彥宏更進一步警告，“如果失去了用戶的支持，失去對價值觀的堅守，百度離破產只有30天”。

而在百度之前，索尼常務董事就曾撰文稱“績效主義毀了索尼”；王石也曾在其微博中痛呼，“績效主義像企業的膿包”，而小米，直接干脆就“拋棄了KPI”。

除了對員工不擇手段的擔憂，在瞬息萬變的互聯網時代，僅僅只依靠某些量化指標來評判員工的工作量和勤奮程度，有時候并不合理。畢竟隨著技術和市場的快速更迭，工作目標也會隨之不斷調整，在這種情況下，盲目苛求某些量化指標，反而會扼殺企業的創新能力或低估杰出員工的價值等。

比如，當公司以代碼行數作為考核目標，可能會因此鼓勵大量垃圾代碼的產生，而錯過了簡潔優雅的優秀代碼；如果以解決Bug的數量作為評判標準，可能會挫敗優秀程序員的積極性。因為如果程序員因為修復自己項目的Bug數量多而受到賞識，估計就沒有員工愿意一開始就寫出完美無缺的代碼了。諸如此類的例子不勝枚舉。

在互聯網時代，不可否認的是，企業們會有越來越多的情況，需要面對未知的場景，提出顛覆的觀點，創造不曾存在的模式，開發全新的產品。那么，在這一切創新誕生之前，企業們應該以什么樣的KPI去給自己的員工定性呢？是每個月提交報告，還是多做幾個ppt呢？

正如資深 IT 人曹政所說的那樣，KPI的意義在于約束平庸的員工，以提升他們的執行力，而不能用于去規范優秀的人才。如果我們希望誕生“AlphaGo Zero”般的高級人才，如果我們想要不一樣的創新，那么，首先要讓人從既定的目標導向里解脫出來。

AlphaGo Zero 先驗知識

熱門專題

科技驅動創新行業智行千里

《2022聯想智能化轉型行業白皮書》重磅發布

飛利浦商用顯示器:智能科技助力高效工作

智能科技助力高效工作

破內卷“出海”勢在必行數字化為全球業務保駕護航

破內卷“出海”勢在必行，數字化為全球業務保駕護航

高端訪談

國藥國際CIO馮偉：數字化轉型要打破信息化建系統的固有思維

中國國際醫藥衛生有限公司數智化中心總經理馮偉在接受企業網D1Net專訪時提到：“回過頭來看，數智化建設最難的是轉思維，必須打破信息化總想去建系統的固有思維，要以平臺化思維、站在運營和業務的角度思考問題。思維轉變后，很多問題將迎刃而解。”

創維集團信息總監寧江：數據治理是數字化轉型的必由之路

創維集團信息總監寧江在接受企業網D1Net采訪時提到：“如今，站在數字化轉型的全局之下回顧過去幾十年的信息化建設，似乎建了很多煙囪，系統之間、流程之間不能共享數據，孤島林立。不同時期有不同時期的特征，都有其合理性和必要性，如今再來解決這些問題為時未晚。

海爾智家技術總監高麗：云原生加速企業數字化轉型

海爾智家全球數字化平臺用到了哪些云原生技術產品?如何實現降本增效?在云原生技術應用方面有哪些實踐和探索?云原生技術發揮了哪些價值?在本期“云原生降本增效大咖說”中，企業網D1Net采訪了海爾智家全球數字化平臺技術總監高麗。

熱文推薦

精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

AlphaGo Zero的啟示：我們的創新究竟出了什么問題？

業務服務

網站地圖

友情鏈接

合作伙伴