Win 10 更新了么?這個周末忙翻了吧!反正“cortana小娜”是忙翻了,不停被“調戲”的截圖分分鐘被刷上頭條。
Cortana小娜是誰?“她呀,中文名字小娜,英文名字是Cortana啊! ”說笑了,Cortana小娜是Windows 10內置的數字化助手,是在云端的智能算法。Cortana的到來可是微軟花了三年的時間,現在只要你更新到Win10 ,在你的電腦上就可以和小娜Say“Hello”啦。接下來,我們不是討論如何使用Cortana小娜的,而是打造同樣的Google Now,Apple Siri語音助理,Android語音辨識等戰略級關鍵技術——機器學習。不只跨國公司搶先研發,連百度、阿里云等本土企業也早就開始用了。
對人工智能的熱議一直沒有停歇,其背后主因是以谷歌和Facebook為代表的高新技術企業廣泛應用機器學習以及深度學習技術開始顯現出了良好的效果。特別是在語音識別和圖像識別兩個領域,這幾年的提升非常快。谷歌在2014年將語音識別的精準度從2012年的84%提升到98%,而Facebook的人臉識別精度在短短幾年里甚至超過人類肉眼的水平。
與此同時,各大企業開始了一場搶奪人工智能人才的大戰,比如谷歌設立了“谷歌大腦計劃”,并在2014初斥資5億美元收購了人工智能創業公司DeepMind。國內的搜索巨頭百度也不甘示弱,高薪從谷歌挖來了斯坦福大學人工智能專家吳恩達負責“百度大腦計劃”。
人類從最早的結繩記事開始學習積累知識、傳播信息,后來有了文字,將知識總結成符號記錄下來。人類在不停探索大腦,希望見多識廣,不知疲憊,永不停歇的記憶住一切,但是知識的積累已經不能用文字,甚至不能靠人了。直到有了互聯網的出現,通過系統的觀察,來累積每個用戶的行為習慣,不僅了解用戶本身,還能夠得到不同用戶之間的差異,能夠大規模的抹平信息鴻溝,減輕人腦的負擔。被系統所理解,并沉淀下智慧,這就是機器學習。
機器學習有下面幾種定義:1996年Langley定義的機器學習是“機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經驗學習中改善具體算法的性能”。 “機器學習是對能通過經驗自動改進的計算機算法的研究”。 “機器學習是用數據或以往的經驗,以此優化計算機程序的性能標準。” 一種經常引用的英文定義是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
機器是人工智能的核心,是使計算機具有智能的根本途徑。通過機器學習技術,應用軟件可以分析海量數據,建立模型,并獲得更加精確的趨勢預測結果。推出的機器學習功能,可以很容易嵌入到企業應用軟件產品中,從而減輕開發負擔。日本通訊與網絡專家吳劍明博士認為,機器學習的思想并不復雜,它模擬人類在生活中學習成長的過程,從數據中自動分析獲得規律,并利用規律對未知數據進行預測。因為機器學習算法中涉及了大量的統計學理論,所以也被稱為統計學習理論。換句話說,換句話說,機器學習的本質就是將人的操作/思維過程的輸入與輸出記錄下來,然后統計(又叫做訓練)出一個模型用來對新的數據進行預測。
上周的互聯網+實踐周刊第三期《混合云 VS 公有云 誰是企業云戰略的核心?》中提到目前亞馬遜、微軟、谷歌、IBM等巨頭在云計算領域的廝殺,而基于機器學習技術的智能預測,也是他們爭奪的新焦點。
早在2012年,搜索巨頭谷歌就推出了“預測API”服務。另外兩個云計算服務商微軟和IBM,也分別推出了“Azure機器學習”和“沃森分析”(沃森“Watson”是IBM超級計算機項目的名字)的機器學習服務。IBM還于今年第一季度收購了專門提供深度學習技術的AlchemyAPI,整合到沃森核心平臺,以提高沃森迅速辨識及理解大量數據集之間關系的能力。IBM Watson部門資深副總裁 Mike Rhodin指出,IBM 在Watson的核心技術與云開發平臺,強化生態,藉著第三方開發商在Watson平臺開發新業務與解決方案。他表示,在這個平臺開發人員已開發出7000多項應用。
在機器學習方面亞馬遜明顯落后于其他廠商,不過于四月份云計算業務部門推出“亞馬遜機器學習”(AmazonMachineLearning)是第一個面向企業提供趨勢預測的產品。該產品會對軟件開發者提供智能預測的API(軟件開發接口),開發者可以建立新的模型,對于來自亞馬遜云計算各種數據庫服務的海量數據進行分析。
利用云計算和機器學習的案例舉不勝數,在硅谷的VMware公司,他們讓機器去分析員工何時離職?
《紐約時報》曾評論,微軟、谷歌、亞馬遜最重要的不是誰會成為最大的贏家,而是,亞馬遜拉低了云機器學習的價格和門檻。我們離一個低成本預測的時代更近了,而這里說的預測,不局限于預測購物行為、觀影喜好等等,而是全面滲入整個世界:基因組學,物聯網,大型網絡軟件,企業決策……
但不可忽略的一個問題就是,機器學習需要不同建模方法,而,互聯網每時每刻都在產生大量新數據,要求模型隨之不停更新,這就需要不論人還是機器學習,學習都不能停!
云就像電網集中供電一樣,通過網絡從hub向分支傳輸資源和能力。每個企業自己進行數據存儲、計算、分析,就像自己用發電機發電一樣,不會是主流現象。當然,就像電廠故障會帶來巨大的經濟損失一樣,隨著云平臺承載了越來越多的任務,安全性和可靠性被擺在了更重要的位置。云服務是否能贏得足夠的信任和認可,除了本身的政府的行動對此有很大影響。去年,AWS獲得CIA6億美金的大單,可以說得到CIA的認可,是對AWS可靠度和影響力的有力背書。而在我國,互聯網+行動計劃的提出,以及工信部出臺可信云認證,都在試圖為云服務指出一條透明的路。