分享嘉賓:毛鄲榕,亞馬遜AWS助理解決方案架構師
毛鄲榕,亞馬遜AWS助理解決方案架構師
在亞馬遜AWS看來,希望IT能夠成為像水電一樣的公共資源,然后我們想要多少資源就能夠拿到多少資源,并且我們只需按照實際用量付費就可以。這聽起來似乎既近又遠,但其實它已經在慢慢靠近。
亞馬遜AWS云計算推出了“人工智能服務”,也就是讓AWS提供的存儲、計算、網絡、數據庫、分析等服務變得更“聰明”,增加應用的預測和分析能力。這一服務叫Amazon Machine Learning ,它提供可視化的工具和向導,指導使用者按部就班地創建機器學習模型,而無需學習復雜的機器學習算法和技術。當您的模型準備好以后,Amazon Machine Learning 只要使用簡單的 API 即可讓您的應用程序輕松獲得預測能力,而無需用戶自定義生成預測代碼或管理任何基礎設施。
在視頻生態鏈安裝“功能按鈕”
在亞馬遜AWS眾多的服務行業中,視頻媒體行業也是其主要的服務對象。
亞馬遜助理解決方案架構師毛鄲榕告訴我們,在整個視頻媒體行業的生態鏈上,亞馬遜AWS對于媒資的處理有一整套解決方案,比如,媒資上傳、媒資存儲、媒資處理(包括建模、渲染、編碼、轉碼、水印等)、以及媒資內容分發等。AWS在美國已經服務了大量媒體的客戶,包括我們非常熟悉的Netflix 、BBC英國廣播電臺,以及像美國棒球聯盟等大型的媒體行業。
毛鄲榕分享了一個美國棒球聯盟的案例:利用AWS云平臺,可以智能分析棒球運動員的軌跡,比如,每秒2萬次測量球的運動路徑和每秒30次測量運動員的所處位置。棒球的飛行軌跡中有他們想要的參數,棒球在空中做一些旋轉,這時候棒球所運行的軌跡和運動員所處的路徑時時刻刻都是可以被設備捕捉下來的,因此我們可以實時地、清晰地判斷這個運動員在場上是處于什么樣的坐標位置,以及他的行動軌跡曲線。有了這些軌跡數據之后,可以非常清晰的看到,哪些運動員可以將看起來非常復雜的問題處理的非常簡單,而哪些運動員又會將非常簡單的問題處理的非常復雜。這樣就可以以科學的視角了解到運動員的技能、比賽水平等信息。
你的數據+機器學習=智能應用
當視頻遇見人工智能,用戶數據,再加上機器學習的服務,就可以簡單的構成智能應用。
機器學習是一種技術,可以自動發現現有數據中的模式,進而對新出現的數據進行預測。
機器學習匯集了一系列高級統計技術,使計算機能夠自動尋找模式匹配和有意義的數據區域。機器學習的經典算法是聚類、分類、推薦,而亞馬遜AWS云平臺將這些特性進行了整合,從而推出了Amazon Machine Learning服務,幫助使用者可以按部就班地創建機器學習模型,而無需學習復雜的機器學習算法和技術。更重要的是還具有穩定可靠、容易擴展的特性,通過強大的算法發現已有數據中的規律,從而創建機器學習模型。最后Amazon Machine Learning 會使用這些模型來處理新數據并為應用程序生成預測結果,并且不斷進行驗證,不斷進行迭代,讓數據變得更加“聰明”。
比如,可以基于對一個用戶的了解,機器學習可以分析出這個用戶會不會使用你的產品;可以基于對一個交易訂單的了解,分析判斷這個訂單是不是一單欺詐交易;可以基于對一條新聞報道的了解,分析出哪些報道會令人感興趣。
當視頻遇上人工智能
當視頻遇見人工智能是怎么處理這些視頻內容的?毛鄲榕為我們介紹了AWS的處理方法:
各大媒體都有自己的視頻內容,每個用戶也會有很多社交媒體源,用戶觀看視頻內容就會產生大量的社交媒體數據,有了這些數據之后,就到了數據信號處理的環節,可以進行情感的處理,比如用戶喜歡恐怖片,愛情片或者槍戰片。情感處理之后,AWS有托管的大數據服務EMR(Elastic Map Reduce),簡單來說我們稱之為托管的Hadoop框架,同時整合了大數據系列的很多框架,比如Pig、Hive、HBase 、Impala、Spark和Presto等。可以對數據進行提取、加載、轉換。因為很多時候我們前期得到的數據是非結構化的,這樣一來傳統的非關系化數據就很難處理,所以我們需要把非結構化的數據轉化為結構化的數據,從而進一步分析,對于分析的結果以及歷史日志還可以放在Amazon S3上,這是一個非常易用的對象存儲,具有簡單的Web服務接口,可在Web上的任何位置存儲和檢索任意體量的數據。用戶還可以對這些結果進行分析或者搜索。有了這些數據之后,我們就可以分析得到這些用戶的行為習慣或者喜好,進而依據此進行內容匹配。對于開發人員,完全可以利用這些托管的服務進行開發、測試以及部署,而不需要一臺一臺的去部署你的服務器,甚至以后會進一步弱化服務器的概念,達到一個托管的“無服務器”式架構,這里還簡單的介紹到了AWS Lambda服務。
總體來看就是兩個步驟:第一步,訓練;第二步,打分。
寫在后面:當視頻遇見人工智能,就是一件不可思議的事情,這件事情處理起來是比較復雜的。但是如果我們有了像亞馬遜AWS這樣的云計算基礎平臺,很多底層基礎設施的調用就會變得輕而易舉,充分利用云計算的特性,使用計算、存儲、網絡、數據庫、大數據分析,以及平臺應用、權限控制等服務構建一整套IT資源,并且只需要按實際使用量付費。從內容的產生、收集、處理,到最終用戶端的展現,一整套流程借助云的優勢就會很簡單。當視頻遇到人工智能,在云計算的基礎上就會變得無限可能。