摘要:在亞馬遜AWS看來,希望IT能夠成為像水電一樣的公共資源,然后我們想要多少資源就能夠拿到多少資源,并且我們只需按照實(shí)際用量付費(fèi)就可以。這聽起來似乎既近又遠(yuǎn),但其實(shí)它已經(jīng)在慢慢靠近。
亞馬遜AWS云計(jì)算推出了“人工智能服務(wù)”,也就是讓AWS提供的存儲、計(jì)算、網(wǎng)絡(luò)、數(shù)據(jù)庫、分析等服務(wù)變得更“聰明”,增加應(yīng)用的預(yù)測和分析能力。這一服務(wù)叫Amazon Machine Learning ,它提供可視化的工具和向?qū)?,指?dǎo)使用者按部就班地創(chuàng)建機(jī)器學(xué)習(xí)模型,而無需學(xué)習(xí)復(fù)雜的機(jī)器學(xué)習(xí)算法和技術(shù)。當(dāng)您的模型準(zhǔn)備好以后,Amazon Machine Learning 只要使用簡單的 API 即可讓您的應(yīng)用程序輕松獲得預(yù)測能力,而無需用戶自定義生成預(yù)測代碼或管理任何基礎(chǔ)設(shè)施。
在視頻生態(tài)鏈安裝“功能按鈕”
在亞馬遜AWS眾多的服務(wù)行業(yè)中,視頻媒體行業(yè)也是其主要的服務(wù)對象。
亞馬遜助理解決方案架構(gòu)師毛鄲榕告訴我們,在整個(gè)視頻媒體行業(yè)的生態(tài)鏈上,亞馬遜AWS對于媒資的處理有一整套解決方案,比如,媒資上傳、媒資存儲、媒資處理(包括建模、渲染、編碼、轉(zhuǎn)碼、水印等)、以及媒資內(nèi)容分發(fā)等。AWS在美國已經(jīng)服務(wù)了大量媒體的客戶,包括我們非常熟悉的Netflix 、BBC英國廣播電臺,以及像美國棒球聯(lián)盟等大型的媒體行業(yè)。
毛鄲榕分享了一個(gè)美國棒球聯(lián)盟的案例:利用AWS云平臺,可以智能分析棒球運(yùn)動員的軌跡,比如,每秒2萬次測量球的運(yùn)動路徑和每秒30次測量運(yùn)動員的所處位置。棒球的飛行軌跡中有他們想要的參數(shù),棒球在空中做一些旋轉(zhuǎn),這時(shí)候棒球所運(yùn)行的軌跡和運(yùn)動員所處的路徑時(shí)時(shí)刻刻都是可以被設(shè)備捕捉下來的,因此我們可以實(shí)時(shí)地、清晰地判斷這個(gè)運(yùn)動員在場上是處于什么樣的坐標(biāo)位置,以及他的行動軌跡曲線。有了這些軌跡數(shù)據(jù)之后,可以非常清晰的看到,哪些運(yùn)動員可以將看起來非常復(fù)雜的問題處理的非常簡單,而哪些運(yùn)動員又會將非常簡單的問題處理的非常復(fù)雜。這樣就可以以科學(xué)的視角了解到運(yùn)動員的技能、比賽水平等信息。
你的數(shù)據(jù)+機(jī)器學(xué)習(xí)=智能應(yīng)用
當(dāng)視頻遇見人工智能,用戶數(shù)據(jù),再加上機(jī)器學(xué)習(xí)的服務(wù),就可以簡單的構(gòu)成智能應(yīng)用。
機(jī)器學(xué)習(xí)是一種技術(shù),可以自動發(fā)現(xiàn)現(xiàn)有數(shù)據(jù)中的模式,進(jìn)而對新出現(xiàn)的數(shù)據(jù)進(jìn)行預(yù)測。
機(jī)器學(xué)習(xí)匯集了一系列高級統(tǒng)計(jì)技術(shù),使計(jì)算機(jī)能夠自動尋找模式匹配和有意義的數(shù)據(jù)區(qū)域。機(jī)器學(xué)習(xí)的經(jīng)典算法是聚類、分類、推薦,而亞馬遜AWS云平臺將這些特性進(jìn)行了整合,從而推出了Amazon Machine Learning服務(wù),幫助使用者可以按部就班地創(chuàng)建機(jī)器學(xué)習(xí)模型,而無需學(xué)習(xí)復(fù)雜的機(jī)器學(xué)習(xí)算法和技術(shù)。更重要的是還具有穩(wěn)定可靠、容易擴(kuò)展的特性,通過強(qiáng)大的算法發(fā)現(xiàn)已有數(shù)據(jù)中的規(guī)律,從而創(chuàng)建機(jī)器學(xué)習(xí)模型。最后Amazon Machine Learning 會使用這些模型來處理新數(shù)據(jù)并為應(yīng)用程序生成預(yù)測結(jié)果,并且不斷進(jìn)行驗(yàn)證,不斷進(jìn)行迭代,讓數(shù)據(jù)變得更加“聰明”。
比如,可以基于對一個(gè)用戶的了解,機(jī)器學(xué)習(xí)可以分析出這個(gè)用戶會不會使用你的產(chǎn)品;可以基于對一個(gè)交易訂單的了解,分析判斷這個(gè)訂單是不是一單欺詐交易;可以基于對一條新聞報(bào)道的了解,分析出哪些報(bào)道會令人感興趣。
當(dāng)視頻遇上人工智能
當(dāng)視頻遇見人工智能是怎么處理這些視頻內(nèi)容的?毛鄲榕為我們介紹了AWS的處理方法:
各大媒體都有自己的視頻內(nèi)容,每個(gè)用戶也會有很多社交媒體源,用戶觀看視頻內(nèi)容就會產(chǎn)生大量的社交媒體數(shù)據(jù),有了這些數(shù)據(jù)之后,就到了數(shù)據(jù)信號處理的環(huán)節(jié),可以進(jìn)行情感的處理,比如用戶喜歡恐怖片,愛情片或者槍戰(zhàn)片。情感處理之后,AWS有托管的大數(shù)據(jù)服務(wù)EMR(Elastic Map Reduce),簡單來說我們稱之為托管的Hadoop框架,同時(shí)整合了大數(shù)據(jù)系列的很多框架,比如Pig、Hive、HBase 、Impala、Spark和Presto等??梢詫?shù)據(jù)進(jìn)行提取、加載、轉(zhuǎn)換。因?yàn)楹芏鄷r(shí)候我們前期得到的數(shù)據(jù)是非結(jié)構(gòu)化的,這樣一來傳統(tǒng)的非關(guān)系化數(shù)據(jù)就很難處理,所以我們需要把非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的數(shù)據(jù),從而進(jìn)一步分析,對于分析的結(jié)果以及歷史日志還可以放在Amazon S3上,這是一個(gè)非常易用的對象存儲,具有簡單的Web服務(wù)接口,可在Web上的任何位置存儲和檢索任意體量的數(shù)據(jù)。用戶還可以對這些結(jié)果進(jìn)行分析或者搜索。有了這些數(shù)據(jù)之后,我們就可以分析得到這些用戶的行為習(xí)慣或者喜好,進(jìn)而依據(jù)此進(jìn)行內(nèi)容匹配。對于開發(fā)人員,完全可以利用這些托管的服務(wù)進(jìn)行開發(fā)、測試以及部署,而不需要一臺一臺的去部署你的服務(wù)器,甚至以后會進(jìn)一步弱化服務(wù)器的概念,達(dá)到一個(gè)托管的“無服務(wù)器”式架構(gòu),這里還簡單的介紹到了AWS Lambda服務(wù)。
總體來看就是兩個(gè)步驟:第一步,訓(xùn)練;第二步,打分。
寫在后面:當(dāng)視頻遇見人工智能,就是一件不可思議的事情,這件事情處理起來是比較復(fù)雜的。但是如果我們有了像亞馬遜AWS這樣的云計(jì)算基礎(chǔ)平臺,很多底層基礎(chǔ)設(shè)施的調(diào)用就會變得輕而易舉,充分利用云計(jì)算的特性,使用計(jì)算、存儲、網(wǎng)絡(luò)、數(shù)據(jù)庫、大數(shù)據(jù)分析,以及平臺應(yīng)用、權(quán)限控制等服務(wù)構(gòu)建一整套IT資源,并且只需要按實(shí)際使用量付費(fèi)。從內(nèi)容的產(chǎn)生、收集、處理,到最終用戶端的展現(xiàn),一整套流程借助云的優(yōu)勢就會很簡單。當(dāng)視頻遇到人工智能,在云計(jì)算的基礎(chǔ)上就會變得無限可能。