工程師們利用5年時間寫下250萬行代碼、6小時內處理100PB數據,相當于1億部高清電影、定價0.3元/GB,花幾百元即可分析海量數據……眼前的每一個數字,都是圍繞著阿里云開放數據處理服務(Open Data Processing Service,簡稱ODPS)展開。
日前,阿里云在一封題為“人人都可以成為BAT(百度、阿里巴巴、騰訊)”的公開信里宣布,阿里云計算最重要的一款產品—ODPS正式開放商用。該平臺是基于阿里巴巴自主知識產權的云計算平臺構建的數據存儲與分析系統,以云計算服務的方式實現海量數據數據的存儲、分享與離線處理,是大規模分布式計算平臺——飛天的核心組成部分,通過控制集權來控制包括幾千臺服務器大集群的管理而實現規模擴展。
“今天的商業化代表了一個承諾,ODPS對外使用,我們會有一定的標準、水平和服務承諾。我們認為ODPS會改變整個中國,不論是云計算還是整個大數據的里程碑。”阿里云總裁王文彬向媒體公開表示。
在他看來,云計算和大數據是一個硬幣的正反面。“相比以前買一個硬件+一套軟件裝進去的IT系統模式,隨著互聯網、移動互聯網的來臨,這個被沿襲了好幾十年的模式有了一個翻天覆地的變化。這個改變如果叫IT2.0的話,應該是云計算+數據的概念,亦即今天不再是用戶或企業用戶,采購不再是計算機加一個軟件,今天采購的是云服務。云服務改變了整個IT的使用和模式,包括使用的周期,而在云服務上面產生的數據處理也變得可能了。”
關鍵詞:平民化
這邊,隨著ODPS的商用,阿里云承諾數據的安全性,包括絕對不會有其他人訪問這個數據以及會在管理上用各種手段保證內部操作不會看到,那邊,依然有不少企業或個人不知道怎么利用這個數據,把大數據變得可用和“平民化”始終是一個待解的問題。
對此,借著ODPS商用的契機,王文彬坦承,雖然談到ODPS是屬于大數據平民化,但這個產品并不是每個人都能用,對用戶的要求是或具有數據分析的技能、精通SQL語言,或至少是程序員,會寫JAVA程序,此外,還得有對數據的敏感度和對業務的洞察力。
總的說來,ODPS還是有一定的使用成本,就像編程一樣,它是一個計算平臺,ODPS上面有更多的工具,需要不同的合作伙伴進來提供不同的工具,慢慢疊加起來。
“中國能夠提供算法的人有很多,中國不欠缺能夠提供算法的聰明人,欠缺的是平臺,能夠把這個算法變成商業的模式。我們相信在ODPS上面,加上這些工具,加上這些環境,我們能夠讓這些算法商業化,這才是啟動整個大數據生態圈的一個做法。”阿里云方面表示。
定位云計算基礎數據服務提供商,不擁有數據,但是擁有平臺服務和大數據計算服務,基于ODPS,建立一個有數據生產者、消費者、加工者和服務應用供應商組成的整個生態系統。或許,這才是阿里云長期以來的一個終極戰略目標,正所謂先有云計算,后有大數據,總之都是為數據而生。
只是,相比傳統IT廠商,欲打造大數據生態圈,阿里云又有哪些優勢呢?
對此,王文彬首先澄清了一個關于“云計算”的概念。“我先講一下,第一點我不覺得現在傳統廠商有云計算,為什么?對我們來講不是云計算,因為它只是一個虛擬化加SAAS的服務,我們賣的就是服務,沒有執照費用,而且是彈性的、擴容的,今天買多少就是多少,而且價格可以一直降低。從這幾個定義來看,全世界只有三家,亞馬遜,阿里巴巴,谷歌只能是半結構,因為剛開始在做。”
他進一步解釋稱,互聯網的技術革命帶動了整個IT產業的變革,相比傳統的軟件公司在20年前服務了那個時代,今天,互聯網的架構和軟件搭建的方式更加高效和符合現在的情況。
至于能提供以上云服務的真正門檻是什么?阿里云方面回應,硬件不是問題,今天硬件最強大的一定不是阿里巴巴,而是IDC的運營商和電信運營商,但如果上幾千上萬臺機器協同的話,需要在硬件上做一套軟件把它聯結在一起,這中間的技術門檻還是很高的。
據悉,從最開始的幾十臺機器到能把五千臺機器連接成一臺的機器,阿里云大概花了六年的時間,期間更是有數百位工程師參與研發。
關鍵詞:免費
就像殺毒軟件開啟免費時代的大門一樣,也有不少人會問,某一天,云計算是不是也有可能不要錢?
阿里云王文彬給出的答案是:這個也是有可能的。
據了解,從去年開始,云計算服務每年會固定降價,原因是規模化效應起來以后,硬件成本一直降低,軟件更加高效,所以出現這一市場現狀。
“我們有一定免費的額度給新進來的使用方,但不是整體免費,云計算這個服務還是會固定在這里。畢竟把云計算比作零售的話,零售不能免費,因為量很大,會有上百萬臺或者幾百萬臺的機器,不可能一直免費。”王文彬表示。
但他也表示,在垂直解決方案里,免費還是有可能的。將云計算的成本包在里面,對外做的時候這個東西就是免費,從利用服務來收費,這是一個增值服務的打法。“今天有可能有一個智能云,上面說云計算的是免費,但是靠其他服務來收費;或者說免費,但是可以靠這個數據交換來收錢,這個也是有可能的。”
無論如何,數據時代要來臨,云計算先落地,有了云計算才有它。作為大數據服務的最底層,ODPS商用化是阿里云前進路上的重要一步,如果說當初飛天5k以及把支付寶的數據從獨立的安全運維切到ODPS上等算是團隊攻克的多個難關,那么,接下來的挑戰依然不少。
“挑戰有幾方面,首先是對非結構數據的支持。目前我們主要的數據是交易數據和用戶行為數據,大多數都是結構化、半結構化,這個就決定了ODPS在發展的最初要專注于業務的需求,對于非結構化的數據支持,是ODPS需要探索的一個很重要的地方;其次,今天雖然有能力把各個不同的計算模型放到飛天上,但大家怎么解決統一的事情,可能也是下一個思考和解決的問題。”阿里云產品經理湯子楠告訴記者。他表示,最終目標是讓用戶能夠真正享受到在一個統一的平臺上能夠做所有的大數據運算的樂趣。