精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

如何才能更好地應用大數據

責任編輯:sjia

2012-09-19 11:32:26

摘自:中云網

盡管大數據研究越來越成為主流,我們仍能從硅谷的數據科學家那里學到很多經驗教訓,因為他們所從事的職業大都依賴大數據才得以生存。

盡管大數據研究越來越成為主流,我們仍能從硅谷的數據科學家那里學到很多經驗教訓,因為他們所從事的職業大都依賴大數據才得以生存。雖然與更傳統些的商業模式相比,他們運用數據的方式存在很大不同,但他們積累了足夠的科學知識和技術,值得剛剛投身于大數據業務的后來者學習和借鑒,借以盡可能規避失敗的風險。

那么,公司如何才能圍繞大數據重構商業模式,或者如何重新思考商業經營理念?針對這一問題,大數據以及數據科學領域的專家持何種觀點?結合IE Group創新會上的所聞所見,可以歸結出5大理念,助你運用好大數據。

一、Hadoop并不意味著一切

雖說這一觀念如今應該是業內常識,但仍需不斷重復,以便銘記于心。當論及Hadoop最大擁護者、Fayyad前雇員(時任首席數據官)Yahoo如何在這方面得到慘重教訓時,ChoozOn公司的CTO Usama Fayyad深入探討了這一觀點。Yahoo原本試圖借助Hadoop做一些客戶細分方面的工作,卻發現,相較于采取更傳統的數據庫架構做同樣的工作,成本竟然高出50倍。認識到這點后,這個項目最終被否決了。后來,數據分析初始企業nPario復活了此種項目,如今,Yahoo已成為nPario的付費用戶。

二、大數據使數據科學變得更親和

Sparked.com網站的首席數據科學家Daniel Wiesenthal清晰闡述了大數據和數據科學這兩個不時會重合的概念,他認為,從本質上講,諸如支持向量機(SVM)以及類神經網絡類的技術,都是經時間檢驗而且被證實切實有效的方法,可用來“從數據庫中獲取細致到最后每一‘盎司’的信息”,即使這些數據庫規模很小。這些技術非常復雜,而且很難被口頭解釋,在一定規模下還會趨于失效。

然而,大數據使數據科學家們得以運用更簡單的模型技術,比如決策樹或者回歸技術,以便更精確地做大量數據賬目管理,使其更具統計意義,而不是僅為追求超級復雜的演算系統。Wiesenthal認為,運用Hadoop之類的通用大數據技術,意味著大數據科學家可以更快地開發和測試模型,因為這種架構不需要與特殊的規則系統或者類型問題相協調,它只是被設計用來更好地處理大數據。

三、知道如何做減法有時更為重要

作為SaaS的市場先鋒,Salesforce.com一直在運用自己的大數據平臺監測各種產品性能付諸實施的情況,產品管理主管Narayan Bharadwaj認為,這么做的目的不僅是希望預測下一步應該添加什么功能,更多則是為利用數據來支持決策,那些不能幫助公司有所提升的功能將被鑒別出來,相關資源被轉投到更具價值的功能上去。“知道如何做減法有時更為重要。”他說。

下一步該怎么做?依照邏輯,自然是分析鑒別功能特性,包括實施良好的和實施效果欠佳的,在布局未來遠景時,公司因此會獲得一個基本認知,什么樣的設計會有成效,什么樣的設計反之,由此趨利避害。

四、內容決定價值

簡單來說,如果用戶事先就知道某些內容為什么會被展示給他們,或者為什么他們會被作某種推薦,他們或許更有可能為此買單。StumbleUpon麾下的一位高階數據科學家表示,為將相關度最高的網頁內容呈現到每位用戶面前,公司在大數據及數據科學技術方面投入大量人力、物力,但事實證明,如果寄希望于用戶信任這種服務決策方式,僅這么做還遠遠不夠。Sparked.com的Wiesenthal在其論述中同樣指出了這一點,他認為諸如Pandora與Netflix這類的服務之所以流行,原因部分在于,在推薦類似內容的時候,它們實際上都向客戶傳遞了自己的一些特性。

五、交易數據遠勝研究數據

PayPal的首席科學家Mok Oh論述了從產品研究到購買的產業鏈,以及從產業鏈一端努力走向另一端時,決策信號為什么變得越來越難以辨別。PayPal試圖跨越這一障礙,做法如下:首先從交易過程著手,然后綜合其他數據(包括內部數據以及由Facebook以及Gnip等處得來的外部數據資源),盡可能鑒別出哪些人是真正的客戶,以及哪些產品或服務是這些客戶真正需要的。他認為,相對于Google努力追蹤客戶購買行為的研究,這樣做更容易些,當然,在另一種情況下例外,如果客戶確實使用像Google Wallet這樣的工具購買了某些商品,后一種研究方式更易操作。

將檸檬汁從檸檬汽水中分離出來,這正是大數據研究所要做的。一個公司所擁有的最有價值的數據資源,就是它針對自身業務特別搜集的數據,大數據處理的成功之路在于,從利用這些數據開始,探索出一些創新方式,然后深入發掘出更具洞察力的內涵。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 许昌县| 揭西县| 阳山县| 精河县| 绥德县| 兴义市| 邛崃市| 万源市| 泾阳县| 通辽市| 韶山市| 沂南县| 琼海市| 扎囊县| 都匀市| 梧州市| 兰考县| 太谷县| 江油市| 崇义县| 宽城| 井冈山市| 柳河县| 武隆县| 奈曼旗| 德安县| 景泰县| 横峰县| 玉溪市| 聂荣县| 织金县| 楚雄市| 离岛区| 琼中| 海林市| 岢岚县| 南雄市| 容城县| 安化县| 阿克苏市| 濮阳县|