即使企業有開發大數據的能力(其實大部分并沒有這個能力),他們還總是喜歡使用未經測試的想當然的想法,而非利用數據科學來做決策。視覺分析公司Atheon Analytics的總經理Guy Cuthbert認為,即使是在那些使用數據的公司中,許多仍然會有選擇性的支持那些已經被認可的觀點,而非真正數據驗證的事實,而利用數據本身,只是靠想法制定決策的一種偽裝罷了。
最近Actian公司在倫敦參加的一個圓桌會議上,Cuthbert談到,數據科學涉及到提出假設和檢驗假設的方法,但他所遇到的大多數商品零售企業都繞過了這兩個方法。
他說:“我能一口氣說出許多零售商的可怕故事,這些故事都有一個共同點,即這些零售商相信客戶存在一個特定的行為方式,因為他們在開張的那一天就有人這么告訴他們了。他們從了沒有真正質疑過這些說法而去探究真實的情況——品類的真實情況、國家中特定地區的情況,或尺碼的情況。數不清的案例表明,人們輕信別人告訴他們的東西,但卻不去自己探究真正的事實是什么樣的。
“我們做了很多工作,想要把各種組織從‘想法驅動’改變為‘數據驅動’,讓它們開始采用事實和假設的科學方法,而不是‘想當然’。”Cuthbert說。
Cuthbert說,自己曾經努力幫助過許多公司,以讓它們理解它們的產品的績效表現,但這些公司都無法被認為具有“分析能力”。按照他的推測,全球的商業企業中大概只有百分之一甚至是只有千分之一是真正的數據驅動的。
Cuthbert說:“我見過大量的依靠直覺運營的企業并不了解原來數據還可以產生決策。我也聽過太多高管們滔滔不絕地噴出了各種各樣的其實沒有什么‘營養’的想法。因此,如果數據繪制者或者數據科學家去做一些事情,去教商人們他們的組織中所蘊含的那些令人著迷數據及背后的事實,他們就會開始自覺地去認識它們了。”
然而,讓業務揭穿企業中的一些(不真實)的神話并開始接受現實,接受以數據為基礎的結論,并非易事。
“在我們向人們展示我們的觀點時,常遇到一些充滿火藥味的‘回擊’,他們當面指責我們,說我們所說的是徹頭徹尾的繆論。”Cuthbert說。
另外一個問題是即使公司試圖科學地使用數據,他們關注的點也過于聚焦而狹隘。
“大多數與我們合作的公司關注已知的東西,他們總是著眼于諸如‘我們希望明年的收入增加6%,讓我們確保能搞定6%’之類的東西。”Cuthbert說。
“他們沒有去尋找增長30%或者120%的機會。我們很多工作只是浮于表面,或者展示那些他們其實自己也沒有弄懂的一套東西。”
不幸的是,盡管技術進步讓我們能夠非常容易地處理數十億條數據,但分析本身,卻必須依靠與人力完成。
“機器缺乏靈感,這是造成機器學習以及其他計算機技術與人類思維鴻溝巨大的現時原因。”Cuthbert說,“靈感來自于人類懂得如何從數據中找出隱含的信息。”
大數據分析公司Actian(之前叫Ingres)的CEO Steve Shine說,一直到現在,為了滿足大數據所需要的開發技能,他們擁有一組特定的高預算的客戶,這些客戶需要他們的這些技能完成項目。
“在過去的三四年中,如果你在任何的一個地方接觸過hadoop項目,你就會意識到,能夠寫一個高效的MapReduce程序并使hadoop高效運行是一個相當牛逼的技能。”Shine說,“這種技能被技術社區熱切地保護了起來,卻并沒有擴散,但最近的12個月內發生了戲劇性的變化。大家都接受了一個事情,即需要讓利用新的技術變得更加容易。”
“我們把人們帶回上世紀80年代,那時如果你能有現在通過代碼來獲取所有的數據和發現新見解的能力,你將會變得有多么的多產。”
但現在新的問題是,大數據技術在迅猛擴散,各種版本的Hadoop、NoSQL,以及提供和整合數據的新方法層出不窮。
“沒有一個CIO因為把這些東西能夠‘粘合’在一起而獲得獎勵。企業并不在乎你多快多好的把這些粘合在一起。企業也不在乎你到底能多快的幫助他找到客戶流失數據。”Shine說。
然而,現在的技術允許企業從他們通常的生產數據中發現意想不到的商業潛力。
Shine援引了他在福利和工資服務行業中的一個客戶的情況,對于工資變化、畢業生和參與者的信息,這個客戶自己處理數據后得到的信息,甚至要比政府提供的信息更能準確描繪宏觀經濟。
他說:“那些看起來傳統的組織,實際上已經有一個業務,即他們意識到如果它們以數據為中心,并且利用數據,以及盡可能地結合其它他們能獲得的數據,他們就能夠基本做出比現在他們能做出來的東西更具根本價值的東西”,他說。