Infogix公司總裁兼首席執(zhí)行官Sumit Nijhawan介紹了許多大數(shù)據(jù)項目失敗的原因,以及企業(yè)如何充分利用這一領(lǐng)域的投資。
最近,調(diào)研機構(gòu)Tech Pro Research公司與數(shù)據(jù)完整性和數(shù)據(jù)治理解決方案廠商Infogix公司首席執(zhí)行官兼總裁Sumit Nijhawan對大數(shù)據(jù)的狀態(tài)和發(fā)展進(jìn)行了交流與探討。該公司創(chuàng)建于30年前,原名為Unitech Systems。在大數(shù)據(jù)時代開始之后,2005年公司更名為Infogix。該公司最近的企業(yè)并購是2017年2月收購了Data3Sixty公司,這是一家專注于云計算數(shù)據(jù)治理的行業(yè)領(lǐng)先的提供商。
早在2016年11月,Infogix公司就發(fā)布了2017年十大變革性數(shù)據(jù)趨勢,并于今年8月又一次進(jìn)行了更新。人們對Infogix公司針對今后趨勢發(fā)展的再次預(yù)測十分關(guān)注。為此,調(diào)研機構(gòu)Tech Pro Research公司對Infogix公司總裁兼首席執(zhí)行官Sumit Nijhawan進(jìn)行了采訪。
Tech Pro:Infogix公司最近更新了2017年的大數(shù)據(jù)預(yù)測,這是因為有了意想不到的發(fā)展還是其他原因?
Nijhawan:“在今年前六個月,我們在與客戶合作中制定了我們的市場戰(zhàn)略和產(chǎn)品策略,而根據(jù)我們和客戶對市場的觀察,對于發(fā)展趨勢的更新是有意義的,特別是在大數(shù)據(jù)治理領(lǐng)域。
我們對幾乎所有的客戶都有一個大數(shù)據(jù)倡議,許多項目都開始進(jìn)行了更多的投資和動作,但是他們發(fā)現(xiàn)所取得的進(jìn)展和從投資中獲得的價值,往往不符合最初的期望。
我們在就一些事情正在與客戶合作,我們認(rèn)為可以變革的是數(shù)據(jù)治理,數(shù)據(jù)準(zhǔn)備,自助服務(wù)和較小的數(shù)據(jù)湖部署的組合。”
Tech Pro:你所說的從大數(shù)據(jù)中獲得洞察力的主要瓶頸實際上是如何發(fā)現(xiàn)所擁有的具有價值的數(shù)據(jù),并將其用于分析嗎?
Nijhawan:“是的,大部分的重點是提供存儲環(huán)境——Hadoop,并讓每個人都可以將任何數(shù)據(jù)轉(zhuǎn)儲到其中。在這里要考慮兩件事情:一,他們到底向Hadoop導(dǎo)入的目標(biāo)和項目到底是什么?第二,即使數(shù)據(jù)存在,它不受管理,是不可搜索的,是不能發(fā)現(xiàn)的,它不是以某種方式吸引消費者的數(shù)據(jù),并幫助他們獲取價值,并非常依賴IT部門 ,仍然需要技術(shù)人員來處理,而這不是客戶從這些投資中獲得價值的方法。”
Tech Pro:你所提到的Hadoop仍然是大數(shù)據(jù)領(lǐng)域的關(guān)鍵產(chǎn)品嗎?
Nijhawan:“大數(shù)據(jù)不僅僅是關(guān)于Hadoop的,而且我也認(rèn)為Hadoop將一直是保持大數(shù)據(jù)業(yè)務(wù)的組成部分,因為有足夠的投入。而且實際上,它作為一種技術(shù)滿足了人們的需求,但是它也有一個整體生態(tài)系統(tǒng):例如Spark,還有Cassandra,MongoDB和HBase這些數(shù)據(jù)庫,以及所有Hadoop提供的存儲和框架,這就是這些技術(shù)的發(fā)展情況。”
Tech Pro:說,大多數(shù)公司仍然努力從大數(shù)據(jù)技術(shù)投資中獲取商業(yè)價值嗎?
Nijhawan:“是的,沒錯,因為這一切都是作為一個實驗開始的,而且有些實驗效果很不錯。但是如何將這些實驗轉(zhuǎn)化成真正能夠以可持續(xù)的方式提供企業(yè)洞察力的東西?這就是每個人的努力方向。
這就像是在說:‘我擁有一大堆產(chǎn)品,我將存放產(chǎn)品的倉庫設(shè)置在了一個偏遠(yuǎn)的地方,現(xiàn)在告訴我你想要什么,我會把產(chǎn)品發(fā)送給你。’但人們不知道這個倉庫里面有什么,或者怎么做,因此需要電子商務(wù),例如亞馬遜風(fēng)格的網(wǎng)站,亞馬遜有很多倉庫,但它之所以能起作用,是因為他們把電子商務(wù)模式整合在一起:任何人都可以訪問,找到他們想要的東西,將其放到購物車上,為其分配價值——亞馬遜甚至向消費者推薦他們應(yīng)該嘗試的東西,在這個背后有一個供應(yīng)鏈在發(fā)揮作用,將產(chǎn)品運送給消費者。
大數(shù)據(jù)需要什么?缺少了什么?缺少的是亞馬遜這樣的頂級網(wǎng)站,以及其背后的供應(yīng)鏈的自動化。”
Tech Pro:那么,許多組織的業(yè)務(wù)和IT之間的關(guān)系是否存在著一種脫節(jié)呢?組織需要培養(yǎng)一種“數(shù)據(jù)文化”嗎?在這種情況下,業(yè)務(wù)部門知道如何詢問數(shù)據(jù)的正確問題,并產(chǎn)生自己的見解嗎?
Nijhawan:“我們當(dāng)然需要更多的業(yè)務(wù)驅(qū)動的數(shù)據(jù)文化。這并不是IT人員不愿分享,只是他們擁有這些工具,他們認(rèn)為自己做得很好,但他們并不真正知道其最終的目標(biāo)是什么,這就是為什么脫節(jié)的原因。除非它是一個商業(yè)驅(qū)動的舉措,否則它很難實現(xiàn)任何有意義的事情。”
Tech Pro:許多組織是否缺少可以連接企業(yè)管理層與業(yè)務(wù)部門以及IT部門的首席數(shù)據(jù)官(CDO)這個環(huán)節(jié)?
Nijhawan:“這個環(huán)節(jié)很可能是缺失的,但我不會說這只是一個職位的問題。剛才提到的‘數(shù)據(jù)文化’是關(guān)于人、過程和技術(shù)以及數(shù)據(jù)本身的。它實際上是關(guān)于端到端的過程:例如如何處理數(shù)據(jù)的方法,所要處理的數(shù)據(jù),以及交付數(shù)據(jù)的方式。這個端到端的過程需要由業(yè)務(wù)發(fā)起人發(fā)起,這當(dāng)然可以是首席數(shù)據(jù)官(CDO)來實施。但如今首席數(shù)據(jù)官面臨的問題是,在許多組織中,這幾乎是一個尷尬的職位:如果首席數(shù)據(jù)官(CDO)具有一定影響力,最終將成為向供應(yīng)商去推銷他們技術(shù)和產(chǎn)品的人,而不是沒有成為實現(xiàn)業(yè)務(wù)目標(biāo)的人。
如今的許多首席數(shù)據(jù)官都是來自IT部門,但企業(yè)真的需要一個有商業(yè)背景的人。”
Tech Pro:當(dāng)與客戶溝通時,你認(rèn)為目前最需要哪些數(shù)據(jù)相關(guān)技能?一些分析人士發(fā)現(xiàn)企業(yè)對數(shù)據(jù)科學(xué)家的需求有所下降,這是真的嗎?
Nijhawan:“我認(rèn)為這種需求正在減少,但這并不是因為數(shù)據(jù)科學(xué)家過剩。更重要的是,現(xiàn)在的數(shù)據(jù)科學(xué)家無法提供企業(yè)想要的價值。于是問題就變成了:‘如果我沒有得到價值,那么招募更多的數(shù)據(jù)科學(xué)家又有什么意義呢?’‘為什么我不能讓公司的業(yè)務(wù)人員和日常數(shù)據(jù)分析師來承擔(dān)這項工作?’坦白地說,這些人就可以勝任,由于80%的數(shù)據(jù)科學(xué)家能夠解決的問題可以通過20%的機器算法來解決,而且這些算法能夠采用易于使用的方式,數(shù)據(jù)分析師和業(yè)務(wù)分析師可以將其納入運營和業(yè)務(wù)流程,其結(jié)果導(dǎo)致企業(yè)對數(shù)據(jù)科學(xué)家的需求下降。”
Tech Pro:人們聽到很多關(guān)于“自助服務(wù)”的分析,而不再需要更多的專家參與,你認(rèn)為其發(fā)展方向是什么?
Nijhawan:“按照這些原則,我們正在與客戶進(jìn)行的工作是查看他們已經(jīng)擁有數(shù)據(jù)湖計劃 - Hadoop,Cloudera和所有這些數(shù)據(jù)的大數(shù)據(jù),并給出建議,‘也許你不需要這些開源技術(shù),不必花費數(shù)月時間和數(shù)百萬美元的費用,我們將為你提供端到端的設(shè)備,實現(xiàn)完全自助的大數(shù)據(jù)服務(wù),這一切都是集成的。你所需要做的只是消費數(shù)據(jù),讓你們的業(yè)務(wù)人員和數(shù)據(jù)科學(xué)家的工作壓力得以緩解。’而這在市場上有很大的吸引力。”
Tech Pro:如今,幾乎每個人都在談?wù)摍C器學(xué)習(xí)和人工智能,你認(rèn)為這些技術(shù)將在大數(shù)據(jù)方面發(fā)揮什么作用?
Nijhawan:“機器學(xué)習(xí)和人工智能的應(yīng)用和發(fā)展已經(jīng)存在一段時間了,但是現(xiàn)在還有很多爭論,但是就像我之前說的那樣:80%的問題可以通過20%的機器學(xué)習(xí)算法來解決,如分割,推薦,分類,回歸,以及預(yù)測。大數(shù)據(jù)質(zhì)量是具有更大吸引力的一個領(lǐng)域,傳統(tǒng)上數(shù)據(jù)質(zhì)量一直在確定匹配規(guī)則和重復(fù)規(guī)則,以及所有這些內(nèi)容,現(xiàn)在數(shù)據(jù)量十分龐大,人們在數(shù)據(jù)湖中投入更多的數(shù)據(jù),他們不一定知道確切的規(guī)則是什么,而只是使用機器學(xué)習(xí)算法,例如分段和分類來查找異常值,這就是機器學(xué)習(xí)已經(jīng)帶來了很多價值的原因,但是同樣,企業(yè)并不需要經(jīng)驗和知識非常豐富的數(shù)據(jù)科學(xué)家來做到這一點。”
Tech Pro:2017年的十大趨勢之一是“信息學(xué)的轉(zhuǎn)型和識別數(shù)據(jù)價值的能力”。你如何定義“信息學(xué)”和“數(shù)據(jù)科學(xué)/工程”之間的差異?
Nijhawan:“這里的主要區(qū)別是,企業(yè)必須按照傳統(tǒng)的定義,將數(shù)據(jù)的貨幣化和數(shù)據(jù)的價值添加到信息學(xué)中,一旦加入,我認(rèn)為這是真正的信息學(xué),而且每個人都在談?wù)摂?shù)據(jù)的價值時,他們非常主觀地進(jìn)行談?wù)摚覀兯龅囊恍┭芯浚瑢嶋H上把數(shù)據(jù)看作是資產(chǎn)負(fù)債表的組成部分,在這一方面,數(shù)據(jù)既是一種資產(chǎn),也可以是一種負(fù)債。因此,從企業(yè)所擁有的并賦予其價值不同的數(shù)據(jù)集的角度來看:是什么使它成為一種資產(chǎn),又是什么使它成為一種負(fù)債,并為其帶來價值。這是我們的一個研究領(lǐng)域。”
Tech Pro:你如何看待廣泛應(yīng)用的物聯(lián)網(wǎng)設(shè)備將更多的數(shù)據(jù)輸入到公司的系統(tǒng)中,這將如何改變大數(shù)據(jù)市場?
Nijhawan:“物聯(lián)網(wǎng)設(shè)備現(xiàn)在是大數(shù)據(jù)投資的主要驅(qū)動力,我認(rèn)為這項技術(shù)已經(jīng)可以解釋這些數(shù)據(jù),盡管人們確實需要更多的商業(yè)頭腦來理解它,并理解其中的含義。這就是發(fā)生的進(jìn)化:數(shù)據(jù)能告訴人們什么是其不知道的,而不是要求某人知道應(yīng)該發(fā)生什么,或者可能發(fā)生什么事。自動發(fā)現(xiàn)結(jié)論和解釋是我認(rèn)為需要做更多工作的地方。”
Tech Pro:你認(rèn)為大數(shù)據(jù)技術(shù)的發(fā)展將會在2017年減緩嗎?今年是一個分水嶺嗎?
Nijhawan:“不,我認(rèn)為2017年還會繼續(xù)發(fā)展下去,更多的項目可能會失敗,然后人們會意識到需要有正確的文化,只有這樣他們才能獲得成功。”
Tech Pro:最后,你認(rèn)為,隨著自助服務(wù)工具的??出現(xiàn),以及非專業(yè)人士和“公民數(shù)據(jù)科學(xué)家” 越來越多地參與,大數(shù)據(jù)的發(fā)展會不會有一個民主化的進(jìn)程?
Nijhawan:“我認(rèn)為這種情況確實會發(fā)生:這是投資大數(shù)據(jù)得以持續(xù)和實現(xiàn)價值的唯一途徑——別無選擇。無論是IT部門還是供應(yīng)商,都有足夠多的人來推動這個問題,并找到解決問題的方法。在三到五年的時間里,人們不會過多地關(guān)注大數(shù)據(jù),而是將以自助服務(wù)的方式關(guān)注大數(shù)據(jù)的結(jié)果。”