精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

CIO們:如何發(fā)揮您企業(yè)數(shù)據(jù)科學(xué)家的作用?

責(zé)任編輯:editor005

作者:litao984lt編譯

2017-09-11 20:10:09

摘自:機(jī)房360

通過數(shù)據(jù)科學(xué)平臺為數(shù)據(jù)科學(xué)家提供自助云訪問,緩解了DevOps的工作,并實現(xiàn)了他們所喜歡的自動彈性計算。更容易實施或部署模型的方法將減少從洞察分析到產(chǎn)生影響的時間,以更快的速度將數(shù)據(jù)科學(xué)工作轉(zhuǎn)化為業(yè)務(wù)價值的實現(xiàn)。

摘要:企業(yè)CIO們要如何掌控當(dāng)前飛速發(fā)展的數(shù)據(jù)科學(xué),并使之成為企業(yè)的核心能力呢?

企業(yè)CIO們要如何掌控當(dāng)前飛速發(fā)展的數(shù)據(jù)科學(xué),并使之成為企業(yè)的核心能力呢?

數(shù)據(jù)科學(xué)代表了由分析所推動的企業(yè)將進(jìn)入下一個時代。利用其潛力,將有助于企業(yè)超越其競爭對手、提高效率、創(chuàng)造新的營收來源。成功的首席信息官將在其所服務(wù)的企業(yè)把數(shù)據(jù)科學(xué)從業(yè)務(wù)周邊轉(zhuǎn)移到核心,通過制定相關(guān)的架構(gòu)和管理制定,提供對于最新技術(shù)的無限訪問,可視化和可審計性,進(jìn)而實現(xiàn)與企業(yè)業(yè)務(wù)的緊密配合。

今天的企業(yè)CIO們所面臨的挑戰(zhàn)是如何整合數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施,以便在不限制數(shù)據(jù)科學(xué)家們的自由度和靈活性的前提下,提升企業(yè)對于數(shù)據(jù)的管理。而未能采取相應(yīng)措施的CIO們或?qū)?dǎo)致整個企業(yè)的業(yè)務(wù)陷入麻煩的孤島,甚至造成企業(yè)內(nèi)部技術(shù)的不一致,超出了IT部門的管轄范圍,甚而阻礙了企業(yè)從其數(shù)據(jù)科學(xué)投資中獲取價值的機(jī)會。

部署實施了恰當(dāng)平臺的CIO將實現(xiàn)三贏:

實現(xiàn)更好的IT管理,同時推動創(chuàng)新,開拓新業(yè)務(wù)的價值

讓數(shù)據(jù)科學(xué)家們獲得自助服務(wù)和靈活敏捷性。

企業(yè)將從其數(shù)據(jù)科學(xué)投資中獲得更大的回報。

何謂數(shù)據(jù)科學(xué)

數(shù)據(jù)科學(xué)將成為數(shù)據(jù)驅(qū)動的業(yè)務(wù)的下一個前沿,數(shù)十年來一直在不斷發(fā)展。

上世紀(jì)80到90年代,數(shù)據(jù)存儲、數(shù)據(jù)管理和數(shù)據(jù)倉儲技術(shù)占主導(dǎo)地位,從而讓彼時的企業(yè)組織掌握了存儲數(shù)據(jù)的價值,以改善業(yè)務(wù)運(yùn)營。

90年代后期,商務(wù)智能(BI)技術(shù)普遍興起,使得企業(yè)組織通過數(shù)據(jù)管理技術(shù)所掌握的洞察分析力更進(jìn)一步的為企業(yè)業(yè)務(wù)所充分運(yùn)用。

隨著諸如Hadoop等NoSQL技術(shù)的興起,2000年代出現(xiàn)了“大數(shù)據(jù)”的繁榮,這些技術(shù)提供了開源的、低成本的數(shù)據(jù)處理和存儲方法,使得無限期保持完整的保真度數(shù)據(jù)變得合理。

數(shù)據(jù)管理和分析的發(fā)展為數(shù)據(jù)科學(xué)鋪平了道路,這一術(shù)語在2010年左右獲得普及,有時也被稱為“定量研究”或“決策科學(xué)”。數(shù)據(jù)科學(xué)包括機(jī)器學(xué)習(xí)(ML)、基于數(shù)據(jù)輸入的預(yù)測計算過程,并隨著數(shù)據(jù)的變化不斷改進(jìn)這些預(yù)測。機(jī)器學(xué)習(xí)只是數(shù)據(jù)科學(xué)廣泛武器庫中的一種武器。

數(shù)據(jù)科學(xué)將統(tǒng)計數(shù)據(jù)與計算機(jī)科學(xué)大大結(jié)合,以查找大數(shù)據(jù)中所蘊(yùn)含的模式,并使用這些模式來預(yù)測結(jié)果或推薦企業(yè)應(yīng)采取的行動或決策。

數(shù)據(jù)科學(xué)將推動企業(yè)從眾多市場競爭者中脫穎而出

幾十年來,企業(yè)組織一直渴望成為數(shù)據(jù)驅(qū)動型的企業(yè)。他們花費(fèi)了多年的時間來開發(fā)技術(shù),使得有效地捕捉、存儲和管理來自當(dāng)今世界的系統(tǒng)中的數(shù)據(jù)成為了可能。現(xiàn)在,鑒于這些數(shù)據(jù)的可用性,使得整個企業(yè)的每一名員工和每個部門都受益匪淺,進(jìn)而推動企業(yè)迅速且積極地采用分析和數(shù)據(jù)科學(xué)。

數(shù)據(jù)科學(xué)被廣泛認(rèn)為應(yīng)當(dāng)成為一項核心的企業(yè)能力,其具有推動企業(yè)增加新的營收來源、自動化決策、改進(jìn)產(chǎn)品和增強(qiáng)客戶體驗,進(jìn)而提高企業(yè)競爭優(yōu)勢的潛力。這種潛力正在推動企業(yè)高管們在這方面進(jìn)行大量投資。

IT企業(yè)有機(jī)會通過提供有助于使數(shù)據(jù)科學(xué)成為核心企業(yè)能力的基礎(chǔ)設(shè)施來幫助企業(yè)實現(xiàn)這一投資的全部潛力,而不是收集孤立的人員和工具。

現(xiàn)代企業(yè)可以利用數(shù)據(jù)科學(xué)來:

預(yù)測并減少優(yōu)秀員工的流失,以設(shè)法留住他們

預(yù)測客戶的生命周期價值和客戶流失

保持在競爭市場的領(lǐng)先

優(yōu)化物流、運(yùn)營和供應(yīng)鏈

在其產(chǎn)品中建立預(yù)測功能(例如,提供建議),以改善客戶體驗

CIO的挑戰(zhàn)

1、數(shù)據(jù)科學(xué)究竟有何不同?

前幾代數(shù)據(jù)技術(shù)涉及集中的單片組件:例如一臺BI服務(wù)器、數(shù)據(jù)庫服務(wù)器、數(shù)據(jù)湖平臺。而相比之下,數(shù)據(jù)科學(xué)工作則涉及數(shù)十種較小的工具和技術(shù),其中許多工具和技術(shù)旨在在數(shù)據(jù)科學(xué)家工作站的本地使用。

除此之外,這些語言具有豐富的“軟件打包”系統(tǒng),為更專業(yè)化的目的提供了補(bǔ)充功能。許多這些軟件包和工具是開源的,可以在線下載,數(shù)據(jù)科學(xué)家們定期下載數(shù)十個或數(shù)百個軟件包以用于日常工作。而且在過去幾年中,圍繞這些工具和軟件包的開放源碼系統(tǒng)已經(jīng)獲得了蓬勃的發(fā)展,推動了快速的創(chuàng)新,頻繁的更新,乃至每個月可提供全新的軟件包。換句話說,現(xiàn)代數(shù)據(jù)科學(xué)的工作存在于數(shù)十個或數(shù)百個客戶端,而不是集中在一臺服務(wù)器中。

根據(jù)KDnugget網(wǎng)站在2017年的調(diào)研顯示,數(shù)據(jù)科學(xué)中最流行的語言是Python和R。

2、數(shù)據(jù)科學(xué)在企業(yè)的混亂局面

數(shù)據(jù)科學(xué)家們渴望始終走在技術(shù)的最前沿,并利用這些最前沿的技術(shù),通過各種工具和軟件包進(jìn)行實驗。隨著開源系統(tǒng)的創(chuàng)新更快速化,這一嘗試的速度越來越快。結(jié)合基于客戶的工作,大量易于訪問的技術(shù)以及快速實驗的愿望在大多數(shù)企業(yè)中創(chuàng)造了數(shù)據(jù)科學(xué)工具采用的混亂局面。不一致的技術(shù)分散在企業(yè)的不同部分,沒有任何管理或透明度。

更糟糕的是,在許多企業(yè)中,“影子IT”正在逐漸增加,以支持這些系統(tǒng)。例如,一個小團(tuán)隊可能會在共享服務(wù)器上安裝RStudio或Jupyter(都是免費(fèi)下載的)以用于其團(tuán)隊的業(yè)務(wù),而不考慮支持要求或與企業(yè)其他部分的一致性。

除了上述這類明顯的問題之外,這種混亂的數(shù)據(jù)科學(xué)工作也造成了其他的一些問題:

重要的業(yè)務(wù)流程依賴于不可靠的基礎(chǔ)架構(gòu)。數(shù)據(jù)科學(xué)家通常會將計劃的作業(yè)設(shè)置為在本地計算機(jī)上運(yùn)行, 或者將共享服務(wù)器作為“實驗室”或“開發(fā)”機(jī)器運(yùn)行。一家財富十強(qiáng)的銀行的關(guān)鍵業(yè)務(wù)流程依賴于數(shù)據(jù)科學(xué)家每天在其筆記本電腦上運(yùn)行的模型——而這一現(xiàn)象只有當(dāng)該數(shù)據(jù)科學(xué)家離職并且這臺筆記本電腦被淘汰時才被發(fā)現(xiàn)。

計算成本可能過高而不受控制。與BI不同,數(shù)據(jù)科學(xué)涉及計算密集型技術(shù),需要大功率機(jī)器和像GPU這樣的專業(yè)資源。特別是在云環(huán)境中,混亂狀況下的數(shù)據(jù)科學(xué)家們可能會無意中每天花費(fèi)數(shù)千美元,使昂貴的機(jī)器不必要地運(yùn)行。

高價值的知識產(chǎn)權(quán)保護(hù)不當(dāng)。預(yù)測模型和分析可以將洞察力納入競爭優(yōu)勢的關(guān)鍵,而且這些工作往往分散在網(wǎng)絡(luò)驅(qū)動器、維基或Sharepoint站點(diǎn)。

數(shù)據(jù)科學(xué)家在DevOps工作方面浪費(fèi)了時間。數(shù)據(jù)科學(xué)家是寶貴的,他們的薪酬相當(dāng)高昂,但他們經(jīng)常必須花費(fèi)25%的時間來處理DevOps的任務(wù),例如安裝軟件包并在機(jī)器之間遷移文件。

數(shù)據(jù)科學(xué)家浪費(fèi)時間從事重復(fù)性的工作。 除了個別科學(xué)家們會將時間耗費(fèi)在DevOps上之外,整個團(tuán)隊都可能浪費(fèi)時間來追求重新發(fā)明的項目,或者不依賴企業(yè)過去所積累的知識,導(dǎo)致重復(fù)性的工作,因為過去的工作已經(jīng)沉沒,無法發(fā)現(xiàn)。

3、一個錯誤的困境

由于希望使用最新技術(shù)和最大的機(jī)器來開發(fā)比競爭對手更快的模型,或?qū)⑹沟闷髽I(yè)的數(shù)據(jù)科學(xué)家們錯誤地站在創(chuàng)新的另一面。他們不太可能察覺到缺乏標(biāo)準(zhǔn)化的管理所導(dǎo)致的中長期后果,并將找到阻力最小的途徑。如果IT部門無法提供他們所需要的,他們會自己發(fā)掘解決辦法,并會無意中使企業(yè)長期存在風(fēng)險。

上述將情況視為創(chuàng)新與安全之間的折中,是自然但卻過于簡單的。 這種框架將CIO限制在業(yè)務(wù)進(jìn)展和競爭力之間,或認(rèn)可混亂和風(fēng)險。 這種框架是一個錯誤的困境,錯過了調(diào)整利益相關(guān)者在整個業(yè)務(wù)中的目標(biāo)和采取激勵措施的一個機(jī)會。

CIO的機(jī)會

在上述挑戰(zhàn)中也蘊(yùn)涵了一個巨大的機(jī)會,為混亂的局面帶來秩序,同時實現(xiàn)關(guān)鍵的業(yè)務(wù)轉(zhuǎn)型。許多企業(yè)在成為真正數(shù)據(jù)驅(qū)動的企業(yè)的過程中,關(guān)鍵點(diǎn)在于,如果借助正確構(gòu)建有效的數(shù)據(jù)科學(xué)功能將改變每一個業(yè)務(wù)。

1、創(chuàng)建集中式管理

如果說數(shù)據(jù)庫和數(shù)據(jù)湖是現(xiàn)代企業(yè)的核心架構(gòu),那么數(shù)據(jù)科學(xué)時代的基礎(chǔ)技術(shù)就是數(shù)據(jù)科學(xué)平臺。與數(shù)據(jù)庫不同,數(shù)據(jù)科學(xué)平臺不能托管您的數(shù)據(jù),而是存放與數(shù)據(jù)科學(xué)工作流相關(guān)聯(lián)的工件和工作產(chǎn)品。

正如銷售企業(yè)使用一款CRM創(chuàng)建成熟度和可擴(kuò)展性一樣,工程企業(yè)也使用版本控制,企業(yè)正在部署數(shù)據(jù)科學(xué)平臺,以便在數(shù)據(jù)科學(xué)工作中創(chuàng)造更多的成熟度和管理規(guī)則。

數(shù)據(jù)科學(xué)平臺允許IT部門能夠輕易的在整個區(qū)域范圍內(nèi)控制數(shù)據(jù)科學(xué)工具、資產(chǎn)和基礎(chǔ)設(shè)施。數(shù)據(jù)科學(xué)家們不是在不同的地方環(huán)境中工作,而是在一個中心的地方工作。為了支持涉及數(shù)據(jù)科學(xué)工作的用例范圍,有效的數(shù)據(jù)科學(xué)平臺將提供:

自助服務(wù)基礎(chǔ)架構(gòu),所以數(shù)據(jù)科學(xué)家可以進(jìn)行探索性的數(shù)據(jù)分析和模型開發(fā),而無需配置和使用自己的計算資源。數(shù)據(jù)科學(xué)平臺包括計算資源以及現(xiàn)代數(shù)據(jù)科學(xué)工作所需的語言,軟件包和工具,以及關(guān)于資源使用情況的控制和報告來管理或歸因成本。

部署,生產(chǎn)或運(yùn)營完整模型的各種方法,并非驅(qū)動數(shù)據(jù)科學(xué)家建立影子系統(tǒng)。這包括在一個地方為計劃的作業(yè)、報告、API或儀表板部署模型。數(shù)據(jù)科學(xué)平臺還提供了非功能需求(安全性,HA等)的一致基準(zhǔn),以及為整個企業(yè)提供資產(chǎn)和利用透明度的目錄。

圍繞上述研究和部署工作過程中所創(chuàng)建的所有工件的治理,協(xié)作和知識管理。

2、贏在云中

數(shù)據(jù)科學(xué)工作流程非常適合在云中處理,因為它們可以從突發(fā)計算和GPU等專業(yè)資源中獲益。

彈性計算和GPU訪問與模型開發(fā)周期的龐大工作負(fù)載相一致。

通過數(shù)據(jù)科學(xué)平臺為數(shù)據(jù)科學(xué)家提供自助云訪問,緩解了DevOps的工作,并實現(xiàn)了他們所喜歡的自動彈性計算。

云中的數(shù)據(jù)科學(xué)平臺為IT提供成本控制,資源跟蹤和報告。

將數(shù)據(jù)科學(xué)工作遷移至集中式平臺將有助于確保:

業(yè)務(wù)流程中涉及的任何模型或分析集中監(jiān)控,即使其原始的創(chuàng)建者離開了企業(yè)。

數(shù)據(jù)科學(xué)家采用一致的標(biāo)準(zhǔn)化工具,減少了支持的負(fù)擔(dān)和操作風(fēng)險。

所有數(shù)據(jù)科學(xué)資產(chǎn)均獲得許可,這些權(quán)限是可審計的。

  3、與企業(yè)中的利益相關(guān)者保持一致

部署一款數(shù)據(jù)科學(xué)平臺來集中數(shù)據(jù)科學(xué)工作將降低IT企業(yè)的風(fēng)險及其所支持的負(fù)擔(dān)。但是,獲得企業(yè)其他部門的認(rèn)同,特別是獲得不太愿意討論“數(shù)據(jù)管理”的數(shù)據(jù)科學(xué)家們的認(rèn)可,將會變得至關(guān)重要。

CIO挑戰(zhàn)的關(guān)鍵部分是向不同的利益相關(guān)方提供有效的定制溝通;使整個企業(yè)團(tuán)結(jié)起來,使成功的數(shù)據(jù)科學(xué)成為共同的目標(biāo)。這樣做需要理解企業(yè)各個不同部門的獨(dú)特動機(jī)和觀點(diǎn)。幸運(yùn)的是,可以通過傳達(dá)各種各樣的益處來調(diào)整各方的利益。

數(shù)據(jù)科學(xué)家

優(yōu)先考慮的是通過在自助服務(wù)環(huán)境中利用最好和最新的工具盡可能快地進(jìn)行創(chuàng)新:

推動數(shù)據(jù)科學(xué)的自助服務(wù)環(huán)境的益處,使他們能夠獨(dú)立地提供基礎(chǔ)架構(gòu),通過自己選擇的工具(例如Jupyter,RStudio)提升工作空間,并安全地嘗試新的軟件包和工具。他們不會浪費(fèi)時間自行執(zhí)行DevOps工作,他們不需要IT的支持。

他們可以更快地運(yùn)行實驗,并在同一個地方就他們正在開發(fā)的工作與其他人進(jìn)行協(xié)作,從而節(jié)省時間。

業(yè)務(wù)執(zhí)行高管

重點(diǎn)是通過快速整合洞察分析來改進(jìn)業(yè)務(wù)流程,從數(shù)據(jù)科學(xué)投資中獲得回報:

推動數(shù)據(jù)科學(xué)“記錄系統(tǒng)”的概念(類似于CRM為銷售企業(yè)所履行的職能)。

其集中了數(shù)據(jù)科學(xué)家和工程、IT和合規(guī)管理及設(shè)施團(tuán)隊中的其他業(yè)務(wù)利益相關(guān)者之間的所有工作流和通信,促進(jìn)數(shù)據(jù)科學(xué)團(tuán)隊以更為成熟、可預(yù)測、可擴(kuò)展的方式來提供價值。

更快的實驗將推動更多的數(shù)據(jù)科學(xué)項目和研究突破完成得更快。

更容易實施或部署模型的方法將減少從洞察分析到產(chǎn)生影響的時間,以更快的速度將數(shù)據(jù)科學(xué)工作轉(zhuǎn)化為業(yè)務(wù)價值的實現(xiàn)。

為數(shù)據(jù)科學(xué)家提供現(xiàn)代化工具和技術(shù)的靈活性將有助于在競爭激烈的領(lǐng)域招聘頂尖人才。

自動維護(hù)每款模型開發(fā)的完整審核日志將降低算法決策的運(yùn)營和監(jiān)管風(fēng)險。

IT部門

優(yōu)先考慮的是控制基礎(chǔ)設(shè)施的成本,并保持單一的整合環(huán)境:

促進(jìn)與現(xiàn)有系統(tǒng)和工具與基礎(chǔ)設(shè)施業(yè)務(wù)管理流程平臺集成整合的概念,提供實時評分、批次評分和應(yīng)用程序托管選項。

可以通過跟蹤硬件,工具使用和生產(chǎn)模型的更改來主動識別風(fēng)險和問題。

使用昂貴的計算資源(特別是在云環(huán)境中)可以更容易地進(jìn)行監(jiān)控,限制和歸因。

通過成功引導(dǎo)企業(yè)內(nèi)部各個利益相關(guān)方關(guān)注和部署數(shù)據(jù)科學(xué)平臺,每個各個利益相關(guān)方都將從中獲益:IT管理團(tuán)隊通過治理和集中化成功地減輕風(fēng)險,同時為數(shù)據(jù)科學(xué)家提供生產(chǎn)力的提升。建立數(shù)據(jù)科學(xué)平臺使IT部門有望取得成功,有助于推動業(yè)務(wù)部門更快的創(chuàng)新

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 陈巴尔虎旗| 泰宁县| 美姑县| 牙克石市| 汶川县| 临潭县| 定安县| 陕西省| 三明市| 楚雄市| 潮州市| 乌拉特中旗| 榆社县| 潜江市| 萨迦县| 文水县| 遂川县| 江津市| 梁河县| 钟祥市| 洪雅县| 景宁| 房产| 格尔木市| 泽普县| 华亭县| 文山县| 兴义市| 威信县| 息烽县| 驻马店市| 遂昌县| 台东市| 罗山县| 贵德县| 绍兴市| 黑山县| 阿巴嘎旗| 富裕县| 临汾市| 曲阳县|