精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:CIO技術探討 → 正文

為什么數據分析舉措仍然會失敗

責任編輯:cres 作者:Mary K. Pratt |來源:企業網D1Net  2018-05-07 16:14:39 原創文章 企業網D1Net

強大的數據分析是數字化業務的當務之急——這一切都始于智能數據治理實踐,以及對質量和情境的強調。
 
高管們都泛泛地談論數據的價值,但Navient Solutions的企業數據情報總監Michele Koch卻可以計算出公司數據的實際價值。
 
事實上,Koch能用以真金白銀計算公司各種數據元素產生的收入增長和成本下降。因此,她十分清楚,Navient的數據中存在的問題可能會損害其盈虧。例如,客戶檔案中的關鍵數據字段中的錯誤可能意味著公司無法以最低的成本處理貸款。
 
她說:“這涉及到錢,所以我們有一個數據質量儀表板,我們可以在這里跟蹤一切。我們跟蹤實際的和潛在的價值。”
 
Navient的首席數據管理員兼財務副總裁Barbara Deemer表示,Navient(位于特拉華州威爾明頓市的資產管理和業務處理服務公司)早期有一項與數據相關的舉措說明了風險所在。2006年的舉措側重于提高營銷數據質量,并產生了720萬美元的投資回報——從貸款量的增加和運營支出的減少中獲得回報。
 
Koch說,從那時起,Navier的高管們致力于支持強大的數據治理計劃,以此作為成功分析工作的關鍵組成部分。Navient的治理計劃包括公認的最佳實踐——如數據字段的標準化定義并確保有干凈的數據。
 
它為每個約2,600個企業數據元素分配所有權;所有權要么屬于數據字段首先發源的業務領域;要么屬于特定的數據字段是其流程不可或缺的業務領域。
 
該公司還有一個積極監測字段質量的數據質量計劃,以確保高標準可以得到滿足。該公司還發起了數據治理委員會(2006年)和分析數據治理委員會(2017年),以解決持續存在的問題或疑慮,在整個企業中做出決策,不斷改進數據操作以及數據饋入公司的分析工作的方式。
 
Koch說:“數據對于我們的業務舉措以及商機十分重要,重要到我們希望著重對支持分析計劃的數據進行一如既往的改進。”
 
根據數據治理解決方案公司Erwin和UBM發布的2018年數據治理狀況,大多數高管都認為數據治理至關重要,他們例舉了合規定、客戶滿意度和更好的決策作為關鍵驅動因素。但是,報告發現,近40%的應答組織沒有單獨的數據治理預算,約46%的應答組織沒有正式的戰略。
 
該調查結果基于118名受訪者的答復,其中包括首席信息官、首席技術官、數據中心管理者、IT員工和顧問。
 
專家表示,有鑒于這些數字,很多企業數據程序中存在薄弱環節就不足為奇了。以下是七種有問題的數據實踐。
 
將數據匯總在一起,但不能真正地集合數據
 
數據治理專家組織(Data Governance Professionals Organization)的通訊副總裁Anne Buff表示,在如今的數據和分析領域,集成是第一難題。
 
Buff解釋說,誠然,很多組織將所有數據收集到一個地方。但實際上,他們沒有集成多個數據源的各個部分。因此,某一個系統里的Bill Smith與其它系統生成的Bill Smith的數據(以及他的名字的變體)沒有關聯。業務無法清楚地了解他的身份。
 
Buff說:“共存數據與集成數據不同。你必須有一種方法來匹配來自不同來源的記錄。你需要做到這一點,當這一切都結合在一起時,有關Bill Smith的身份的更宏觀的觀點就形成了。你必須融會貫通。”
 
Buff說,各種數據集成技術使這一點成為可能。選擇,實施和執行正確的工具對于避免過多的人工工作或重復勞動至關重要。
 
此外,集成變得越來越重要,因為數據科學家正在搜尋數據中的模式,以獲得可以產生突破、競爭優勢的洞察。
 
Buff(他同時也是北卡羅來納州卡瑞市的SAS咨詢業務解決方案經理)說:“但是,如果你不能把以前從未匯集過的數據匯集在一起,你就無法找到這些模式。”
 
沒有意識到業務部門有獨特的需求
 
沒錯,統一的、集成的數據對于成功的分析計劃至關重要。但有些業務用戶可能需要不同版本的數據,Buff這樣說道。
 
她補充道:“一種形式的數據并不能滿足組織中每個人的需求。”
 
相反,IT要考慮數據供應,即提供業務用戶或業務部門確定的業務案例所需的數據。
 
她以金融機構不同的需求為例。盡管有些部門可能需要集成的數據,但欺詐檢測部門可能希望其數據科學家使用不干凈的數據,以便搜索危險信號。他們可能想搜尋同一地址的人,他們用個人識別信息的輕微變化來申請多筆貸款。
 
Buff解釋道:“你會看到類似但有細微變化的數據元素,所以你不想剔除和清理太多的差異。”
 
她說,另一方面,該金融機構的市場部希望擁有正確的客戶姓名、地址等內容,以便以正確的通信錄為目標。
 
只招數據科學家而不招數據工程師
 
隨著企業漸漸超越基礎的商業智能,轉向預測性和規范性分析以及機器學習和人工智能,他們要不斷提高數據團隊的專業水平。
 
反過來,數據科學家一職也因此受到了關注。但數據工程師同樣重要,他們整理了所有需要集成的數據集,以供數據科學家完成工作,但他們迄今為止鮮有組織問津。
 
貝恩公司(Bain & Co.)舊金山辦事處的合伙人兼高級分析和數字化實踐的領導者Lori Sherer說,這種情況正在發生變化。
 
Sherer說:“我們已經看到,對數據工程師的需求增長大約是對數據科學家需求增長的兩倍。”
 
聯邦勞工統計局預測,對數據工程師的需求在未來十年將持續快速增長,美國經濟體在2016年至2026年期間將增加44,200個職位,平均年薪已達135,800美元。
 
然而,專家說,數據工程師像很多IT部門的重要職位一樣,其數量無法滿足IT部門,這使現在剛剛開始招聘或培訓該職位的IT部門不得不迎頭追趕。
 
保留過時的數據,而非管理其生命周期
 
在過去十年中,存儲成本大幅下降,使IT部門能夠更輕松地存儲大量數據,而且存儲時間比以往任何時候都長。有鑒于如今數據創建的數量和速度,以及對用于分析的存儲容量的需求增長,這似乎是個好消息。
 
位于佛羅里達州阿波羅海灘的Soaring Eagle Consulting的聯合創始人、《挖掘新黃金:管理你的業務數據》一書的合著者Penny Garbus說,盡管很多人對擁有海量的數據和資料的價值表示贊賞,但過猶不及。
 
Garbus說,很多企業持有數據的時間太長了。
 
她說:“你不僅需要為此付費,而且如果它已存在10年之久,這些信息很可能遠遠過時了。因此我們鼓勵人們為數據設置期限。”
 
Garbus說,數據的截止日期不僅因組織而異,還因部門而異。零售公司的庫存部門可能只需要相對較新的數據,而市場營銷部門可能需要數年前的數據來跟蹤趨勢。
 
如果是這樣的話,IT要實施能夠將正確時間范圍內的數據傳遞到正確位置的體系結構,以確保所有人的需求都能得到滿足,并且舊數據不會破壞具有時效性的分析程序。
 
正如Garbus所指出的那樣:“不能因為你必須保留[舊數據],就認為你必須將它保存在核心環境中。而是你必須擁有它。”
 
關注數量,而非針對相關性
 
IT咨詢公司博思艾倫(Booz Allen Hamilton)的高級副總裁Steve Escaravage表示:“我們仍在建立模型并用可用性最高而非關聯度最高的數據運行分析。”
 
他說,組織往往會認為它們應該采集并不斷添加數據集。他說,它們認為“或許我們沒有找到要找的東西,而不是問:我們是否有合適的數據?”
 
他說,鑒于有很多機構通過分析海量數據來尋找異常情況,以此來尋找欺詐行為。這雖然是一項重要的活動,但領先的機構也會分析能獲得更好成果的更具針對性的數據集。在這種情況下,他們可能會考察產生某些類型交易的個人或機構,這些交易可能存在問題。又或者是,醫療機構在分析患者預后(patient outcome)時可能會考慮這樣的數據——醫生在提供患者護理時的輪班時間。
 
Escaravage表示,組織可以從創建數據愿望清單開始。雖然這個練習始于業務端,“始于理解這個清單并實現它,這是首席信息官、首席技術官或首席數據官的分內事。”
 
提供數據,但忽略了數據的出處
 
如今的熱點話題是分析的偏差,這種情況可能會扭曲結果,甚至會產生錯誤的結論,以糟糕的業務決策或結果告終。產生偏差的問題存在于企業分析計劃的多個不同領域——包括IT如何處理數據本身,Escaravage這樣說道。
 
他說,IT在追蹤它所擁有的數據的來源時往往做得不夠出色。
 
Escaravage認為,對數據產生的方式和位置缺乏可見性使偏差更難控制,他說:“如果你不知道這一點,這會影響你的模型的性能。”
 
他說:“了解數據來自哪里以及數據遭遇了什么,這是IT的責任。人們在數據管理方面投入頗多,但他們也應該有一個元數據管理解決方案。”
 
提供數據,但未能幫用戶理解情境
 
IT不僅要有強大的元數據管理計劃,而且還要跟蹤數據的來源以及它如何在系統中移動,應該讓用戶了解一些歷史數據,并為通過分析產生的一些結果提供情境,Escaravage這樣說道。
 
他說:“我們對自己能夠創造的東西感到非常興奮。我們認為自己有非常好的數據,尤其是未經分析的數據,我們可以根據這些數據的效用建立一個心理模型。盡管過去五年的分析方法令人驚嘆不已,但這些方法所產生的結果遠不如過去那么容易解釋——過去,你在數據挖掘之后應用業務規則,數據很容易得到解釋。”
 
Escaravage解釋說,更新的深度學習模型提供了洞察和可執行的建議。但是這些系統往往不會提供對最佳決策有幫助甚至至關重要的情境。例如,它沒有提供關于可能性的信息和基于數據可能會發生某事的確定性。
 
Escaravage說,人們需要更好的用戶界面來提供情境。
 
他說:“技術問題在于人們將如何與這些模型進行交互。這就是從透明度立場關注UI/UX的做法顯得十分重要的場合。因此,如果有人看到來自人工智能平臺的推薦,他們可以在多大程度上深入查看潛在的數據源?首席信息官將不得不問這樣一個問題——如何在他們的系統中建立這種透明度。”
 
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。

關鍵字:CIO數據分析

原創文章 企業網D1Net

x 為什么數據分析舉措仍然會失敗 掃一掃
分享本文到朋友圈
當前位置:CIO技術探討 → 正文

為什么數據分析舉措仍然會失敗

責任編輯:cres 作者:Mary K. Pratt |來源:企業網D1Net  2018-05-07 16:14:39 原創文章 企業網D1Net

強大的數據分析是數字化業務的當務之急——這一切都始于智能數據治理實踐,以及對質量和情境的強調。
 
高管們都泛泛地談論數據的價值,但Navient Solutions的企業數據情報總監Michele Koch卻可以計算出公司數據的實際價值。
 
事實上,Koch能用以真金白銀計算公司各種數據元素產生的收入增長和成本下降。因此,她十分清楚,Navient的數據中存在的問題可能會損害其盈虧。例如,客戶檔案中的關鍵數據字段中的錯誤可能意味著公司無法以最低的成本處理貸款。
 
她說:“這涉及到錢,所以我們有一個數據質量儀表板,我們可以在這里跟蹤一切。我們跟蹤實際的和潛在的價值。”
 
Navient的首席數據管理員兼財務副總裁Barbara Deemer表示,Navient(位于特拉華州威爾明頓市的資產管理和業務處理服務公司)早期有一項與數據相關的舉措說明了風險所在。2006年的舉措側重于提高營銷數據質量,并產生了720萬美元的投資回報——從貸款量的增加和運營支出的減少中獲得回報。
 
Koch說,從那時起,Navier的高管們致力于支持強大的數據治理計劃,以此作為成功分析工作的關鍵組成部分。Navient的治理計劃包括公認的最佳實踐——如數據字段的標準化定義并確保有干凈的數據。
 
它為每個約2,600個企業數據元素分配所有權;所有權要么屬于數據字段首先發源的業務領域;要么屬于特定的數據字段是其流程不可或缺的業務領域。
 
該公司還有一個積極監測字段質量的數據質量計劃,以確保高標準可以得到滿足。該公司還發起了數據治理委員會(2006年)和分析數據治理委員會(2017年),以解決持續存在的問題或疑慮,在整個企業中做出決策,不斷改進數據操作以及數據饋入公司的分析工作的方式。
 
Koch說:“數據對于我們的業務舉措以及商機十分重要,重要到我們希望著重對支持分析計劃的數據進行一如既往的改進。”
 
根據數據治理解決方案公司Erwin和UBM發布的2018年數據治理狀況,大多數高管都認為數據治理至關重要,他們例舉了合規定、客戶滿意度和更好的決策作為關鍵驅動因素。但是,報告發現,近40%的應答組織沒有單獨的數據治理預算,約46%的應答組織沒有正式的戰略。
 
該調查結果基于118名受訪者的答復,其中包括首席信息官、首席技術官、數據中心管理者、IT員工和顧問。
 
專家表示,有鑒于這些數字,很多企業數據程序中存在薄弱環節就不足為奇了。以下是七種有問題的數據實踐。
 
將數據匯總在一起,但不能真正地集合數據
 
數據治理專家組織(Data Governance Professionals Organization)的通訊副總裁Anne Buff表示,在如今的數據和分析領域,集成是第一難題。
 
Buff解釋說,誠然,很多組織將所有數據收集到一個地方。但實際上,他們沒有集成多個數據源的各個部分。因此,某一個系統里的Bill Smith與其它系統生成的Bill Smith的數據(以及他的名字的變體)沒有關聯。業務無法清楚地了解他的身份。
 
Buff說:“共存數據與集成數據不同。你必須有一種方法來匹配來自不同來源的記錄。你需要做到這一點,當這一切都結合在一起時,有關Bill Smith的身份的更宏觀的觀點就形成了。你必須融會貫通。”
 
Buff說,各種數據集成技術使這一點成為可能。選擇,實施和執行正確的工具對于避免過多的人工工作或重復勞動至關重要。
 
此外,集成變得越來越重要,因為數據科學家正在搜尋數據中的模式,以獲得可以產生突破、競爭優勢的洞察。
 
Buff(他同時也是北卡羅來納州卡瑞市的SAS咨詢業務解決方案經理)說:“但是,如果你不能把以前從未匯集過的數據匯集在一起,你就無法找到這些模式。”
 
沒有意識到業務部門有獨特的需求
 
沒錯,統一的、集成的數據對于成功的分析計劃至關重要。但有些業務用戶可能需要不同版本的數據,Buff這樣說道。
 
她補充道:“一種形式的數據并不能滿足組織中每個人的需求。”
 
相反,IT要考慮數據供應,即提供業務用戶或業務部門確定的業務案例所需的數據。
 
她以金融機構不同的需求為例。盡管有些部門可能需要集成的數據,但欺詐檢測部門可能希望其數據科學家使用不干凈的數據,以便搜索危險信號。他們可能想搜尋同一地址的人,他們用個人識別信息的輕微變化來申請多筆貸款。
 
Buff解釋道:“你會看到類似但有細微變化的數據元素,所以你不想剔除和清理太多的差異。”
 
她說,另一方面,該金融機構的市場部希望擁有正確的客戶姓名、地址等內容,以便以正確的通信錄為目標。
 
只招數據科學家而不招數據工程師
 
隨著企業漸漸超越基礎的商業智能,轉向預測性和規范性分析以及機器學習和人工智能,他們要不斷提高數據團隊的專業水平。
 
反過來,數據科學家一職也因此受到了關注。但數據工程師同樣重要,他們整理了所有需要集成的數據集,以供數據科學家完成工作,但他們迄今為止鮮有組織問津。
 
貝恩公司(Bain & Co.)舊金山辦事處的合伙人兼高級分析和數字化實踐的領導者Lori Sherer說,這種情況正在發生變化。
 
Sherer說:“我們已經看到,對數據工程師的需求增長大約是對數據科學家需求增長的兩倍。”
 
聯邦勞工統計局預測,對數據工程師的需求在未來十年將持續快速增長,美國經濟體在2016年至2026年期間將增加44,200個職位,平均年薪已達135,800美元。
 
然而,專家說,數據工程師像很多IT部門的重要職位一樣,其數量無法滿足IT部門,這使現在剛剛開始招聘或培訓該職位的IT部門不得不迎頭追趕。
 
保留過時的數據,而非管理其生命周期
 
在過去十年中,存儲成本大幅下降,使IT部門能夠更輕松地存儲大量數據,而且存儲時間比以往任何時候都長。有鑒于如今數據創建的數量和速度,以及對用于分析的存儲容量的需求增長,這似乎是個好消息。
 
位于佛羅里達州阿波羅海灘的Soaring Eagle Consulting的聯合創始人、《挖掘新黃金:管理你的業務數據》一書的合著者Penny Garbus說,盡管很多人對擁有海量的數據和資料的價值表示贊賞,但過猶不及。
 
Garbus說,很多企業持有數據的時間太長了。
 
她說:“你不僅需要為此付費,而且如果它已存在10年之久,這些信息很可能遠遠過時了。因此我們鼓勵人們為數據設置期限。”
 
Garbus說,數據的截止日期不僅因組織而異,還因部門而異。零售公司的庫存部門可能只需要相對較新的數據,而市場營銷部門可能需要數年前的數據來跟蹤趨勢。
 
如果是這樣的話,IT要實施能夠將正確時間范圍內的數據傳遞到正確位置的體系結構,以確保所有人的需求都能得到滿足,并且舊數據不會破壞具有時效性的分析程序。
 
正如Garbus所指出的那樣:“不能因為你必須保留[舊數據],就認為你必須將它保存在核心環境中。而是你必須擁有它。”
 
關注數量,而非針對相關性
 
IT咨詢公司博思艾倫(Booz Allen Hamilton)的高級副總裁Steve Escaravage表示:“我們仍在建立模型并用可用性最高而非關聯度最高的數據運行分析。”
 
他說,組織往往會認為它們應該采集并不斷添加數據集。他說,它們認為“或許我們沒有找到要找的東西,而不是問:我們是否有合適的數據?”
 
他說,鑒于有很多機構通過分析海量數據來尋找異常情況,以此來尋找欺詐行為。這雖然是一項重要的活動,但領先的機構也會分析能獲得更好成果的更具針對性的數據集。在這種情況下,他們可能會考察產生某些類型交易的個人或機構,這些交易可能存在問題。又或者是,醫療機構在分析患者預后(patient outcome)時可能會考慮這樣的數據——醫生在提供患者護理時的輪班時間。
 
Escaravage表示,組織可以從創建數據愿望清單開始。雖然這個練習始于業務端,“始于理解這個清單并實現它,這是首席信息官、首席技術官或首席數據官的分內事。”
 
提供數據,但忽略了數據的出處
 
如今的熱點話題是分析的偏差,這種情況可能會扭曲結果,甚至會產生錯誤的結論,以糟糕的業務決策或結果告終。產生偏差的問題存在于企業分析計劃的多個不同領域——包括IT如何處理數據本身,Escaravage這樣說道。
 
他說,IT在追蹤它所擁有的數據的來源時往往做得不夠出色。
 
Escaravage認為,對數據產生的方式和位置缺乏可見性使偏差更難控制,他說:“如果你不知道這一點,這會影響你的模型的性能。”
 
他說:“了解數據來自哪里以及數據遭遇了什么,這是IT的責任。人們在數據管理方面投入頗多,但他們也應該有一個元數據管理解決方案。”
 
提供數據,但未能幫用戶理解情境
 
IT不僅要有強大的元數據管理計劃,而且還要跟蹤數據的來源以及它如何在系統中移動,應該讓用戶了解一些歷史數據,并為通過分析產生的一些結果提供情境,Escaravage這樣說道。
 
他說:“我們對自己能夠創造的東西感到非常興奮。我們認為自己有非常好的數據,尤其是未經分析的數據,我們可以根據這些數據的效用建立一個心理模型。盡管過去五年的分析方法令人驚嘆不已,但這些方法所產生的結果遠不如過去那么容易解釋——過去,你在數據挖掘之后應用業務規則,數據很容易得到解釋。”
 
Escaravage解釋說,更新的深度學習模型提供了洞察和可執行的建議。但是這些系統往往不會提供對最佳決策有幫助甚至至關重要的情境。例如,它沒有提供關于可能性的信息和基于數據可能會發生某事的確定性。
 
Escaravage說,人們需要更好的用戶界面來提供情境。
 
他說:“技術問題在于人們將如何與這些模型進行交互。這就是從透明度立場關注UI/UX的做法顯得十分重要的場合。因此,如果有人看到來自人工智能平臺的推薦,他們可以在多大程度上深入查看潛在的數據源?首席信息官將不得不問這樣一個問題——如何在他們的系統中建立這種透明度。”
 
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。

關鍵字:CIO數據分析

原創文章 企業網D1Net

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 荆州市| 游戏| 焦作市| 堆龙德庆县| 库尔勒市| 大宁县| 天峨县| 综艺| 佳木斯市| 托克逊县| 德安县| 宁国市| 兴城市| 卫辉市| 莱西市| 长子县| 洪湖市| 根河市| 安塞县| 昌宁县| 宝清县| 陇南市| 天门市| 吉林市| 大新县| 和田县| 富阳市| 镇平县| 类乌齐县| 宁城县| 夏邑县| 陆川县| 城口县| 白银市| 望江县| 绥芬河市| 丰宁| 许昌市| 隆子县| 抚顺县| 高要市|