精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

治理分析應用 保護客戶數據

責任編輯:editor005

作者:Craig Stedman

2015-07-29 14:34:18

摘自:TechTarget中國

CDPQ是加拿大魁北克省蒙特利爾市一家公司,該公司管理著加拿大魁北克的公共部門養老基金。他強調說:“我們看起來像是常規的時尚業公司,但是我們必須有良好的數據存儲使消費者信服,進而只租不買”。

CDPQ是加拿大魁北克省蒙特利爾市一家公司,該公司管理著加拿大魁北克的公共部門養老基金。該公司正面臨一個棘手的問題:如何監管其數據科學家和業務分析師基于分析應用所做的工作,同時還不會妨礙他們的工作。

作為新數據管理架構的一部分,其設計是為幫助提升其分析能力,CDPQ在數據倉庫內部設置了分離的數據沙箱,給分析師提供探索和原型用途。CDPQ負責建模和業務分析的高級主管Luc Veillette介紹,他們的目標是為分析師們清理道路,快速研制算法并對業務問題給出答案——最終實現更好的投資計劃和投資組合管理決策。

但是,這并不意味著可以全權委托。CDPQ的數據治理項目包括一組使用規則,例如:只要有可用的官方公司數據源,分析師們必須使用這些數據源;分析模型需要在審計階段審查。他和其它經理們還要對分析活動保持關注。

他說:“我們對于我們的數據科學家做什么,努力形成集中的認識。另外CDPQ想確保分析過程有文檔記錄下來,而且數據不會被誤用。即便如此,治理工作也并不是高壓強制措施,而是一種協作行為,為了讓業務單元持續走上數據驅動的發展方向。”

Intuit公司個人理財軟件開發者已經把這種協作帶到了另一個層面。兩年前,Intuit把其150人的分析團隊安置為法務部門的一部分,并且讓律師們和分析經理、數據科學家和其他員工配合工作,一起確立訪問和分析不同客戶數據集的規則,使各個產品線配合更加緊密。

分析應用程序的不同優先級

Laura Fennell是Intuit公司的高級副總裁,兼法律顧問和秘書,他說此舉是因擴展分析應用的需求而產生的,為了推動產品研發和市場策略,同時維護客戶個人信息,盡力避免任何形式的數據誤用。誤用可能會損害加利福尼亞州Mountain View公司的名聲。

Fennell說:“我們必須做正確的事。分析的利益是巨大的,但是風險也是巨大的。我們客戶的信任就是品牌的一切。這是我們客戶的數據,不是我們的數據。涉及信息總量巨大:截止今年年初,我們有超過五千萬客戶,數據累積超過6PB。”

分析團隊負責人Bill Loconzolo在剛剛結束的Strata+Hadoop2015全球大會上展示了一次聯合演示,Fennell承認“我們對關系的處理真是萬事開頭難”。法律團隊看到了大量需要保護的敏感數據,數據科學家質疑如果在流程中有律師參與,他們怎么能做出來創新性的分析工作。Loconzolo說,即便現在,為什么分析團隊屬于法律部門也仍然是“一個不斷被問及的問題,我們一直在解答這個問題”,每次他和其他管理者們招募到了新的分析師就需要解釋一次。

但是,Loconzolo說這種搭配經證明是有好處的,他現在的頭銜是數據工程副總裁。在此之前,分析團隊主要是為明確客戶數據保護措施而努力工作,作為獨立的業務單元一對一的交流,法律團隊在形成技術決策以后提供輸入。但是,Loconzolo說這樣做流程太慢而且“極其痛苦”,可能會要幾年時間才能完成整個公司64個產品名錄的相關工作。Intuit加快了這項工作,把更多數據放到了專為分析用途建立的私有云,經過這樣的集中化處理,就把律師從業務單元帶到了原始數據的面前。

律師們還必須調整他們對新流程環節的認識。Fennell說:“我們的工作必須調整,不能只是說不行,要考慮我們怎樣能使工作運轉起來。目標不是完全鎖定在客戶數據,而是要弄清楚如何使數據量合適,以便分析師們可以完成他們的工作。要避免不同方向兩頭使勁,他們要把待分析數據訪問的目標共享出來,讓大家都能有分析用途的數據訪問,也分擔了實現那些目標的職責。”

Rent the Runway 是紐約一家創業公司,該公司利用互聯網租借禮服和時尚配飾用于婚禮、聚會派對和其它活動。該公司要處理的數據比Intuit少,但是對于處理系統中的客戶數據避免步驟出錯也有類似的擔憂。

Vijay Subramanian是該公司的首席分析官。他說:“這正是我們思考的內容。我們的理念是‘客戶至上,信任第一’”。由于Rent the Runway 公司現在還沒有自己的法務部門,所以他在外面聘請律師來操作,審核在線表單收集的尺碼信息和其他數據,這些數據會導入到網站的推薦引擎中用來幫助給訪問網站的用戶推薦他們可能喜歡的服飾。

為分析項目限制時間

該創業公司資源非常有限,而其業務需求變化很快。結果,Subramanian試圖限制他的團隊所做開發項目的周期不超過三個月到六個月。他說:“對于要做的業務來說,超過這個時間范圍就有巨大風險,我們沒有那么奢侈的時限。”

Rent the Runway公司的數據科學家們使用Python或者開源R編程語言來編寫機器學習算法,包括增強的推薦引擎和用于微調定價的需求預測系統。為幫助保證開發流程向前推進,Subramanian采用了所謂的最小化變化產品方法學,該策略限制算法實現盡可能少的功能并高效實現。他說,然后數據科學家們可以回過頭來在另一輪開發周期中再添加算法,他希望在項目中避免“沙漠中漫無目的的游蕩”。

在后端,Rent the Runway公司把數據放到數據倉庫,使用了HP的Vertica數據庫,把來自MySQL系統的傳統數據和來自MongoDB的NoSQL數據(存儲關于對服飾的態度評價信息),還有跟蹤網站活動的JSON日志文件混存到了一起。隨著該公司數據量的增長,Subramanian說他希望最終在Vertica之前增加一套Hadoop系統作為資產存儲所有原始數據。

在他們公司有一件事永遠不會落伍,就是在利用分析應用改善業務方面做投資。Rent the Runway公司需要數據來驅動成功。他強調說:“我們看起來像是常規的時尚業公司,但是我們必須有良好的數據存儲使消費者信服,進而只租不買”。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 盈江县| 阳东县| 宽甸| 望江县| 迭部县| 宿迁市| 六盘水市| 万盛区| 石狮市| 房山区| 楚雄市| 伊春市| 凯里市| 法库县| 团风县| 永登县| 女性| 兴城市| 夏津县| 茶陵县| 梅州市| 永福县| 长葛市| 淮滨县| 芦溪县| 荆州市| 长泰县| 汝城县| 宁国市| 南京市| 石景山区| 新津县| 海伦市| 永兴县| 沾化县| 北流市| 洛川县| 杭州市| 江川县| 化德县| 营口市|