精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

云計算時代 企業要如何迎接大數據?

責任編輯:zsheng

2018-06-14 19:13:19

摘自:西部數碼

隨著云計算的落地,“大數據”已成為業界討論最廣泛的關鍵詞之一,很多企業已經在尋找合適的BI工具來處理不同來源收集到的大數據,但盡管大家對于大數據的意識在提高,但只有少部分的企業如谷歌和Facebook這樣的企業才能夠真正利用大數據挖掘企業商業價值。

隨著云計算的落地,“大數據”已成為業界討論最廣泛的關鍵詞之一,很多企業已經在尋找合適的BI工具來處理不同來源收集到的大數據,但盡管大家對于大數據的意識在提高,但只有少部分的企業如谷歌和Facebook這樣的企業才能夠真正利用大數據挖掘企業商業價值。

其實隨著大數據時代的來臨,企業對于大數據的理解不應僅限于對Apache Hadoop這樣的基礎技術的了解,企業應該要從基礎設施角度來了解和保護企業擁有的大數據。因為在未來3到5年,我們將會看到那些真正理解大數據并能利用大數據進行價值挖掘的企業和不懂得大數據價值挖掘企業之間的差距,真正能夠利用好大數據的企業必然具備強勁有力的競爭優勢,從而成為行業的大佬。

事實上,目前很多企業都已經開始關注大數據,廠商也開始大肆介紹自己的大數據產品,相關會議持續不斷,這也讓我們看到大數據知識普及的成功,但這只是從思想工作角度來看的,當我們尋找那些真正能挖掘大數據商業價值的企業時,幾乎寥寥無幾,所以就目前來看,大數據價值的挖掘還只是處于初級階段。

未來真正能夠在大數據中挖到第一桶金的必然是像Facebook和Google這樣的企業,他們在數據管理和數據開采方面具備先天的優勢,所以有理由相信他們將會引領這個大數據時代。除了他們,其他要想在大數據時代引領前端的企業必定是那些行業里的領導者,因為他們有提早布局以此建立行業標準的野心。

大數據的角色

大數據在IT領域到底扮演著什么樣的角色呢?舉個例子來說說這個問題吧。例如,制藥企業如果想要進入制藥行業的100強,那么他就必須要抓取上百萬個相關網頁的數據,然后進行分析、擦除無用信息最后才能找到有價值的信息。對于一個汽車制造商來說,它需要實時手機那些駕駛在道路上的汽車的信息。

盡管企業已經意識到大數據的機制,但卻不知道如何才能從中挖掘到商業價值。大數據就像是一個深入大海底部的大魚網,有的金槍魚、大白鯊等精品,但同時也有蝦米、貝殼等價值低的便宜貨。而我們的企業是大小通吃的,這樣龐大的數據如何挖掘價值也就成為了一個頭疼的難題。

大數據里的語義數據模型

大數據的數據很大一部分屬于非結構化數據,包括語音、視頻、圖片、文檔、論壇、網頁等,如何才能輕松的操作這些數據呢?建立一個語義數據層是一個很不錯的方法,你可以從中提取可用數據在數據庫之上建立一個數據語義模型層,以此來幫助你理解地下所有的信息。

從不同來源收集到數據之后,企業要將其放置在一起,然后開始分析、處理這些數據。傳統的做法是建立一個數據倉庫,將這些收集到的數據提取到建立好的數據倉庫中并生成報告。但這是一個相當耗時的過程,而且還無法靈活進行,每次你要做修改,都必須要回到數據倉庫去做修改,相當的頭疼。

大數據的數據容量是如此龐大,我們需要處理一大堆相關信息,這些信息來源都不同。不同的人對同一個東西的描述也都不一樣,語義技術就能夠幫助判斷出這些叫法是否講的是同一個事物。例如,有人會叫IBM為“IBM”,有人則稱其為“International Business Machines”,其實說的都是一個公司,其實計算機是很笨的,只有通過這個語義數據模型層就能進行很好的判斷。

大數據里的風險管理

在數據管理的時候,將所有數據放在一個地方是有很大的風險的,為了數據的安全,數據應該存儲不同的地方。如數值數據可以存儲在數據庫里,非結構化的數據則可以存儲在文檔或者表格里。我們看到,增加了這些不同來源的風險信息的語義描述,意味著我們可以迅速了解綜合風險狀況。

通過語義數據模型一個最大的好處就是,在進行修改時,無需回到數據最底層進行修改,去重寫遺留系統和數據庫語義。因為這個語義數據模型是在數據之上的,它的破壞性遠小于其他的技術,只要我們為一個來源的數據提供一個語義定義,我們就可以直接應用到其他來源的數據之上。

其實這個技術并不是為程序員或是數據庫管理人員設計的,而是為業務人員設計。業務人員他需要明白這些數據對他而言是何意義,他看不懂最底層的數據表格,他希望能夠直觀的看到一段時間內銷售量與其他因素的關系,而這些只有通過我們的語義數據模型層才能做到。近幾年,IT部門與業務部門的界限其實開始漸漸模糊,業務部門能夠更好的明確自己的需求,而IT部門也能更好的滿足業務部門的需求,雖然還沒達到最佳的狀態,但已經超著這個方向在努力了。

大數據的安全問題

對于收集到的數據的訪問需求,也以為這企業需要保證這些數據的安全性。

很多企業在數據安全方面犯的最大錯誤就是做完架構、設計、開發等所有工作之后,才開始考慮安全問題,這是非常大的錯誤。所以實數據安全性應該從開始之初就要考慮安全架構問題。

安全架構的搭建只是一個方面,為了保證數據的安全,建議企業將數據切片進行存儲。因為這樣能夠做到更精確的控制。其實每一塊的數據都是企業的資產,在這里可以設置公司員工對于這個數據資產的權限,如查看、修改、刪除等權限。當然還要對這些數據進行加密,這樣一來,就算有人侵入數據庫盜用了這個部分的數據,我們還是比較安全的,因為無上下文的數據對于竊取者來說并無多大意義,因為大數據的價值密度很低。

在這里不得不提到“’toxic data”,這個詞是Forrester提出的,主要指的是企業手中“毒數據”。舉個例子解釋一下,大家可以想象一下無線公司收集到的數據,其中包括登錄到信號塔的用戶信息,用戶在線時間、用戶使用的數據,他們的地理位置是否移動等,企業通過這些數據可以進行用戶行為分析,但與此同時,公司還能收集到用戶的信用卡密碼、社交網站的密碼、購買習慣等用戶私人信息。

這些數據應該說是具有相當大的價值,為何又稱為“毒數據”呢?因為一旦這些數據流出落入非法份子手上,勢必對企業和個人造成巨大的損失。

世界是很公平的,收入與風險是成正比。但為了降低風險,這時對數據的加密就變得尤為的關鍵。

談到大數據,最基本的做法是使用透明數據加密法——那就是對所有捕獲到的數據都進行加密。這樣能保證企業的所有數據都是經過加密的。過去,考慮到成本問題,很多企業都不愿意這么做,但現在有很多開源的加密方法可供企業進行選擇。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 泰来县| 彭水| 惠安县| 靖边县| 交城县| 九江县| 双桥区| 郁南县| 铁力市| 治多县| 广水市| 子洲县| 中牟县| 华阴市| 抚顺县| 德江县| 兰西县| 昌乐县| 鲁山县| 吴堡县| 新疆| 昌江| 时尚| 凤翔县| 平利县| 环江| 大厂| 驻马店市| 马山县| 雷州市| 呼伦贝尔市| 白玉县| 辉南县| 合川市| 鹤岗市| 沈丘县| 新邵县| 新营市| 台北市| 温宿县| 云南省|