精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:大數據業界動態 → 正文

大數據:我們大家貢獻出來的

責任編輯:editor004 |來源:企業網D1Net  2014-01-07 11:19:13 本文摘自:至頂網

在國外,大數據在農業研究、金融市場、氣象預報、交通管理、新聞報道等方面已經應用得很廣泛。大數據會怎樣改變我們的生活?大數據距離普通個體到底有多遠?大數據作為新興產業應如何科學理性發展?

用當下工具處理不了的數據就是大數據

大數據是今天才有的嗎?對此,工業和信息化部電信研究院互聯網中心主任何寶宏告訴大家,大數據不是今天出現的,而是當一個時代的人無法用那個時代的工具來處理的數據,就可以稱為大數據。所以,現在的大數據,就是現代人用現代工具處理不了的數據。

人口普查,就是一個海量的數據。美國人口普查10年一次,1880年的人口普查用了8年,1890年大概用了13年時間。何寶宏說,任何一次挑戰,都會導致一次新的技術革命。自從有人發明了穿孔卡片制表機,美國人口普查用一年時間就完成了。是人口普查催生了現代信息產業的誕生,也就是計算機的誕生。

早期是人口的大數據,后來又發明了用數據來表示長度、重量、體積和面積,現在計算機用非常精確的數據表示不同的顏色,以及電流、電壓、聲音、圖像。何寶宏分析認為,準確地用數據或大數據方式描述醫學或者描述遺傳學的,很可能會獲諾貝爾獎。事實上,去年的諾貝爾化學獎獲得者就做了大數據分析。

人際關系也能用數據來表達

何寶宏說,今天我們的社交網絡,像QQ、微信,實際上就是一種將人類關系數據化的過程。幾年前大家恐怕還難以想象人際關系怎么能用數據來表示,而現在卻已經做到了。在外國互聯網最早開始時,我們是被動地將自己的數據留在互聯網上讓大家處理分析;微博、微信時代,我們開始主動往互聯網上輸送信息,特別是在移動互聯網時代,隨時隨地都在產生數據;而到了云計算時代,不僅是隨時隨地產生數據,人們還希望把整個硬盤上的數據都搬到云計算上分析處理,作為大數據的組成部分。

為什么今天大數據那么熱?何寶宏認為,首先是我們確實獲取數據的渠道太多了,像物聯網、互聯網、基因、量子力學等等,都是在用數據描述世界,采集數據的工具越來越多樣化;其次是云計算的興起,云計算時代可以廉價、高效地處理大數據。但他說,如果沒有辦法用經濟有效的方式去處理大數據,數據就沒有用。

大數據帶來了生活方式的轉變

何寶宏說,大數據還給我們帶來了生活習慣和方式的轉變。譬如營銷,目前大數據最成熟的應用是互聯網廣告營銷,公眾在搜索或者瀏覽網頁時推出的廣告越來越精確。傳統媒體的廣告支撐主要是靠拍賣,而互聯網廣告已經進展到了一個新的時代,是實時競價——某個人在瀏覽某個網頁時廣告是自動、動態生成的,哪個人愿意投廣告,多少人投標,基本上可以分析出這個人的性格特征,所有的東西都是在一秒鐘之內完成的。而現在的傳統媒體投廣告,沒有幾個月時間是難以實現的。

還有銀行。金融業本身就是數據的行業,去年互聯網金融非常熱,根基就是由于大數據技術的來臨。比如,在互聯網上記錄每一筆交易的單筆成本是2元,而傳統銀行放一筆貸款大概需要800元~2000元的費用,所以廣大中小企業都變成了互聯網金融的客戶。

大數據的作用還體現在能夠引導公眾的行為方式,甚至影響思想意識。最重要的是,大數據不但可以運用互聯網發展,還可以運用物聯網發展。物聯網典型的就是智慧城市發展中利用大數據來發展智慧城市,而智慧城市最重要的是提高政府對城市的管理水平和服務水平。大數據可以運用到社會的方方面面,軍事、政治、社會管理、醫療、交通、物流、金融服務、消費、食品安全、環境、氣象。比如,智慧醫療就可以在大數據的幫助下實現。比如,心臟病患者平時做心電圖時,醫生花幾十秒的時間隨便一看可能看不出啥問題,因為沒有歷史數據無法進行分析。現在有了大數據,就可以對累計數據進行分析,用遠程實時監測、預測心臟病發生的幾率并做出預判處理。

推動大數據的動力是人類對分析世界的渴望

既然大數據這么重要,那么推動大數據的動力是什么?張新生認為,核心動力是人類對測量記錄和分析世界的渴望。他說,互聯網、移動互聯網、物聯網和云計算的快速發展,使人類測量、記錄和分析世界成為可能。

今天是信息爆炸時代。張新生說,信息爆炸時代如果不利用大數據,或者沒有手段利用,我們就會被信息淹死。好在今天有了云技術,可以對所有的數據進行存儲、記錄、測量、分析。云技術的出現,使人類測量、記錄和分析世界成為可能。

而在過去我們認識的物理世界里,在分析時要做大量的實證性工作,比如做問卷、訪談,得到一小部分樣本進行分析、計算,最后得出結論。在那種條件下,認識整個世界太慢、太復雜了,但今天所有的東西都在網絡中,都在大的云計算平臺里,可以在網絡上精確地再現現實世界全貌的模型——如同有人所說,今天我們可以把現實世界用投影儀投在幕布上。

有能力,就可以從大量的信息中提取有用的數據,獲取價值,但如果沒有能力,就會被大數據淹死。張新生說,通過先進技術從海量的信息中挖掘出有質量、有價值的數據,并且使大量有價值的數據轉化成知識,是大數據今天要解決的關鍵問題。

大數據是我們大家貢獻出來的

大數據是從哪兒來的?唐雄燕說,其實是我們大家貢獻出來的。比如,平時有些隱私的話可能不會跟家里人說,但告訴百度了;上網搜什么東西,百度知道;社交關系誰掌握,所用的微信和QQ會掌握;購物愛好和習慣,淘寶網、京東網知道;通話和上網記錄,三個運營商可能有;身份、家庭和房產信息,政府那里有;在哪里刷了信用卡,銀行知道;現在人在哪兒,你的手機可能掌握。

要在數據里找出有價值的東西來,這就是大數據技術的核心,迅速完成數據價值的提純。比如,監控了你一整天,可能真正有用的數據,就是在一兩秒鐘內發現你干了壞事。這是如何找出來的?這就是數據挖掘技術的關鍵。通過大數據應用可達到什么目的?唐雄燕認為,對我們的管理來說實現了更高效的管理,對商業來說實現了更精確的營銷,對于社會很多事件的發生,或者是環境的預測來說,則提供了更及時的預測,以及更優質的服務。比如,谷歌通過對搜索的分析判斷流感的趨勢,和美國疾控中心的數據完全是一致的,而且速度更快。

大數據應用靠技術來支撐

大數據到底是一種現象還是一種技術?百度公司發展研究中心副主任率鵬認為,沒有技術支撐的大數據是沒有辦法應用起來的。

比如,在“百度知心”上搜索“劉德華”,除了在屏幕左側展現劉德華的基本信息,還同時在右側展現用戶在訪問“劉德華”信息過程中可能會感興趣的其他資料——代表作、家庭情況、個人生活信息,甚至目前和他關系緊密的一些其他藝人的資料。這樣一些信息,恰恰是對于用戶在百度上對劉德華大量的搜索行為總結和歸納的基礎上,才把知心的信息歸納并且展現出來的。

搜索“紫色的小花”,百度就會給出很多類似的花卉,并且一定是紫色的,同時這個花一定不大。這樣的搜索結果,也都是通過對于大數據的歸納和處理總結出來的。還有“PK大咖”——拍一張自己的照片,百度就能告訴你哪個明星和你長得最像,相似度有多少。

“百度翻譯”,則是通過大數據和學習的技術,上線了24種語言不同的翻譯工具,其中有12種是整個百度翻譯團隊都沒有人懂的。率鵬說,在完全不了解、不懂得、不理解這種語言的情況下,正是大數據技術的支撐,開發出了這個在行業中質量非常領先的翻譯工具。

大數據對隱私保護提出了挑戰

大數據的應用,會讓人們在上網、刷卡時把自己的信息暴露出來,因而就產生了關于隱私保護的問題。大公司對于用戶隱私的保護是非常嚴格的,包括最近國內的10家公共云服務企業做了內部評測,它們是可信和有保障的。

但他也指出,對于政策制定來說,原來對用戶的隱私保護更多側重于隱私本身是什么,如個人的名字、電話號碼、銀行賬號等。而大數據時代除了保護這些信息,需要一些新的思路和方法,如果只是保護用戶信息的采集環節,在大數據時代就是不完整的,因為總有一些其他信息能夠分析出有些涉及用戶隱私的信息。就是說企業掌握這個數據,或者掌握這些分析是允許的,但法律要禁止的是拿這些數據不能做什么。他認為,大數據時代對隱私保護提出了新的挑戰。

大企業在隱私的保護上相對會有比較完善的手段,也不敢輕易去作惡,如果要作惡的話,代價是非常大的。但一些小的企業,就比較容易出問題了。隨著大數據的發展,將來騙子在互聯網上也是透明的,如果有不良行為,很快就可以被抓住。有了大數據,反而能增強信息的安全。

率鵬則認為,首先是國家有相關的法律進行保護和約束。在隱私問題上,他重點強調了兩個概念:一是符號化,二是用戶特征。所謂符號化,就是當去識別一個用戶的時候,實際上是用和他的真實信息不相關的符號標記這個用戶,這個符號是通過算法來保證的,使你下一次登陸時依然能夠識別出和上一次登陸是同一個用戶,但是從技術上,卻沒有辦法通過這個符號反推出這個人在真實生活中的姓名、電話和住址,這些信息和這個符號都是沒有辦法關聯起來的,是單向的識別,而不是在網絡上肖像和真實身份掛接起來。這就使得基本享受了大數據帶來的優勢,同時又規避了信息安全的風險。

所謂用戶特征,則意味著在大數據時代,企業感興趣的往往是這個用戶的特征,而不是家庭地址、電話號碼那些敏感的信息。如果在數據使用過程中嚴格遵循這些原則的話,就能夠規避風險。率鵬特別提到,有些用戶會把照片發到微博上,或者把真實的履歷信息以一種公開的形式放在互聯網上。他認為,在大數據時代,迫切需要向用戶加強對于保護個人信息意識的教育,即安全上網的教育。

關鍵字:實時競價信時代谷歌數據挖掘技術

本文摘自:至頂網

x 大數據:我們大家貢獻出來的 掃一掃
分享本文到朋友圈
當前位置:大數據業界動態 → 正文

大數據:我們大家貢獻出來的

責任編輯:editor004 |來源:企業網D1Net  2014-01-07 11:19:13 本文摘自:至頂網

在國外,大數據在農業研究、金融市場、氣象預報、交通管理、新聞報道等方面已經應用得很廣泛。大數據會怎樣改變我們的生活?大數據距離普通個體到底有多遠?大數據作為新興產業應如何科學理性發展?

用當下工具處理不了的數據就是大數據

大數據是今天才有的嗎?對此,工業和信息化部電信研究院互聯網中心主任何寶宏告訴大家,大數據不是今天出現的,而是當一個時代的人無法用那個時代的工具來處理的數據,就可以稱為大數據。所以,現在的大數據,就是現代人用現代工具處理不了的數據。

人口普查,就是一個海量的數據。美國人口普查10年一次,1880年的人口普查用了8年,1890年大概用了13年時間。何寶宏說,任何一次挑戰,都會導致一次新的技術革命。自從有人發明了穿孔卡片制表機,美國人口普查用一年時間就完成了。是人口普查催生了現代信息產業的誕生,也就是計算機的誕生。

早期是人口的大數據,后來又發明了用數據來表示長度、重量、體積和面積,現在計算機用非常精確的數據表示不同的顏色,以及電流、電壓、聲音、圖像。何寶宏分析認為,準確地用數據或大數據方式描述醫學或者描述遺傳學的,很可能會獲諾貝爾獎。事實上,去年的諾貝爾化學獎獲得者就做了大數據分析。

人際關系也能用數據來表達

何寶宏說,今天我們的社交網絡,像QQ、微信,實際上就是一種將人類關系數據化的過程。幾年前大家恐怕還難以想象人際關系怎么能用數據來表示,而現在卻已經做到了。在外國互聯網最早開始時,我們是被動地將自己的數據留在互聯網上讓大家處理分析;微博、微信時代,我們開始主動往互聯網上輸送信息,特別是在移動互聯網時代,隨時隨地都在產生數據;而到了云計算時代,不僅是隨時隨地產生數據,人們還希望把整個硬盤上的數據都搬到云計算上分析處理,作為大數據的組成部分。

為什么今天大數據那么熱?何寶宏認為,首先是我們確實獲取數據的渠道太多了,像物聯網、互聯網、基因、量子力學等等,都是在用數據描述世界,采集數據的工具越來越多樣化;其次是云計算的興起,云計算時代可以廉價、高效地處理大數據。但他說,如果沒有辦法用經濟有效的方式去處理大數據,數據就沒有用。

大數據帶來了生活方式的轉變

何寶宏說,大數據還給我們帶來了生活習慣和方式的轉變。譬如營銷,目前大數據最成熟的應用是互聯網廣告營銷,公眾在搜索或者瀏覽網頁時推出的廣告越來越精確。傳統媒體的廣告支撐主要是靠拍賣,而互聯網廣告已經進展到了一個新的時代,是實時競價——某個人在瀏覽某個網頁時廣告是自動、動態生成的,哪個人愿意投廣告,多少人投標,基本上可以分析出這個人的性格特征,所有的東西都是在一秒鐘之內完成的。而現在的傳統媒體投廣告,沒有幾個月時間是難以實現的。

還有銀行。金融業本身就是數據的行業,去年互聯網金融非常熱,根基就是由于大數據技術的來臨。比如,在互聯網上記錄每一筆交易的單筆成本是2元,而傳統銀行放一筆貸款大概需要800元~2000元的費用,所以廣大中小企業都變成了互聯網金融的客戶。

大數據的作用還體現在能夠引導公眾的行為方式,甚至影響思想意識。最重要的是,大數據不但可以運用互聯網發展,還可以運用物聯網發展。物聯網典型的就是智慧城市發展中利用大數據來發展智慧城市,而智慧城市最重要的是提高政府對城市的管理水平和服務水平。大數據可以運用到社會的方方面面,軍事、政治、社會管理、醫療、交通、物流、金融服務、消費、食品安全、環境、氣象。比如,智慧醫療就可以在大數據的幫助下實現。比如,心臟病患者平時做心電圖時,醫生花幾十秒的時間隨便一看可能看不出啥問題,因為沒有歷史數據無法進行分析。現在有了大數據,就可以對累計數據進行分析,用遠程實時監測、預測心臟病發生的幾率并做出預判處理。

推動大數據的動力是人類對分析世界的渴望

既然大數據這么重要,那么推動大數據的動力是什么?張新生認為,核心動力是人類對測量記錄和分析世界的渴望。他說,互聯網、移動互聯網、物聯網和云計算的快速發展,使人類測量、記錄和分析世界成為可能。

今天是信息爆炸時代。張新生說,信息爆炸時代如果不利用大數據,或者沒有手段利用,我們就會被信息淹死。好在今天有了云技術,可以對所有的數據進行存儲、記錄、測量、分析。云技術的出現,使人類測量、記錄和分析世界成為可能。

而在過去我們認識的物理世界里,在分析時要做大量的實證性工作,比如做問卷、訪談,得到一小部分樣本進行分析、計算,最后得出結論。在那種條件下,認識整個世界太慢、太復雜了,但今天所有的東西都在網絡中,都在大的云計算平臺里,可以在網絡上精確地再現現實世界全貌的模型——如同有人所說,今天我們可以把現實世界用投影儀投在幕布上。

有能力,就可以從大量的信息中提取有用的數據,獲取價值,但如果沒有能力,就會被大數據淹死。張新生說,通過先進技術從海量的信息中挖掘出有質量、有價值的數據,并且使大量有價值的數據轉化成知識,是大數據今天要解決的關鍵問題。

大數據是我們大家貢獻出來的

大數據是從哪兒來的?唐雄燕說,其實是我們大家貢獻出來的。比如,平時有些隱私的話可能不會跟家里人說,但告訴百度了;上網搜什么東西,百度知道;社交關系誰掌握,所用的微信和QQ會掌握;購物愛好和習慣,淘寶網、京東網知道;通話和上網記錄,三個運營商可能有;身份、家庭和房產信息,政府那里有;在哪里刷了信用卡,銀行知道;現在人在哪兒,你的手機可能掌握。

要在數據里找出有價值的東西來,這就是大數據技術的核心,迅速完成數據價值的提純。比如,監控了你一整天,可能真正有用的數據,就是在一兩秒鐘內發現你干了壞事。這是如何找出來的?這就是數據挖掘技術的關鍵。通過大數據應用可達到什么目的?唐雄燕認為,對我們的管理來說實現了更高效的管理,對商業來說實現了更精確的營銷,對于社會很多事件的發生,或者是環境的預測來說,則提供了更及時的預測,以及更優質的服務。比如,谷歌通過對搜索的分析判斷流感的趨勢,和美國疾控中心的數據完全是一致的,而且速度更快。

大數據應用靠技術來支撐

大數據到底是一種現象還是一種技術?百度公司發展研究中心副主任率鵬認為,沒有技術支撐的大數據是沒有辦法應用起來的。

比如,在“百度知心”上搜索“劉德華”,除了在屏幕左側展現劉德華的基本信息,還同時在右側展現用戶在訪問“劉德華”信息過程中可能會感興趣的其他資料——代表作、家庭情況、個人生活信息,甚至目前和他關系緊密的一些其他藝人的資料。這樣一些信息,恰恰是對于用戶在百度上對劉德華大量的搜索行為總結和歸納的基礎上,才把知心的信息歸納并且展現出來的。

搜索“紫色的小花”,百度就會給出很多類似的花卉,并且一定是紫色的,同時這個花一定不大。這樣的搜索結果,也都是通過對于大數據的歸納和處理總結出來的。還有“PK大咖”——拍一張自己的照片,百度就能告訴你哪個明星和你長得最像,相似度有多少。

“百度翻譯”,則是通過大數據和學習的技術,上線了24種語言不同的翻譯工具,其中有12種是整個百度翻譯團隊都沒有人懂的。率鵬說,在完全不了解、不懂得、不理解這種語言的情況下,正是大數據技術的支撐,開發出了這個在行業中質量非常領先的翻譯工具。

大數據對隱私保護提出了挑戰

大數據的應用,會讓人們在上網、刷卡時把自己的信息暴露出來,因而就產生了關于隱私保護的問題。大公司對于用戶隱私的保護是非常嚴格的,包括最近國內的10家公共云服務企業做了內部評測,它們是可信和有保障的。

但他也指出,對于政策制定來說,原來對用戶的隱私保護更多側重于隱私本身是什么,如個人的名字、電話號碼、銀行賬號等。而大數據時代除了保護這些信息,需要一些新的思路和方法,如果只是保護用戶信息的采集環節,在大數據時代就是不完整的,因為總有一些其他信息能夠分析出有些涉及用戶隱私的信息。就是說企業掌握這個數據,或者掌握這些分析是允許的,但法律要禁止的是拿這些數據不能做什么。他認為,大數據時代對隱私保護提出了新的挑戰。

大企業在隱私的保護上相對會有比較完善的手段,也不敢輕易去作惡,如果要作惡的話,代價是非常大的。但一些小的企業,就比較容易出問題了。隨著大數據的發展,將來騙子在互聯網上也是透明的,如果有不良行為,很快就可以被抓住。有了大數據,反而能增強信息的安全。

率鵬則認為,首先是國家有相關的法律進行保護和約束。在隱私問題上,他重點強調了兩個概念:一是符號化,二是用戶特征。所謂符號化,就是當去識別一個用戶的時候,實際上是用和他的真實信息不相關的符號標記這個用戶,這個符號是通過算法來保證的,使你下一次登陸時依然能夠識別出和上一次登陸是同一個用戶,但是從技術上,卻沒有辦法通過這個符號反推出這個人在真實生活中的姓名、電話和住址,這些信息和這個符號都是沒有辦法關聯起來的,是單向的識別,而不是在網絡上肖像和真實身份掛接起來。這就使得基本享受了大數據帶來的優勢,同時又規避了信息安全的風險。

所謂用戶特征,則意味著在大數據時代,企業感興趣的往往是這個用戶的特征,而不是家庭地址、電話號碼那些敏感的信息。如果在數據使用過程中嚴格遵循這些原則的話,就能夠規避風險。率鵬特別提到,有些用戶會把照片發到微博上,或者把真實的履歷信息以一種公開的形式放在互聯網上。他認為,在大數據時代,迫切需要向用戶加強對于保護個人信息意識的教育,即安全上網的教育。

關鍵字:實時競價信時代谷歌數據挖掘技術

本文摘自:至頂網

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 日土县| 牡丹江市| 合作市| 永安市| 宁国市| 当阳市| 原平市| 来宾市| 通州区| 恩施市| 永昌县| 志丹县| 托克托县| 肇东市| 齐齐哈尔市| 丹凤县| 宜城市| 苍南县| 阿图什市| 西乡县| 离岛区| 拉萨市| 涞源县| 黄冈市| 岢岚县| 凯里市| 冀州市| 德保县| 海兴县| 太和县| 岑溪市| 城口县| 南华县| 江北区| 南漳县| 东乡县| 琼中| 崇阳县| 门源| 云和县| 九寨沟县|