精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

雅虎公開13.5TB用戶數據 參與人工智能

責任編輯:editor004

作者:張帆

2016-01-15 11:14:06

摘自:新浪科技

北京時間1月15日上午消息,雅虎周四公布了關于用戶如何使用該公司服務,例如雅虎新聞和雅虎財經的大量數據。雅虎提供了100行的數據范例,其中包含多種類型的數據,例如股票、學校、政治、體育和明星等。

北京時間1月15日上午消息,雅虎周四公布了關于用戶如何使用該公司服務,例如雅虎新聞和雅虎財經的大量數據。此舉是為了給學術界的機器學習研究者提供素材。

這并不是雅虎首次公布這樣的數據。在雅虎實驗室的Webscope項目中,雅虎曾56次發布這樣的數據,其中涉及廣告、圖片、社交媒體和評級等。此次公布的數據來自2015年的4個月時間,覆蓋了2000萬人,其中包括用戶訪問雅虎網站所使用的設備類型、文章的閱讀情況,以及文章的主題。其他數據還包括用戶的位置、年齡和性別,但這些數據都經過了匿名化處理。

不過值得指出的是,雅虎此次提供的數據集規模龐大,多達13.5TB。而雅虎此前提供的數據集通常只有1TB。

加州大學圣迭戈分校電氣和計算機工程教授格特·蘭克利特(Gert Lanckriet)表示:“我對此感到興奮。這是因為,學術界和工業界的這類合作對于更強大人工智能和機器學習技術的研究、設計和開發,現實世界中的大數據處理至關重要。”

近期,雅虎正在采取措施吸引開發者。例如,雅虎開源了一些算法。這些算法用于對流數據的計算和網頁爬蟲,處理網站上的結構化數據。雅虎此次公布的數據將幫助學術界進一步了解用戶的閱讀習慣,進而對自己的算法進行優化。

雅虎提供了100行的數據范例,其中包含多種類型的數據,例如股票、學校、政治、體育和明星等。

雅虎實際上還有更多數據可以分享。雅虎實驗室個性化科學研究總監蘇吉·拉簡(Suju Rajan)表示,她常常需要與PB(1PB=1000TB)級別的數據量打交道,而對雅虎這樣的互聯網公司來說并不少見。不過,PB級別的數據對單一研究者來說很難處理,即使是13TB的數據都已顯得十分龐大。

雅虎實驗室研究副總裁里卡多·貝扎-耶茨(Ricardo Baeza-Yates)表示:“許多人都沒有能力使用這一數據,但我們認為,通過這種方式我們可以推進相關研究。”

鏈接已復制,快去分享吧

企業網版權所有?2010-2025 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 柳江县| 桦甸市| 阳朔县| 陆河县| 桦川县| 南昌市| 菏泽市| 故城县| 仁怀市| 海阳市| 金秀| 桐梓县| 乌审旗| 文登市| 卓尼县| 新疆| 资阳市| 乌拉特后旗| 巩留县| 射阳县| 平利县| 莎车县| 庄河市| 达拉特旗| 夏邑县| 保康县| 天镇县| 岗巴县| 年辖:市辖区| 吴江市| 土默特左旗| 确山县| 道真| 浦江县| 韶山市| 江川县| 贵南县| 商洛市| 荃湾区| 阿拉尔市| 台南市|