精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

大數據:之于人的“大腦”

責任編輯:editor008

2014-09-24 09:39:50

摘自:36大數據

現如今,在大數據時代下,當我們提到大數據,我們通常想到的網站:十億社交媒體的用戶,數以百萬計的手機感應器,成千上萬的維基百科的貢獻詞條等等。由于最近的創新,網絡級數據現在也可以來自一個小但非常復雜的對象——大腦。

現如今,在大數據時代下,當我們提到大數據,我們通常想到的網站:十億社交媒體的用戶,數以百萬計的手機感應器,成千上萬的維基百科的貢獻詞條等等。由于最近的創新,網絡級數據現在也可以來自一個小但非常復雜的對象——大腦。

分布式計算的新進展正在改變神經科學家處理結果數據 的方式,并可能在這個過程中,改變我們對計算的看法。

大腦由許多神經元組成,一只蒼蠅或斑馬魚幼體有十萬的神經元,老鼠有數百萬的神經元,人有數十億的神經元。其功能依賴于神經元的活動以及它們彼此如何溝通。長期以來,神經活動的記錄一度僅限于少數的神經元,但最近的一些進步使我們能夠監測整個成千上萬個神經元,在某些情況下(如斑馬魚幼蟲),甚至是整個大腦的反應。

許多這些方法是光學方法:動物被基因工程改造以使它們的神經元的字面點亮時的這些活動模式顯微鏡捕獲圖像的活性,以及動物表現出不同的行為。由此產生的數據到達每小時TB級,對分析和理解提出了重大挑戰。它們需要兩個低層次處理(“munging”)和高級別分析。因此,我們要用多種方式查看每個數據集,如有關動物行為或實驗的神經反應方面,或通過識別大量的的相關活動模式。我們永遠無法提前知道答案,有時我們甚至不知道從哪里開始。

我們需要探索大型數據集以及開發新分析的靈活性的互動工具。到現在為止,單一的工作站解決方案,如在一個功能強大的機器上運行Matlab,已經成為神經科學的標準,但這些解決方案擴展很差。在分布式計算替換中,我們發現Apache Spark的平臺提供了核心優勢。首先,Spark的抽象的內存緩存使得夠在數秒或數分鐘內迅速找到大型數據集,加速了數據探索。其次,Spark提供在Scala、Java和Python中強大,靈活,直觀的API。Python的API是 特別有吸引力,因為它可以讓我們結合Spark與各種現有的Python工具進行科學計算(NumPy,SciPy和scikit-learn)和可視化(matplotlib,seaborn,mpld3)。

用Spark為大型計算平臺,我們正在開發名為迅雷的開放資源庫來模塊式地表達、分析Python常用工作流的時空數據。(這個庫以及應用實例,在最近同米沙阿倫斯實驗室合作發表的論文中被提及。)

通過將大腦反應與外部世界屬性相聯系,很多分析建立了大腦的統計“映射”。比如,斑馬魚呈現了正朝著不同的方向的模式,我們可以計算出一個抓住了每個神經元的反應呈現出不同的方向的映射。這很像投票取向映射——人民投票支持的候選人,神經投票支持方向。在另一個例子中,我們比較了神經元對動物的游泳的反應,發現當動物在游泳時,腦部的大部分反應激烈,但另一部分在不游泳時反應激烈,這些神經元的功能仍然是個謎。

這種映射是靜態的,但我們的數據基本上是動態的,因為神經元活性隨時間變化。一系列基于降維(這里審查)的方法從高維時間序列數據開始,恢復低維表示,用于捕獲關鍵動態特性,盡管用的是簡單的形式。這些一次性檢查了全部數據的分析特別依賴于分布式計算。

我們的長期目標是要利用這些技術來揭示神經編碼原則。大多數神經科學家認為,大腦的計算引擎非常有效,比一臺筆記本電腦消耗的能量少,切能夠在毫秒內識別目標,定位一個充滿障礙的環境,并協調復雜的運動計劃。了解這些功能將反過來刺激人工智能的進步的想法由來已久。實際上,所謂的神經網絡,包括最近的深信念網絡熱潮,大腦結構的模擬物:它們由許多彼此傳遞信號的類似“神經細胞”的節點建立。有些網絡解決任務,如對象和語音識別,以及令人印象深刻。

但是,這些網絡和現實的大腦之間仍存在著顯著差距。在大多數的人工網絡中,每個節點本質上不一樣,任何時候我們都能看到大腦的多樣性。成百上千種不同的神經元,具有不同的形態,功能,連接模式,以及溝通的方式。真正的生物不解決只是一個有明確目標(如人臉識別)、非常具體的任務。它們靈活地同一個動態的、不斷變化的世界進行互動。這種神經多樣性的作用與生物計算的基本原則仍是一個謎。但大量的努力,映射整個神經系統的活動,以及有系統地表征神經元形態和解剖連通,將有助于鋪平解決問題的道路。

在短期,可能還有另一種神經科學的研究方法會影響計算,數據挖掘和人工智能。數據神經學家正在進行收集,與其它數據進行對抗,不僅是在規模上,而且在復雜性上。神經科學會越來越受益于更廣泛的數據科學和機器學習的社區。例如,我們的映射分析類似于從大的衛星圖像數據或地理統計學習功能。而且,只要我們的數據是時間序列的集合,它們會像網站上隨時間變化的用戶統計數據或出現在我們的身體的傳感器和我們家里的信號。

D1Net評論:

不管是什么來源,科學家們在不同層面都面臨著類似的挑戰——前處理、分布式管道、算法模式發現和可視化,我越來越相信我們可以,而且應該,開始一起解決這些問題,只是時間問題。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 牟定县| 新绛县| 长岭县| 彭水| 谷城县| 昭苏县| 贺兰县| 平阳县| 木兰县| 福海县| 枣庄市| 台前县| 黄浦区| 防城港市| 乌兰察布市| 齐齐哈尔市| 通辽市| 广东省| 尼玛县| 西盟| 承德市| 阜平县| 维西| 工布江达县| 九台市| 涞水县| 伊宁县| 三河市| 合山市| 常宁市| 文水县| 禄丰县| 淮安市| 长治县| 从化市| 泸西县| 神木县| 神木县| 双柏县| 普宁市| 正蓝旗|