這支平均年齡只有36歲的科研團隊在組建短短三年多的時間內就接連發表了多項備受矚目的研究成果:在人腦中,他們發現導致抑郁癥和睡眠質量不佳的腦區有著重合之處,揭示了吸煙與喝酒對人腦功能呈相反的異常模式……然而,這樣一個整天研究人腦的年輕團隊卻在時下最熱門的人工智能走得更遠:該團隊和國家電網合作,研發了巡檢機器人,并利用人工智能的技術,研發了“步態識別”系統,精度達到95%。
科研路線:從疾病腦切入類腦智能
“什么是智能?”從事類腦智能領域研究十余年,馮建峰一直最想搞明白的問題很“簡單”,馮建峰將人工智能的研究設定為團隊的長期目標,“通過學習人和動物的腦的工作機制,解析其運作原理,并從中獲得靈感,運用到人工智能的研究中去,就是類腦智能研究。”
“但是人腦實在是太復雜了,我們無法把人腦像車一樣拆解成一個個‘零件’來研究其功能和作用機制。”對馮建峰等從事類腦研究的科學家來說,“疾病腦”給他們提供了一個最好的研究對象,比如患上抑郁癥、精神分裂癥等疾病的腦。“病人提供了最好的研究腦機制的模型,比如大腦的獎勵懲罰機制在戒煙、戒酒的應用,而人腦這種獎懲機制則又可以幫助我們進行具有情感的人工智能研究。”馮建峰說。
馮建峰團隊最近幾年的研究成果都集中于大腦的獎勵與懲罰機制。早在2016年他們就發現,對獎勵沒興趣、對懲罰太敏感是得抑郁癥最根本的原因。最近的研究表明,大腦中調控睡眠質量出問題的那塊區域,恰恰與抑郁癥患者對懲罰過于敏感的區域相同。而對于精神分裂癥的研究也表明,風險基因造成影響的區域,同樣也與獎勵、懲罰的調控區域有關。
從疾病腦研究中獲知人腦的反應機制,并將其運用到人工智能的研究中。馮建峰說,在追求長期目標的同時“沿途下蛋”,研究成果也有社會價值,是一件“一箭雙雕”的事情。
新式武器:“成果算出來”
大腦結構那么復雜,怎么才能精準找到“有病”的區域呢?“我們的成果是算出來的!”馮建峰說,以前的研究方法就兩類:實驗和理論,最近幾十年,增加了第三種手段——計算。舉個例子,對于研究核爆炸的人來說,震天動地的“蘑菇云”已經成了過去式,無需再把核材料堆起來“炸一次”,通過計算就能完成整個實驗。而且,實驗中根本看不見的極微小數量級,計算也能把其中空白填補上。
而在人腦與精神疾病的研究中怎么發揮計算的特殊作用呢?以精神分裂癥基因位點的關聯分析為例,傳統的影像遺傳學主要是通過對大腦不同腦區的結構、體積與基因組進行關聯分析發現遺傳基因對腦結構的控制。馮建峰提出,充分利用磁共振空間分辨率把這種關聯分析方法從“腦區”提升到“體素”(核磁信號能檢測到的最小單元)的水平,即全腦體素-全基因組關聯分析方法。
“經典腦區定義,單個腦區可能就有上千個體素。從90個腦區到對40多萬個體素進行基因位點關聯分析,計算量會激增至此前的四萬倍,對計算能力提出了很大的挑戰。”羅強表示,團隊通過算法改進,將計算效率提高了上萬倍,在不到一百個小時內完成了1600萬次關聯分析,并首次找到青少年大腦結構與基因位點之間最為顯著的關聯關系。
全球科研數據支撐
“巧婦難為無米之炊”,即便算法“高明”,缺乏數據的支持,再好的研究設計都得“半途而廢”。“此項研究的突破主要基于對來自全球范圍的多中心影像遺傳學數據進行計算分析,這些全維度標準化大數據的獲取,得益于多年來我們在全世界范圍內深入開展的國際合作研究。”馮建峰對于精神分裂癥研究成果所用到的數據來源頗為看重。
之前,有不少人做過類腦智能領域的研究,但因只包含了二三十人的小樣本數據,結果穩定性較差,研究備受爭議。近些年來,馮建峰團隊一方面與國內各大醫院開展合作,從而獲取第一手的臨床數據,同時整合Biobank、HCP、ADNI、ABCD等世界上最大規模腦數據庫,成功實現了實驗結果的可重復。
“我們克服了很多困難,終于找到了一個非常強的遺傳控制信號。”當時,羅強高興極了,但馮建峰并不滿足:“馮老師非常嚴謹,要求我們找更多獨立數據來做驗證。”最終,他們聯絡了國際上的一些科研小組,用近一萬人的數據驗證了該發現,論文全部的署名作者共有33名。
為了找到疾病與大腦基因位點的關聯通路,課題組對來自英美等6個國家20余所研究機構的超過1萬例影像遺傳學數據進行計算分析,通過全腦體素全基因組范圍的“廣泛搜索”,終于發現與青春期大腦殼核體積最為相關的基因位點同時也是精神分裂癥的風險位點。
應用數學、計算機科學、生物學、信息學、臨床醫學……毫無疑問,類腦智能研究是一門新興的交叉學科。馮建峰在本科念數學時就學了生物,他始終認為,將來學科的增長點就在于交叉學科。“現在的信息技術越來越發達,各類信息交織在一起,如今科技發展到了這個地步,以大數據為根基的科學范式,自然成為了主流。”