這一點,最初對于深腦鏈 CEO 何永來說,也是充滿著好奇、疑惑甚至始料未及
從最初對人機交互技術的研發,過渡到采用時下最熱的區塊鏈技術驅動人工智能算力并付諸實踐,何永坦承,推動這件事兒的還是“痛點”兩個字!
參看何永的履歷,我們得知,關于 AI 研發,他可以稱得上是相當資深,但在漫長的技術攻堅過程中,一個問題卻始終困擾著他與團隊。
數據不夠,怎么辦?機器也不夠,又該如何是好?
人工智能就像一只需要非常龐大的數據來“飼養”的動物,量的要求已然讓企業力不從心,暫且還未提及數據來源、質量以及隱私等諸多亟待解決的問題。
除了需要通過大量數據完成學習以及訓練外,企業用于處理數據的 GPU 等各式各樣的芯片也時常告急!
每年需要提高差不多 5-10 倍的性能才能勉強追上企業發展的步伐,飛快的更新迭代所帶來的硬件設備的“海量”投入,早已讓企業叫苦不迭。
各種花銷這么多,發展負擔如此重,此類普適性的行業問題究竟該如何解決?
何永與團隊成員思忖良久。
“為了解決我們遇到的,也是諸多 AI 企業所困擾的,技術團隊從 2016 年開始著手接觸一些火熱的新科技,最后鎖定了區塊鏈。最早我們只知道比特幣,但從未想過人工智能如何與區塊鏈相結合的事兒。”何永表示。
從 2016 年想法初現,2017 年上半年初步形成相對完成的解決方案,再到 2017 年下半年正式推出,何永以及團隊馬不停蹄地,在解決 AI 數據以及算力的問題上奔走!
過程總有曲折,談及困難,何永很感慨,整個過程就如同向兩個行業分別做知識普及一樣。
畢竟人工智能與區塊鏈都是技術含量很高的前沿科技,對于很多人來說,其中一種已經比較難懂了,更何況是兩種相結合?推廣的難度可想而知!
何永對記者說:“我們需要向懂區塊鏈的人介紹何為人工智能、人工智能的價值以及行業優勢等,還要告訴他們這個項目是用來解決人工智能領域相關問題的,這個推廣實際來看很曲折。”
另外,由于人工智能行業對區塊鏈技術了解的也不足夠,只是將更多的目光聚焦在比特幣的高價以及炒幣的亂象上,對此何永以及團隊還要將“區塊鏈技術究竟對人工智能行業帶來怎樣的幫助”這一點講透徹,“艱辛”成為了主旋律。
理念依靠普及,產品還需落地。
最終,何永及其團隊選擇通過區塊鏈技術為人工智能搭建一個計算網絡的方式,即深腦鏈(DBC),來解決人工智能企業算力成本以及數據隱私等問題。
這個“人工智能+區塊鏈”合力作用的計算網絡究竟玄機何在?
據記者了解,深腦鏈 DBC 的網絡節點,主要以高性能 GPU 服務器為主,尤其是 4 卡、8 卡的 1080Ti 及以上的 GPU 組成。
通過區塊鏈技術,網絡節點之間形成了去中心化、分布式以及彈性算力的特征。
具體來說,整個網絡的節點由個人設備、中小企業設備以及類似現代礦場的大設備群組成,所以并不像通常我們熟識的節點那樣,呈現高度中心化的狀態。
在這種機制的作用下,如果網絡上有企業提出數據需求,只需要通過客戶端打包隨后充入 gas,可以單純理解為手續費或者定金之類的。
然后滿足要求的節點就開始運行相關程序來協助企業完成數據處理的需要,這個過程中,只要鏈接到 DBC 上的設備都可以作為處理器工作。
此外,用戶還可以根據自身業務要求,使用 DBC 網絡的彈性算力。
早在設計之初,DBC 網絡節點就采用了結構化、非結構化的分布式,同時選用區塊鏈的底層架構來進行垂直或者水平擴展以及大規模伸縮,所以無限擴展的功能得以保障。
網絡的工作機制如此,計算節點的收入組成也有明確的規定。
每個 AI 計算節點的收入主要來自于 DBC 網絡挖礦的獎勵以及 AI 算力使用方支付的使用付費。
所以,AI 廠商可以提前購入 DBC Token,在需要算力的時候,直接支付就可以使用。
其實,DBC 網絡不但為 AI 企業開啟了最短時間集中穩定算力的高效通道,同時也出爐了相對完善的監控機制,主要用于約束挖礦行為以及規范 AI 企業的訓練結果,避免算力的使用不當等問題。
對于參與 AI 訓練和挖礦行為的企業和個人,如果存在惡意指令檢測或者惡意行為檢測等,將會考慮被扣除保證金。
此外,由于企業的 AI 訓練行為可以同時發射到多臺主機上并行,得出的結果也可相互驗證,所以訓練過程可以得到遠程的實時監控,從而通過可視化的技術保障算力使用恰當。
需要提及的一點,由于 DBC 網絡上涉及挖礦行為,所以挖礦節點的技術組成也是很復雜的,畢竟直接關系到一部分算力的產出。
據悉,挖礦節點主要由計算引擎、鏡像管理系統、存儲管理系統、身份服務引擎、網絡管理引擎等幾部分構成。
隨著生態的逐步繁榮,對于節點性能的要求自然會逐步提高,如果做到持續擁有高效的 GPU 算力、充足的內存、較大的磁盤空間以及良好的帶寬等,需要不斷在技術上尋求突破,保障節點的高性能。
眾所周知,安全作為每個產品必須提起重視的關鍵一環,DBC 網絡對于數據安全、物理服務器安全以及企業身份驗證等痛點又有何技術上的保障呢?
過去中心化的云計算平臺,盡管在 API 訪問權限以及存儲管理等方面都做了“精心”的設置,但數據泄露的頻率依舊很高,系統故障排除后必須進行的數據恢復也是個大大的問題。
相比傳統的中心化平臺,DBC 網絡在數據安全方面利用技術優勢,達成了多重加密、數據并行,可以理解為數據在不同的主機上完成切片并行訓練的能力,來提升數據的安全性;此外還在不斷探究同態加密、代理重加密的可行性,最終加大黑客攻擊的成本。
問及同態加密的進展,何永表示,目前同態加密的理論可行,但關鍵的問題在于速度太慢。
對此,深腦鏈技術團隊考慮到,隨著機器性能的提升,或許能夠發現進一步提升同態加密速度的方法;另外就是精細控制用于同態加密的數據量。
仔細想想,其實并不是所有的數據都需要通過這種技術手段來加密,所以優先選擇特別隱私的或者體量較小的數據,從工程的角度出發落地這項技術才是正道。
很長一段時間,企業對于物理主機以及服務器的安全保障同樣是比較糾結的一件事兒。
經常,中心化的物理主機或服務器如果遭到破壞,“旗下”負責管理的所有虛擬服務器都有可能遭到攻克或者破壞,之間產生的漏洞也會被利用。
“對于此類現象,我們選擇將應用運行在容器內部,針對容器進行安全加固。無論是攔截惡意指令,還是監控惡意行為,企業只有自己掌握私鑰才能訪問數據,第三方根本沒有權限。”何永補充道。
關于最頭痛的身份驗證呢?
深腦鏈提出的解決方案還是高效地利用了區塊鏈技術。
主要將用戶的信息進行二次加密,就算有人處心積慮的拿到數據,也是加密之后的,根本無法直接使用。
采訪中,何永表示,目前 DBC 的測試網絡已經支持了 TensorFlow、Caffe2、H2O 等 AI 和機器學習框架,同時團隊在 AI TestNet 上也已經完成了多種 AI 訓練任務。
訓練任務從無人駕駛到人臉識別,從醫學腫瘤檢測到智能制造 AI 質檢,范圍涵蓋了人機交互、交通、安全、醫學、智能制造等多個領域;基于企業對于 AI 訓練的算力迫切需求,深腦鏈與 AGI 等公司的合作也在有條不紊地進行著。
據記者了解,深腦鏈正式網(AI 訓練網絡正式網)將于 8 月 8 日上線。
早在北京時間 6 月 15 日,深腦鏈基金會已開啟“天網計劃”,向社會各界征集 AI 算力。
如果作為算力提供方,只需要擁有以下部分或全部資源就可滿足“天網計劃”的算力征集條件。