這首歌就是被傳唱一時的《你是我的眼》,原唱者蕭煌奇是一一位視障人士,失明的人生中,他一直保持樂觀態度,熱愛音樂與創作,一首以自己為原型的《你是我的眼》橫空出世,給所有黑暗中的視障人士帶來了鼓勵與溫暖。
但是你能想象嗎?有一天,視障人士可能會深情款款地對AI唱起“你是我的眼/帶我領略四季的變化/你是我的眼/帶我閱讀浩瀚的書海……”
當AI要承擔起“眼睛”這個角色時,要如何才能將這個世界帶到視障人士的面前呢?利用高科技來“作眼”,又是否切合了視障人士的真正需求?
從感知到“看見”:層出不窮的“助視”產品
不得不說,巨頭們在推進前沿技術的同時,一直沒有忘記對視障這一弱勢群體的關懷。一大批助力視障患者的產品和技術如雨后春筍般涌現,這些產品里流露的溫情不僅體現了企業對視障群體的關懷,也是對科技巨頭最好的品牌廣告。
智能相對論(aixdlun)分析師顏璇梳理了各類與視障有關的智能產品,大致將其分為三種類型:
1、曲線救國型:還記得我們一直拿來做作文論據的海倫凱勒嗎?海倫·凱勒的老師在教她認“water”時,讓她伸出一只手去感知水的流動,并在海倫的另一只手上拼寫了這個單詞。從這里我們可以看出,目不能視的視障患者認知外界世界的渠道是除了視覺之外的其它感官感覺,比如聽覺、嗅覺和觸覺。
基于此,慕尼黑公司和韓國公司聯合完成了一款專供盲人使用的盲文智能手表(Dot Watch),搭載了盲文顯示系統,以盲文的形式將各種信息呈現在手表的觸摸表盤里。
相機也給出了觸摸形式。美國一位設計師專門為視障人士設計了一款to see 3D相機,這款相機能通過鏡頭實時地將拍攝的物體轉化成三維觸感數據,使視障人士通過觸摸屏幕表面生成的立體形狀來識別面部細節,比如讀取表情等。
當然了,除了觸覺,聽覺的更不會少。IBM 推出了無障礙環境的一項發明——專為盲人設計的新型導航 APP NavCog.NavCog 可通過耳機與智障人士“耳語”,幫助人實時識別位置、朝向,還能辨認迎面走來的熟人。
2、外力加持型:這種類型的載體一般是智能眼睛,主要是為弱視群體(即視力不到常人的 60%)打造。
比如一款名為eSight的產品,結合算法和部分盲人自身的需要,通過控制器中的液體鏡頭技術進行“聚焦”,弱視者可以利用眼鏡中的 Bioptic 傾斜功能,不僅可以調整瞳孔距離(對焦),還可以調整圖像的清晰度(顏色、對比度、亮度),從而“重獲光明”。
3、直截了當型:視覺的產生依賴于三大組織器官:眼球(主要為視網膜)、視神經、視皮層。對于視障患者而言,如果想要“一了百了”,恢復視覺,就必須研發出能替代這三種組織的假體,即視網膜假體、視神經假體和視皮層假體。
國內就有研究團隊制作出了人造視網膜,其由體內電子微系統和體外電子系統兩部分組成。使用方法是在患者眼球內部植入IC芯片,用來接收信息和傳導電信號。然后再為盲人配備一個體外接收系統,比如眼鏡。
“眼前的黑不是黑,你說的白是什么白”
即使現在的智能“助視”產品比比皆是,但要真的掀開視障患者眼前的簾子,恐怕還不容易。
人造視網膜技術具有很強的綜合性和復雜性,需要機器視覺、IC設計、半導體工藝、納米技術、神經科學、生物材料等十多個學科的科學家和工程師全力投入,密切配合,缺一不可。但即便擁有如此高精度團隊,外界信息通過電信號傳遞到大腦中,盲人感受到的也不過是一個灰度的、馬賽克的世界。
即使是黑白的“渣像素”,也能勉強算“看見”了。而不能算“看見”的那些智能產品,比如智能眼鏡、認知助手等,僅僅只能提供語音讓患者接收到相應信息。患者能做的就是,在“助手”說前面有障礙物請繞過去時無奈繞開,而不能親眼看看阻攔自己的障礙物究竟是一個石頭還是一輛單車。
當我們不斷加大視障患者在其它感官上接受的信息量時,也會帶來不小的后患。比如,從聽覺入手的產品往往會讓使用者戴上耳機,這就會讓盲人與周遭的聲音隔絕,出行在外容易造成危險,而不帶上耳機進行電子播報,容易造成患者的信息外泄。
我們將智能產品應用在視障患者身上時,除了要為他們帶來生活上的方便,更是想讓他們看到這個美麗的世界,無障礙地探索這個世界。當我們用一種以其它感官來輔助視覺的技術思路來實現客觀上的無障礙的時候,肯定會與視障患者主觀上的無障礙有區別。就正好應了那句歌詞,“眼前的黑不是黑,你說的白是什么白”。
即使是弱勢群體的智能眼鏡,戴久了人們或多或少都會產生不適感。想想我們在電影院看3D電影的時候,3D眼鏡也曾讓我們頭暈目眩,沉浸式技術也極容易帶來頭暈、惡心等反應。除此之外,戴智能眼鏡限制了側面周邊的視覺范圍,視障患者要做到和正常人一樣的移動和工作還是不易。
要真正的為視障人士帶來便利,這些智能“助視”產品必須要解決它成本太高,價格太貴的問題。由于致盲因素不同,很多盲人需要高度個性化定制的智能產品,這更加導致成本居高不下。比如加拿大一家醫療科技公司Ocumentics在去年開發的仿生鏡片也只適合25歲以上的成年人。
看得見,以看懂表情為標準
歸根究底,不管智能產品有多炫目,對盲人而言,他們更在乎智能產品的實用性,而真正實用的產品于他們而言就是三個字——看得見。
仿生眼球當然具有很大的市場,但這種療法并不適用于所有眼科疾病。智能眼鏡+芯片的組合則是可以通用的,因為其視覺計算能力,人臉識別等功能可以接收外界信息,芯片通過柔性電極陣列來傳輸電信號,刺激視網膜的神經細胞,進而傳遞到大腦中,讓盲人看見黑白的影像。
但對于市場來說,通用的就不具有特殊性了,所以,誰能快速抓住“通用”中的亮點以及最不易解決的問題,誰就能在“助視”這方面成為佼佼者。
神經科學家認為“人臉識別”有兩個方面,其一是特征識別,也是目前的智能眼鏡配備的識別類型。其二是表情識別。事實上,經過了億萬年的進化,人類形成了六七種與情緒密切相關的基本表情,它們是:快樂、驚奇、悲傷、憤怒、厭惡、輕視和恐懼。這些基本表情是人的本能,不需要學習就與生俱來。
目前,我們對臉部特征與表情之間的區別還不太清楚。在我們看到一個人時,我們大腦里的人臉識別機制就會開始運作,我們會在一瞬間就判斷處這一張臉是不是熟面孔以及這個人的表情如何。但這一瞬間,對于視障患者卻難如登天。
所以,讓AI來幫助盲人看到人的表情或許是智能“助視”在人臉識別上的真正戰場。這一舉動的意義不止在于需要AI去識別更細微的臉部特征,還在于要為盲人獲得更加清晰的圖案,而不是模糊的一個影像。
英國《柳葉刀·全球衛生》有一份研究報告預計,當下,全球盲人數量為3600萬,如果不加強對眼疾的治療,到2050年將增至1.15億。這是一個足夠驚人的數據,而借助技術的力量,我們希望,每一個在生活中艱難獨行的盲人,不論他們的年齡大小、環境狀況如何、貧窮或富有,他們都有和明眼人一樣看美麗世界的權利。
智能相對論:深挖人工智能這口井,評出咸淡,講出黑白,道出vb深淺。重點關注領域:AI+醫療、機器人、智能駕駛、AI+硬件、物聯網、AI+金融、AI+安全、AR/VR、開發者以及背后的芯片、算法、人機交互等。