IBM,這個(gè)藍(lán)色巨人近年來在科技領(lǐng)域似乎過于保守。從生產(chǎn)機(jī)械制表機(jī)開始,直到成為一個(gè)集硬件、軟件和服務(wù)于一身的大型科技企業(yè),IBM在自己的領(lǐng)域顯得非常專注,并不輕易進(jìn)行核心領(lǐng)域之外的其他科研活動(dòng)。它曾經(jīng)在存儲(chǔ)技術(shù)、數(shù)字通信技術(shù)、半導(dǎo)體芯片技術(shù)等方面領(lǐng)先世界,但是也僅僅是淺嘗輒止,并沒有深耕細(xì)作,形成完整的產(chǎn)業(yè)鏈。它更多地是不斷完善自己的系統(tǒng),以服務(wù)于政府單位、金融機(jī)構(gòu)和大企業(yè),似乎對(duì)個(gè)人零售產(chǎn)品不太感興趣。
即便到了移動(dòng)互聯(lián)網(wǎng)時(shí)代,也不見得它在個(gè)人版APP上的開發(fā)有多大的突破。雖然在去年和蘋果公司合作開發(fā)了10款I(lǐng)OS系統(tǒng)的APP,涉及航空、金融、保險(xiǎn)、電信、零售以及政府通信等領(lǐng)域,但是這些APP無一例外全部是企業(yè)版本。比如一款叫做Plan Flight的APP,主要用途是供飛行員提前查看航班時(shí)刻表、航班計(jì)劃以及機(jī)組人員名單,在飛行中向地勤人員報(bào)告遇到的問題,提出最佳燃油使用推薦,很顯然這個(gè)APP是為航空公司設(shè)計(jì)的。
服務(wù)大企業(yè)和大機(jī)構(gòu)是IBM的一貫作風(fēng),也是這家企業(yè)傳承已久的商業(yè)傳統(tǒng)和文化基因。二戰(zhàn)時(shí)期,它甚至還制造過槍械武器,當(dāng)時(shí)下訂單的是美國(guó)國(guó)防部。
這是一個(gè)足以傲視全球的巨無霸,但是最近它悄悄改變了作風(fēng),開始研發(fā)一款個(gè)人用的APP,說實(shí)話,這個(gè)APP還不一定有多少人用,但是這個(gè)轉(zhuǎn)變無疑是值得期待的。
IBM和卡內(nèi)基·梅隆大學(xué)合作開發(fā)個(gè)人用APP
華盛頓郵報(bào)近期在科技欄目上刊發(fā)了一篇短文,介紹了一款可以做盲人眼睛的新型APP,那么這個(gè)被叫做NavCog的應(yīng)用到底如何呢?下面先簡(jiǎn)單介紹一下。
1、由IBM和卡內(nèi)基·梅隆大學(xué)合作開發(fā)。負(fù)責(zé)這個(gè)手機(jī)應(yīng)用開發(fā)的工程師來自久負(fù)盛名的IBM Research和卡內(nèi)基-梅隆大學(xué),這個(gè)開發(fā)工程是雙方的合作項(xiàng)目。有意思的是,其中一個(gè)主要的工程師,名叫Asakawa的女士,她自己本身就是一個(gè)盲人,她對(duì)這個(gè)應(yīng)用充滿期待和自信,她希望以后能夠憑借這個(gè)應(yīng)用在科研樓里自由漫步。
2、它不只可以導(dǎo)航。習(xí)慣了手機(jī)地圖的我們,對(duì)于導(dǎo)航功能并不陌生,甚至是司空見慣。可是對(duì)于盲人,事情就沒有那么簡(jiǎn)單了。不過,這個(gè)應(yīng)用的構(gòu)想也是不簡(jiǎn)單的。
首先,這個(gè)應(yīng)用可以通過語音或者震動(dòng)兩種方式,為盲人提供信息并進(jìn)行導(dǎo)航;
其次,它可以將盲人的周邊環(huán)境處理成3D空間模型,并通過超聲波提供更準(zhǔn)確的定位和導(dǎo)航制導(dǎo);
第三,為了讓盲人知道身邊都有誰,這個(gè)應(yīng)用還貼心地提供了人臉掃描功能,并能告訴盲人身邊的人的情緒。
當(dāng)然,導(dǎo)航功能目前已經(jīng)成熟,而人臉識(shí)別還在探索。
3、它暫時(shí)依賴藍(lán)牙燈塔提供的信號(hào)。應(yīng)用的運(yùn)行在目前主要依靠藍(lán)牙燈塔(Bluetooth Beacon),藍(lán)牙燈塔在國(guó)內(nèi)可能不多見,但是在蘋果、谷歌等企業(yè)已經(jīng)有相關(guān)的產(chǎn)品問世,簡(jiǎn)而言之,它是一種比較方便的信號(hào)傳遞載體。目前,NavCog的試驗(yàn)主要依賴于遍布校園的藍(lán)牙燈塔,不過根據(jù)工程師們的介紹,他們的工作方向是逐漸讓應(yīng)用適應(yīng)各種環(huán)境,適應(yīng)沒有藍(lán)牙燈塔的環(huán)境。
藍(lán)牙燈塔
IBM也許會(huì)給人們帶來驚喜
如果NavCog的導(dǎo)航和人臉識(shí)別系統(tǒng)完善了,那么它將是盲人的一大福音。或許某一天在街頭上,你可以看見一個(gè)身穿休閑裝、戴著耳機(jī)悠閑散步、時(shí)不時(shí)和路上的熟人打招呼的人,她看起來和我們一模一樣,誰也不會(huì)說她是個(gè)盲人。
不過IBM的工程師不滿足這些,有了上述功能,工程師可以開發(fā)出其他提高輔助認(rèn)知能力的應(yīng)用,這些應(yīng)用可以當(dāng)做醫(yī)護(hù)人員和氣象監(jiān)測(cè)員的助手,甚至它還有可能用到對(duì)自閉癥的研究中來。
雖然目前的技術(shù)水平還沒有達(dá)到此程度,但是不得不說這是IBM給人們帶來的驚喜,一個(gè)蘊(yùn)含著人文關(guān)懷的手機(jī)應(yīng)用,一份進(jìn)軍個(gè)人版APP領(lǐng)域的華麗開端。
一款可以做盲人眼睛的新型APP
本文所提到的華盛頓郵報(bào)文章,我自己將這篇文章翻譯出來了,供參考
隨著計(jì)算機(jī)在周邊環(huán)境下的感知能力的進(jìn)一步提升,它也在幫助人們更好地感知這個(gè)世界。好在人工智能和機(jī)器人學(xué)等專業(yè)的發(fā)展,IBM Research和卡內(nèi)基·梅隆大學(xué)的科學(xué)家正在為視覺損傷者研究一項(xiàng)讓他們能夠看見外面的世界的新方法。
這個(gè)目標(biāo)不僅鼓舞人心,還極具創(chuàng)意——建立一個(gè)技術(shù)平臺(tái),讓視覺損傷者可以向其他人一樣自由漫步。這個(gè)工程的第一個(gè)嘗試是一款叫做NavCog的應(yīng)用,它可以在IOS系統(tǒng)和安卓系統(tǒng)上使用,這個(gè)應(yīng)用可以通過耳機(jī)發(fā)出的聲音或者讓手機(jī)震動(dòng)來為盲人導(dǎo)航(使用者可以選擇設(shè)定應(yīng)用為“聲音模式”還是“震動(dòng)模式”)。
就像汽車GPS提供的實(shí)時(shí)導(dǎo)航一樣,這個(gè)應(yīng)用為盲人提供實(shí)時(shí)的視角。它分析來自人行道上的藍(lán)牙燈塔以及智能手機(jī)傳感器提供的信號(hào),能讓盲人在沒有其他人的幫助下自由行動(dòng),無論在學(xué)校建筑內(nèi)還是在戶外都可以。
當(dāng)程序能夠幫助盲人隨時(shí)定位、告訴他們所處的方向以及周邊環(huán)境的其他信息時(shí),好戲就開始了。電子導(dǎo)航程序?qū)⑹謾C(jī)內(nèi)對(duì)周邊環(huán)境拍下的照片處理成3D空間模型,以此來作為實(shí)時(shí)導(dǎo)航的指導(dǎo)。
NavCog工程,是位于Yorktown Heights 的IBM Research和卡內(nèi)基-梅隆大學(xué)的合作項(xiàng)目,它對(duì)于工程的主要研究者之一的Chieko Asakawa具有特別的意義,她是IBM的院士以及卡內(nèi)基-梅隆的客座教授,她是一個(gè)盲人。對(duì)她而言,利用這個(gè)APP幫助她在校園內(nèi)行走將可能在短時(shí)間內(nèi)變?yōu)楝F(xiàn)實(shí),她戴著耳機(jī),聽著從手機(jī)里傳過來的聲音,行走時(shí)和別人并非兩樣。
“這僅僅是一個(gè)開端”,卡內(nèi)基·梅隆大學(xué)機(jī)器人研究院的Kris Kitani這樣說道。當(dāng)然,一個(gè)主要的目標(biāo),是要拓展被藍(lán)牙燈塔覆蓋面,目前的試驗(yàn)主要依靠的是大學(xué)校園里面的藍(lán)牙燈塔。為了鼓勵(lì)覆蓋,項(xiàng)目科學(xué)家將NavCog平臺(tái)完全開放了,開發(fā)者能夠自由使用IBM BlueMix cloud上的資源。這使得其他的開發(fā)者有能力為系統(tǒng)強(qiáng)化其他方面的功能,并且加快展現(xiàn)出其他物理上的功能。
Kitani說,另一個(gè)重要目標(biāo),是使系統(tǒng)可以在任何環(huán)境,甚至在沒有藍(lán)牙燈塔的情況下運(yùn)行。為了將這個(gè)可能性變?yōu)楝F(xiàn)實(shí),學(xué)校希望在電子視覺和輔助認(rèn)知兩方面進(jìn)行提升,開展新的工作。輔助認(rèn)知這個(gè)領(lǐng)域的設(shè)立是為了增強(qiáng)盲人正在消失和弱化了的感知能力,從外界重新獲得信息。
例如,通過電子輔助視覺系統(tǒng)對(duì)照片的處理,可能會(huì)發(fā)展一個(gè)更加精準(zhǔn)的,不需要藍(lán)牙燈塔的系統(tǒng)。此外,當(dāng)電子輔助視覺系統(tǒng)與定位系統(tǒng)結(jié)合時(shí),潛在地也就能識(shí)別出每天的“地標(biāo)”。比如,路上一排臺(tái)階或者柵欄,這些東西目前并不能被傳感器感應(yīng)。
“憑借對(duì)那些對(duì)象的本地化信息的理解,我們正在嘗試一項(xiàng)技術(shù),讓現(xiàn)實(shí)環(huán)境更加適合每一個(gè)人。我們開展人類智能和機(jī)器人技術(shù)的研究已經(jīng)有很長(zhǎng)一段時(shí)間,我們能更好地完善人們對(duì)于周邊環(huán)境的感知能力。這個(gè)開放的平臺(tái)將擴(kuò)大全球研究人員合作范圍,一個(gè)視覺障礙患者觀看世界的新時(shí)代即將來臨。”
——卡內(nèi)基-梅隆大學(xué)機(jī)器人學(xué)院院長(zhǎng)Martial Hebert說。
得利于卡內(nèi)基-梅隆大學(xué)內(nèi)人工智能和機(jī)器人專業(yè)的融合,研究者計(jì)劃在系統(tǒng)內(nèi)加入其他的功能,使得NavCog不僅僅可以導(dǎo)航。舉個(gè)例子,面部識(shí)別元件將實(shí)時(shí)提醒你,你正在一個(gè)熟人旁邊路過。不止如此,傳感器還可以識(shí)別人們面部表情所反映出來的情緒:因?yàn)樗梢苑治龀鲈谀忝媲按掖叶^的人是笑容滿面還是緊鎖眉頭——這是與學(xué)校里其他關(guān)于自閉癥的部分研究工作有關(guān)。研究者同時(shí)還可以探索通過電子視覺來判斷周圍的人的活動(dòng),通過超聲波技術(shù)更加精準(zhǔn)的定位。
如Asakawa所說,輔助識(shí)別的研究的進(jìn)步創(chuàng)造出的NavCog應(yīng)用與IBM Watson機(jī)構(gòu)展示的電子識(shí)別是有類似的地方的。在這兩個(gè)案例中,他們都在不斷嘗試在確保時(shí)效性的前提下提高人類的識(shí)別能力。例如,在IBM公司內(nèi)部,研究者有時(shí)候會(huì)使用“Watson on my shoulder”這個(gè)術(shù)語來憧憬IBM Watson的未來。那將是一個(gè)連續(xù)的、地方化的存在,它可以為所有人提供輔助識(shí)別,包括醫(yī)護(hù)人員和氣象監(jiān)測(cè)員。
如果一切進(jìn)展順利,那么就可以為機(jī)器智能和人類智能設(shè)想一個(gè)高質(zhì)的反饋回路,在這里,為提升機(jī)器能力而發(fā)展起來的識(shí)別技術(shù),最終也會(huì)促進(jìn)人類能力本身的提升。