AI何時才能承擔起「眼睛」這個角色?
圖片來源:視覺中國
在台灣,有一位歌手叫蕭煌奇,他因先天性白內障一出生就全盲,在4歲動了眼部手術後成為弱視。15歲那年,蕭煌奇在重見光明多年後再度失明,但是他一直保持樂觀態度,熱愛音樂與創作,一首以自己為原型的《你是我的眼》橫空出世,給所有黑暗中的視障人士帶來了鼓勵與溫暖。
「你是我的眼,帶我領略四季的變化」,當AI要承擔起「眼睛」這個角色時,是否能將這個世界帶到視障人士的面前呢?又是否切合了視障人士的真正需求呢?
從感知到「看見「:層出不窮的「助視」產品
不得不說,巨頭們在推進前沿技術的同時,一直沒有忘記對視障這一弱勢群體的關懷。一大批助力視障患者的產品和技術如雨後春筍般湧現。
微軟繼前年在主題演講會中講述了人工智慧和智能眼鏡幫助盲人「看到」世界後,今年又一次提及了人工智慧幫助盲人學生跨越交流障礙,這些科技里流露的溫情不僅體現了企業對視障群體的關懷,也是對科技巨頭最好的品牌廣告。
智能相對論分析師顏璇梳理了各類與視障有關的智能產品,大致將其分為三種類型:
曲線救國型
一般來說,目不能視的視障患者認知外界世界的渠道是除了視覺之外的其它感官感覺,比如聽覺、嗅覺和觸覺。比如海倫·凱勒的老師在教她認「water」時,讓她伸出一隻手去感知水的流動,並在海倫的另一隻手上拼寫了這個單詞。
基於此,慕尼黑公司和韓國公司聯合完成了一款專供盲人使用的盲文智能手錶(Dot Watch),搭載了盲文顯示系統,以盲文的形式將各種信息呈現在手錶的觸摸錶盤里。
相機也給出了觸摸形式。美國一位設計師專門為視障人士設計了一款to see 3D相機,這款相機能通過鏡頭實時地將拍攝的物體轉化成三維觸感數據,使視障人士通過觸摸屏幕表面生成的立體形狀來識別面部細節,比如讀取表情等。
當然了,除了觸覺,聽覺的也不會少。IBM 推出了無障礙環境的一項發明——專為盲人設計的新型導航 APP NavCog。NavCog 可通過耳機與智障人士「耳語」,幫助人實時識別位置、朝向,還能辨認迎面走來的熟人。
外力加持型
視障人士通常分為兩種,一種是全失明,指完全失去視力,另一種為弱視,即視力不到常人的60%,在視障人士當中,弱視群體佔到近 70% 的比例。面對這類群體,為他們做一個智能眼鏡就很有必要了。
比如一款名為eSight的產品,結合演算法和部分盲人自身的需要,通過控制器中的液體鏡頭技術進行「聚焦」,弱視者可以利用眼鏡中的 Bioptic 傾斜功能,不僅可以調整瞳孔距離(對焦),還可以調整圖像的清晰度(顏色、對比度、亮度),從而「重獲光明」。
直截了當型
視覺的產生依賴於三大組織器官:眼球(主要為視網膜)、視神經、視皮層。對於視障患者而言,如果想要「一了百了」,恢復視覺,就必須研發出能替代這三種組織的假體,即視網膜假體、視神經假體和視皮層假體。
國內就有研究團隊製作出了人造視網膜,其由體內電子微系統和體外電子系統兩部分組成。使用方法是在患者眼球內部植入IC晶元,用來接收信息和傳導電信號。然後再為盲人配備一個體外接收系統,比如眼鏡。
智能「助視」產品要解決哪些問題?
即使現在的智能「助視」產品比比皆是,但要真的掀開視障患者眼前的帘子,恐怕還不容易。
首先,當我們不斷加大視障患者在其它感官上接受的信息量時,也會帶來不小的後患。
比如,從聽覺入手的產品往往會讓使用者戴上耳機,這就會讓盲人與周遭的聲音隔絕,出行在外容易造成危險,而不帶上耳機進行電子播報,容易造成患者的信息外泄。
我們不斷地將智能產品應用在視障患者身上時,除了要為他們帶來生活上的方便,更是想讓他們看到這個美麗的世界,無障礙地探索這個世界。當我們用一種以其它感官來輔助視覺的技術思路來實現客觀上的無障礙的時候,肯定會與視障患者主觀上的無障礙有區別。
其次,可穿戴設備戴久了,尤其是戴在眼睛上,人們或多或少都會產生不適感。
想想我們在電影院看3D電影的時候,3D眼鏡也曾讓我們頭暈目眩,沉浸式技術也極容易帶來頭暈、噁心等反應。除此之外,戴智能眼鏡限制了側面周邊的視覺範圍,視障患者要做到和正常人一樣的移動和工作還是不易。
然後,人造視網膜技術具有很強的綜合性和複雜性,需要機器視覺、IC設計、半導體工藝、納米技術、神經科學、生物材料等十多個學科的科學家和工程師全力投入,密切配合,缺一不可。但即便擁有如此高精度團隊,外界信息通過電信號傳遞到大腦中,盲人感受到的也不過是一個灰度的、馬賽克的世界。
即使是黑白的「渣像素」,也能勉強算「看見」了。而不能算「看見」的那些智能產品,比如智能眼鏡、認知助手等,僅僅只能提供語音讓患者接收到相應信息。患者能做的就是,在「助手」說前面有障礙物請繞過去時無奈繞開,而不能親眼看看阻攔自己的障礙物究竟是一個石頭還是一輛單車。
最後,這些智能「助視」產品最大的問題就在於它的成本太高,價格太貴,一般人很難負擔得起。
由於致盲因素不同,很多盲人需要高度個性化定製的智能產品,這導致成本居高不下。即使是仿生眼球,也不能適用於所有視障患者,比如加拿大一家醫療科技公司Ocumentics在去年開發的仿生鏡片也只適合25歲以上的成年人。
此外,患有角膜渾濁、接受過白內障手術、重度視網膜黃斑變性、重度遺傳性視網膜病變、視神經損傷等疾病的患者,亦不適合這一療法。
看得見,以看懂表情為標準
歸根究底,不管智能產品有多炫目,對盲人而言,他們更在乎智能產品的實用性,而真正實用的產品於他們而言就是三個字——看得見。
仿生眼球當然具有很大的市場,但上文中也提到,這種療法並不適用於所有眼科疾病。智能眼鏡+晶元的組合則是可以通用的,因為其視覺計算能力,人臉識別等功能可以接收外界信息,晶元通過柔性電極陣列來傳輸電信號,刺激視網膜的神經細胞,進而傳遞到大腦中,讓盲人看見黑白的影像。
但對於市場來說,通用的就不具有特殊性了,所以,誰能快速抓住「通用」中的亮點以及最不易解決的問題,誰就能在「助視」這方面成為佼佼者。
神經科學家認為「人臉識別」有兩個方面,其一是特徵識別,也是目前的智能眼鏡配備的識別類型。其二是表情識別。
事實上,經過了億萬年的進化,人類形成了六七種與情緒密切相關的基本表情,它們是:快樂、驚奇、悲傷、憤怒、厭惡、輕視和恐懼。這些基本表情是人的本能,不需要學習就與生俱來。
目前,我們對臉部特徵與表情之間的區別還不太清楚。在我們看到一個人時,我們大腦里的人臉識別機制就會開始運作,我們會在一瞬間就判斷處這一張臉是不是熟面孔以及這個人的表情如何。但這一瞬間,對於視障患者卻難如登天。
所以,讓AI來幫助盲人看到人的表情或許是智能「助視」在人臉識別上的真正戰場。這一舉動的意義不止在於需要AI去識別更細微的臉部特徵,還在於要為盲人獲得更加清晰的圖案,而不是模糊的一個影像。
英國《柳葉刀·全球衛生》有一份研究報告預計,當下,全球盲人數量為3600萬,如果不加強對眼疾的治療,到2050年將增至1.15億。這是一個足夠驚人的數據,而藉助技術的力量,我們希望,每一個在生活中艱難獨行的盲人,不論他們的年齡大小、環境狀況如何、貧窮或富有,他們都有和明眼人一樣看美麗世界的權利。(本文首發鈦媒體)
【鈦媒體作者介紹:文/顏璇,智能相對論(微信id:aixdlun):深挖人工智慧這口井,評出鹹淡,講出黑白,道出深淺。】
更多精彩內容,關注鈦媒體微信號(ID:taimeiti),或者下載鈦媒體App


※三大運營商公布4月數據:中國移動4G用戶首現負增長
※QQ號可以註銷了,你捨得和青春說再見嗎?
TAG:鈦媒體APP |