編者按:作者艾韜,深圳市易瞳科技CTO,畢業(yè)于多倫多大學(xué)計算機工程專業(yè)。多年跟隨“世界穿戴電腦之父” Steve Mann教授,專注于智能眼鏡的基礎(chǔ)研究。
前不久,一篇AI下圍棋的新聞炒得沸沸揚揚,圍棋AI在人類歷史上第一次戰(zhàn)勝職業(yè)選手。然而,就像當(dāng)年被“深藍”打敗的國際象棋大師Garry所說的那樣,這并不意味著電腦在象棋領(lǐng)域取代了人類。不僅僅是下棋,AI再聰明,它也取代不了人。我相信,最終取代人腦的不是電腦,而是“人腦+電腦”。未來的象棋或圍棋大師,不是人也不是電腦,而是最會用電腦分析棋局的人。一個相信計算機,并且能和計算機兼容的人,叫Cyborg(賽博格)。這個人機共生體,實現(xiàn)的不是AI,而是HI。
上一次在概念篇《神奇的虛實世界:關(guān)于你可能還不那么了解的智能眼鏡》中跟大家探討了智能眼鏡中的一些概念,基本上覆蓋了所有智能眼鏡的形態(tài),也就是大家正在做的是什么。但我覺得,比“做什么(What)”和“怎么做(How)”更重要的是“為什么(Why)”。這是一個框架,也代表了一個愿景。更重要的,這是一個核心。
所以,今天要給大家介紹的東西叫Humanistic Intelligence(HI),由穿戴電腦之父Steve Mann教授于上世紀(jì)90年代提出。在電子科大陳東義老師(國內(nèi)最早研究穿戴電腦的學(xué)者)的筆下,HI的中文翻譯是“人文智能”。HI凝聚了上世紀(jì)頂尖學(xué)者的心血,在過去的30多年里,智能眼鏡的發(fā)展方向是以HI為指導(dǎo)思想的。而實現(xiàn)HI中的“人機共生”,就是我們做智能眼鏡的初心。
前年底當(dāng)我快要離開實驗室的時候,實驗室的名稱已經(jīng)從之前的“EyeTap Personal Imaging Lab(ePI Lab)”改成“HI Lab”了。去年底,回實驗室拜訪教授時,他讓我在實驗室的宣傳視頻中向多倫多大學(xué)的新生們介紹一下我對HI的理解。所以,在我向你們?nèi)映雒苊苈槁榈奈淖种?,可以先看一看下面這段小視頻。在介紹從實驗室走出來的各個黑科技創(chuàng)業(yè)公司的同時,我也把我心目中所理解的HI給大家簡單地說了一下。
小毛衣不錯是吧?好啦,言歸正傳。傳統(tǒng)意義上的“人機交互(HCI)”把人和計算機分開成兩個孤立的個體,它們通過各種I/O進行通訊,從而傳達信息。鼠標(biāo),鍵盤,耳機和觸屏都是我們熟悉的交互方式。然而,由HI所提出的“人機共生”把計算機和人當(dāng)作一個整體。在這個體系中,計算機是人的第二個大腦,輔助佩戴者工作的同時,在使用者的指導(dǎo)下學(xué)習(xí)并改變著這個世界。所以,就像視頻中提到的那樣,你覺得自己在玩兒計算機,其實計算機也在玩兒你。
接下來,我會跟大家簡單討論一篇論文的內(nèi)容。這是98年IEEE期刊的封面文章,比較系統(tǒng)地闡述了HI的各個方面,同時也對HI如何指導(dǎo)智能眼鏡的研發(fā)有一個很明確的敘述。由于我水平有限,需要注意的是,以下內(nèi)容是一個小工程師對一個大師思想的反芻倒嚼。是我進食后經(jīng)過一段時間從肚子里吐出來的半消化物。
HI描述的是零距離的人機關(guān)系,所以HI的實現(xiàn)就需要人與機的緊密結(jié)合,而所有人機交互中,智能眼鏡可以把需要傳達的信息量實現(xiàn)到最大化。從大方向說,實現(xiàn)HI所需的系統(tǒng)有三種運行模式:
第一,Constancy(恒定模式)。這個系統(tǒng)必須恒定持續(xù)地運行(Operationally Constant,OC),它偶爾會進入睡眠狀態(tài),但它不應(yīng)該完全斷電?,F(xiàn)在大家用手機時就可以深切感受到OC的重要性。沒電的手機就失去了OC,令人崩潰。另外,這個系統(tǒng)必須恒定持續(xù)地可交互(Interactionally Constant,IC)。也就是說,它隨時處于待命狀態(tài)。從這個意義上來說,IC就意味著OC,但OC不一定代表IC。讀到這里,Apple為什么要多出一個iWatch的原因就很清楚了。手機在兜里,雖然持續(xù)運行,但不可持續(xù)交互,所以沒有實現(xiàn)IC;為了縮短“交互距離”,手機就需要多一塊表。通常人們不一定能意識到恒定模式的重要性,所以大多數(shù)電子設(shè)備的“交互距離”是很大的。作為HI的最基本的運行模式,恒定模式是實現(xiàn)智能眼鏡的第一步。有恒定模式的人機交互如下圖所示,人與機互相通訊,共同作業(yè)。
第二,Augmentation(增強模式)。傳統(tǒng)的人機交互的觀點通常把計算(Computation)本身作為最主要的任務(wù)。然而,HI的觀點是把計算融入更重要的人的任務(wù)中去。實現(xiàn)增強模式的應(yīng)用有一個特點,就是人在用計算機的同時,還在做一件別的事情。而通常來說,這件對于計算機來說的“別的事情”才是這個人機共同體的主要任務(wù)。例如某人在用導(dǎo)航的時候,首先他要開車要看路,他不能總是盯著屏,所以路徑圖要在視線范圍內(nèi)的一個方便的位置并加上語音輔助;其次計算機給出的所謂最短路徑并不是唯一方案。某人(我不會開車,所以不是我)要去接個女性朋友,他就不會考慮最初給予的最短路徑而希望系統(tǒng)持續(xù)更新并重新規(guī)劃路徑,實現(xiàn)了增強模式的系統(tǒng)示意。如下圖,人可以同時接受來自物理世界(真實環(huán)境)和數(shù)字世界(虛擬圖像)的信息,并同時和兩個世界進行交互。
第三,Mediation(介導(dǎo)模式)。當(dāng)上述兩個模式可以被某種系統(tǒng)實現(xiàn)之后,這個系統(tǒng)可以通過介導(dǎo)模式將人機更緊密的結(jié)合起來。這個時候,計算機的輸入和輸出就和人的感知和運動無縫地連接在一起了。實際上,我們說介導(dǎo)模式就是計算機對人的一種封裝。拿智能眼鏡舉例子,有增強模式的智能眼鏡可以讓佩戴者同時看到自然光和數(shù)字光,而有介導(dǎo)模式的智能眼鏡先通過傳感器采集自然光,并對這些數(shù)字化過后的光做出需要的調(diào)整,最后把這些數(shù)字化的光通過設(shè)備重新還原出來。這樣佩戴者會感覺到他看到的世界以一種新的方式呈現(xiàn)出來。然而,現(xiàn)實是沒有變的,被改變的只是佩戴者的感官。如下圖,這種封裝既能使人從現(xiàn)實中脫離出去,又能使人以更強的感官去感受現(xiàn)實。從這個意義上來說,介導(dǎo)模式增強了人的能力。
綜上所述,HI的三個模式是可以并存于一個系統(tǒng)之內(nèi)的。對于人來說,聽覺和視覺信號是可以數(shù)字化的信號。而視覺信息所能傳遞的信息量比聽覺要大很多。因此,計算機的交互發(fā)展會以視覺為主導(dǎo)。在智能眼鏡當(dāng)中的概念(VR,AR,和MR),即虛擬現(xiàn)實,增強現(xiàn)實和介導(dǎo)現(xiàn)實的實現(xiàn)也必須以上述三個模式來運行。如下圖,結(jié)合三個模式并可以相互轉(zhuǎn)換的話,我們就有了一個完整的HI示意圖。
當(dāng)然,既然是科普,有些東西不會講的特別細。系統(tǒng)運行當(dāng)中的六個基本信號流程及其作用本質(zhì)我這里就不多做說明了。能讀到這里感覺味道還不錯的同學(xué)我建議你們?nèi)ハ螺d教授的原文,原文中會對下圖所示的完整HI進行詳細的闡述。
最后,講一下HI。
HI代表的是 Humanistic Intelligence,它是我們實驗室里進行各種工作的指導(dǎo)思想。
大家經(jīng)常問我對人工智能的看法,人工智能確實酷,但同時,它是冰冷的。
對我來說:HI是有心靈的人工智能,它是為了改良一個物種,而非創(chuàng)造一個新的物種。
在HI反饋環(huán)里,人和計算機實質(zhì)上是一個整體。
我們在研究穿戴電腦的時候,遵循的是人機共生的思想。
你覺得自己在玩計算機,其實計算機也在玩你。
過去我們一直想培養(yǎng)具有STEM素養(yǎng)的人才,也就是科學(xué),技術(shù),工程和數(shù)學(xué),但這種理念漏掉了對心靈的培養(yǎng)。
教授Steve提出DAST,認(rèn)為全面教育應(yīng)該包括:
設(shè)計,藝術(shù),科學(xué)和技術(shù)。
所以我們相信:在HI 實驗里,優(yōu)秀的學(xué)生不僅僅要寫出沒有BUG的軟件,或做出高速運算的硬件。
我們希望你嘗試去找到真心喜歡和特別擅長的契合點。
我覺得對你來說,這個點才能讓你成為一個走心的工程師。(文|艾韜)
{{item.content}}