翻譯:younger 審校:心
從《2001太空漫游》中的機(jī)器人HAL,到Spike Jonze導(dǎo)演的《她》中的Samantha,幾十年來,我們一直在幻想,未來某天智能計(jì)算機(jī)將能夠與人類交互,像人一樣可以聽從指令,也可以獨(dú)立做出決策。
自iPhone 4 的Siri上線以來,Google, Facebook, Amazon, Microsoft ,Baidu也已踏入這一領(lǐng)域。雖然每一代的新AI或許都會(huì)有新特點(diǎn)或新應(yīng)用,然而它們離電影中呈現(xiàn)的人工智能還相差甚遠(yuǎn)。很難想象真的會(huì)有人與Siri戀愛,或者NASA讓Alexa掌控整個(gè)太空飛船。
電影的期望甚高,我們?nèi)匀辉诘却@樣的聲控AI助理能夠在未來廣泛地進(jìn)入真實(shí)世界。然而,一個(gè)能夠真正輔助人類日常生活的智能助理時(shí)代,或許并未像我們想象地那么遙遠(yuǎn)。
只依賴于用戶輸入的被動(dòng)助理
談到智能人類助理,人們想到的總會(huì)是Siri, Cortana或者 Amazon Echo。某些熟悉科技的用戶可能也從Siri的創(chuàng)始人那里聽說過Viv, 還有Facebook最近研發(fā)的M,以及Operator或Magic等基于信息的AI工具。但是,雖然最近這些工具炒得火熱,然而就用戶案例而言,其中大多數(shù)仍然局限于所謂的Q&A模式。
最近幾年,關(guān)于科技公司對待AI研發(fā)態(tài)度認(rèn)真的信號時(shí)常出現(xiàn)。2014年谷歌以5億美元收購了倫敦的深度學(xué)習(xí)研究企業(yè)DeepMind,去年IBM收購了AlchemyAPI,最近1周內(nèi)蘋果就進(jìn)行了兩次收購。
基于GPU加速的深度學(xué)習(xí)出現(xiàn)突破后,這些收購接踵而至,使得模式識(shí)別方面出現(xiàn)卓越進(jìn)展,并有了更強(qiáng)大的語音識(shí)別和計(jì)算機(jī)視覺應(yīng)用。據(jù)Expect Labs的創(chuàng)始人和CEO Tim Tuttle所說,未來兩年機(jī)器將能夠比人類更善于聽從語音指令。
通過我們的感官傳達(dá)的能力是否真的是人類智慧的本質(zhì),仍然存在爭議,然而這種能力就像是基本配方的一種配料。伯克利大學(xué)的Stuart Russell教授確認(rèn)了計(jì)算機(jī)為通過整個(gè)圖靈測試需要具備的六種主要能力:自然語言處理,知識(shí)表達(dá),自動(dòng)推理,機(jī)器學(xué)習(xí),計(jì)算機(jī)視覺,以及機(jī)器人技術(shù)。
簡單地說,這些能力組成了通用人工智能,語音識(shí)別只是一個(gè)方面。手敲鍵盤累的時(shí)候,說話可以是另外一種替代方式,你的聲音只是一種介質(zhì),并不一定是最好的輸入方式。多少次你用語音問Siri一些問題,最后卻不得不在谷歌上把請求敲下來?
聯(lián)系背景信息最困難
Viv背后的團(tuán)隊(duì)相信,利用深度學(xué)習(xí)技術(shù),讓機(jī)器教自己如何解決問題,他們能夠打造更棒的個(gè)人助理。雖然Viv團(tuán)隊(duì)對自己的秘密武器仍然諱莫如深,然而最近披露的消息表明他們的人工智能仍然需要一些人類指導(dǎo)才能建造用戶案例。根據(jù)知道如何解決該問題的人提供的線索,人類可以解決問題,同樣地,人類也幫助AI找到解決問題的方式。
與人類的比較到此為止,因?yàn)槿祟惻c機(jī)器不同,人類有能力自動(dòng)將問題放在不同背景下,找到解決問題的原始方法,構(gòu)建知識(shí)結(jié)構(gòu)。我們會(huì)自然地連接要點(diǎn),找到答案做出決策,而現(xiàn)在的AI通常不能將問題與某些要素結(jié)合起來,且很難根據(jù)周圍背景信息而改變形式。
如果掌握背景信息,AI能夠形成更智能的決定,而不僅僅靠定義明確的輸入指令。這樣AI就可以將過去,現(xiàn)在,未來的信息結(jié)合起來解決復(fù)雜信息。巴黎大學(xué)的教授Patrick Brézillon:“缺少上下背景信息的顯式表達(dá)是很多基于知識(shí)的人工智能系統(tǒng)失敗的原因之一。”的確,還有很多問題需要克服。
教計(jì)算機(jī)聯(lián)系背景處理問題是一個(gè)艱巨的難題:人們并不總是能夠預(yù)測未來情況,而未來的多樣性也沒有止境。個(gè)人層面,用機(jī)器學(xué)習(xí)技術(shù)理解某人的社交行為和決策行為,或許需要及其漫長的用戶數(shù)據(jù)輸入??赡苊刻?4小時(shí)地觀察某人可以做到這點(diǎn),但是因?yàn)檫€沒有讀心術(shù),你不得不需要大聲表達(dá)你的推理思維,如此機(jī)器才能模仿你思考的模式。
利用互聯(lián)網(wǎng)的力量
機(jī)器學(xué)習(xí)需要海量數(shù)據(jù)。自然語言處理的數(shù)據(jù)通常搜集在語料庫里,語料庫是結(jié)構(gòu)化的數(shù)量繁多的文本集,可用來訓(xùn)練AI。如果你想知道這些數(shù)據(jù)集有多大,那么可以說當(dāng)Watson打敗Jeopardy冠軍的時(shí)候,這種數(shù)據(jù)集早已將整個(gè)維基百科數(shù)據(jù)庫納入了。
IBM Watson有趣的一點(diǎn)是,它的數(shù)據(jù)集不需要預(yù)先構(gòu)建,也就是說 Watson能夠在無人類監(jiān)督的情況下使用這些數(shù)據(jù)。如果M,這個(gè)未來目標(biāo)是能夠交談以及執(zhí)行復(fù)雜任務(wù)的AI,也有同樣的訓(xùn)練方式將會(huì)怎樣呢?這個(gè)模型將會(huì)是什么樣?去哪里發(fā)現(xiàn)合適的數(shù)據(jù)呢?
互聯(lián)網(wǎng)上有幾百萬小時(shí)的會(huì)話,視頻,數(shù)據(jù)等各種東西,神經(jīng)網(wǎng)絡(luò)可以以此構(gòu)建智能。你想教一個(gè)機(jī)器什么是愛嗎?那么就給它輸入羅密歐和朱麗葉等浪漫小說吧。教它商業(yè)的東西嗎,那么給它讀華爾街日報(bào)的新聞。Deepmind最近給我們展示了一點(diǎn)類似的做法,為了教AI語言,他們給AI提供了來自CNN和每日郵報(bào)的30多萬篇文章。
數(shù)據(jù)就在那里,而現(xiàn)在我們似乎還浮于表面。但機(jī)器學(xué)習(xí)迎來下一波突破后,我們將能夠更能理解以EB為單位的網(wǎng)絡(luò)信息意味著什么,而這些進(jìn)展將會(huì)帶來變革,并大大帶動(dòng)超級人工智能的進(jìn)展。
除了沉迷于非結(jié)構(gòu)化的在線數(shù)據(jù)汪洋中,其實(shí)能讓生活更舒適的未來已經(jīng)近在咫尺。每天,人們通過網(wǎng)絡(luò)做出幾百個(gè)決策,每次我們點(diǎn)擊一個(gè)鏈接,都會(huì)被廣告和分析公司記錄下來。想象一下,你和幾百萬個(gè)其他用戶在網(wǎng)絡(luò)中暢游并搜集相關(guān)信息的時(shí)候,這些信息被想要理解你瀏覽喜好的AI所利用,它們正在利用這些數(shù)據(jù)生成跟你有關(guān)的模式。
這種AI不僅會(huì)給你一種個(gè)性化和情景化的網(wǎng)絡(luò)體驗(yàn),也會(huì)更好地理解你的意圖,并且在你表達(dá)需要之前就主動(dòng)滿足你的需求!哇,一個(gè)真正能夠減輕你的負(fù)荷的AI個(gè)人助理真的成為現(xiàn)實(shí)了。
研究人員預(yù)測,在我們真正體驗(yàn)偉大的普適類人智能之前,還需要至少等10年。于此同時(shí),互聯(lián)網(wǎng)已經(jīng)為AI的巨大進(jìn)展準(zhǔn)備好了必備的材料,并且已經(jīng)出現(xiàn)了很多bot,scrapers, analytics等API,它們讓在線數(shù)據(jù)更加充實(shí),我們也能夠加以利用,那么讓我們將電影與眼前實(shí)際發(fā)生的進(jìn)展區(qū)分開來,去意識(shí)到,我們可以好好利用這些經(jīng)常用到的數(shù)據(jù),打造出來能夠讓生活更簡便的AI,并且,機(jī)會(huì)很大。
{{item.content}}