泰伯網(wǎng)訊 據(jù)新浪科技5月16日?qǐng)?bào)道,為了讓電腦更好地理解人類的語(yǔ)言,F(xiàn)acebook周一成立了一個(gè)研究項(xiàng)目,希望開(kāi)發(fā)更加強(qiáng)大的語(yǔ)音識(shí)別軟件。蘋(píng)果Siri、亞馬遜Alexa和谷歌Assistant都使用了這樣的技術(shù)。值得一提的是,該公司甚至還在尋求外部人士的幫助。
“如果沒(méi)有劇本,就表演不好。”Facebook人工智能研究總監(jiān)Yann LeCun說(shuō)。深度學(xué)習(xí)等人工智能的進(jìn)步已經(jīng)可以教會(huì)電腦識(shí)別圖片中的貓,但理解語(yǔ)言卻是一項(xiàng)更為復(fù)雜的任務(wù)。
例如,LeCun表示,電腦往往會(huì)把下面兩個(gè)句子搞混:“獎(jiǎng)杯放不進(jìn)手提箱,因?yàn)樗罅恕?rdquo;以及“獎(jiǎng)杯放不進(jìn)手提箱,因?yàn)樗×恕?rdquo;
要理解這兩個(gè)句子,需要分析“它”所指的具體對(duì)象。根據(jù)“大”和“小”兩個(gè)線索,可以判斷“它”究竟指的是“獎(jiǎng)杯”還是“手提箱”。人類通??梢悦靼祝旱谝痪湓捠钦f(shuō)獎(jiǎng)杯太大,放不進(jìn)行李箱;第二句話是說(shuō)手提箱太小,獎(jiǎng)杯放不進(jìn)去。
但電腦缺乏對(duì)物體尺寸的基本了解,因會(huì)搞錯(cuò)兩個(gè)句子的意思。要充分理解語(yǔ)言,電腦就必須知道物理世界的一些基本事實(shí),避免搞混簡(jiǎn)單的句子。
要為電腦提供幫助,方法之一就是為其提供各種對(duì)話和網(wǎng)絡(luò)語(yǔ)言實(shí)例,將此作為教學(xué)工具。例如,研究人員曾經(jīng)使用Reddit的上關(guān)于電影的討論數(shù)據(jù)來(lái)訓(xùn)練電腦,使之學(xué)會(huì)人類討論自己喜歡的電影時(shí)使用的聊天方式。在另外一個(gè)案例中,研究人員還使用維基百科的數(shù)據(jù)來(lái)訓(xùn)練電腦回答與具體電影有關(guān)的問(wèn)題。
Facebook希望讓世界各地的研究人員可以分享他們通過(guò)具體的實(shí)驗(yàn)得出的結(jié)論,并共享他們使用的數(shù)據(jù)。該公司相信,這種合作可以加快這項(xiàng)技術(shù)的發(fā)展,并最終讓電腦完全理解人類語(yǔ)言。
Facebook的人工智能研究團(tuán)隊(duì)開(kāi)發(fā)了免費(fèi)的軟件工具,供其他人免費(fèi)下載,并為他們的實(shí)驗(yàn)提供幫助,使之可以匯總數(shù)據(jù),并查看其他項(xiàng)目參與者的研究成果。這些軟件都開(kāi)放了源代碼,所以其他人也可以貢獻(xiàn)自己的研究成果,從而改進(jìn)底層技術(shù)。
目前還不清楚其他大公司的人工智能研究人員是否會(huì)加入Facebook的項(xiàng)目,并為這項(xiàng)技術(shù)做出貢獻(xiàn)。但Facebook高管表示,微軟等公司的研究人員已經(jīng)表達(dá)了興趣。
Facebook認(rèn)為,盡管很多從事語(yǔ)音軟件開(kāi)發(fā)的公司彼此之間存在競(jìng)爭(zhēng),但也可以通過(guò)相互合作獲益。但由于這類研究所對(duì)應(yīng)的產(chǎn)品可能關(guān)系到價(jià)值數(shù)十億美元的產(chǎn)品,加之Facebook、谷歌、蘋(píng)果、亞馬遜和微軟都存在激烈的競(jìng)爭(zhēng)關(guān)系,因此他們之間的合作希望似乎比較渺茫。
不過(guò),LeCun表示,該項(xiàng)目的最終目標(biāo)是創(chuàng)造能夠完全理解對(duì)話的強(qiáng)大電腦,這還要等待多年才有可能實(shí)現(xiàn)。他表示,短期目標(biāo)是讓數(shù)字助手能夠根據(jù)用戶自主提供的興趣數(shù)據(jù)推薦有用的信息和新聞。
{{item.content}}