世界上最大科技公司們正將它們成功的鑰匙交出去,那就是開源它們的人工智能系統(tǒng)。
傳統(tǒng)意義上,計(jì)算機(jī)用戶可以看到一個(gè)軟件實(shí)現(xiàn)功能的終端產(chǎn)品,比如可以編輯文檔的Microsoft Word或可以玩的視頻游戲;但底層編程——源代碼——是專有的,遠(yuǎn)離普通大眾視野。在計(jì)算機(jī)科學(xué)中,開放源代碼是極其重大的問題,因?yàn)橹来a的人越多,就更有可能被人知道更多漏洞、承擔(dān)更多的風(fēng)險(xiǎn)。
出于相似的原因,科學(xué)方面的開放也正變得越來越事關(guān)重大。傳統(tǒng)的科研方法涉及到收集數(shù)據(jù)、分析數(shù)據(jù)和在論文上發(fā)表結(jié)果。和計(jì)算機(jī)程序一樣,傳統(tǒng)意義上的科學(xué)結(jié)果對讀者是可見的,但實(shí)際資源(用于分析的數(shù)據(jù)和通常用的軟件)卻并不免費(fèi)提供。將資源開放給所有人是具有顯著的社群吸引力的;但開源的商業(yè)吸引力就沒那么顯著了。
微軟、谷歌、Facebook和亞馬遜在人工智能系統(tǒng)開發(fā)上已經(jīng)取得顯著進(jìn)展。如今,這些公司將許多成果都發(fā)布給公眾免費(fèi)使用、探索更多可能性并幫助這些系統(tǒng)帶來提升。
這看起來很怪異:為什么這些公司要披露自己的業(yè)務(wù)核心呢?而它們對開源人工智能的擁抱對人工智能的現(xiàn)狀有什么影響呢?
異常強(qiáng)大的軟件
每一種被披露出來的技術(shù)都展現(xiàn)出了非同尋常的能力,這些能力在十年前還無法想象。這些技術(shù)的核心是所謂的「深度學(xué)習(xí)」——一種分層次組織神經(jīng)網(wǎng)絡(luò)層的分析非常大的數(shù)據(jù)集的方法,該方法不僅能夠搜索簡單的統(tǒng)計(jì)數(shù)據(jù),還能搜尋確定豐富而有趣的抽象模式。
這些主要的科技公司開放的技術(shù)有:
亞馬遜的Alexa,內(nèi)置于該公司的Echo設(shè)備中的語音命令響應(yīng)系統(tǒng),于2015年6月開放。
谷歌的TensorFlow,其圖像搜索技術(shù)的核心,于2015年11月開源。
可以運(yùn)行Facebook的M私人助理的定制硬件設(shè)計(jì),于2015年12月開源。
微軟給這些機(jī)器學(xué)習(xí)系統(tǒng)提供的答案,通俗命名為計(jì)算網(wǎng)絡(luò)工具包(Computation Network Tool Kit) ,今年1月份對公眾開放,是人工智能開發(fā)的公共可選庫的最新加入者。
Facebook人工智能研究部門負(fù)責(zé)人Yann LeCun演示M的能力
要了解什么在推動(dòng)這些公司做出開源的舉動(dòng),我們不妨從更宏大的社會(huì)背景里入手,看看與上述公司一起開源的其他組織或機(jī)構(gòu)。
甚至軍方也在開源
DARPA(美國國防部高級(jí)研究計(jì)劃局)是一個(gè)有用的對照,它是美國國防部的一個(gè)研究機(jī)構(gòu)。很難想象一個(gè)這樣的組織竟不在意別人利用自己公開的信息。然而,DARPA已經(jīng)向開源機(jī)器學(xué)習(xí)技術(shù)邁出了一大步。
事實(shí)上,DARPA XDATA項(xiàng)目導(dǎo)致產(chǎn)生一個(gè)目前最先進(jìn)的機(jī)器學(xué)習(xí)、可視化和其他技術(shù)的目錄,任何人都可以下載、使用和修改這些技術(shù)以打造定制化的人工智能工具。
DARPA和國防部如此支持開源的事實(shí)有力地表明開源的優(yōu)點(diǎn)大于將高質(zhì)量的工具提供給潛在對手的缺點(diǎn)。
另一個(gè)有用的對照是OpenAI項(xiàng)目,該項(xiàng)目最近由技術(shù)企業(yè)家Elon Musk和Sam Altman等人公布。這項(xiàng)工作的目的是研究具有越來越強(qiáng)的理解世界和與世界交互的能力的機(jī)器的創(chuàng)造與發(fā)布背后的倫理道德。
盡管讀過艾薩克·阿西莫夫的人對這些目標(biāo)很熟悉,但它們掩蓋了一個(gè)更深層次的問題:即使專家也不理解人工智能可能會(huì)何時(shí)或怎樣變得強(qiáng)大到足以帶來危害、破壞或傷害。
開放源代碼可以讓很多人單獨(dú)或一起思考這些后果。理想情況下,這種努力將會(huì)推動(dòng)軟件的發(fā)展,使其越來越強(qiáng)大和有用,同時(shí)我們也能對其機(jī)制和影響有更清楚的理解。
人工智能系統(tǒng)涉及到大量——一般是非常非常巨量——代碼,任何一個(gè)人都不可能具有同時(shí)在深度和廣度上理解如此巨量的代碼的能力。審查、故障排除和漏洞修復(fù)對人工智能來說尤為重要,因?yàn)槿斯ぶ悄懿⒉皇窃O(shè)計(jì)出來解決特定任務(wù)的工具(如汽車一樣),而是代替我們學(xué)習(xí)、適應(yīng)和做決定的工具。其所帶來的積極結(jié)果和潛在的負(fù)面后果都是巨大的。
開源人工智能同樣具有商業(yè)意義
DARPA和OpenAI的動(dòng)機(jī)都不能解釋到底為什么這些商業(yè)技術(shù)公司要開源他們的人工智能代碼。作為技術(shù)公司,他們關(guān)注的問題更加直接和具體。畢竟如果沒人使用他們的產(chǎn)品,那好而整潔的代碼和用心良苦的算法又有什么用呢?
業(yè)內(nèi)存在一個(gè)共識(shí),即谷歌、Facebook和亞馬遜這樣的公司的業(yè)務(wù)模式和人們所想的并不一樣。從長遠(yuǎn)來看,谷歌和Facebook都沒有真正的廣告銷售業(yè)務(wù),亞馬遜也不是銷售產(chǎn)品的企業(yè)。不,這些技術(shù)公司都是由你的眼球(和數(shù)據(jù))驅(qū)動(dòng)的。他們的通貨是用戶。以谷歌為例,免費(fèi)提供電子郵箱和搜索服務(wù)將用戶吸引到它的產(chǎn)品上;它需要快速創(chuàng)新、產(chǎn)出更多更好地產(chǎn)品以確保用戶留存下來。
這些公司開源它們的人工智能軟件是因?yàn)樗鼈兿M蔀槠渌藙?chuàng)新的基礎(chǔ)。成功的企業(yè)可以借此壯大,而這些科技公司也可以將它們整合到自己的產(chǎn)品集群中。人工智能是其中的核心,因?yàn)橥ㄟ^設(shè)計(jì),它可以學(xué)習(xí)、適應(yīng)甚至決策。人工智能不只是一種產(chǎn)品:它是一個(gè)產(chǎn)品生成器。在不遠(yuǎn)的未來,人工智能并不會(huì)被直接用來提供圖像服務(wù)或消費(fèi)類產(chǎn)品,但會(huì)通過創(chuàng)新新產(chǎn)品,幫助企業(yè)找到新的創(chuàng)新機(jī)會(huì)。
開源人工智能的舉措能夠保證這些公司在前沿技術(shù)領(lǐng)域保持自己的領(lǐng)先地位。從這個(gè)意義上看,它們并沒有交出自己成功的鑰匙,而只是在給自己的未來鋪路。(來源|機(jī)器之心 編譯|吳攀)
{{item.content}}