圖源:《AI創(chuàng)世者》劇照
撰文 | 程子筠
編輯 | 神璐璐
審核 | 劉玉琳
封面 | 《AI創(chuàng)世者》劇照
近日,在本屆英偉達(dá)GTC的爐邊談話中,美國(guó)國(guó)家工程院院士、斯坦福大學(xué)教授李飛飛與英偉達(dá)首席科學(xué)家比爾?達(dá)利(Bill Dally)圍繞AI發(fā)展、AI風(fēng)險(xiǎn)、人類在AI時(shí)代的角色定義等話題展開對(duì)談。
李飛飛認(rèn)為,要真正創(chuàng)造出空間智能,創(chuàng)造出今天仍然缺乏的世界模型,“當(dāng)我們用大數(shù)據(jù)進(jìn)行擴(kuò)展時(shí),我想看到的是結(jié)構(gòu)化建模,或者說偏向于三維感知和結(jié)構(gòu)的模型與大數(shù)據(jù)相結(jié)合?!?/strong>
從公開信息看,李飛飛現(xiàn)階段的工作重點(diǎn)集中在AI智能體上。與十幾年前不同的是,這種智能體不僅能接收來自數(shù)據(jù)集的靜態(tài)圖像,還能在三維虛擬世界的模擬環(huán)境中四處移動(dòng),并與周圍環(huán)境交互。
當(dāng)AI模型從早期ImageNet時(shí)代的ContralNets,到用于語(yǔ)言的RNN,再到Transformer,基于世界數(shù)據(jù)、多模態(tài)數(shù)據(jù)的模型架構(gòu)持續(xù)被李飛飛看好。
早在2007年,李飛飛啟動(dòng)了圖像數(shù)據(jù)集項(xiàng)目ImageNet。彼時(shí),數(shù)據(jù)集的整理和標(biāo)注是臟活累活,學(xué)術(shù)界和產(chǎn)業(yè)界并不太關(guān)注。
{{item.content}}