泰伯網(wǎng)訊,5月21日,在2025全球時(shí)空智能大會(huì)(WGDC25)會(huì)議現(xiàn)場(chǎng),清華大學(xué)人工智能研究院視覺(jué)智能研究中心主任鄧志東教授進(jìn)行了題為《人工智能與世界模型演進(jìn)及智駕場(chǎng)景應(yīng)用》的主題演講。
他表示,世界模型智能體的本質(zhì)是next spatio-temporal state prediction,即“下一個(gè)時(shí)空狀態(tài)的預(yù)測(cè)”。世界模型智能體能夠?qū)崿F(xiàn)交互式學(xué)習(xí)。在模仿學(xué)習(xí)的基礎(chǔ)上,最終通過(guò)交互式的導(dǎo)入,自主獲得人類(lèi)或超過(guò)人類(lèi)水平的決策、規(guī)劃及行動(dòng)能力,實(shí)現(xiàn)物理AI。
鄧志東認(rèn)為,時(shí)空智能面臨的主要挑戰(zhàn)包括怎么進(jìn)行時(shí)間和空間的對(duì)齊、時(shí)空感知與理解、時(shí)空預(yù)測(cè)、時(shí)空推理、上下文動(dòng)態(tài)理解與預(yù)測(cè)、時(shí)空交互、時(shí)空閉環(huán)等等。
當(dāng)前,時(shí)空智能在真實(shí)物理世界賦能智駕場(chǎng)景應(yīng)用。他預(yù)判,從時(shí)空理解、時(shí)空預(yù)測(cè),到基于學(xué)習(xí)的時(shí)空決策規(guī)劃,自動(dòng)駕駛從感知智能走向認(rèn)知智能的變革性發(fā)展,可真正實(shí)現(xiàn)大模型時(shí)代自動(dòng)駕駛的大規(guī)模商業(yè)化落地及產(chǎn)業(yè)化。
{{item.content}}