4月17日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)(Seed)發(fā)布并開源UI-TARS-1.5。據(jù)介紹,這是一款基于視覺-語(yǔ)言模型構(gòu)建的開源多模態(tài)智能體,能夠在虛擬世界中高效執(zhí)行各類任務(wù)。目前,UI-TARS-1.5已在7個(gè)典型的GUI圖形用戶界面評(píng)測(cè)基準(zhǔn)中取得SOTA表現(xiàn),并首次展現(xiàn)了其在游戲中的長(zhǎng)時(shí)推理能力和在開放空間中的交互能力。(36氪)