字節(jié)跳動開源多模態(tài)AI Agent—UI-TARS-1.5

2025-04-23 09:37

4月23日，字節(jié)跳動開源了多模態(tài)AI Agent UI-TARS的最新1.5版本。與上一代相比，1.5版本在計算機使用、瀏覽器使用和手機使用等基準測試中均表現(xiàn)非常出色。在計算機使用方面，OSworld測試得分為42.5，高于OpenAI CUA的36.4、Claude 3.7的28以及之前的最高水平38.1（200步）；Windows Agent Arena（50步）得分為42.1，遠超之前的29.8。瀏覽器使用方面，WebVoyager得分為84.8，接近OpenAI CUA和之前最高水平的87，Online-Mind2web得75.8，優(yōu)于OpenAI CUA的71、Claude 3.7的62.9和之前的71。手機使用方面，Android World得64.2，高于之前的59.5。（AIGC開放社區(qū)）

喜歡您正在閱讀的內(nèi)容嗎？歡迎免費訂閱泰伯每周精選電郵。立即訂閱

聲明：泰伯網(wǎng)登載此文出于傳遞更多信息之目的，并不意味著贊同其觀點或證實其描述，文章內(nèi)容僅供參考。