4月23日,字節(jié)跳動開源了多模態(tài)AI Agent UI-TARS的最新1.5版本。與上一代相比,1.5版本在計算機使用、瀏覽器使用和手機使用等基準測試中均表現(xiàn)非常出色。在計算機使用方面,OSworld測試得分為42.5,高于OpenAI CUA的36.4、Claude 3.7的28以及之前的最高水平38.1(200步);Windows Agent Arena(50步)得分為42.1,遠超之前的29.8。瀏覽器使用方面,WebVoyager得分為84.8,接近OpenAI CUA和之前最高水平的87,Online-Mind2web得75.8,優(yōu)于OpenAI CUA的71、Claude 3.7的62.9和之前的71。手機使用方面,Android World得64.2,高于之前的59.5。(AIGC開放社區(qū))