4月17日,火山引擎公布了模型、Agent工具、云基礎(chǔ)設(shè)施的最新進(jìn)展,旨在幫助企業(yè)更快、更省地構(gòu)建和部署Agent應(yīng)用:發(fā)布豆包1.5·深度思考模型,升級(jí)豆包·文生圖模型3.0、豆包·視覺(jué)理解模型。
同時(shí),面向Agent服務(wù),發(fā)布OS Agent解決方案、GUI Agent大模型——豆包1.5·UI-TARS模型;面向大規(guī)模推理,發(fā)布AI云原生·ServingKit推理套件。
截至2025年3月底,豆包大模型日均tokens調(diào)用量已超過(guò)12.7萬(wàn)億,是2024年12月的3倍,是一年前剛剛發(fā)布時(shí)的106倍。
豆包1.5·深度思考模型采用 MoE 架構(gòu),總參數(shù)為200B,激活參數(shù)僅20B。
豆包1.5·深度思考模型還具備視覺(jué)理解能力,可以像人類(lèi)一樣,不光基于文字思考,更能基于所見(jiàn)畫(huà)面思考,思考更立體,讓模型同時(shí)擁有“大腦”和“眼睛”。
此次全新升級(jí)的豆包·文生圖模型3.0,能夠?qū)崿F(xiàn)更好的文字排版表現(xiàn)、實(shí)拍級(jí)的圖像生成效果,以及2K 的高清圖片生成方式。
火山引擎正式發(fā)布 OS Agent 解決方案,未來(lái)兩周將陸續(xù)上線火山引擎官網(wǎng)。
該解決方案通過(guò)火山引擎 veFaaS 平臺(tái)對(duì)豆包大模型能力進(jìn)行封裝,可以讓企業(yè)和開(kāi)發(fā)者輕松構(gòu)建輕量級(jí)的 Code use 和 Browser use。而針對(duì)任務(wù)相對(duì)復(fù)雜的 Computer Use 和 Mobile Use Agent,則可以通過(guò) ECS 或云手機(jī)等調(diào)用豆包1.5·UI-TARS 模型,驅(qū)動(dòng)圖形用戶(hù)界面交互,精準(zhǔn)識(shí)別用戶(hù)的任務(wù)需求,進(jìn)行感知、自主推理并準(zhǔn)確行動(dòng)。
{{item.content}}