4月17日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)(Seed)發(fā)布并開源UI-TARS-1.5。據(jù)介紹,這是一款基于視覺-語言模型構(gòu)建的開源多模態(tài)智能體,能夠在虛擬世界中高效執(zhí)行各類任務(wù)。目前,UI-TARS-1.5已在7個(gè)典型的GUI圖形用戶界面評(píng)測(cè)基準(zhǔn)中取得SOTA表現(xiàn),并首次展現(xiàn)了其在游戲中的長(zhǎng)時(shí)推理能力和在開放空間中的交互能力。
4月14日,高德地圖宣布,推出基于地圖的AI導(dǎo)航智能體(NaviAgent)。據(jù)技術(shù)負(fù)責(zé)人介紹,其核心架構(gòu)采用Planner-Executor模式,通過感知、規(guī)劃、執(zhí)行、表達(dá)四大模塊構(gòu)建智能閉環(huán),集成多項(xiàng)高德核心技術(shù):在感知層,TrafficVLM模型可捕捉多尺度的交通時(shí)空變化, 交互層應(yīng)用AmapVoice情感語音技術(shù)。
4月10日消息,谷歌在Google Cloud Next 25大會(huì)上推出Agent2Agent 協(xié)議(A2A),這是一項(xiàng)全新的開放標(biāo)準(zhǔn),旨在讓AI智能體能夠相互通信。此前,Anthropic的模型上下文協(xié)議(MCP) 為智能體提供了一種結(jié)構(gòu)化的工具使用方式,而A2A則為智能體提供了一種相互協(xié)作的方式,將孤立的機(jī)器人轉(zhuǎn)變?yōu)閿?shù)字工作團(tuán)隊(duì)。此外,谷歌還在發(fā)布了全新AI處理器Ironwood,這是其定制TPU架構(gòu)的第七代產(chǎn)品。
4月8日,火山引擎宣布推出一款名為Data Agent的企業(yè)數(shù)據(jù)智能體。基于大模型的推理、分析和調(diào)用工具等能力,Data Agent能夠深度理解業(yè)務(wù)需求,自動(dòng)化完成撰寫深度研究報(bào)告、營銷活動(dòng)設(shè)計(jì)等任務(wù)。
預(yù)算金額為2800萬元。
3月20日,OpenAI進(jìn)行了技術(shù)直播發(fā)布了三款全新語音模型,專用于開發(fā)語音AI Agent。兩個(gè)是語音轉(zhuǎn)文本模型GPT-40 Transcribe和GPT-4 Mini Transcribe;一個(gè)是文本轉(zhuǎn)語音模型GPT-40 Mini TTS。OpenAI還特意開發(fā)了一個(gè)新網(wǎng)站來展示新功能。
3月19日,“聚勢(shì)開源AI、點(diǎn)亮世界級(jí)宜昌”主題大會(huì)在湖北宜昌召開,會(huì)上聯(lián)想集團(tuán)與宜昌方面正式簽署了“城市超級(jí)智能體”合作協(xié)議。據(jù)介紹,聯(lián)想城市超級(jí)智能體通過整合大模型和智能體技術(shù),將從多個(gè)維度推動(dòng)宜昌城市建設(shè)和經(jīng)濟(jì)發(fā)展的深層次變革。聯(lián)想集團(tuán)高級(jí)副總裁、中國方案服務(wù)業(yè)務(wù)群總經(jīng)理戴煒表示,聯(lián)想宜昌超級(jí)城市智能體將全面賦能宜昌AI宜居城市的建設(shè),此次合作不僅是聯(lián)想在智慧城市領(lǐng)域的一次重要實(shí)踐,也是宜昌邁向智慧城市4.0時(shí)代的關(guān)鍵一步。
3月18日,理想汽車自動(dòng)駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬在NVIDIA GTC2025上表示,理想汽車下一代自動(dòng)駕駛架構(gòu)MindVLA是機(jī)器人大模型,成功整合了空間智能、語言智能和行為智能,一旦跑通物理世界和數(shù)字世界結(jié)合的范式后,將有望賦能更多行業(yè)?!癕indVLA將把汽車從單純的運(yùn)輸工具轉(zhuǎn)變?yōu)橘N心的專職司機(jī),它能聽得懂、看得見、找得到。我們希望MindVLA能為汽車賦予類似人類的認(rèn)知和適應(yīng)能力,將其轉(zhuǎn)變?yōu)槟軌蛩伎嫉闹悄荏w。”
3月15日,聯(lián)想集團(tuán)與武夷山市政府簽署合作協(xié)議,共同打造全球首個(gè)基于大模型和智能體技術(shù)的城市超級(jí)智能體。該智能體旨在推動(dòng)人工智能技術(shù)在城市的廣泛應(yīng)用,成為城市管理和產(chǎn)業(yè)賦能的新平臺(tái)。
據(jù)報(bào)道,軟銀計(jì)劃將日本一家前夏普液晶面板工廠改造為數(shù)據(jù)中心,用于運(yùn)行與OpenAI聯(lián)合開發(fā)的人工智能智能體。據(jù)悉,收購該工廠及土地的協(xié)議最快周五簽署,收購價(jià)格預(yù)計(jì)約為1000億日元。
3月10日,《武漢市2025年人工智能產(chǎn)業(yè)發(fā)展行動(dòng)方案》發(fā)布。武漢市中小企業(yè)發(fā)展促進(jìn)中心主任蘇新威在發(fā)布會(huì)上表示,《方案》將重點(diǎn)推動(dòng)大模型向智能體演進(jìn),在產(chǎn)業(yè)政策中給予支持,目前正在開展全市首批智能體產(chǎn)品和創(chuàng)新創(chuàng)業(yè)團(tuán)隊(duì)的入庫、培育。武漢市已經(jīng)建立了服務(wù)專班,協(xié)調(diào)服務(wù)企業(yè)發(fā)展所需要的數(shù)據(jù)、算力等各類要素,搭建溝通交流平臺(tái),全年將開展10場(chǎng)以上的供需對(duì)接的活動(dòng),推動(dòng)人工智能企業(yè)聯(lián)合行業(yè)開發(fā)工業(yè)、醫(yī)療、教育、法律、文創(chuàng)等垂直行業(yè)的智能體,形成武漢智能體產(chǎn)品的矩陣,打造一批輕量化的智能化的產(chǎn)品。
百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在人民網(wǎng)發(fā)表《緊抓AI智能體爆發(fā)元年機(jī)遇?推動(dòng)新質(zhì)生產(chǎn)力加快發(fā)展》署名文章。李彥宏表示,2025年可能會(huì)成為AI智能體爆發(fā)的元年。推理大模型涌現(xiàn)出讓人驚嘆的深度思考能力,這將推動(dòng)人工智能的一個(gè)重要應(yīng)用方向,即“AI智能體”的落地。同時(shí),面對(duì)空前激烈的全球人工智能領(lǐng)域競(jìng)爭(zhēng),必須在人工智能芯片、數(shù)據(jù)中心、云基礎(chǔ)設(shè)施上更大膽地投入,打造更好、更智能的下一代模型。
西湖大學(xué)AGI實(shí)驗(yàn)室張馳團(tuán)隊(duì)日前推出AppAgentX——一款具備自我進(jìn)化能力的GUI代理。據(jù)介紹,它能夠在不斷執(zhí)行任務(wù)的過程中學(xué)習(xí)并優(yōu)化自身的行為模式,實(shí)現(xiàn)更加高效的操作。從實(shí)驗(yàn)結(jié)果來看,AppAgentX從單步的執(zhí)行效率到總體的API token消耗,在多個(gè)GUI交互任務(wù)上展現(xiàn)出了顯著的“降本增效”。
3月6日消息,亞馬遜的云業(yè)務(wù)集團(tuán)正在成立一個(gè)部門,該部門將開發(fā)與人工智能智能體協(xié)同工作的軟件,因?yàn)樵摴局荚谠谏墒饺斯ぶ悄茴I(lǐng)域與競(jìng)爭(zhēng)對(duì)手保持同步。
2月13日消息,百度Apollo宣布,Apollo智艙大模型和出行智能體已完成DeepSeek接入。接入DeepSeek的Apollo智艙大模型將陸續(xù)在凱迪拉克、別克品牌的新車型上陸續(xù)搭載使用。
華爾街日?qǐng)?bào)1月22日消息,OpenAI首席產(chǎn)品官凱文·維爾(Kevin Weil)表示,OpenAI預(yù)計(jì)將在2月或3月發(fā)布更智能的GPT o3模型。此外,該公司還將在第一季度推出其首批AI智能體工具,使ChatGPT能夠在計(jì)算機(jī)上執(zhí)行實(shí)際操作。維爾舉了一個(gè)例子,說明ChatGPT可以幫助他的孩子填寫并提交足球報(bào)名表。Anthropic首席執(zhí)行官達(dá)里奧·阿莫代21日接受采訪時(shí)預(yù)測(cè),在兩到三年內(nèi),可能就會(huì)出現(xiàn)超越人類智能的AI。維爾暗示,這甚至可能在2027年之前就會(huì)發(fā)生。
北京時(shí)間周一上午,OpenAI CEO山姆·奧爾特曼(Sam Altman)發(fā)布了一篇以“反思”為主題的博客長(zhǎng)文,側(cè)面回應(yīng)了圍繞OpenAI的爭(zhēng)議話題?!拔覀兊脑妇安粫?huì)變,而戰(zhàn)術(shù)還將繼續(xù)演變。”奧爾特曼表示,現(xiàn)在OpenAI有信心說自己已經(jīng)知道了如何構(gòu)建AGI(通用人工智能)。相信2025年人們將會(huì)看到第一批AI智能體“加入勞動(dòng)力大軍”,從根本上改變各公司產(chǎn)出的東西。OpenAI也已看向更遠(yuǎn)的遠(yuǎn)方,目標(biāo)已經(jīng)轉(zhuǎn)向了真正意義上的超級(jí)智能。關(guān)于智能體的展望,奧爾特曼此前已提及過一次,他在去年10月底表示,下一個(gè)重大突破將是智能體。
12月31日,山姆·奧特曼公布了2025年OpenAI即將發(fā)布的技術(shù)產(chǎn)品,包括通用人工智能AGI、智能體更好的GPT-4o升級(jí)版、更好的記憶存儲(chǔ)、更好的上下文窗口成人模式、深度研究特色功能更好的Sora更好的個(gè)性化定制等。
12月24日,深圳市眾擎機(jī)器人科技有限公司發(fā)布了新一代全開放通用具身智能體PM01,定價(jià)8.8萬元起。眾擎PM01身高1.38m,體重約40kg,全身24個(gè)自由度,移動(dòng)速度2m/s,具有機(jī)械步態(tài)和擬人自然步態(tài)兩種行走模式,擬人程度與運(yùn)動(dòng)表現(xiàn)宣稱“媲美旗艦機(jī)型 SE01”。