8月22日消息,Meta據(jù)悉聘請?zhí)O果公司AI高管Frank Chu加入Superintelligence團隊。
8月19日,通義千問宣布,推出Qwen-Image-Edit,Qwen-Image的圖像編輯版本。Qwen-Image-Edit基于20B的Qwen-Image模型進?步訓練,將Qwen-Image的文本渲染能力延展至圖像編輯領域,實現(xiàn)了對圖片中文字的精準編輯。
8月14日消息,智元機器人推出面向真實世界機器人操控的統(tǒng)一世界模型平臺Genie Envisioner(GE)。 不同于傳統(tǒng)“數(shù)據(jù)—訓練—評估”割裂的流水線模式,GE將未來幀預測、策略學習與仿真評估首次整合進以視頻生成為核心的閉環(huán)架構,使機器人在同一世界模型中完成從“看”到“想”再到“動”的端到端推理與執(zhí)行。
8月6日消息,寶馬i系列設計主管Kai Langer日前在領英發(fā)文宣布,在寶馬集團工作了二十多年之后,于8月1日加入小米。根據(jù)領英資料,Kai Langer自2003年進入寶馬集團,主要從事設計方面的工作。
8月6日消息,谷歌DeepMind宣布推出第三代通用的世界模型Genie 3,可以生成前所未有的多樣化交互式環(huán)境。給出文本提示,Genie 3可以生成動態(tài)世界,可以以每秒24幀的速度實時導航,并以720p的分辨率保持幾分鐘的一致性。與前代模型(如 Genie 1/2)和視頻生成模型(如 Veo 2,Veo 3對直覺物理學的深刻理解)相比,Genie 3是第一個允許實時交互的世界模型,同時其一致性和真實感也得到了提升。
OpenAI通過技術直播發(fā)布ChatGPT統(tǒng)一智能體(ChatGPT Agent)。據(jù)介紹,ChatGPT Agent具備自主思考和行動的能力,能夠主動從其技能庫中選擇合適的工具,包括Operator、 Deep Research和ChatGPT來完成各種超復雜任務。
據(jù)報道,軟銀創(chuàng)始人孫正義與OpenAI首席執(zhí)行官山姆·奧爾特曼日前在“SoftBank World”大會上通過視頻連線展開對話,他們認為AI所激發(fā)的巨大需求使得算力持續(xù)擴展勢在必行。奧爾特曼表示,“隨著人工智能成本下降,就會有更多的人想要使用它……全球對智能的需求是巨大的?!眾W爾特曼提到能夠制造其他機器人的機器人,孫正義則進一步闡述了AI Agent具備自主學習能力,并能創(chuàng)造新Agent來提升生產力的構想。他計劃今年在軟銀集團內部部署10億個AI Agent,并為其設計一個操作系統(tǒng)。
7月8日,中科星圖GEOVIS數(shù)字地球全球總部項目主體結構正式封頂。項目建成后將成為推動空天信息產業(yè)發(fā)展的支撐平臺,賦能商業(yè)航天、低空經濟、智慧城市等重大領域,助力安徽打造具有重要影響力的空天科技創(chuàng)新策源地和產業(yè)集聚地。
6月25日,出門問問發(fā)布Agentic AI軟硬結合產品TicNote。據(jù)了解,TicNote是出門問問發(fā)布的新一代Agentic AI軟硬件結合的產品,通過內置“Shadow AI”為用戶構建“有記憶的AI記錄+主動洞察 +主動分析+陪伴創(chuàng)作”的路徑,適用于會議、電話溝通、商務會議、學術講座、醫(yī)生問診、課堂學習、采訪溝通等場景。
OpenAI聯(lián)合創(chuàng)始人兼首席執(zhí)行官Sam Altman表示,前幾天OpenAI刪除一切與設計師Jony Ive的信息。原因就是,OpenAI收購公司的名字是io,與AI耳機公司iyO看起來很相似,所以被起訴了。Altman公布了與iyO的交涉郵件,除了展示了事情來龍去脈之外,還透露了一個重要信息,OpenAI收購io的主要原因想開發(fā)與硬件交互的語音AI Agent,進軍AI硬件領域,并且一開始想合作的對象是iyO。
據(jù)悉,吳德周離開字節(jié)跳動后創(chuàng)立的智能眼鏡公司「致敬未知」,于近期推出其首款AI運動眼鏡BleeqUp Ranger。該產品專為騎行、徒步等戶外運動設計,將于6月底在海外發(fā)售。與Meta計劃推出的AI運動眼鏡相比,BleeqUp Ranger在功能設計上更貼合運動場景需求,例如攝像頭置于中間、配備雙倍揚聲器、自動觸發(fā)錄像功能等。吳德周認為,垂直場景的AI眼鏡是創(chuàng)業(yè)公司的機會,未來智能眼鏡將成為個人全天候智慧助手,而打通手機權限將是關鍵。
6月9日消息,據(jù)媒體報道,某DeepSeek核心高管已于半年前悄然離職創(chuàng)業(yè),并將于2025年圣誕節(jié)前后發(fā)布Agent產品。據(jù)知情人士透露,該高管系原DeepSeek CTO。不過另有知情人士透露,DeepSeek內部并無明確的CTO一職,即在DeepSeek內部并無明確為“CTO”的職位,但有承擔相應工作的人士。上述知情人士進一步透露,這位DeepSeek核心高管的創(chuàng)業(yè)項目已拿到IDG資本融資。對此,IDG相關人士表示對此事并不知情。有業(yè)內人士表示,通常情況下這種“不予置評”的態(tài)度在投資圈并不罕見,尤其是涉及高敏感度的人才流動和前沿技術賽道時。
Meta公司6月5日公布Aria Gen 2實驗性智能眼鏡的詳細設計。作為2020年初代產品的升級版,這款眼鏡專為AR、AI及機器人技術研究優(yōu)化,重量僅75克,配備可折疊鏡臂并提供8種尺寸選擇。Aria Gen 2搭載眼動追蹤系統(tǒng),可精準捕捉視線與眨眼動作,為人機交互提供新思路。四臺計算機視覺攝像頭支持3D手部及物體追蹤,適用于高精度操作場景。此外,鼻托集成心率傳感器、降噪麥克風及環(huán)境光傳感器,進一步擴展研究應用場景。Meta表示,Aria Gen 2是探索未來計算平臺的重要工具,計劃于今年晚些時候向研究人員開放申請,推動技術前沿創(chuàng)新。
當?shù)貢r間5月6日,谷歌DeepMind人工智能研究團隊發(fā)布了Gemini 2.5 Pro “I/O” ,這是今年3月發(fā)布的多模態(tài)大語言模型Gemini 2.5 Pro的升級版本。在AI排行榜LMArena上,該模型在多個指標上登頂。目前該模型已向Google AI Studio的獨立開發(fā)者、Vertex AI云平臺的企業(yè)用戶以及Gemini應用的普通用戶開放。
4月23日,字節(jié)跳動開源了多模態(tài)AI Agent UI-TARS的最新1.5版本。與上一代相比,1.5版本在計算機使用、瀏覽器使用和手機使用等基準測試中均表現(xiàn)非常出色。在計算機使用方面,OSworld測試得分為42.5,高于OpenAI CUA的36.4、Claude 3.7的28以及之前的最高水平38.1(200步);Windows Agent Arena(50步)得分為42.1,遠超之前的29.8。瀏覽器使用方面,WebVoyager得分為84.8,接近OpenAI CUA和之前最高水平的87,Online-Mind2web得75.8,優(yōu)于OpenAI CUA的71、Claude 3.7的62.9和之前的71。手機使用方面,Android World得64.2,高于之前的59.5。
Google最近發(fā)布了一個Geospatial Reasoning的代理大模型,根據(jù)介紹Geospatial Reasoning大模型想著重解決的問題:1、地理空間應用過程中需要花費大量的成本進行數(shù)據(jù)以及模型的整合,同時還需要多領域的專業(yè)知識;2、如何能夠將用戶的數(shù)據(jù)和Google的數(shù)據(jù)和模型進行低成本的整合應用;3、Gemini表現(xiàn)出了強大的推理能力,這個能力有助于解決如上這些問題。
4月8日,火山引擎宣布推出一款名為Data Agent的企業(yè)數(shù)據(jù)智能體?;诖竽P偷耐评?、分析和調用工具等能力,Data Agent能夠深度理解業(yè)務需求,自動化完成撰寫深度研究報告、營銷活動設計等任務。
近日,易智瑞GeoScene 5.1正式發(fā)布。GeoScene 5.1一核六翼產品技術體系中,核心產品和六大技術能力都融合了大量智能化功能:一方面針對時空數(shù)據(jù)生產、數(shù)據(jù)治理等勞動密集型工作,提供自動化工具和技術流程;另一方面提供更豐富的智能化算法,實現(xiàn)時空大數(shù)據(jù)的高效精準分析挖掘;再者隨著生成式AI技術日新月異的發(fā)展,GeoScene也探索結合語言、視覺以及多模態(tài)大模型,助力用戶智能化升級邁向最前沿。
3月25日,第四范式推出大模型推理一體機解決方案SageOne Lite,8.8萬元可運行滿血版DeepSeek,以極致性價比幫助企業(yè)乃至個人實現(xiàn)本地使用DeepSeek。該方案基于KTransformers,支持單機運行滿血模型服務。此外,一體機解決方案還集成了ModelHub平臺實現(xiàn)模型管理及不同模型服務的靈活切換,內置智能算力池化管理平臺提升GPU資源使用效率,并搭載了大模型開發(fā)平臺及開箱即用AI應用套件,幫助企業(yè)及開發(fā)者體驗滿血強大智能同時,快速創(chuàng)建生成式AI應用。
全球化客戶服務AI Agent企業(yè)Shulex近日完成新一輪億元級融資,由盛大資本領投,北極光創(chuàng)投、Starting Gate Fund跟投,非凡資本擔任獨家財務顧問。新的融資將用于加速大模型驅動的AI數(shù)字員工開發(fā),擴大全球業(yè)務版圖,并加快實現(xiàn)AI Agent大規(guī)模釋放人類生產力的使命。