8月21日消息,智元機(jī)器人今天在首屆合作伙伴大會(huì)上發(fā)布新品靈犀X2-W,一款基于X2平臺(tái)衍生,專為“作業(yè)智能”打造的輪式雙臂機(jī)器人原型。此外,智元還啟動(dòng)了首個(gè)專注具身智能產(chǎn)業(yè)鏈的創(chuàng)業(yè)加速計(jì)劃——“智元A計(jì)劃”。該計(jì)劃旨在孵化50 + 高潛力早期項(xiàng)目,在三年內(nèi)打造千億級(jí)產(chǎn)業(yè)生態(tài)。
8月19日,通義千問(wèn)宣布,推出Qwen-Image-Edit,Qwen-Image的圖像編輯版本。Qwen-Image-Edit基于20B的Qwen-Image模型進(jìn)?步訓(xùn)練,將Qwen-Image的文本渲染能力延展至圖像編輯領(lǐng)域,實(shí)現(xiàn)了對(duì)圖片中文字的精準(zhǔn)編輯。
前Waymo CEO John Krafcik評(píng)價(jià)特斯拉的Robotaxi:“特斯拉推出自動(dòng)駕駛出租車的時(shí)候請(qǐng)告訴我——我還在等。如果車?yán)镉袉T工,那很明顯不是自動(dòng)駕駛出租車。”一位博主發(fā)文轉(zhuǎn)載了有關(guān)報(bào)道。另一位汽車博主轉(zhuǎn)發(fā)貼文并表示,“好的我們會(huì)讓你知道的。你告訴我什么時(shí)候能買Waymo。我好奇這兩件事哪個(gè)先發(fā)生?!碧厮估瑿EO馬斯克回復(fù)道:“他們會(huì)從聲稱特斯拉的自動(dòng)駕駛是假的,轉(zhuǎn)變?yōu)檎f(shuō)特斯拉的自動(dòng)駕駛不好?!?
8月7日,阿里通義千問(wèn)發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。據(jù)通義千問(wèn)介紹,在非推理領(lǐng)域,Qwen3-4B-Instruct-2507全面超越了閉源的GPT4.1-Nano;在推理領(lǐng)域,Qwen3-4B-Thinking-2507甚至可以媲美中等規(guī)模的Qwen3-30B-A3B(thinking)。目前新模型已在魔搭社區(qū)、HuggingFace正式開(kāi)源。
當(dāng)?shù)貢r(shí)間周二(8月5日),亞馬遜在官網(wǎng)發(fā)布新聞稿稱,公司云計(jì)算部門AWS將在Bedrock和SageMaker平臺(tái)上提供OpenAI的開(kāi)放權(quán)重模型gpt-oss-120b和gpt-oss-20b。日內(nèi)早些時(shí)候,OpenAI發(fā)布了這兩款A(yù)I推理模型。亞馬遜表示,通過(guò)向AWS上的數(shù)百萬(wàn)客戶提供該技術(shù),可以擴(kuò)大OpenAI領(lǐng)先技術(shù)的影響力。在此之前,微軟是唯一一家可以轉(zhuǎn)售OpenAI軟件的云服務(wù)商,這一優(yōu)勢(shì)幫助其云計(jì)算部門Azure的增速超過(guò)了同行AWS。
7月30日,昆侖萬(wàn)維正式推出并開(kāi)源采用自回歸路線的“多模態(tài)統(tǒng)一預(yù)訓(xùn)練模型Skywork UniPic”,在單一模型中深度融合圖像理解、文本到圖像生成、圖像編輯三大核心能力。該模型基于大規(guī)模高質(zhì)量數(shù)據(jù)進(jìn)行端到端預(yù)訓(xùn)練,具備良好的通用性與可遷移性。
7月30日,阿里通義千問(wèn)宣布Qwen3-30B-A3B模型推出新版本:Qwen3-30B-A3B-Instruct-2507。據(jù)介紹,這是一個(gè)非思考模式(non-thinking mode)的新模型,長(zhǎng)文本理解能力提升至256K,僅激活3B參數(shù),就能取得可媲美Gemini 2.5-Flash(non-thinking)、GPT-4o等閉源模型的性能。
谷歌旗下自動(dòng)駕駛公司W(wǎng)aymo周一表示,將于2026年在達(dá)拉斯推出自動(dòng)駕駛叫車服務(wù)。在特斯拉努力發(fā)展其最近推出的自動(dòng)駕駛出租車業(yè)務(wù)之際,Waymo加速了其在美國(guó)的擴(kuò)張。經(jīng)過(guò)多年的謹(jǐn)慎增長(zhǎng),Waymo最近加快了步伐,通過(guò)與叫車平臺(tái)和車隊(duì)運(yùn)營(yíng)商合作,在新城市推出了其服務(wù)。
7月27日,2025世界人工智能大會(huì)騰訊論壇上,騰訊正式發(fā)布混元3D世界模型1.0,并宣布全面開(kāi)源。這是業(yè)界首個(gè)開(kāi)源可沉浸漫游、可交互、可仿真的世界生成模型,為游戲開(kāi)發(fā)、VR、數(shù)字內(nèi)容創(chuàng)作等領(lǐng)域帶來(lái)了全新的可能性。除3D模型外,騰訊混元還披露了包括端側(cè)混合推理語(yǔ)言模型、多模態(tài)理解模型、游戲視覺(jué)模型等在內(nèi)的一系列開(kāi)源計(jì)劃。目前,混元3D世界模型1.0已全面開(kāi)源。從秒級(jí)生成單個(gè)3D資產(chǎn),到一鍵打造可漫游的3D世界,騰訊混元正逐步構(gòu)建完善的3D內(nèi)容生成生態(tài)。
7月28日消息,商湯絕影攜全新升級(jí)的“絕影開(kāi)悟”世界模型亮相WAIC 2025,并發(fā)布業(yè)內(nèi)最大規(guī)模的生成式駕駛數(shù)據(jù)集“WorldSim-Drive”。目前,商湯絕影正在與上汽集團(tuán)旗下的智己汽車進(jìn)行深度合作,已順利打通Cut-in、碰撞等場(chǎng)景的數(shù)據(jù)生成鏈路。未來(lái),絕影將攜手上汽智己等各方伙伴共同打造數(shù)據(jù)工廠。
Alphabet旗下無(wú)人駕駛技術(shù)公司W(wǎng)aymo當(dāng)?shù)貢r(shí)間7月17日宣布,當(dāng)日起,其無(wú)人駕駛服務(wù)在美國(guó)得州奧斯汀覆蓋更多地區(qū)。
近日,總部位于班加羅爾的深度科技初創(chuàng)公司QWR (Question What's Real) 推出了Humbl,并聲稱這是印度首款人工智能智能眼鏡。這款無(wú)屏眼鏡采用語(yǔ)音控制,可通過(guò)“Hey Humbl”激活,并配備情境攝像頭、開(kāi)放式耳機(jī)、手勢(shì)支持和內(nèi)置人工智能助手,這些功能的實(shí)現(xiàn)基于其搭載的Qualcomm AR1芯片。QWR計(jì)劃于今年7月下旬正式發(fā)布,但預(yù)計(jì)在2025年第四季度開(kāi)始發(fā)貨。在此之前,其社交媒體渠道上只提供預(yù)告視頻, NewsBytes網(wǎng)站上沒(méi)有產(chǎn)品詳情。據(jù)了解,QWR由Suraj Aiar于2017年創(chuàng)立,擁有強(qiáng)大的XR傳統(tǒng),致力于生產(chǎn)純音頻智能眼鏡 (Aurl) 和VR頭顯。
7月9日,昆侖萬(wàn)維發(fā)布并開(kāi)源Skywork-R1V 3.0版本。據(jù)昆侖萬(wàn)維介紹,在權(quán)威的綜合性多模態(tài)評(píng)測(cè)MMMU中,Skywork-R1V 3.0取得了76.0的開(kāi)源模型最高成績(jī),,超越了Claude-3.7-Sonnet(75.0)和GPT-4.5(74.4)等閉源模型,逼近人類初級(jí)專家水平(76.2)。
7月7日,人工智能云服務(wù)商CoreWeave表示,將收購(gòu)數(shù)據(jù)中心基礎(chǔ)設(shè)施提供商Core Scientific,這項(xiàng)全股票交易價(jià)值約90億美元。
谷歌旗下自動(dòng)駕駛公司W(wǎng)aymo周一表示,將在費(fèi)城開(kāi)始測(cè)試,車隊(duì)數(shù)量有限,并配備人類安全駕駛員。Waymo在X上寫道:“我們的公路之旅接下來(lái)將繼續(xù)前往費(fèi)城?!痹摴咀C實(shí),將從今年秋天開(kāi)始在這座賓夕法尼亞州最大的城市進(jìn)行測(cè)試,并補(bǔ)充說(shuō),首批無(wú)人駕駛汽車將在費(fèi)城較為復(fù)雜的地區(qū)進(jìn)行人工駕駛,包括市中心和高速公路。
7月7日,阿里通義開(kāi)源了網(wǎng)絡(luò)智能體WebSailor。據(jù)介紹,該智能體具備強(qiáng)大的推理和檢索能力,在高難度智能體評(píng)測(cè)集BrowseComp上,WebSailor的成績(jī)超越了DeepSeek R1、Grok-3等模型和智能體,一舉登頂開(kāi)源網(wǎng)絡(luò)智能體榜單。目前WebSailor的構(gòu)建方案及部分?jǐn)?shù)據(jù)集已在Github開(kāi)源。
7月4日,昆侖萬(wàn)維宣布開(kāi)源第二代獎(jiǎng)勵(lì)模型(Reward Model)Skywork-Reward-V2系列,共包含8個(gè)基于不同基座模型和不同大小的獎(jiǎng)勵(lì)模型,參數(shù)規(guī)模從6億到80億不等。
6月28日消息,在本周舉行的阿斯彭思想節(jié)(Aspen Ideas Festival)上,福特CEO吉姆?法利( Jim Farley)表達(dá)了對(duì)特斯拉自動(dòng)駕駛方案的疑慮。法利在與作家沃爾特?艾薩克森的交談中談到了對(duì)特斯拉和Waymo自動(dòng)駕駛的看法。艾薩克森問(wèn)法利更傾向于哪種模式,他表示W(wǎng)aymo基于激光雷達(dá)(LiDAR)的方案“更合理”,然后他列舉了安全、消費(fèi)者信任以及基于攝像頭模型的局限性等因素來(lái)進(jìn)行說(shuō)明。但他也指出,特斯拉和Waymo都在自動(dòng)駕駛方面“取得了很大進(jìn)展”。法利還確認(rèn),他已就此事與馬斯克進(jìn)行過(guò)交談。盡管如此他仍然認(rèn)為L(zhǎng)iDAR是自動(dòng)駕駛的關(guān)鍵。
6月28日,阿里推出多模態(tài)統(tǒng)一理解與生成模型Qwen VLo,用戶可通過(guò)Qwen Chat訪問(wèn)該模型(預(yù)覽版)。Qwen VLo具有三大亮點(diǎn):理解和生成更準(zhǔn)確,支持開(kāi)放指令編輯修改圖片,以及多語(yǔ)言指令支持。用戶可發(fā)送如“生成一張可愛(ài)貓咪的圖片”或“給貓咪頭上加頂帽子”等指令來(lái)生成或修改圖像。該模型還支持包括中文、英文在內(nèi)的多種語(yǔ)言指令,為全球用戶提供了便捷的交互體驗(yàn)。
6月26日,比利時(shí)全息技術(shù)公司Swave Photonics宣布獲得了600萬(wàn)歐元(約合701萬(wàn)美元)的融資,這筆資金作為A輪補(bǔ)充融資的一部分,由IAG Capital Partners 領(lǐng)投,三星風(fēng)投參投,這600萬(wàn)歐元將幫助Swave Photonics加速公司新型全息擴(kuò)展現(xiàn)實(shí)技術(shù)的商業(yè)化和應(yīng)用。對(duì)于獲得融資,Swave Photonics首席執(zhí)行官M(fèi)ike Noonen表示:“這筆補(bǔ)充融資表明,人們對(duì)新興的空間+人工智能計(jì)算時(shí)代感到非常興奮,而顯示技術(shù)將有助于開(kāi)啟下一個(gè)時(shí)代?!?