在當(dāng)?shù)貢r(shí)間周一揭幕的行業(yè)頂級(jí)會(huì)議SIGGRAPH(國(guó)際計(jì)算機(jī)協(xié)會(huì)計(jì)算機(jī)圖形學(xué)和交互技術(shù)特別興趣小組年度會(huì)議)上,“全球股王”英偉達(dá)推出一系列面向機(jī)器人開發(fā)者的世界模型、應(yīng)用庫(kù)和基礎(chǔ)設(shè)施。其中,最引人關(guān)注的是參數(shù)量只有70億的開源物理AI應(yīng)用和機(jī)器人視覺推理模型Cosmos Reason。憑借記憶和理解能力,Cosmos Reason能夠使機(jī)器人和AI具身代理“像人類一樣推理”,并在真實(shí)世界中采取行動(dòng)。
8月7日消息,消息稱,百度最快將在8月底推出文心大模型最新版推理模型,目前該模型正在全力測(cè)試中。據(jù)悉,文心新版推理模型將在邏輯推理、復(fù)雜計(jì)算等能力上超越OpenAI o3滿血版。百度還計(jì)劃未來(lái)數(shù)月內(nèi)發(fā)布文心基座大模型最新版,有內(nèi)部人士指出,新模型在百度世界大會(huì)上發(fā)布的概率極大。
6月27日,騰訊混元宣布開源首個(gè)混合推理MoE模型 Hunyuan-A13B,總參數(shù)80B,激活參數(shù)僅13B。即日起,模型已經(jīng)在Github和Huggingface等開源社區(qū)上線,同時(shí)模型API也在騰訊云官網(wǎng)正式上線,支持快速接入部署。這是業(yè)界首個(gè)13B級(jí)別的MoE開源混合推理模型,在Agent工具調(diào)用和長(zhǎng)文能力上有突出表現(xiàn)。
3月31日,智譜將于4月14日開源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414,并于近期陸續(xù)上線bigmodel.cn。上述模型是智譜新推出的AI Agent“沉思”背后的模型。
去年12月,阿里通義千問推出了QVQ-72B-Preview, 作為一個(gè)探索模型,它存在一些不足之處。今天,我們正式推出 QVQ-Max 視覺推理模型的第一版。這一新版本的模型具備強(qiáng)大的多模態(tài)處理能力,它不僅能夠“看懂”圖片和視頻里的內(nèi)容,還能結(jié)合這些信息進(jìn)行分析、推理,甚至給出解決方案。從數(shù)學(xué)題到生活小問題,從編程代碼到藝術(shù)創(chuàng)作,QVQ-Max 都表現(xiàn)出了不俗的能力。
3月18日,昆侖萬(wàn)維正式開源首款工業(yè)界多模態(tài)思維鏈推理模型Skywork R1V,即日起開源模型權(quán)重和技術(shù)報(bào)告。
3月6日,阿里巴巴發(fā)布并開源全新的推理模型通義千問QwQ-32B,阿里巴巴稱,這是一款擁有320億參數(shù)的模型,其性能可與具備6710億參數(shù)(其中370億被激活)的DeepSeek-R1媲美。
2月20日消息,阿里巴巴集團(tuán)CEO吳泳銘在財(cái)報(bào)會(huì)上表示,阿里將于近期發(fā)布基于千問Qwen2.5-MAX的深度推理模型。1月底,阿里發(fā)布了AI基礎(chǔ)大模型千問旗艦版Qwen2.5-MAX,在多項(xiàng)權(quán)威基準(zhǔn)評(píng)測(cè)中,其處于業(yè)界領(lǐng)先水平。目前,Qwen的全球衍生模型已突破9萬(wàn)個(gè),全球排名第一。
據(jù)科大訊飛官方微博,1月15日,訊飛星火大模型升級(jí)發(fā)布,正式發(fā)布星火深度推理模型X1,訊飛星火4.0 Turbo底座能力迎來(lái)全新升級(jí),同時(shí)首發(fā)星火語(yǔ)音同傳大模型。
科大訊飛在1月7日的辦公智能體產(chǎn)品升級(jí)發(fā)布會(huì)上宣布,將于1月15日對(duì)外發(fā)布“訊飛星火深度推理模型X1”,該模型將為訊飛智能體產(chǎn)品注入更強(qiáng)大的AI能力,進(jìn)一步拓展智慧辦公的應(yīng)用邊界。 ?
2024年12月31日,智譜宣布深度推理模型 GLM-Zero 的初代版本 GLM-Zero-Preview 上線。據(jù)官方介紹,這是智譜首個(gè)基于擴(kuò)展強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練的推理模型。其專注于增強(qiáng) AI 推理能力的模型,擅長(zhǎng)處理數(shù)理邏輯、代碼和需要深度推理的復(fù)雜問題。在同基座模型相比,GLM-Zero-Preview 在不顯著降低通用任務(wù)能力的情況下,在專家任務(wù)能力方面的表現(xiàn)大幅提升,其在 AIME 2024、MATH500 和 LiveCodeBench 評(píng)測(cè)中,效果與 OpenAI o1-preview 相當(dāng)。官方也表示,目前的 GLM-Zero-Preview 與 OpenAI 的 o3 模型仍有不少的差距,在未來(lái)智譜也持續(xù)優(yōu)化迭代。
12月25日,阿里云通義千問發(fā)布業(yè)界首個(gè)開源多模態(tài)推理模型QVQ-72B-Preview。QVQ展現(xiàn)出超預(yù)期的視覺理解和推理能力,在解決數(shù)學(xué)、物理、科學(xué)等領(lǐng)域的復(fù)雜推理問題上表現(xiàn)尤為突出。多項(xiàng)評(píng)測(cè)數(shù)據(jù)顯示,QVQ超越了此前的視覺理解模型「開源王者」Qwen2-VL,整體表現(xiàn)與「滿血版」OpenAI o1、Claude3.5 Sonnet等推理模型相當(dāng)。目前,開發(fā)者可在魔搭社區(qū)和HuggingFace平臺(tái)上直接體驗(yàn)。
OpenAI當(dāng)?shù)貢r(shí)間12月5日宣布推出“滿血版”推理模型o1和ChatGPT Pro(每月訂閱費(fèi)200美元)。OpenAI o1現(xiàn)已全面推出給ChatGPT Plus、Team和Pro用戶。ChatGPT Pro能夠提供最好的模型和工具,包括無(wú)限制地訪問OpenAI o1和o1的Pro-only版本,可以思考更長(zhǎng)的時(shí)間以獲得更可靠的響應(yīng)。
11月16日消息,月之暗面旗下Kimi發(fā)布新一代數(shù)學(xué)推理模型k0-math?;鶞?zhǔn)測(cè)試顯示,Kimi k0-math數(shù)學(xué)能力可對(duì)標(biāo)OpenAI o1系列可公開使用的兩個(gè)模型:o1-mini和o1-preview。月之暗面創(chuàng)始人楊植麟認(rèn)為,最適合讓AI去鍛煉思考能力的場(chǎng)景就是數(shù)學(xué)場(chǎng)景。