3月4日,大模型獨(dú)角獸智譜發(fā)布2025開源年的第一個(gè)模型:首個(gè)支持生成漢字的開源文生圖模型——CogView4。據(jù)悉,該模型在DPG-Bench基準(zhǔn)測(cè)試中的綜合評(píng)分排名第一,在開源文生圖模型中達(dá)到SOTA(最先進(jìn)的)。該模型也是首個(gè)遵循Apache2.0協(xié)議的圖像生成模型。
1月25日,中國(guó)電信人工智能研究院(TeleAI)“復(fù)雜推理大模型”TeleAI-t1-preview正式發(fā)布。TeleAI-t1-preview使用了強(qiáng)化學(xué)習(xí)訓(xùn)練方法,通過(guò)引入探索、反思等思考范式,提升模型在數(shù)學(xué)推導(dǎo)、邏輯推理等復(fù)雜問(wèn)題的準(zhǔn)確性。在美國(guó)數(shù)學(xué)競(jìng)賽AIME 2024、MATH500兩項(xiàng)數(shù)學(xué)基準(zhǔn)評(píng)測(cè)中,TeleAI-t1-preview分別以60和93.8分的成績(jī),超過(guò)OpenAI o1-preview、GPT-4o等標(biāo)桿模型。在研究生級(jí)別問(wèn)答測(cè)試GPQA Diamond中,TeleAI-t1-preview得分超過(guò) GPT-4o。
1月24日,百川智能發(fā)布了國(guó)內(nèi)首個(gè)全場(chǎng)景深度思考模型Baichuan-M1-preview。該模型是國(guó)內(nèi)目前唯一同時(shí)具備語(yǔ)言、視覺(jué)和搜索三大領(lǐng)域推理能力的模型。在數(shù)學(xué)、代碼等多個(gè)權(quán)威評(píng)測(cè)中,Baichuan-M1-preview的表現(xiàn)均超越了o1-preview。此外,它還解鎖了醫(yī)療循證模式,實(shí)現(xiàn)了從醫(yī)療證據(jù)檢索到深度推理的完整端到端服務(wù),能夠回答醫(yī)療臨床、科研問(wèn)題。