2024年12月31日,智譜宣布深度推理模型 GLM-Zero 的初代版本 GLM-Zero-Preview 上線。據(jù)官方介紹,這是智譜首個基于擴展強化學(xué)習(xí)技術(shù)訓(xùn)練的推理模型。其專注于增強 AI 推理能力的模型,擅長處理數(shù)理邏輯、代碼和需要深度推理的復(fù)雜問題。在同基座模型相比,GLM-Zero-Preview 在不顯著降低通用任務(wù)能力的情況下,在專家任務(wù)能力方面的表現(xiàn)大幅提升,其在 AIME 2024、MATH500 和 LiveCodeBench 評測中,效果與 OpenAI o1-preview 相當(dāng)。官方也表示,目前的 GLM-Zero-Preview 與 OpenAI 的 o3 模型仍有不少的差距,在未來智譜也持續(xù)優(yōu)化迭代。(36氪)