5月28日消息,浪潮信息發(fā)布了“源2.0-M32” 開(kāi)源大模型。該模型在源2.0系列大模型基礎(chǔ)上,采用了“基于注意力機(jī)制的門控網(wǎng)絡(luò)”技術(shù),構(gòu)建包含32個(gè)專家的混合專家模型(MoE),并大幅提升模型算力效率。M32憑借特別優(yōu)化設(shè)計(jì)的模型架構(gòu),在僅激活37億參數(shù)的情況下,取得了和700億參數(shù)LLaMA3相當(dāng)?shù)男阅芩剑乃懔H為L(zhǎng)LaMA3的1/19。(鈦媒體App)