777精品久无码人妻蜜桃,国产日本精品视频在线观看 ,国产亚洲99久久精品熟女av,brazzersvideosex欧美最新版,人人爽人人人爽人人爽

分享
Scan me 分享到微信

華為將發(fā)布AI推理領(lǐng)域突破性成果:或能降低對(duì)HBM依賴,提升國(guó)內(nèi)大模型性能

完善中國(guó)AI推理生態(tài)的關(guān)鍵部分。

8月10日消息,據(jù)報(bào)道,華為將于8月12日在2025金融AI推理應(yīng)用落地與發(fā)展論壇上,發(fā)布AI推理領(lǐng)域的突破性技術(shù)成果。據(jù)悉,這項(xiàng)成果或能降低中國(guó)AI推理對(duì)HBM(高帶寬內(nèi)存)技術(shù)的依賴,提升國(guó)內(nèi)AI大模型推理性能,完善中國(guó)AI推理生態(tài)的關(guān)鍵部分。

據(jù)了解,華為在AI推理領(lǐng)域的技術(shù)突破已有先例。2025年3月,北京大學(xué)聯(lián)合華為發(fā)布了DeepSeek全棧開(kāi)源推理方案,該方案基于北大自研SCOW算力平臺(tái)系統(tǒng)和鶴思調(diào)度系統(tǒng),整合了DeepSeek、openEuler、MindSpore與vLLM/RAY等社區(qū)開(kāi)源組件,實(shí)現(xiàn)了華為昇騰上的DeepSeek高效推理。

在性能方面,華為昇騰已實(shí)現(xiàn)多項(xiàng)突破。例如CloudMatrix 384超節(jié)點(diǎn)部署DeepSeek V3/R1時(shí),在50ms時(shí)延約束下單卡Decode吞吐突破1920Tokens/s;Atlas 800I A2推理服務(wù)器在100ms時(shí)延約束下單卡吞吐達(dá)到808 Tokens/s。科大訊飛與華為的合作也取得了顯著成果,雙方率先實(shí)現(xiàn)了國(guó)產(chǎn)算力上MoE模型的大規(guī)??绻?jié)點(diǎn)專家并行集群推理,使推理吞吐提升3.2倍,端到端時(shí)延降低50%。

喜歡您正在閱讀的內(nèi)容嗎?歡迎免費(fèi)訂閱泰伯每周精選電郵。 立即訂閱

參與評(píng)論

【登錄后才能評(píng)論哦!點(diǎn)擊

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回復(fù){{item.replynum}}
    {{child.username}} 回復(fù) {{child.to_username}}:{{child.content}}

更多精選文章推薦