777精品久无码人妻蜜桃,国产日本精品视频在线观看 ,国产亚洲99久久精品熟女av,brazzersvideosex欧美最新版,人人爽人人人爽人人爽

華為將發(fā)布AI推理領(lǐng)域突破性成果：或能降低對(duì)HBM依賴，提升國(guó)內(nèi)大模型性能

IT之家 2025-08-11 10:20

完善中國(guó)AI推理生態(tài)的關(guān)鍵部分。

8月10日消息，據(jù)報(bào)道，華為將于8月12日在2025金融AI推理應(yīng)用落地與發(fā)展論壇上，發(fā)布AI推理領(lǐng)域的突破性技術(shù)成果。據(jù)悉，這項(xiàng)成果或能降低中國(guó)AI推理對(duì)HBM（高帶寬內(nèi)存）技術(shù)的依賴，提升國(guó)內(nèi)AI大模型推理性能，完善中國(guó)AI推理生態(tài)的關(guān)鍵部分。

據(jù)了解，華為在AI推理領(lǐng)域的技術(shù)突破已有先例。2025年3月，北京大學(xué)聯(lián)合華為發(fā)布了DeepSeek全棧開(kāi)源推理方案，該方案基于北大自研SCOW算力平臺(tái)系統(tǒng)和鶴思調(diào)度系統(tǒng)，整合了DeepSeek、openEuler、MindSpore與vLLM/RAY等社區(qū)開(kāi)源組件，實(shí)現(xiàn)了華為昇騰上的DeepSeek高效推理。

在性能方面，華為昇騰已實(shí)現(xiàn)多項(xiàng)突破。例如CloudMatrix 384超節(jié)點(diǎn)部署DeepSeek V3/R1時(shí)，在50ms時(shí)延約束下單卡Decode吞吐突破1920Tokens/s；Atlas 800I A2推理服務(wù)器在100ms時(shí)延約束下單卡吞吐達(dá)到808 Tokens/s。科大訊飛與華為的合作也取得了顯著成果，雙方率先實(shí)現(xiàn)了國(guó)產(chǎn)算力上MoE模型的大規(guī)?？绻?jié)點(diǎn)專家并行集群推理，使推理吞吐提升3.2倍，端到端時(shí)延降低50%。

喜歡您正在閱讀的內(nèi)容嗎？歡迎免費(fèi)訂閱泰伯每周精選電郵。立即訂閱

打開(kāi)APP，查看更多內(nèi)容

聲明：泰伯網(wǎng)登載此文出于傳遞更多信息之目的，并不意味著贊同其觀點(diǎn)或證實(shí)其描述，文章內(nèi)容僅供參考。

參與評(píng)論

{{item.username}}

{{item.content}}

{{item.created_at}}

{{item.support}}

回復(fù){{item.replynum}}

{{child.username}} 回復(fù) {{child.to_username}}：{{child.content}}