8月4日,小米發(fā)布和全量開源了MiDashengLM-7B模型。MiDashengLM-7B聲音理解性能在22個公開評測集上刷新多模態(tài)大模型最好成績(SOTA),單樣本推理的首Token延遲(TTFT)僅為業(yè)界先進模型的1/4,同等顯存下的數(shù)據(jù)吞吐效率是業(yè)界先進模型的20倍以上。在當前版本的基礎上,小米已著手對該模型做計算效率的進一步升級,尋求終端設備上可離線部署,并完善基于用戶自然語言提示的聲音編輯等更全面的功能。(36氪)
8月4日,小米發(fā)布和全量開源了MiDashengLM-7B模型。MiDashengLM-7B聲音理解性能在22個公開評測集上刷新多模態(tài)大模型最好成績(SOTA),單樣本推理的首Token延遲(TTFT)僅為業(yè)界先進模型的1/4,同等顯存下的數(shù)據(jù)吞吐效率是業(yè)界先進模型的20倍以上。在當前版本的基礎上,小米已著手對該模型做計算效率的進一步升級,尋求終端設備上可離線部署,并完善基于用戶自然語言提示的聲音編輯等更全面的功能。(36氪)