通義千問(wèn)3月27日宣布發(fā)布Qwen2.5-Omni,Qwen模型家族中新一代端到端多模態(tài)旗艦?zāi)P?。該模型專為全方位多模態(tài)感知設(shè)計(jì),能夠無(wú)縫處理文本、圖像、音頻和視頻等多種輸入形式,并通過(guò)實(shí)時(shí)流式響應(yīng)同時(shí)生成文本與自然語(yǔ)音合成輸出。該模型現(xiàn)已在Hugging Face、ModelScope、DashScope和GitHub上開(kāi)源開(kāi)放。(界面)