8月22日,記者獲悉,阿里通義發(fā)布新一代端到端的語音識別大模型Fun-ASR,該模型增強(qiáng)了上下文感知和高精度語音轉(zhuǎn)寫能力,在家裝、保險等多個行業(yè)場景的語音識別準(zhǔn)確率均提升了15%以上。目前,F(xiàn)un-ASR已應(yīng)用于會議字幕與同傳、智能紀(jì)要、語音助手等場景,未來該模型將進(jìn)一步在阿里云百煉上線。
8月19日,通義千問宣布,推出Qwen-Image-Edit,Qwen-Image的圖像編輯版本。Qwen-Image-Edit基于20B的Qwen-Image模型進(jìn)?步訓(xùn)練,將Qwen-Image的文本渲染能力延展至圖像編輯領(lǐng)域,實(shí)現(xiàn)了對圖片中文字的精準(zhǔn)編輯。
8月7日,阿里通義千問發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。據(jù)通義千問介紹,在非推理領(lǐng)域,Qwen3-4B-Instruct-2507全面超越了閉源的GPT4.1-Nano;在推理領(lǐng)域,Qwen3-4B-Thinking-2507甚至可以媲美中等規(guī)模的Qwen3-30B-A3B(thinking)。目前新模型已在魔搭社區(qū)、HuggingFace正式開源。
7月30日,阿里通義千問宣布Qwen3-30B-A3B模型推出新版本:Qwen3-30B-A3B-Instruct-2507。據(jù)介紹,這是一個非思考模式(non-thinking mode)的新模型,長文本理解能力提升至256K,僅激活3B參數(shù),就能取得可媲美Gemini 2.5-Flash(non-thinking)、GPT-4o等閉源模型的性能。
7月27日消息,原通義實(shí)驗(yàn)室應(yīng)用視覺團(tuán)隊(duì)負(fù)責(zé)人薄列峰已加入騰訊混元大模型團(tuán)隊(duì),直接向騰訊副總裁兼混元項(xiàng)目負(fù)責(zé)人蔣杰匯報(bào)。據(jù)悉,薄列峰在今年4月30日從阿里離任,彼時曾有傳聞稱他已加盟某大型互聯(lián)網(wǎng)企業(yè),在美國任職,并負(fù)責(zé)多模態(tài)模型方向的全面工作,直接向公司高管匯報(bào)。薄列峰于2022年加入阿里,起初接棒譚平領(lǐng)導(dǎo)達(dá)摩院XR實(shí)驗(yàn)室,后調(diào)至通義實(shí)驗(yàn)室主導(dǎo)應(yīng)用視覺方向,成為推動阿里圖像與視頻AIGC技術(shù)的重要人物。
6月9日,阿里云宣布比亞迪接入通義大模型。未來,比亞迪智能座艙將通過語音指令實(shí)現(xiàn)買票、點(diǎn)單等在線服務(wù)。Mobile-Agent采用全視覺解決方案,結(jié)合Qwen-VL的視覺識別和推理能力,可智能感知座艙屏幕、規(guī)劃復(fù)雜任務(wù)并操作應(yīng)用UI。比亞迪與阿里云在智能座艙、心理伴聊、營銷服務(wù)等領(lǐng)域已展開深度合作,包括上線「AI壁紙」和「心理伴聊」功能。
6月6日消息,亞馬遜公司正在加速布局人形機(jī)器人,并采用DeepSeek、阿里通義千問等開源的大語言模型進(jìn)行機(jī)器人的操控。公開信息顯示,亞馬遜已在其硬件研發(fā)部門Lab126內(nèi)組建了一支新的 Agentic AI(代理式人工智能)團(tuán)隊(duì),著重推進(jìn)“物理AI ”的研發(fā)工作,希望創(chuàng)造能夠根據(jù)自然語言指令執(zhí)行任務(wù)的機(jī)器人。
北京時間5月29日,英偉達(dá)CEO黃仁勛在財(cái)報(bào)電話會上說,來自中國的DeepSeek和Qwen(阿里通義千問)是開源AI模型之中最好的。免費(fèi)發(fā)布后,它們在美國、歐洲及其他地區(qū)獲得了巨大關(guān)注。最終,贏得AI開發(fā)者的平臺將贏得AI。出口限制應(yīng)該加強(qiáng)美國平臺,而不是將世界上一半的AI人才推向競爭對手。
近期,日本經(jīng)濟(jì)新聞(NIKKEI)提到阿里通義千問大模型已成日本AI開發(fā)基礎(chǔ)。在日經(jīng)新聞評測的AI模型綜合排名中,通義千問Qwen2.5-Max排名第六,超越了DeepSeek-V3和OpenAI o3-mini等大模型。據(jù)了解,日本大量新興企業(yè)正在基于千問開發(fā)企業(yè)大模型。
英偉達(dá)近日開源其代碼推理模型(Open Code Reasoning model),包括32B、14B和7B三個參數(shù)。該模型以阿里通義千問Qwen2.5-32B、Qwen2.5-14B、Qwen2.5-7B為底座模型。
“互聯(lián)網(wǎng)八卦小喇叭”等多個微信公眾號爆料,阿里巴巴通義實(shí)驗(yàn)室應(yīng)用視覺團(tuán)隊(duì)負(fù)責(zé)人薄列峰(職級P10),已于4月30日低調(diào)離職。他曾帶領(lǐng)團(tuán)隊(duì)做出通義App上全民舞王「兵馬俑跳科目三」等爆款功能。知情人士透露,他已經(jīng)加入某互聯(lián)網(wǎng)大廠,base美國,擔(dān)任多模態(tài)模型部副總經(jīng)理,負(fù)責(zé)部門整體工作,直接向公司副總裁匯報(bào)。消息稱,該大廠剛剛進(jìn)行了架構(gòu)調(diào)整。據(jù)了解,薄列峰2022年加入阿里,此前擔(dān)任京東數(shù)字科技集團(tuán)AI實(shí)驗(yàn)室首席科學(xué)家一職。
去年12月,阿里通義千問推出了QVQ-72B-Preview, 作為一個探索模型,它存在一些不足之處。今天,我們正式推出 QVQ-Max 視覺推理模型的第一版。這一新版本的模型具備強(qiáng)大的多模態(tài)處理能力,它不僅能夠“看懂”圖片和視頻里的內(nèi)容,還能結(jié)合這些信息進(jìn)行分析、推理,甚至給出解決方案。從數(shù)學(xué)題到生活小問題,從編程代碼到藝術(shù)創(chuàng)作,QVQ-Max 都表現(xiàn)出了不俗的能力。
3月14日消息,阿里通義實(shí)驗(yàn)室語音團(tuán)隊(duì)負(fù)責(zé)人鄢志杰已于近期離職,離職時間為2月15日,按照以前的P序列比照,其職級為P10。鄢志杰2003年大學(xué)本科畢業(yè),升入中科大語音實(shí)驗(yàn)室攻讀博士學(xué)位;2008年獲得博士學(xué)位后,鄢志杰在微軟亞洲研究院語音組擔(dān)任主管研究員。2015年加入阿里巴巴,曾擔(dān)任阿里IDST智能語音交互團(tuán)隊(duì)總監(jiān)。
3月11日,Manus平臺宣布與阿里通義千問團(tuán)隊(duì)正式達(dá)成戰(zhàn)略合作。雙方將基于通義千問系列開源模型,致力于在國產(chǎn)模型和算力平臺上實(shí)現(xiàn)Manus的全部功能。Manus AI方面表示,目前兩家技術(shù)團(tuán)隊(duì)已展開緊密協(xié)作,共同致力于為中國用戶打造更具創(chuàng)造力的通用智能體產(chǎn)品。
11月18日消息,在今日下午的Rokid Jungle 2024合作伙伴暨新品發(fā)布會上,Rokid Glasses AR眼鏡新品發(fā)布。Rokid Glasses與暴龍眼鏡合作,可選多款配色,整體重量僅49g,支持全天佩戴。通過整合阿里巴巴通義千問多模態(tài)大模型,Rokid Glasses支持接打電話、AI問答搜索、AI識別物體、AI拍照答題、AI多語種翻譯、AI導(dǎo)航、AI轉(zhuǎn)譯、AI健康提醒等。從發(fā)布會獲悉,Rokid Glasses定價2499元,將于2025年第二季度上市開售。
11月13日,據(jù)阿里云消息,阿里云通義大模型團(tuán)隊(duì)正式開源通義千問代碼模型全系列,共6款Qwen2.5-Coder模型。此次開源共推出0.5B/1.5B/3B/7B/14B/32B等6個尺寸的全系列模型,每個尺寸都開源了Base和Instruct模型。其中,Base模型可供開發(fā)者微調(diào),Instruct模型則是開箱即用的官方對齊模型。
近日,有媒體報(bào)道,阿里通義千問大模型技術(shù)負(fù)責(zé)人周暢低調(diào)加入字節(jié)跳動。據(jù)悉,加入字節(jié)的重要大模型人才不止周暢。目前,已有多位AI領(lǐng)域的專家計(jì)劃加入該研究院。前面壁智能核心成員秦禹嘉和前零一萬物核心成員黃文灝已加入字節(jié)的大模型團(tuán)隊(duì),匯報(bào)給朱文佳。另外,字節(jié)還通過收購方式吸攬人才,目前已有多家知名AI創(chuàng)業(yè)公司收到字節(jié)的收購要約。
9月14日,記者獲悉,阿里通義將在云棲大會期間發(fā)布視頻生成大模型,目前通義App頻道和通義萬相PC端已上線“視頻生成”入口,僅支持用戶預(yù)約,但未開放使用。頁面內(nèi)容顯示,全新發(fā)布的視頻生成大模型是由通義實(shí)驗(yàn)室自主研發(fā),包含“文生視頻”和“圖生視頻”兩種創(chuàng)作模式。
6月7日,阿里通義千問Qwen2大模型發(fā)布,并在Hugging Face和ModelScope上同步開源。Qwen2系列涵蓋5個尺寸的預(yù)訓(xùn)練和指令微調(diào)模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,上下文長度支持進(jìn)一步擴(kuò)展,最高達(dá)128K tokens。
5月21日消息,阿里云宣布通義千問GPT-4級主力模型降價,對此,火山引擎相關(guān)負(fù)責(zé)人回應(yīng)稱,非常歡迎通義千問大模型降價,共同助力企業(yè)以更低成本探索AI轉(zhuǎn)型,加速大模型應(yīng)用場景落地。據(jù)介紹,豆包大模型在大幅降價同時,還為客戶提供了業(yè)內(nèi)最高標(biāo)準(zhǔn)的 TPM(每分鐘Tokens)和 RPM(每分鐘請求數(shù)),每分鐘處理 Tokens 限額達(dá)到業(yè)內(nèi)同規(guī)格模型的數(shù)倍,能夠支持大量并發(fā)請求,有助于企業(yè)在生產(chǎn)系統(tǒng)調(diào)用大模型。