近期,日本經(jīng)濟新聞(NIKKEI)提到阿里通義千問大模型已成日本AI開發(fā)基礎(chǔ)。在日經(jīng)新聞評測的AI模型綜合排名中,通義千問Qwen2.5-Max排名第六,超越了DeepSeek-V3和OpenAI o3-mini等大模型。據(jù)了解,日本大量新興企業(yè)正在基于千問開發(fā)企業(yè)大模型。
英偉達近日開源其代碼推理模型(Open Code Reasoning model),包括32B、14B和7B三個參數(shù)。該模型以阿里通義千問Qwen2.5-32B、Qwen2.5-14B、Qwen2.5-7B為底座模型。
去年12月,阿里通義千問推出了QVQ-72B-Preview, 作為一個探索模型,它存在一些不足之處。今天,我們正式推出 QVQ-Max 視覺推理模型的第一版。這一新版本的模型具備強大的多模態(tài)處理能力,它不僅能夠“看懂”圖片和視頻里的內(nèi)容,還能結(jié)合這些信息進行分析、推理,甚至給出解決方案。從數(shù)學(xué)題到生活小問題,從編程代碼到藝術(shù)創(chuàng)作,QVQ-Max 都表現(xiàn)出了不俗的能力。
通義千問3月27日宣布發(fā)布Qwen2.5-Omni,Qwen模型家族中新一代端到端多模態(tài)旗艦?zāi)P?。該模型專為全方位多模態(tài)感知設(shè)計,能夠無縫處理文本、圖像、音頻和視頻等多種輸入形式,并通過實時流式響應(yīng)同時生成文本與自然語音合成輸出。該模型現(xiàn)已在Hugging Face、ModelScope、DashScope和GitHub上開源開放。
3月11日,Manus平臺宣布與阿里通義千問團隊正式達成戰(zhàn)略合作。雙方將基于通義千問系列開源模型,致力于在國產(chǎn)模型和算力平臺上實現(xiàn)Manus的全部功能。Manus AI方面表示,目前兩家技術(shù)團隊已展開緊密協(xié)作,共同致力于為中國用戶打造更具創(chuàng)造力的通用智能體產(chǎn)品。
3月6日,阿里巴巴發(fā)布并開源全新的推理模型通義千問QwQ-32B,阿里巴巴稱,這是一款擁有320億參數(shù)的模型,其性能可與具備6710億參數(shù)(其中370億被激活)的DeepSeek-R1媲美。
11月13日,據(jù)阿里云消息,阿里云通義大模型團隊正式開源通義千問代碼模型全系列,共6款Qwen2.5-Coder模型。此次開源共推出0.5B/1.5B/3B/7B/14B/32B等6個尺寸的全系列模型,每個尺寸都開源了Base和Instruct模型。其中,Base模型可供開發(fā)者微調(diào),Instruct模型則是開箱即用的官方對齊模型。
9月19日云棲大會,阿里云CTO周靖人發(fā)布通義千問新一代開源模型Qwen2.5,其中,旗艦?zāi)P蚎wen2.5-72B性能超越Llama 405B,再登全球開源大模型王座。Qwen2.5涵蓋多個尺寸的大語言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型,每個尺寸都有基礎(chǔ)版本、指令跟隨版本、量化版本,總計上架100多個模型,刷新業(yè)界紀錄。截至2024年9月中旬,通義千問開源模型累計下載量已突破4000萬,成為僅次于Llama的世界級模型群。
7月17日消息,有消息稱阿里通義大模型團隊核心成員周暢博士擬于近日離職創(chuàng)業(yè)。知情人士向界面新聞透露,周暢是通義實驗室算法團隊的核心技術(shù)骨干之一,屬于正常離職。通義大模型的研發(fā)和開源工作正在繼續(xù)向前推進。 目前,阿里通義實驗室負責(zé)人為周靖人。
6月7日,阿里通義千問Qwen2大模型發(fā)布,并在Hugging Face和ModelScope上同步開源。Qwen2系列涵蓋5個尺寸的預(yù)訓(xùn)練和指令微調(diào)模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,上下文長度支持進一步擴展,最高達128K tokens。
4月28日消息,通義千問開源1100億參數(shù)模型Qwen1.5-110B,成為全系列首個千億級參數(shù)開源模型。通義千問1100億參數(shù)模型延續(xù)了Qwen1.5系列的Transformer解碼器架構(gòu),采用了分組查詢注意力方法(GQA),使得模型在推理時更加高效。110B模型支持32K上下文長度,具備優(yōu)秀的多語言能力,支持中、英、法、德、西、俄、日、韓、越、阿拉伯等多種語言。
4月7日,阿里云通義千問開源320億參數(shù)模型Qwen1.5-32B。通義千問此前已開源5億、18億、40億、70億、140億和720億參數(shù)6款大語言模型。此次開源的320億參數(shù)模型,將在性能、效率和內(nèi)存占用之間實現(xiàn)更理想的平衡。目前,通義千問共開源了7款大語言模型,在海內(nèi)外開源社區(qū)累計下載量突破300萬。
10月31日消息,在2023云棲大會上,阿里云正式發(fā)布通義千問2.0版本,阿里云CTO周靖人表示,該版本用的是千億參數(shù)的基礎(chǔ)模型,在閱讀理解、邏輯思維等方面的能力都有大幅提升。此外,通義千問推出app版本,支持語音對話等功能。
9月13日,阿里云宣布通義千問大模型已首批通過備案,并正式向公眾開放,用戶可登錄通義千問官網(wǎng)(https://qianwen.aliyun.com/)體驗,企業(yè)用戶可以通過阿里云調(diào)用通義千問API(https://dashscope.console.aliyun.com/model)。阿里云表示,近期將開源一個更大參數(shù)規(guī)模的大模型版本,供全社會免費商用。
8月3日,阿里云開源通義千問70億參數(shù)模型,包括通用模型Qwen-7B和對話模型Qwen-7B-Chat,兩款模型均已上線魔搭社區(qū),開源、免費、可商用。此舉讓阿里云成為國內(nèi)首個加入大模型開源行列的大型科技企業(yè)。