通義千問開源 1100 億參數模型 Qwen1.5-110B,成為全系列首個千億級參數開源模型,并在多項基準測評中都創下可與 Llama3-70B 媲美的成績。目前 Qwen1.5 系列已累計開源 10 款大模型,通義千問開源模型下載量超過 700 萬。
通義千問 1100 億參數模型延續了 Qwen1.5 系列的 Transformer 解碼器架構,采用了分組查詢注意力方法(GQA),使得模型在推理時更加高效。110B 模型支持 32K 上下文長度,具備優秀的多語言能力,支持中、英、法、德、西、俄、日、韓、越、阿拉伯等多種語言。
Qwen1.5-110B 在 MMLU、TheoremQA、GPQA 等多個基準測評中展現出卓越性能,基礎能力可與 Meta 剛剛發布的 Llama-3-70B 模型相媲美,相比通義千問 720 億參數開源模型也有明顯提升。研發團隊指出,Qwen1.5-110B 的預訓練方法與同系列其他模型并無明顯差異,性能提升主要來自于參數規模的擴增。
研發團隊還在 MT-Bench 和 AlpacaEval 2.0 兩個測評集上對 1100 億參數模型的 Chat 版本作了評估,通義千問 110B 比通義千問 72B 的效果有顯著提升。
今年 2 月初,通義千問團隊推出最新開源模型系列 Qwen1.5,隨后在不到 3 個月的時間連續開出 8 款大語言模型,模型參數規模涵蓋 5 億、18 億、40 億、70 億、140 億、320 億、720 億、1100 億;Qwen1.5 系列還推出了一款基于 LLM 開發的代碼模型 CodeQwen1.5-7B 和一款混合專家模型 Qwen1.5-MoE-A2.7B,均在開源社區收獲熱烈反響。
開發者可在魔搭社區 ModelScope 和 HuggingFace 等開源社區下載使用 Qwen1.5-110B。據悉,目前通義千問開源模型下載量超過 700 萬,是最受開發者歡迎的開源大模型之一。
通義大模型的落地應用也開啟了加速度,近期,新東方、同程旅行、長安汽車、西部機場集團、親寶寶等多家企業宣布接入通義大模型。通義大模型開始“上天入地”支持千行百業,比如,中國科學院國家天文臺人工智能組基于通義千問開源模型開發了新一代天文大模型“星語 3.0”,大模型首次應用于天文觀測領域;陜煤建新煤礦等十余座礦山推出由通義大模型支持的新型礦山重大風險識別處置系統,這是大模型在礦山場景的首次規模化落地。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。