通義千問昨晚開源了基于Qwen1.5的代碼模型CodeQwen1.5,這是一個基于 Qwen 語言模型的代碼專家模型。CodeQwen1.5擁有7B 參數,采用 GQA 架構,經過約3T tokens 代碼數據的預訓練,支持92種編程語言,并且能夠處理最長64K 的上下文輸入。
在代碼生成、長序列建模、代碼修改和 SQL 能力等方面,CodeQwen1.5展現出了卓越的性能,極大地提升了開發人員的工作效率,并簡化了軟件開發流程。
在代碼生成方面,CodeQwen1.5已經超越了許多更大尺寸的模型,縮小了開源 CodeLLM 與 GPT-4之間在編碼能力上的差距。通過 HumanEval 和 MBPP 的評估,CodeQwen1.5在各項指標上均表現出色。
此外,LiveCodeBench 的評估顯示,CodeQwen1.5在 LeetCode、AtCoder 和 CodeForces 三個競賽平臺的問題上具有極強的泛化能力,盡管其預訓練語料中包含了 LeetCode 的數據。
CodeQwen1.5不僅精通 Python,還支持多種編程語言。在 MultiPL-E 的8種主流語言上進行全面評估,CodeQwen1.5證明了其多語言編程的卓越能力。長序列能力對于代碼模型至關重要,CodeQwen1.5通過精心構造的長序列代碼數據預訓練,實現了最長64K 輸入長度的支持。
在實際應用方面,CodeQwen1.5在 SWE Bench 上的表現尤為突出,它能夠理解代碼倉庫并生成可通過單測的代碼,解決了真實軟件開發中的問題。
CodeQwen1.5在代碼修改方面的能力也得到了驗證,它在 CodeEditorBench 的四個方面——Debug、Translate、Switch、Polish——均達到了最佳效果。
作為一個智能的 SQL 專家,CodeQwen1.5通過自然語言查詢數據庫,極大地降低了非編程專業人士與高效數據交互之間的學習曲線。在 Spider 和 Bird 兩個流行的文本到 SQL 基準測試中,CodeQwen1.5的性能接近 GPT-4,顯示了其在 SQL 領域的強大實力。
CodeQwen1.5作為 Qwen1.5開源家族的一員,目前已支持多種平臺和工具,如 Transformers, vLLM, llama.cpp, Ollama 等。開源社區對 CodeQwen1.5的發布充滿期待,希望它在代碼助手、Code Agent 等方面為社區做出貢獻,并在未來的代碼智能建設中發揮重要作用,實現真正的 AI 程序員。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。