UIUC與BigCode組織的研究者們最近發布了StarCoder2-15B-Instruct代碼大模型,這一創新成果在代碼生成任務方面取得了顯著突破。這款模型成功超越了CodeLlama-70B-Instruct,登上了代碼生成性能榜單之巔。
StarCoder2-15B-Instruct的獨特之處在于其純自對齊策略,整個訓練流程公開透明,且完全自主可控。通過自我生成數千個指令-響應對,直接對StarCoder-15B基座模型進行微調,無需依賴昂貴的人工標注數據,也無需從商業大模型中獲取數據,避免了潛在的版權問題。
在HumanEval測試中,StarCoder2-15B-Instruct以72.6%的Pass@1成績脫穎而出,較CodeLlama-70B-Instruct的72.0%有所提升。在LiveCodeBench數據集的評估中,這一自對齊模型的表現甚至超越了基于GPT-4生成數據訓練的同類模型,證明了通過自身數據訓練的大模型同樣能夠有效地學習如何與人類偏好對齊。
StarCoder2-15B-Instruct的數據生成流程主要包括種子代碼片段的采集、多樣化指令的生成和高質量響應的生成三個核心步驟。種子代碼片段的采集是通過從開源代碼片段中選取高質量、多樣化的種子函數開始的。然后,基于這些種子函數的不同編程概念,StarCoder2-15B-Instruct能夠創建出多樣化且真實的代碼指令。最后,通過自我驗證的方式確保生成的響應是準確且高質量的。
StarCoder2-15B-Instruct在備受矚目的EvalPlus基準測試中表現出色,超越了規模更大的Grok-1Command-R+和DBRX,并與Snowflake Arctic480B和Mixtral-8x22B-Instruct等業界翹楚性能相當。此外,在LiveCodeBench和DS-1000等評估平臺上也展現出了強大的實力。
該項目的成功實施得到了美國東北大學Arjun Guha課題組、加州大學伯克利分校、ServiceNow和Hugging Face等機構的鼎力支持。
StarCoder2-15B-Instruct-v0.1的發布標志著研究者們在代碼模型自我調優領域邁出了重要一步。這款模型的成功實踐展示了通過自我調優同樣能夠構建出性能卓越的代碼模型。同時,該模型的開源數據集和訓練流程為未來該領域的研究和發展奠定了堅實的基礎。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。