李開復旗下公司「零一萬物」的大模型 Yi-34B 引發爭議,因研究者發現其基本采用 LLaMA 架構,但只是對兩個張量進行了重命名。
2. 有關該模型的性能和成就,包括上下文窗口大小超過200k、一次處理40萬漢字、在 Hugging Face 全球開源模型排行榜中獲得雙料冠軍等。
3. 在社區中有人指出,Yi-34B 實際上是對 LLaMA 代碼的一次重構,但未作實質性改變,引起對虛假宣傳、許可證違規等問題的疑慮。公司回應表示基于 GPT 結構,并在模型訓練中遇到的一些需求導致了代碼重命名。
最近,「零一萬物」公司旗下的大模型 Yi-34B 因使用 LLaMA 架構但改變張量名引發爭議。這一爭議中,研究者指出其代碼實際上是對 LLaMA 代碼的一次重構,只是未作實質性改變。社區擔心這可能違反了許可證規定,且未經過框架支持的外部代碼附加可能存在安全風險。
Yi-34B 的成就在開源大模型領域引起了廣泛關注,其上下文窗口大小超過200k,能處理40萬漢字,成為全球開源模型雙料冠軍。然而,爭議的核心在于其是否真正符合 LLaMA 的許可協議,以及對模型代碼的更改是否屬于虛假宣傳。
在社區的討論中,有人提到模型的性能參數和配置存在疑慮,包括模型被標榜為32K 模型實際上配置為4K 模型的問題。此外,對于模型的微調數據和基準測試的信息也沒有充分提供,引起了社區的疑慮。
「零一萬物」公司回應稱,他們的模型結構基于 GPT 成熟結構,但在訓練實驗中由于需求對代碼進行了更名。他們強調模型的結構只是其中一部分,投入了大量研發工作在數據工程、訓練方法、評估方法等方面,這是他們在大模型預訓練階段的核心技術護城河。最后,他們表示尊重社區的反饋,將代碼進行更新以更好地融入 Transformer 生態。
綜合來看,爭議集中在「零一萬物」公司的 Yi-34B 模型是否違反了開源協議,以及其在性能參數和代碼修改上的透明度。這一事件提醒開源社區對于模型的合規性和透明度的重要性,同時也反映了在開源領域中公司的技術選擇可能引發廣泛關注和爭議的現實。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。