近日,聯通數據智能有限公司重磅開源首個完全在國產昇騰AI基礎軟硬件平臺上實現訓練和推理的中文原生文生圖模型,實現多項自主創新突破。
在架構上,通過在SDXL架構中融合復合語言編碼模塊,實現了對中文長文本、多屬性對應和中文特色詞匯的精確語義理解,對應圖像的生成效果得到了極大提升。
在昇騰AI大規模算力集群上實現了中文原生文生圖模型的訓練和推理,并將模型和代碼對業界開源,以推動文生圖領域的國產化進程。
當前的文生圖主流模型以英文輸入為主,中文原生的文生圖模型研發則相對比較緩慢,這導致了模型對中文語義的理解能力不足,中文特色圖片生成能力有限。中國聯通作為數字信息運營服務國家隊、數字技術融合創新排頭兵,長期關注中文原生大模型的發展,并走出了一條夯實基礎、自主研發的技術創新突破之路。目前,元景文生圖模型已在聯通內外部多個項目中成功應用,成為助力企業降本增效、智能化升級的重要一環。
架構創新:引入復合語言編碼模塊,支持中文長文本輸入
原始SDXL的語言編碼器僅使用了英文CLIP模型,導致其一方面僅支持英文文本作為輸入,另一方面在輸入長度上也存在嚴重限制(最長77個token)。對此,元景文生圖模型一方面將英文CLIP模型替換成中文CLIP,使得模型中文短文本輸入具有更好的理解能力;同時,引入復合語言編碼架構,將基于encoder-decoder架構的語言模型引入了語言編碼器部分,這使得模型能支持超過CLIP長度限制的長文本,實現更準確的中文語義理解和判斷。

元景中文文生圖架構
中文原生模型:支持中文原生語義理解和中文特色圖像生成
通過引入復合語言編碼模塊,元景文生圖模型實現了原生中文語義理解,避免了傳統的利用翻譯插件等作為中介調用英文文生圖模型的方法所帶來的中文信息損失。同時通過引入海量中文圖文對數據進行預訓練,模型對中文專屬名詞,如鼠標-老鼠、仙鶴-吊車等英文模型易混淆的對象,以及中文菜譜等英文模型無法理解的名詞,都能夠準確理解并生成對應的高質量圖片。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。