聯想今日宣布,旗下首款 AMD AI 大模型訓練服務器——聯想問天 WA7785a G3在單機部署671B(滿血版) DeepSeek 大模型時,實現了高達6708token/s 的極限吞吐量,再次刷新了單臺服務器運行超大規模模型性能的紀錄。
據介紹,此次性能突破得益于聯想萬全異構智算平臺的強大支持。聯想通過訪存優化、顯存優化、創新的 PCIe5.0全互聯架構以及精選 SGLang 框架中的最優算子等一系列創新技術手段,對大模型從預訓練、后訓練到推理的全流程進行了持續優化。實測結果顯示,在單臺部署 DeepSeek671B 大模型的聯想問天 WA7785a G3服務器上,最高吞吐量達到了驚人的6708token/s。
在模擬問題對話場景(上下文序列長度128/1K)時,該服務器最高可支持158的并發數,TPOT(Time Per Output Token)為93毫秒,TTFT(Time To First Token)為2.01秒;而在模擬代碼生成場景(上下文序列長度512/4K)時,并發數可達140,TPOT 為100毫秒,TTFT 為5.53秒。聯想方面表示,這一性能表現意味著單臺聯想問天 WA7785a G3服務器即可支撐1500人規模企業的正常使用,是繼聯想問天 WA7780G3服務器單機部署滿血版 DeepSeek 大模型總吞吐量突破2500token/s 之后,在單機部署該大模型推理性能上的又一次重大飛躍。
聯想方面強調,此次技術突破是聯想中國基礎設施業務群、聯想研究院 ICI 實驗室和 AMD 聯合設計、協同調優、共同實現的成果。同時,這并非最終結果,聯想與 AMD 仍在持續探索深度調優的新方法,以期實現更高的性能突破。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。