科技媒體marktechpost報道,英偉達近日發布視覺-語言模型Eagle 2.5,專注于長上下文多模態學習,尤其擅長處理高分辨率圖像和長視頻序列。盡管參數規模僅為8B,該模型在Video-MME基準測試(512幀輸入)中取得72.4%的高分,性能媲美更大規模模型。
Eagle 2.5的成功得益于創新訓練策略,包括信息優先采樣和漸進式后訓練。前者通過圖像區域保留技術和自動降級采樣優化視覺與文本輸入平衡;后者逐步擴展上下文窗口,確保模型在不同輸入長度下保持穩定。此外,定制數據集Eagle-Video-110K結合雙重標注方法,顯著提升了模型在高幀數任務中的表現。
性能測試顯示,Eagle 2.5在多項視頻和圖像理解任務中表現優異,例如MVBench得分74.8,DocVQA達94.1。消融研究證實,其關鍵訓練策略和數據集的貢獻不可替代。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。