智源研究院推出了新一代檢索排序模型 BGE Re-Ranker v2.0,支持100+ 種語言,文本長度更長,并在多項評測中達到了 SOTA(state-of-the-art)的結果。該模型是智源團隊在 BGE(BAAI General Embedding)系列基礎上的新嘗試,擴展了向量模型的 “文本 + 圖片” 混合檢索能力。
BGE Re-Ranker v2.0采用分層自蒸餾策略優化推理效率,通過不同尺寸的模型基座(如 MiniCPM-2B、Gemma-2B、BGE-M3-0.5B)支持多語言檢索能力。此外,該模型還新增了對 “文本 + 圖片” 混合檢索功能的支持,通過引入 CLIP 模型生成的 visual token 實現。

在性能評測方面,BGE Re-Ranker v2.0在英文、中文、多語言主流基準上取得了優秀的檢索效果。例如,在 MTEB、C-MTEB、MIRACL、LLaMA-Index 等評測基準中,BGE Re-Ranker v2.0在重排 BGE-v1.5-large 的 top-100候選集時表現優異,提升了檢索精度。同時,模型在 RAG 場景下也能夠顯著提升各種 embedding 模型的召回結果,配合 BGE-M3可以獲得最佳的端到端檢索質量。
BGE 系列模型的優秀性能和通用性也受到了社區的廣泛關注,Vespa、Milvus 等主流向量數據庫框架已經集成了 BGE-M3模型,為用戶搭建 “三位一體” 的檢索流水線提供了便利。
綜上所述,智源研究院推出的 BGE Re-Ranker v2.0檢索排序模型具有強大的多語言支持、更長文本長度、優秀的檢索效果和靈活的 “文本 + 圖片” 混合檢索功能,為信息檢索領域帶來了新的利器。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。