AI大模型(LLM)掀起的生成式革命,正重塑各行各業(yè),連我們每天刷到的推薦系統(tǒng)也不例外。
傳統(tǒng)推薦系統(tǒng)像一條多環(huán)節(jié)的“流水線”(級(jí)聯(lián)架構(gòu)),容易導(dǎo)致算力浪費(fèi)、目標(biāo)沖突,制約了發(fā)展。要突破瓶頸,關(guān)鍵在于用LLM技術(shù)進(jìn)行“一體化”重構(gòu),實(shí)現(xiàn)效果提升和成本降低。
快手技術(shù)團(tuán)隊(duì)最新提出的「OneRec」系統(tǒng),正是這一思路的突破。它首次用端到端的生成式AI架構(gòu),徹底改造了推薦系統(tǒng)的全流程,在效果和成本上實(shí)現(xiàn)了“既要又要”:
效果猛增:有效計(jì)算量提升10倍!讓強(qiáng)化學(xué)習(xí)技術(shù)在推薦場(chǎng)景真正“活”了起來(lái),推薦更精準(zhǔn)。
成本銳減:通過(guò)架構(gòu)革新,訓(xùn)練和推理的算力利用率(MFU)分別飆升至23.7%和28.8%,運(yùn)營(yíng)成本(OPEX)僅為傳統(tǒng)方案的10.6%。
目前,該系統(tǒng)已在快手App/快手極速版雙端服務(wù)所有用戶,承接約25%的QPS(每秒請(qǐng)求數(shù)量),帶動(dòng)App停留時(shí)長(zhǎng)提升0.54%/1.24%,關(guān)鍵指標(biāo)7日用戶生命周期(LT7)顯著增長(zhǎng),為推薦系統(tǒng)從傳統(tǒng)Pipeline邁向端到端生成式架構(gòu)提供了首個(gè)工業(yè)級(jí)可行方案。
完整技術(shù)報(bào)告鏈接:https://arxiv.org/abs/2506.13695
![]()
圖:OneRec 系統(tǒng)概覽
OneRec基礎(chǔ)模型剖析
OneRec采用端到端生成式架構(gòu),首創(chuàng)協(xié)同感知多模態(tài)分詞器:通過(guò)融合視頻標(biāo)題、圖像等多維信息與用戶行為,利用RQ-Kmeans分層生成語(yǔ)義ID。其Encoder-Decoder框架將推薦轉(zhuǎn)化為序列生成任務(wù):
Encoder整合用戶終身/短期行為序列實(shí)現(xiàn)多尺度建模;
MoE增強(qiáng)的Decoder通過(guò)Next Token Prediction精準(zhǔn)生成推薦結(jié)果。
實(shí)驗(yàn)驗(yàn)證其遵循Scaling Law——參數(shù)量增至2.633B時(shí)訓(xùn)練損失顯著下降,結(jié)合特征/碼本/推理級(jí)優(yōu)化,實(shí)現(xiàn)效果與算力的協(xié)同突破。
強(qiáng)化學(xué)習(xí)(RL)偏好對(duì)齊
OneRec突破傳統(tǒng)推薦依賴歷史曝光的局限,創(chuàng)新引入強(qiáng)化學(xué)習(xí)偏好對(duì)齊機(jī)制。通過(guò)融合偏好獎(jiǎng)勵(lì)(用戶偏好)、格式獎(jiǎng)勵(lì)(有效輸出)及業(yè)務(wù)獎(jiǎng)勵(lì)(工業(yè)需求)構(gòu)建綜合獎(jiǎng)勵(lì)系統(tǒng),并利用個(gè)性化P-Score作為強(qiáng)化信號(hào)。采用改進(jìn)的ECPO算法(嚴(yán)格截?cái)嘭?fù)優(yōu)勢(shì)梯度)提升訓(xùn)練穩(wěn)定性,在快手場(chǎng)景中實(shí)現(xiàn)不損失曝光量前提下顯著提升用戶時(shí)長(zhǎng),達(dá)成工業(yè)級(jí)效果突破。
![]()
性能優(yōu)化
在性能優(yōu)化上,OneRec突破傳統(tǒng)推薦MFU個(gè)位數(shù)魔咒:通過(guò)架構(gòu)重構(gòu)+算子壓縮92%至1,200個(gè),訓(xùn)練/推理MFU提升至23.7%/28.6%,算力效能達(dá)主流AI模型水平,實(shí)現(xiàn)3~5倍躍升。首次讓推薦系統(tǒng)達(dá)到與主流AI模型比肩的算力效能水平。
此外,快手技術(shù)團(tuán)隊(duì)還針對(duì)OneRec特性在訓(xùn)練和推理框架層面進(jìn)行了深度定制優(yōu)化。訓(xùn)練側(cè)采用請(qǐng)求分組特征復(fù)用與變長(zhǎng)Flash Attention提升計(jì)算密度,自研SKAI系統(tǒng)實(shí)現(xiàn)Embedding全流程GPU訓(xùn)練,徹底消除CPU同步瓶頸;推理側(cè)首創(chuàng)計(jì)算復(fù)用架構(gòu)——Encoder單次前向+Beam間KV共享+Decoder層KV Cache,支撐512大Beam Size生成需求,并基于Float16混合精度與MoE/Attention算子深度融合提升吞吐。最終訓(xùn)練/推理MFU達(dá)23.7%/28.8%(較傳統(tǒng)模型提升3~5倍),運(yùn)營(yíng)成本降至傳統(tǒng)方案10.6%,實(shí)現(xiàn)近90%成本節(jié)約。
Online實(shí)驗(yàn)效果
該模型經(jīng)過(guò)一周5%流量AB測(cè)試,在點(diǎn)贊、關(guān)注、評(píng)論等所有交互指標(biāo)上均獲正向收益(如下圖)。系統(tǒng)現(xiàn)已全量覆蓋短視頻推薦主場(chǎng)景,承擔(dān)約25%QPS。除了短視頻推薦的消費(fèi)場(chǎng)景之外,OneRec在快手本地生活服務(wù)場(chǎng)景同樣表現(xiàn)驚艷:AB對(duì)比實(shí)驗(yàn)表明該方案推動(dòng)GMV暴漲21.01%、訂單量提升17.89%、購(gòu)買用戶數(shù)增長(zhǎng)18.58%,其中新客獲取效率更實(shí)現(xiàn)23.02%的顯著提升。目前,該業(yè)務(wù)線已實(shí)現(xiàn)100%流量全量切換。
![]()
生成式AI方興未艾,正引發(fā)各領(lǐng)域根本性技術(shù)變革與降本增效。OneRec不僅論證了推薦系統(tǒng)與LLM技術(shù)棧深度融合的必要性,更重構(gòu)了互聯(lián)網(wǎng)核心基礎(chǔ)設(shè)施的技術(shù)DNA。隨著其新范式的到來(lái),推薦系統(tǒng)將加速迎來(lái)「端到端生成式覺醒」時(shí)刻。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
海報(bào)生成中...
海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過(guò)80萬(wàn)個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。
9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬(wàn)臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。