搜广推技术发展时间线¶
本页梳理近年来搜索、广告、推荐(搜广推)领域的主要技术成果,帮助快速了解从经典方法到前沿架构的演进脉络。
技术演进关系图¶
实线表示同一技术分支内的演进,虚线表示跨分支影响,金色边框表示本仓库已实现的方法。
将鼠标悬停于节点可高亮其相关方法,拖拽画布可平移视图。
经典时代(2015 及以前)¶
| 年份 | 里程碑 | 说明 |
|---|---|---|
| 2001 | Item-based CF | Amazon 提出基于物品的协同过滤,奠定工业推荐基础 |
| 2007 | Matrix Factorization | Netflix Prize 推动矩阵分解方法成为主流 |
| 2010 | FM (Factorization Machines) | Rendle 提出因子分解机,统一多种特征交叉方法 |
| 2013 | DSSM | Huang et al. 提出深度结构化语义模型,将深度学习引入检索 |
| 2015 | GRU4Rec | 首次将 RNN 用于会话推荐(按 arXiv 预印本时间) |
深度学习推荐崛起(2016–2019)¶
| 年份 | 里程碑 | 说明 |
|---|---|---|
| 2016 | YouTube DNN | Covington et al. 提出召回+排序两阶段深度架构,成为工业标准 |
| 2016 | Wide & Deep | Google 融合记忆与泛化能力 |
| 2017 | DeepFM | 将 FM 与 DNN 端到端结合 |
| 2018 | DIN (Deep Interest Network) | 阿里引入 Target Attention 机制建模用户兴趣 |
| 2018 | SASRec | 将 Self-Attention 应用于序列推荐 |
| 2019 | BERT4Rec | 借鉴 BERT 双向编码做序列推荐 |
| 2019 | DIEN | 兴趣演化网络,用 AUGRU 捕捉动态兴趣 |
| 2019 | DLRM | Meta 开源深度学习推荐模型,成为行业基准 |
长序列与特征交叉(2020–2023)¶
| 年份 | 里程碑 | 说明 |
|---|---|---|
| 2020 | MIMN / SIM | 长序列兴趣建模,突破用户行为序列长度限制 |
| 2021 | DCNv2 | Google 改进交叉网络,提升特征交叉效率 |
| 2022 | DHEN | Meta 提出异构专家网络 |
| 2023 | ETA / SDIM | 基于哈希的长序列高效检索方案 |
| 2024 | Wukong | 字节提出大规模排序模型 |
| 2024 | LONGER | 字节的长序列 Transformer 压缩方案 |
| 2024 | RankMixer | Token-Mixing 特征交叉架构 |
PCVR 建模:样本偏差与延迟反馈(2018–2026)¶
Post-Click Conversion Rate(PCVR)预估是广告与电商推荐的核心任务,但在实践中面临两大特有挑战:样本选择偏差(Sample Selection Bias, SSB)和数据稀疏(Data Sparsity, DS)。CVR 训练样本仅来自点击后子集,而推理需覆盖全部曝光空间;转化行为远少于点击行为,正样本极度稀缺。此外,延迟反馈(Delayed Feedback)使转化标签随时间逐步到达,加剧了建模难度。
核心挑战¶
| 挑战 | 说明 |
|---|---|
| 样本选择偏差 (SSB) | CVR 仅在点击空间训练,但需在曝光空间推理,训练/推理分布不一致 |
| 数据稀疏 (DS) | 转化行为极为稀少(通常 <1% 点击率),正样本严重不足 |
| 延迟反馈 (DF) | 转化可能发生在点击数小时甚至数天后,训练时标签不完整 |
| 行为路径异构 | 用户从曝光→点击→转化之间经历多步中间行为,如何利用中间信号是关键 |
全空间多任务建模演进¶
从 ESMM 开创全空间建模范式以来,后续工作沿"行为路径分解 → 因果推断 → 表示增强"三个方向不断演进。
下表按时间顺序梳理 PCVR 全空间多任务建模的关键里程碑。
| 年份 | 里程碑 | 说明 | 方法类型 |
|---|---|---|---|
| 2018 | ESMM | 阿里提出全空间多任务模型,利用 CTR×CVR=CTCVR 恒等式消除 SSB,特征表示迁移缓解 DS (SIGIR 2018) | 全空间多任务 |
| 2019 | ESM² | 阿里提出点击后行为分解,在 click→conversion 之间插入 DAction/OAction 并行路径,进一步缓解 DS (SIGIR 2020) | 行为路径分解 |
| 2020 | NCS4CVR | 腾讯提出神经元连接共享,通过结构共享将 CTR 网络知识迁移到 CVR 网络 | 结构共享 |
| 2020 | DESMM | 在 ESMM 基础上引入延迟反馈建模,处理转化标签延迟到达问题 | 延迟反馈 |
| 2021 | HM³ | 阿里提出微观/宏观行为分层建模,利用详情页组件级交互补充细粒度 CVR 信号 (SIGIR 2021) | 行为路径分解 |
| 2021 | Follow the Prophet | 提出基于 Prophet 的在线延迟反馈校正方法 (SIGIR 2021) | 延迟反馈 |
| 2022 | MSEN | 多尺度用户行为网络,捕获不同时间粒度的行为信号用于全空间多任务学习 (CIKM 2022) | 行为路径分解 |
| 2023 | DCMT | 提出直接全空间因果多任务框架,反事实机制消除选择偏差并解决 NMAR 问题 (ICDE 2023) | 因果推断 |
| 2023 | ESMC | ESM² 的参数约束改进版,通过参数约束增强全空间 CVR 建模的稳定性 | 全空间多任务 |
| 2023 | CST | 点击感知结构迁移 + 样本权重分配,利用点击侧结构信息辅助 CVR 估计 | 结构迁移 |
| 2025 | ChorusCVR | 快手提出合唱监督,区分模糊负样本与事实负样本,实现去偏全空间 CVR 学习 | 全空间多任务 |
| 2025 | Counterfactual CVR | 基于反事实推断的点击后转化率预估,消除选择偏差 (ICDM 2025) | 因果推断 |
| 2026 | EKTM | 华为提出多任务推荐有效知识迁移,Router + Transmitter + Enhancer 跨任务传递 CVR 知识,eCPM +3.93% | 知识迁移 |
| 2026 | RankUp | 腾讯提出高秩表示架构,通过随机置换分割 + 多嵌入 + 全局 token + 预训练嵌入交叉 + 任务 token 解耦提升 CVR | 表示增强 |
| 2026 | Counterfactual MTL-DF | 反事实多任务学习应对电商大促延迟转化建模 (SIGIR 2026) | 因果+延迟 |
RankUp:PCVR 表示增强的最新进展¶
RankUp(Chen et al., 2026, arXiv 2604.17878)是当前 PCVR 表示增强方向最具代表性的工作,已部署于微信视频号、公众号和朋友圈广告,GMV 分别提升 3.41%、4.81% 和 2.21%。其核心发现是:MetaFormer 架构中 token 表示的有效秩随深度呈阻尼振荡轨迹,深层无法单调增长甚至退化——即参数增长 ≠ 表示容量增长。为此提出五项机制:
- 随机置换分割 (RPS) — 相比语义分组减少 token 间相关性和共线性
- 多嵌入表示 (ME) — 扩展潜在空间基础自由度
- 全局 token 集成 (GTI) — token mixing 时交互全局上下文
- 预训练嵌入交叉 (CPE) — 引入外部领域/场景知识丰富潜在空间
- 任务 token 解耦 (TSD) — 缓解多目标梯度干扰
PCVR 开放挑战¶
- 统一架构下的 PCVR:当前竞赛(TAAC 2026)以单一 Transformer 主干统一序列建模与特征交互完成 PCVR,如何在此框架下引入全空间/因果/延迟反馈机制是开放问题
- 表示坍缩与有效秩:深层推荐模型表示趋向低秩子空间集中,限制用户/物品区分能力,需更系统的高秩保持机制
- 跨任务知识迁移:CTR→CVR 的知识迁移仍是工业界关键需求,如何在 MoE / 多任务框架下高效迁移有待探索
- 延迟反馈在线学习:大促等场景下延迟转化建模的实时性要求与 ESMM 类全空间方法的兼容
统一建模与 Scaling Law(2024–2026)¶
这一阶段的核心趋势是将序列建模与特征交叉统一到单一 Transformer 主干中,并验证推荐系统中的 Scaling Law。
注:本表年份与仓库内技术图谱及 Semantic Scholar 缓存使用的 year 字段保持一致,以避免与图中 x 轴年份冲突。
| 年份 | 里程碑 | 说明 | 本仓库 |
|---|---|---|---|
| 2024 | HSTU / GR | Meta 提出 Hierarchical Sequential Transducer Units,1.5 万亿参数生成式推荐器,验证 Scaling Law | — |
| 2024 | InterFormer | UIUC & Meta 提出交错式异构交互学习,双向信息流 + Cross Arch | 论文 · 实验包 |
| 2025 | OneTrans | NTU & 字节提出单 Transformer 主干 + 统一 Tokenizer + KV 缓存 | 论文 · 实验包 |
| 2025 | GPSD | 阿里巴巴提出生成式预训练初始化判别式推荐,13K→0.3B 参数遵循 Power Law (KDD'25) | — |
| 2025 | Foundation-Expert | Meta 提出 Foundation-Expert 范式,首次大规模部署推荐基础模型,日服务数百亿请求 | — |
| 2025 | HoMer | 美团提出统一 Encoder-Decoder,序列 + 集合建模消除三重异构性,节省 27% GPU | — |
| 2025 | MTmixAtt | 美团提出 MoE + AutoToken + Multi-Mix Attention,缩放至 1B 参数实现跨场景统一排序 | — |
| 2026 | HyFormer | 字节提出混合 Transformer,统一长序列建模与特征交叉 | 论文 · Baseline |
生成式推荐(2023–2026)¶
生成式推荐将推荐任务从"检索+排序"转变为"序列生成",利用 LLM 的自回归能力预测下一个物品。
关键思路¶
- 语义 ID:用有语义含义的 token 序列代替传统物品 ID(如 IDGenRec),让模型理解物品本质
- RAG 架构:轻量召回 + LLM 精排,兼顾效率与质量(LlamaRec、PALR)
- 多模态生成:同时处理文本、图片、视频的统一推荐(UniMP, MMGRec, Molar)
- 可控生成:Speculative Decoding 加速推理(SpecGR),指令微调实现约束推荐
代表工作¶
| 年份 | 工作 | 说明 |
|---|---|---|
| 2024 | GenRec | 基于 LLM 的序列推荐,Masked Item Prediction |
| 2024 | IDGenRec | 训练 ID 生成器将元数据转化为语义 ID |
| 2024 | RecGPT | 生成式预训练文本推荐 (ACL 2024) |
| 2024 | UniMP | 统一多模态个性化框架 (ICLR 2024) |
| 2024 | MMGRec | 多模态生成推荐 + 层级量化 (CIKM 2024) |
| 2024 | SpecGR | 基于 Speculative Decoding 的归纳式生成推荐 |
| 2024 | Molar | 多模态 LLM + 协同过滤对齐 |
| 2025 | SessionRec | 下一会话预测范式 (NSPP),解决传统 NIPP 与真实用户行为的不一致 |
| 2025 | COBRA | 级联稀疏-稠密表示的统一生成推荐,2 亿日活广告平台部署 (腾讯) |
| 2025 | LLaDA-Rec | 离散扩散替代自回归,并行生成语义 ID |
| 2025 | RecGPT-V2 | 层级多 Agent + 约束 RL,淘宝部署 CTR +2.98% (阿里) |
| 2025 | xGR | 面向生成式推荐的高效服务系统,3.49x 吞吐提升 |
| 2025 | OxygenREC | 快慢思考 + 指令跟随生成推荐,统一多场景训练一次全场景部署 |
| 2026 | TencentGR / TAAC 2025 | 腾讯广告算法大赛官方论文,发布全模态广告生成式推荐数据集、基线与 Top 方案总结;论文 |
| 2026 | HiGR | 层级规划 + 多目标偏好对齐的生成式 Slate 推荐 |
开放挑战¶
- 推理成本:LLM 解码多 token 延迟高,需量化/蒸馏/Speculative Decoding 加速
- 评估标准:传统 NDCG/HR 不够,需多样性、新颖性、可解释性等新维度
- 长尾推荐:热门物品易推、长尾物品难推,需多样性奖励和重采样
- 冷启动:语义 ID 理论上缓解冷启动,但实际效果仍需验证
参考文献¶
- Zhai et al. Actions Speak Louder than Words: Trillion-Parameter Sequential Transducers for Generative Recommendations. ICML 2024
- Zeng et al. InterFormer: Effective Heterogeneous Interaction Learning for CTR Prediction. arXiv 2411.09852
- Huang et al. HyFormer: Revisiting the Roles of Sequence Modeling and Feature Interaction in CTR Prediction. arXiv 2601.12681
- Zhang et al. OneTrans: Unified Feature Interaction and Sequence Modeling with One Transformer. WWW 2026
- Wang et al. Scaling Transformers for Discriminative Recommendation via Generative Pretraining. KDD 2025. arXiv 2506.03699
- Li et al. Realizing Scaling Laws in Recommender Systems: A Foundation-Expert Paradigm for Hyperscale Model Deployment. arXiv 2508.02929
- Chen et al. HoMer: Addressing Heterogeneities by Modeling Sequential and Set-wise Contexts for CTR Prediction. arXiv 2510.11100
- Qi et al. MTmixAtt: Integrating Mixture-of-Experts with Multi-Mix Attention for Large-Scale Recommendation. arXiv 2510.15286
- Cao & Lio. GenRec: Generative Sequential Recommendation with Large Language Models. ECIR 2024
- Ji et al. IDGenRec: LLM-RecSys Alignment with Textual ID Learning. 2024
- Liu et al. Multi-Behavior Generative Recommendation. CIKM 2024
- Wei et al. UniMP: Towards Unified Multi-modal Personalization. ICLR 2024
- Zhao et al. Recommender Systems in the Era of Large Language Models. IEEE TKDE 2024
- Huang et al. SessionRec: Next Session Prediction Paradigm for Generative Sequential Recommendation. arXiv 2502.10157
- Yang et al. Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations. arXiv 2503.02453
- Shi et al. LLaDA-Rec: Discrete Diffusion for Parallel Semantic ID Generation in Generative Recommendation. arXiv 2511.06254
- Yi et al. RecGPT-V2 Technical Report. arXiv 2512.14503
- Sun et al. xGR: Efficient Generative Recommendation Serving at Scale. arXiv 2512.11529
- Hao et al. OxygenREC: An Instruction-Following Generative Framework for E-commerce Recommendation. arXiv 2512.22386
- Pang et al. HiGR: Efficient Generative Slate Recommendation via Hierarchical Planning and Multi-Objective Preference Alignment. arXiv 2512.24787
- Pan et al. The Tencent Advertising Algorithm Challenge 2025: All-Modality Generative Recommendation. arXiv 2604.04976
PCVR 参考文献¶
- Ma et al. Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate. SIGIR 2018. arXiv 1804.07931
- Wen et al. Entire Space Multi-Task Modeling via Post-Click Behavior Decomposition for Conversion Rate Prediction. SIGIR 2020. arXiv 1910.07099
- Xiao et al. NCS4CVR: Neuron-Connection Sharing for Multi-Task Learning in Video Conversion Rate Prediction. 2020. arXiv 2008.09872
- Wang et al. Delayed Feedback Modeling for the Entire Space Conversion Rate Prediction. 2020. arXiv 2011.11826
- Wen et al. Hierarchically Modeling Micro and Macro Behaviors via Multi-Task Learning for Conversion Rate Prediction. SIGIR 2021. arXiv 2104.09713
- Li et al. Follow the Prophet: Accurate Online Conversion Rate Prediction in the Face of Delayed Feedback. SIGIR 2021. arXiv 2108.06167
- Jin et al. Multi-Scale User Behavior Network for Entire Space Multi-Task Learning. CIKM 2022. arXiv 2208.01889
- Zhu et al. DCMT: A Direct Entire-Space Causal Multi-Task Framework for Post-Click Conversion Estimation. ICDE 2023. arXiv 2302.06141
- Jiang et al. ESMC: Entire Space Multi-Task Model for Post-Click Conversion Rate via Parameter Constraint. 2023. arXiv 2307.09193
- Ouyang et al. Click-aware Structure Transfer with Sample Weight Assignment for Post-Click Conversion Rate Estimation. 2023. arXiv 2304.01169
- Cheng et al. ChorusCVR: Chorus Supervision for Entire Space Post-Click Conversion Rate Modeling. 2025. arXiv 2502.08277
- Ahn & Lee. On Predicting Post-Click Conversion Rate via Counterfactual Inference. ICDM 2025. arXiv 2510.04816
- Jia et al. No One Left Behind: How to Exploit the Incomplete and Skewed Multi-Label Data for Conversion Rate Prediction. 2025. arXiv 2512.13300
- Cai et al. Effective Knowledge Transfer for Multi-Task Recommendation Models. 2026. arXiv 2605.05730
- Chen et al. RankUp: Towards High-rank Representations for Large Scale Advertising Recommender Systems. 2026. arXiv 2604.17878
- Song et al. Counterfactual Multi-task Learning for Delayed Conversion Modeling in E-commerce Sales Pre-Promotion. SIGIR 2026. arXiv 2604.21675