跳转至

InterFormer

双向序列-特征交互

概述

InterFormer 提出了行为感知交互块(Behavior-Aware Interaction Block),实现序列建模与特征交互之间的双向信息流。此外引入了个性化 FFN(PersonalizedFFN),根据上下文摘要动态生成用户级别的网络权重。

→ 完整论文笔记见 InterFormer 论文

模型架构

  • SelfGating:门控值路径
  • StandardSelfAttention:标准自注意力
  • LinearCompressedEmbedding:学习输入→输出 token 压缩
  • SequencePreprocessor:融合历史/发布/作者/时间/动作/分组特征
  • PersonalizedFFN:从上下文摘要生成用户特定权重
  • Memory Slots:4 个可学习记忆槽

关键特性:自注意力 + 交叉注意力上下文的门控融合,2 个可学习 Query。

默认配置

参数
embedding_dim 128
num_layers 3
num_heads 4
segment_count 4
memory_slots 4
num_queries 2
recent_seq_len 2
epochs 10
batch_size 64
learning_rate 1e-3
pairwise_weight 0.0

快速运行

uv run taac-train --experiment config/gen/interformer
uv run taac-evaluate single --experiment config/gen/interformer

输出目录

outputs/gen/interformer/

来源

论文:Effective Heterogeneous Interaction Learning for Click-Through Rate Prediction(Meta AI,CIKM 2025)

评论