跳转至

TAAC 2026 Experiment Workspace

迈向统一序列建模与特征交互的大规模推荐系统


项目定位

这是一个面向 TAAC 2026 的实验工作区。我们把共享训练底座、目录式实验包、统一输出产物和回归测试放进同一套工程里,让新实验可以更快接入、训练、评估和复核。

声明

本仓库是 TAAC 2026 其中一个参赛队伍的代码仓库,不代表官方。

核心能力

能力 说明
统一训练框架 一条命令完成训练、评估、checkpoint 保存
目录式实验包 每个实验包独立管理数据、模型、损失函数,互不干扰
超参数搜索 基于 Optuna,自动检测 GPU 空闲显存并发派发 trial
回归测试 Unit / Integration / Property 三层测试,CI 自动覆盖率门控
论文复现 内置 InterFormer、OneTrans、HyFormer 等已发表工作的可运行实现

内置实验包

当前共 10 个独立实验包,覆盖从基础 baseline 到前沿论文的多种架构:

实验包 架构特点 来源
Baseline 最小参考实现,强调可扩展性 本仓库
CTR Baseline DIN 风格注意力 creatorwyx/TAAC2026-CTR-Baseline
DeepContextNet 上下文感知建模 suyanli220/TAAC-2026-Baseline
Grok 分段建模 + pairwise 损失 本仓库
HyFormer 多序列分支 + Query Decode/Boost 论文
InterFormer 双向序列-特征交互 论文
OneTrans 统一 Tokenizer + 单 Transformer 论文
O_o 简化统一设计 salmon1802/O_o
UniRec 多阶段融合 hojiahao/TAAC2026
UniScaleFormer 缩放序列 + 融合 twx145/Unirec

技术栈

  • Python ≥ 3.12
  • PyTorch ≥ 2.6
  • uv 作为包管理器
  • Optuna ≥ 4.4 用于超参数搜索
  • pytest + Hypothesis 用于测试

快速预览

# 安装环境
uv python install 3.13
uv sync --locked

# 训练 baseline
uv run taac-train --experiment config/gen/baseline

# 评估
uv run taac-evaluate single --experiment config/gen/baseline

# 超参数搜索
uv run taac-search --experiment config/gen/baseline --trials 20

→ 详细步骤见 快速开始

评论