← 返回报告列表

2026-05-11 日报

日报 📅 2026-05-08
生成式推荐基准审计与对话式语义ID落地
semantic-id pretrained-lm cold-start industrial academic
📊 共 5 篇 · 精读 2

2026-05-11 日报

主题: 生成式推荐基准审计与对话式语义ID落地

标签: semantic-id · pretrained-lm · cold-start · industrial · academic

📊 统计: 共 5 篇 · 精读 2 · 🏢 工业界 1 · 🎓 学术 4 · generative-rec 2 · other 1 · llm 1 · discriminative-rec 1

综述

本日共 5 篇论文,2 篇精读、3 篇略读;类别分布上生成式推荐 2 篇、判别式推荐 1 篇、LLM 推荐 1 篇、其他 1 篇,工业界(腾讯、Airbnb)与学术界各半。重点论文方面,腾讯 NewsRec-Chat 提出 Generate-then-Match 范式,让 7B LLM 直接生成 3 层分层 Semantic ID 前缀,对 24h 滚动新闻池做模糊匹配,从架构上保证 0% 幻觉,并通过 PADR 自适应路由实现纯冷启动用户 L1 命中 18.0% 反超 warm 用户的 11.9%,是对话式新闻推荐落地的代表作;Airbnb 与 MSU 合作的 TGH 用一个极简免训练图启发式审计了覆盖 87% 近期生成式推荐论文的 Amazon Review 基准,揭示低分叉局部转移、特征平滑、短历史足够三类 shortcut 结构,TGH 在 14 个数据集中 10 个排名第一或第二,NDCG@10 反超 SOTA 生成式推荐器 17–44%,对整个领域评测体系敲响警钟。其余 RRCM(GRPO 训练的 agentic 记忆检索)、TRACE(旅游对话推荐 benchmark)、DCGL(KG 双通道图学习)各自在 LLM agent、对话推荐评测、知识图谱融合方向做了增量探索。整体趋势上,Semantic ID + LLM 直接生成正成为工业级落地主流,而""benchmark 是否真的在衡量能力""的反思也开始浮出水面。

重点论文

NewsRec-Chat · ⭐ 8/10

Intent-Driven Semantic ID Generation for Grounded Conversational News Recommendation

🏢 Tencent · 生成式推荐

腾讯 NewsRec-Chat 用 Generate-then-Match 范式将对话式新闻推荐从 retrieve-first 转为 LLM 直接生成 3 层 SID prefix + fuzzy match,结合 PADR 自适应 warm/hybrid/cold 推理路径,7B 模型在 152K SID 空间架构级保证 0% 幻觉,冷启动 L1 18.0% 反超 warm 11.9%。

TGH · ⭐ 8/10

An Embarrassingly Simple Graph Heuristic Reveals Shortcut-Solvable Benchmarks for Sequential Recommendation

🎓 学术 · 生成式推荐

用故意设计极简的免训练图启发式 TGH 审计 87% 生成式推荐论文使用的 Amazon Review benchmark,揭示三种数据集 shortcut 结构(低分叉局部转移 / 特征平滑 / 短历史足够),TGH 在 14 个数据集中 10 个 best/second-best,呼吁 capability-aware evaluation。

全部论文

模型 标题 类别 公司 摘要分 精读分
NewsRec-Chat Intent-Driven Semantic ID Generation for Grounded Conversational News Recommendation 生成式 🏢 Tencent 7 8
TGH An Embarrassingly Simple Graph Heuristic Reveals Shortcut-Solvable Benchmarks for Sequential Recommendation 生成式 🎓 学术 7 8
RRCM RRCM: Ranking-Driven Retrieval over Collaborative and Meta Memories for LLM Recommendation LLM 🎓 学术 6
TRACE TRACE: Tourism Recommendation with Accountable Citation Evidence 其他 🎓 学术 4
DCGL DCGL: Dual-Channel Graph Learning with Large Language Models for Knowledge-Aware Recommendation 判别式 🎓 学术 4