大模型驱动下的生成式搜推:淘宝闪购全链路重构实践|QCon 北京

问AI · 大模型在搜推落地中如何解决传统瓶颈?
作者 | QCon 全球软件开发大会

从「AI For What」到「Value From AI」,100+ 可落地实践案例打通 AI 实战最后一公里!

4 月 16 日 -4 月 18 日,QCon 全球软件开发大会 将在北京举办。本届大会锚定 Agentic AI 时代的软件工程重塑,聚焦 Agentic AI、多智能体协作、算力优化、技术债治理、多模态和 AI 原生基础设施等前沿话题,邀请来自腾讯、阿里、百度、华为、蚂蚁、小米、网易等企业技术专家,带来百余项真实落地案例,系统性分享前沿洞察与实战干货,以技术共创探索 AI 落地新路径。

阿里巴巴淘宝闪购资深算法专家桑梓森已确认出席 “Agentic Engineering” 专题,并发表题为 大模型驱动下的生成式搜推:淘宝闪购全链路重构实践 的主题分享。淘宝闪购业务规模快速增长,对搜索推荐系统的效率与精准度提出了更高要求。传统搜推算法在特征工程、用户理解和商品表征上已逐步触及天花板。本次分享聚焦大模型时代下闪购搜推系统的技术演进,结合真实业务场景,分享关键技术选型的决策过程、落地中的踩坑经验与效果数据。

图片

桑梓森,淘宝闪购搜推排序团队负责人,主导淘宝闪购搜索 / 推荐系统算法优化与系统演进,专注于即时零售场景下的多目标优化、个性化推荐以及 LLM& 生成式相关技术在搜推场景的落地。他在本次会议的详细演讲内容如下:

演讲提纲

  • 开场:闪购业务背景与搜推挑战

    • 闪购业务特点、传统搜推瓶颈

  • 大模型 LLM/VLM 多模态在搜推全链路落地

    • Query 理解与改写

    • 商品理解与表征

    • 召回与排序中的大模型特征注入

    • 用户冷启动

  • 算力 Scaling Up 策略

    • 模型维度的 Scaling

    • 训练与推理优化

    • 算力 ROI 度量 torch 训推迭代

  • 生成式搜推新范式探索

    • HSTU 类在搜推探索落地

    • RQ-VAE 生成式召回

  • G-E 生成式重混排落地

    • 面向 AI 搜推的核心链路升级改造

  • 总结与展望

这样的技术在实践过程中有哪些痛点?

  • 搜推传统模型与大模型的对齐;

  • 生成式范式落地中的坑点、工程以及算法之间的协同优化;

  • AI 时代搜索的变化及解法。

演讲亮点

  • 大模型与传统搜推深度结合:精排、召回、多模态训练等;

  • 生成式技术演进与落地:RQ-VAE 等实践、G-E 生成式混排在搜推中的落地;

  • AI 搜推面向千问场景的业务接入及迭代优化。

听众收益

  • 大模型能力在搜推全链路落地的算法与工程范式;

  • 面向 AI 时代,传统搜推与 AI 之间的结合。

除此之外,本次大会还策划了 Agentic Engineering、多模态理解与生成的突破、记忆觉醒:智能体记忆系统的范式重塑与产业落地、具身智能与物理世界交互、Agent Infra 架构设计、AI 重塑数据生产与消费、AI 原生基础设施、AI 驱动的技术债治理、小模型与领域适配模型、大模型算力优化、Agent 可观测性与评估工程、AI for SRE 等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+ 资深专家在 QCon 北京站现场带来前沿技术洞察和一线实践经验。

会议推荐

QCon 全球软件开发大会·2026 北京站将于 4 月 16 日 -18 日正式举办。本届大会以“Agentic AI 时代的软件工程重塑”为主题,聚焦 100+ 重磅议题,汇聚来自阿里、腾讯、字节跳动、小米、百度等一线科技企业与创新团队的技术专家,围绕 AI 工程化、系统架构与研发模式演进展开深入探讨。更多详情可扫码或联系票务经理 18514549229 进行咨询。