混元推出国内首个交互式AI播客,听播客可以“举手”提问了

听播客的时候,如果有一些延伸的问题,或者一时没听懂,你一般会怎么办?

1️⃣ 打开大模型应用或者搜索引擎找答案

2️⃣ 留着,等到想起来的时候再搜索

等等,如果能打断嘉宾,直接进行提问呢?

腾讯混元推出国内首个交互式AI播客,用户可在收听播客的过程中,随时打断主持人和嘉宾的发言,通过语音或者打字的方式提问。

这就改变了传统播客只能单向收听不能实时互动的交互模式,带来更加丰富的体验,通过播客来获得信息的效率也更高了。

基于大模型意图识别、长上下文理解、多轮对话和外部联网检索能力,交互式AI播客能够结合上下文以及背景信息,更加准确地给出答案。

我们以下面这篇腾讯新闻深度报道《为啥有些年轻人不爱交朋友了?教室氛围显沉闷,有人像“NPC”》为例,将文本转换成播客后,在收听的过程中可以打断对话,提出问题:“有相关书籍推荐吗?”

除交互式播客能力,混元AI播客现已支持用户对播客风格、主持人数以及播客音色进行自主选择,支持快速进行播客内容创作。

播客风格:提供默认模式(详略得当)、深度探索(结合AI搜索进行深入挖掘与讨论)、思辨讨论(双主持观点交锋)三种模式,支持用户基于自身场景定制内容风格。

主持人数:提供单人播客、双人对谈两种模式,新增满足故事陈述、报告分析等更多独白场景的应用。

播客音色:提供8种不同性别、年龄段与人设特点的高质音色,用户可体验男女对谈、老少对谈、古今对谈、角色扮演等播客场景应用。

图片

腾讯混元AI播客于2025年8月正式上线, 支持将文本、网页、文档一键转化为自然流畅的双人对谈式音频,它能把原本晦涩难啃的内容,变成一场有逻辑、有节奏的对话。

混元 AI 播客的核心能力,在于实现 “静态文字” 到 “动态音频” 的跨模态生成。无论是输入任意主题,还是粘贴网页链接、上传本地文件,都能快速生成高质量播客内容,支持主题描述、网页URL和文档上传三种模式。

目前微信公众号、腾讯新闻、ima、腾讯文档PDF已经接入该能力,「让用户可以收听到由内容转化成的AI播客」,在财研报解读、新闻速递、知识教育等场景得到广泛应用。

👉🏻体验入口,使用电脑访问腾讯混元官网(https://hunyuan.tencent.com/agent?skill=aiPodcast),点击首页对话框下方“AI播客”即可体验。

图片