Sam Altman发布2025年技术愿景，你想OpenAI怎么做？

AIGC开放社区

2024-12-26 07:19发布于北京科技领域创作者

全文1346字，阅读约需4分钟，帮我划重点

划重点

01Sam Altman发布了2025年技术愿景，并在社交平台上征求网友意见，希望OpenAI发布更强功能。

02网友对OpenAI的技术路线和功能优化建议非常感兴趣，评论浏览量破270万。

03其中，Sam基本确定的技术路线包括更强的GPT-4o替换品、更长的上下文窗口和更好的语音聊天轮流检测。

04另外，网友提出了一些很好的建议，如添加家庭账户、可拖放式用户界面和高级语音模式的本地存储功能等。

05最后，Sam表示明年会完善用户的需求，包括添加家庭账户和更好的语音聊天轮流检测功能。

以上内容由腾讯混元大模型生成，仅供参考

SamAltman发布了新的一年技术愿景，并在社交平台上征求网友的意见，希望OpenAI发布哪些技术同时优化哪些功能。

用户对这个非常感兴趣，评论已经超过8300，浏览量破270万，算是Sam今年最高的推文之一了，比前几天的连续12天直播热闹很多。

对于用户的反馈，Sam回复也非常积极，并且还肯定了一些意见非常不错，基本上已经安排上很快就会实现。

下面「AIGC开放社区」就挑选一些Sam基本确定的技术路线，以及比较好的意见。

更强的GPT-4o替换品，GPT/o系列模型/文生图模型Sora可以无缝集成到 ChatGPT中（也就是说要求ChatGPT更强的多模态能力）

50/70美元的计划，中间价位？（最近200美元的Pro太贵了）更长的上下文窗口。当然，终极愿望还是AGI，相信你们会实现的。

Sam非常喜欢这个建议，明年会完善的。

希望可以添加家庭账户。这样可以为我的孩子增加带保护功能的账号，这样可以放心的让他们发挥自己的想象，但又在设定的合理范围之内，同时也能根据他们对ChatGPT的使用，来了解孩子的想法。

非常棒的建议。

更好的语音聊天轮流检测。现在比较烦人的是，我还没安静地思考5秒呢，就会被AI打断。（就是认为语音模式下AI回复太快了，应该更人性化一点停顿时间长一些。）

Sam认为这是一个非常好的建议，未来OpenAI会修复这个问题。

当我使用高级语音模式时，我希望它能更好地记住我之前的对话，即便只是一个 RAG 系统。我喜欢在通勤时进行对话和头脑风暴，但我发现不得不详细重复之前的内容！

这位老哥的问题给Sam干懵圈了，没搞懂他的需求。其实，他的意思是就想让语音模式的ChatGPT能像文本那样，记住他们之前的对话。估计现在语音模式还不具备记忆的能力。这个应该以后也会修复。

可拖放式用户界面，能将多个独立的聊天/模型串联在一起，生成和优化输出。（这简直就是大锅炖，不敢想真实现了能有多香。）

Sam认为，这个想法非常有趣，我们还没认真考虑过呢。

说实话，现在的非思考模式的 GPT-4o有点不行了，甚至mini也不太好。

这个问题确实存在。

发布GPT-4o的图像生成功能。

希望会实现的。

高级语音模式的本地存储功能。我经常遇到这样的情况：我在手机上说了3分钟，然后连接失败，我的整个输入就消失了。

其实他的这个需求和上面那个人差不多，基本都是要求ChatGPT的高级语音模式新增“记忆”功能。

能够在使用语音模式时同时看到文本。有时候阅读回复更快，但仍希望能够以语音方式回应。

看来OpenAI的高级语音模式优化空间相当大，明年肯定会再更新一波吧。

更好的AI Gent功能用于研究城市中的本地事，例如，公共交通、活动、电影时间、景点、门票等。这些通常涉及多步骤的工作流程，以进行研究并获得答案。希望可以一键完成。

我希望能够将 Gmail 和 Google 日历等API 与ChatGPT相结合，这样它就能随时了解我的日程安排和工作内容。（其实谷歌的Gemini模型已经实现了）

新的用户界面类型，例如，思想连接可视化的空间界面、AI和人类共同构建的协作Canvas、根据上下文变化的流动工作空间，以及在应用之间自然传递的AI Agent功能。

关于AI Agent用户关心的也比较多，明年OpenAI肯定会上线一款的，前不久已经公布在研发了。

目前，网友的积极性非常高，估计这周末评论轻松破1万。看来大家对OpenAI还是相当期待的，而这次Sam搞的用户反馈大会也相当成功，2025年OpenAI的主要动力之一便是完善用户的需求。

本文素材来源Sam Altman，如有侵权请联系删除

查看原图 26K