划重点
01OpenAI在12天的直播中发布了多个新技术,包括完整版o1和Pro模型、强化微调技术、文生成视频模型Sora Turbo等。
02完整版o1和Pro在数学、代码和博士级科学问题上获得了大幅度提升,可以解决超复杂难题。
03此外,OpenAI还宣布与苹果的iPhone、iPad、Mac和Siri实现深度集成,iPhone 16可以使用ChatGPT的高级视觉功能。
04为此,OpenAI还发布了ChatGPT Canvas协作平台,为用户提供独立的工作页面,提高工作效率。
05最后,OpenAI为感谢用户热情,特别奖励无限使用Sora,消除之前的开放限制。
以上内容由腾讯混元大模型生成,仅供参考
「AIGC开放社区」有幸参与了OpenAI所有凌晨2点的技术直播,下面就为大家整理一下12天的内容。
无论是你普通用户、专业开发者还是吃瓜群众,都能快速了解到最新技术发展趋势——AI正在改变你我的生活、工作方式,重塑这个世界。
第一天:完整版o1、ChatGPT Pro
OpenAI在第一天发布了期待已久的完整版o1和Pro两个模型,还可以使用高级语音和图片上传功能。
与之前预览版相比,完整版o1和Pro在数学、代码和博士级科学问题上获得了大幅度提升可以解决超复杂难题,思考时间也更长但答案更准确。
同时OpenAI还发布了ChatGPT Pro可以无限使用完整版o1和Pro,只是价格有点小贵200美元一个月。
第二天:OpenAI发布强化微调
强化微调是一种全新的模型定制化技术,只需要几十到数千个高质量数据就能定制金融、法律、医疗、科研等不同领域的AI助手。
强化微调能够强化模型对于类似问题的推理方式。例如,在自然语言处理领域,如果模型经常遇到文本分类的任务,通过强化微调,模型可以更好地学习如何从文本内容中提取关键特征来进行分类。当面对新的但相似的文本分类问题时,模型能够按照经过强化的推理路径来处理,而不是像未微调之前采用比较模糊或者不准确的推理方式。
强化微调能够高效提升模型在特定领域任务中的准确性。以机器翻译为例,通过少量高质量的翻译任务数据和对应的标准答案来微调模型,模型就可以更好地理解源语言和目标语言之间的词汇、语法、语义等多种映射关系。
Sam Altman曾评价强化微调是2024年OpenAI最大惊喜之一。
第三天:Sora Turbo
OpenAI在第三天终于发布了雪藏10个月的文生成视频模型——Sora Turbo。
与今年2月15日亮相的早期版本相比,Turbo的生成效率更快,能通过文本直接生成最多20秒1080P视频,这是目前全球生成时长最高的视频模型之一,同时支持文本+图片/视频,生成特定视频内容,使得模型的生成效果更加可控。
ChatGPTPlus和Pro可以免费使用Sora,但是会限制次数使用人数非常多,在当天服务器就崩溃了。
经过10个多月的迭代,平替Sora的产品有很多,但当它真正放出来的那一刻,用户仍保持强烈的热情。
第四天:ChatGPT Canvas
Canvas是一个功能强大的协作平台,为用户开辟了独立的工作页面,在此页面中,用户能够与 ChatGPT 携手合作,共同执行各类任务。
Canvas直接内置在ChatGPT中,提供了一个单独的窗口,主要用于编程、写作任务,会帮你提供意见、审核和执行具体的功能,可以提供更全面的服务。
例如,当你在编写代码时遇到了困难,Canvas可以高亮显示有问题的代码段,帮助ChatGPT提供内联的调试建议快速修复这些错误;当你在写一篇文章,希望对生成内容进行深度调整时就可以通过Canvas实现。
你可以把Canvas看成是ChatGPT内置的AIAgent,用AI来指导AI高效完成任务。
第五天:苹果全面接入ChatGPT
OpenAI宣布与苹果的iPhone、iPad 、Mac和Siri实现深度集成,可以原生使用ChatGPT。
并且iPhone 16可以使用ChatGPT 的高级视觉功能。当用户拍摄照片或选择相册中的图片后,相机控制功能会对图像进行初步分析,提取图像中的关键元素,如人物、物体、场景等信息。然后,将这些信息传递给 ChatGPT 进行进一步的理解和处理。
苹果的入局对于OpenAI以及整个生成式AI赛道的发展都是意义非凡的,已经正式融入到我们的生活中。
第六天:OpenAI发布高级语音、屏幕共享
用户通过高级视频对话功能,可以实时与ChatGPT进行交流,并且可以打断它的叙述进行实时提问。
而屏幕共享,可以实时的将你的屏幕与ChatGPT共享,例如,在处理电子邮件、文档编辑等任务时,可以直接将屏幕内容分享给ChatGPT,并基于这些内容进行深度连续提问。
为了增加圣诞节气氛,OpenAI还特意在ChatGPT中加入了圣诞老人语音模式,你只需要开启语音模式然后说出“ho ho ho”就能开启,这个模式已经可以使用了,圣诞过后会失效。
第七天:OpenAI发布ChatGPT Projects
Projects是一个工具大合集,包含了文件与指令上传、自定义对话、Canvas、网络搜索、对话管理、实时协作等最新实用高效率的产品。
所以,Projects更像是一个高效的协作平台,你可以在一个项目里同时所有高效工具,无论是开发代码、分析文件、搜索新闻都非常方便。
第八天:OpenAI发布ChatGPT Search
OpenAI向全球用户免费开放了ChatGPT Search(搜索),主要功能包括实时搜索,OpenAI对搜索的算法进行了深度优化,可在用户提出问题后获取实时内容,包括股票、新闻等;高级语音,在高级语音模式下,用户可以与ChatGPT进行更自然的多轮搜索对话,更像是一位语音搜索管家;
移动端优化,用户可以在安卓、iOS、平板等移动端更好地使用搜索功能,效率提升40%以上;地图集成,现在ChatGPT集成了全新的地图功能,用户可以直接在搜索结果中查看周边地理位置信息,进行路线规划和地点探索。
OpenAI开放ChatGPT搜索正式向传统搜索巨头谷歌发起挑战,也标志着AI搜索时代的到来。
第九天:OpenAI开放完整版o1模型API,
完整版o1模型的API与之前的预览版本相比,思考成本降低了60%,并且附带高级视觉功能;GPT-4o的音频成本降低60%,而mini版本价格更是暴降了10倍。
此外,OpenAI还增强实时API并支持WebRTC,使开发的AI应用能够自动处理互联网变化,例如,调整比特率和回声消除,为实时语音应用带来更好的性能和稳定性,也极大简化了开发流程。
第十天:ChatGPT新增电话功能——1-800
OpenAI为了降低ChatGPT使用门槛和扩大应用范围,新增了电话功能并有专属号码1-800(242-8478)。
ChatGPT的电话功能兼容性非常强,无论你是老式座机还是翻盖手机都能打通,向其询问各种问题。
同时ChatGPT还与超级应用WhatsApp完成了集成,同样是这个号码可以直接发短信咨询各种内容,使用方法和web、移动版本一样。
在发布当天,ChatGPT的电话号码就被打爆,看来用户对这个新功能还是相当喜欢的。只不过不要乱试,因为前15分钟免费后面是需要收费的。
第十一天:ChatGPT与MacOS原生应用集成
ChatGPT现在可以在 Mac系统上通过高级语音或文本直接与更多编码和笔记应用程序配合使用。
例如,在与Warp控制台和XcodeIDE的交互中,ChatGPT能够迅速判断用户的意图,无论是分析代码库的提交数据,还是解决复杂的编码逻辑问题,都能高效地自动解决这些难题节省大量开发时间。
其实这个功能算是OpenAI在AI Agent领域的一次尝试,希望借助智能自动化的方式帮助用户提升使用体验。
第十二天:发布新模型——o3
其实在发布的前一天不少人都在猜测OpenAI可能会发布新的文生图模型DALL·E 4,直到前一天的下午,Sam Altman才给出了提示“oh oh oh”,原来是全新模型——o3。
其实,o3现在的热度也非常高,主要原因是这是第一个在ARC AGI的测试中,超过人类评测分数的模型达到了87.5%。也就是说,AGI通用人工能再不是梦想,o3已经是开启这扇大门的钥匙。
而o3在美国AIME数学竞赛中的评测分数也非常恐怖达到了96.7分,超过了目前所有模型,相当于顶级数学家。
只不过o3现在处于邀请测试阶段,并且传言费用非常高,回答一个问题可能在几十美元到数百美元。但OpenAI已经明确表示,当o3正式全面公测时,一定会降低使用成本。
o3作为o1模型的迭代版本本来应该叫“o2”,但与英国著名电信公司重名,无奈只能直接叫o3了。
第十三天:特别奖励,无限使用Sora
上周日,Sam Altman被最后一天的o3热情彻底点燃觉得不过瘾,还加了特别的13天——无限使用Sora,消除了之前的开放限制。
他表示,由于12月下旬圣诞节来临的时候,人们都会放长假,OpenAI的GPU负载会稍微减轻一些。因此,将为所有Plus用户提供假日期间获得无限制的Sora访问权限。
上面就是12天所有直播内容啦,希望对大家有所帮助。未来,「AIGC开放社区」会持续为大家输出最新、准确的技术分享,我们一起结伴同行,见证每一个AI的历史性时刻。
本文素材来源OpenAI,如有侵权请联系删除