在日前举行的一系列新品发布直播活动中,OpenAI方面推出了全新的强化微调(Reinforcement Fine-Tuning)API,使得开发者和机器学习工程师可通过创建经过微调的专家模型,从而更好地处理特定的复杂领域任务集。
据OpenAI首席执行官Sam Altman透露,这一功能的Alpha版本将于2025年一季度公开发布,并且他还表示“强化微调API效果出奇地好,它是我在2024年最大的惊喜之一”。
据介绍,强化微调API支持开发者使用数十到数千个高质量任务来自定义OpenAI的模型,并能够使用其所提供的参考答案来对模型的响应进行评分。对此OpenAI方面指出,这一功能可加强模型对类似问题进行推理的能力,并提高在相关领域特定任务中的准确性。
值得一提的是,基于强化学习算法,强化微调API还可以将模型性能从高中水平提升到专家博士水平,且支持开发者利用自己的数据集创建独特的模型,并将其应用于法律、金融、工程、保险等专业领域。此外这一功能与监督式微调不同,并非是让模型模仿输入,而是教模型以全新的方式进行推理,并且还能通过对模型答案进行评分、强化正确的推理路线,因此只需少量示例就可显著提高模型性能。
对此OpenAI方面表示,强化微调API功能适用于法律、保险、医疗保健、金融和工程等领域,因此也鼓励研究机构、高校和企业,特别是那些目前由专家领导执行一系列狭窄复杂任务,并且将受益于AI协助的机构申请使用这一功能。
据悉,参与者将可提前访问强化微调API的Alpha版本,并能够在特定领域进行测试。同时OpenAI方面强调,参与者将被要求提供反馈、以帮助其改进这一功能,“我们渴望与选择共享其数据集的组织合作,从而帮助改进我们的模型”。
此外有消息显示,近日OpenAI方面正在与微软磋商放弃通用人工智能(AGI)条款,从而释放前者数十亿美元的未来投资潜力。据称,该条款旨在保护OpenAI潜在的先进技术不被滥用于商业目的,并将该技术的所有权授予其非营利公司董事会,如果OpenAI成功开发出AGI,那么微软就将失去对其技术的使用权。
对此有知情人士透露,OpenAI正考虑从其公司结构中删除这一条款,从而使得微软能够在实现AGI后继续投资、并获取相关技术的使用权。
【本文图片来自网络】