OpenAI推出强化微调API，或将会放弃AGI条款

三易生活

2024-12-08 17:32发布于湖北三易生活官方账号

在日前举行的一系列新品发布直播活动中，OpenAI方面推出了全新的强化微调（Reinforcement Fine-Tuning）API，使得开发者和机器学习工程师可通过创建经过微调的专家模型，从而更好地处理特定的复杂领域任务集。

据OpenAI首席执行官Sam Altman透露，这一功能的Alpha版本将于2025年一季度公开发布，并且他还表示“强化微调API效果出奇地好，它是我在2024年最大的惊喜之一”。

据介绍，强化微调API支持开发者使用数十到数千个高质量任务来自定义OpenAI的模型，并能够使用其所提供的参考答案来对模型的响应进行评分。对此OpenAI方面指出，这一功能可加强模型对类似问题进行推理的能力，并提高在相关领域特定任务中的准确性。

值得一提的是，基于强化学习算法，强化微调API还可以将模型性能从高中水平提升到专家博士水平，且支持开发者利用自己的数据集创建独特的模型，并将其应用于法律、金融、工程、保险等专业领域。此外这一功能与监督式微调不同，并非是让模型模仿输入，而是教模型以全新的方式进行推理，并且还能通过对模型答案进行评分、强化正确的推理路线，因此只需少量示例就可显著提高模型性能。

对此OpenAI方面表示，强化微调API功能适用于法律、保险、医疗保健、金融和工程等领域，因此也鼓励研究机构、高校和企业，特别是那些目前由专家领导执行一系列狭窄复杂任务，并且将受益于AI协助的机构申请使用这一功能。

据悉，参与者将可提前访问强化微调API的Alpha版本，并能够在特定领域进行测试。同时OpenAI方面强调，参与者将被要求提供反馈、以帮助其改进这一功能，“我们渴望与选择共享其数据集的组织合作，从而帮助改进我们的模型”。

此外有消息显示，近日OpenAI方面正在与微软磋商放弃通用人工智能（AGI）条款，从而释放前者数十亿美元的未来投资潜力。据称，该条款旨在保护OpenAI潜在的先进技术不被滥用于商业目的，并将该技术的所有权授予其非营利公司董事会，如果OpenAI成功开发出AGI，那么微软就将失去对其技术的使用权。

对此有知情人士透露，OpenAI正考虑从其公司结构中删除这一条款，从而使得微软能够在实现AGI后继续投资、并获取相关技术的使用权。

【本文图片来自网络】

查看原图 22K