OpenAI推出Flex处理模式 牺牲响应速度和稳定性换API费用减半

【太平洋科技快讯】4月18日,OpenAI 宣布推出一项名为“Flex 处理模式”的全新 API 服务。该服务旨在降低模型使用成本,以吸引更多开发者。

图片

Flex 处理模式的核心在于,用户可以通过接受响应速度变慢和资源偶尔无法分配的代价,来换取更优惠的模型使用价格。OpenAI 表示,该模式主要针对那些对实时性要求不高的任务,例如模型评估、数据扩充和异步处理等非生产任务。

目前,Flex 处理模式已对新近发布的 o3 和 o4-mini 推理模型开放测试。采用该模式,API 费用将直接减半。以 o3 为例,Flex 模式下的费用为每百万输入 tokens 收取 5 美元(约合人民币:36.5 元),每百万输出 tokens 收取 20 美元(约合人民币:146 元)。而标准价格分别为 10 美元和 40 美元。对于 o4-mini,Flex 模式的费用则从每百万输入 tokens 收取 1.10 美元、每百万输出 tokens 收取 4.40 美元,降至每百万输入 tokens 收取 0.55 美元(约合人民币:4 元)和每百万输出 tokens 收取 2.20 美元(约合人民币:16.1 元)。

OpenAI 还在通知邮件中提到,为了获取 o3 的访问权限,处于消费层级第 1 至第 3 层的开发者必须完成新上线的身份验证流程。此外,o3 及其他模型的推理摘要功能和流式 API 服务也需完成身份验证后才能启用。OpenAI 表示,引入身份验证机制的目的是为了防止用户违反公司制定的使用政策。