日前,OpenAI方面发布新模型GPT-4o mini,即GPT-4o的更小参数量、简化版本,并称其是“目前功能最强大、成本效益最高的小型模型”。目前GPT-4o mini已向ChatGPT免费用户,以及ChatGPT Plus和Team用户提供,并将于下周向ChatGPT Enterprise用户提供。此外在未来几天内,OpenAI方面还将开放GPT-4o mini微调版本。
据了解,GPT-4o mini支持128K上下文输入以及16K输出、支持50种不同语言、知识库已更新至2023年10月。目前其已支持文本和视觉输入,未来将扩展至音视频。由于与GPT-4o共享改进的分词器,其处理非英语文本的成本效益更高。
值得一提的是OpenAI方面还表示,GPT-4o mini是首个使用其开发的新安全策略(即指令层次结构)的模型。据了解,OpenAI这种安全策略的目的是让AI系统优先执行某些指令(例如来自公司的指令),从而使人们更难让该工具做不该做的事情。但需要注意的是,截至目前OpenAI方面尚未透露GPT-4o mini的具体参数大小,仅表示它大致与其他小型模型,例如Llama 3 8b、Claude Haiku等处于同一水平。
据悉在性能方面,GPT-4o mini的推理能力、数学和编码能力、多模态推理能力等均已超过GPT-3.5,以及Gemini Flash、Claude Haiku等小型模型。其中在数学和编码能力方面,GPT-4o mini在MGSM上的得分为87.0%,高于Gemini Flash的75.5%、Claude Haiku的71.7%,在HumanEval上的得分为87.2%,高于Gemini Flash的71.5%、Claude Haiku的75.9%。
而在价格层面,GPT-4o mini每百万输入tokens为15美分,每百万输出tokens为60美分,成本相比GPT-3.5 Turbo便宜60%以上。对此,OpenAI API 产品负责人Olivier Godement表示,“我们的使命是推动前沿技术的发展,打造最强大、最实用的应用程序,我们当然希望继续开发前沿模型,不断突破极限。但我们也希望拥有最好的小型模型”。
【本文图片来自网络】