智通财经APP获悉,ChatGPT的图像生成功能迎来了历史性的升级。OpenAI正在使ChatGPT中的图像编辑和为包括冗长、易读的文本在内的工作创建视觉效果变得更加容易,这可能会扩大聊天机器人对企业和日常用户的吸引力。
在周二的直播活动中,这家总部位于旧金山的公司展示了ChatGPT用户如何通过与聊天机器人进行一系列对话来优化图像。据该公司称,ChatGPT还将能够更好地创建具有连贯文本的图像,使其更擅长为专业用途提供图表、信息图表和徽标。ChatGPT已经能够大致准确地按照提示词,生成图像中的文本。在演示中,AI成功按照要求生成一整页的讲话文本,同时没有出现错别字。例如,一个人可能会提示聊天机器人生成自定义菜单或地图的逼真图像。该公司表示,它还将能够执行用户关于图像构图的更复杂的指令。
OpenAI越来越多地试图将ChatGPT定位为一款集搜索引擎、语音助手和视频生成器于一体的全能应用。随着最新的改进,OpenAI正在尝试整合更先进的图像功能,这些功能可以适用于个人和专业用途。这也可能帮助ChatGPT保持领先于竞争对手的聊天机器人,比如埃隆·马斯克(Elon Musk)旗下xAI,后者也增加了图像生成器。
然而,与其他人工智能应用一样,ChatGPT在生成图像时可能会编造一些不实内容,例如在图片上包含带有假国家名称的文本。该公司在一篇博客文章中说,这些错误可能会在用户不太详细的提示下发生。OpenAI还表示,其人工智能在创建小尺寸文本和非拉丁字母文本等问题上存在困难。
据该公司的一篇博客文章称,用更新后的功能生成图像也需要一分钟的时间。OpenAI首席执行官萨姆·奥特曼(Sam Altman)在直播过程中表示,因为图像更详细,所以需要更长的时间。
新功能将于周二通过OpenAI的GPT - 4o模型提供,该模型对免费和付费用户开放。该公司表示,将在未来几周内向使用其应用程序编程接口的软件开发人员推出这些新功能。