全网刷屏的Sora，为啥起个日本名

动感日本

2024-02-19 18:17发布于美国日本文华传媒株式会社旗下华文报纸《东方新报》

+关注

▮Sora测试主视频中，一名亚洲女性走过东京街头图：OpenAI官网

2月16日，OpenAI公布最新生成视频产品Sora，引发全球激震。Sora能够根据文字或图片瞬间生成一段最长60秒的视频内容，真实性与视觉效果均达到目前类似技术的最高水平。目前，Sora还在测试阶段，没有确定商用或民用的公开日期。OpenAI宣布已联合企业内外专家成立产品“红队”，检测不妥之处与被滥用的可能性。

日本元素多专家怎么评

Sora公布的几段视频中，东京市中心与郊区的风景引发关注。视频中，人们看到一名戴墨镜的亚洲女性走过霓虹点亮的东京街头，也看到日本上班族在电车上拍摄窗外风景。尽管生成式AI的核心仍是英语，对日语的支持乏善可陈，这款最先进的生成视频软件在测试阶段大量展示了日本风貌，仍旧让日本网友经不住自豪。

▮Sora视频还不能很好地理解物理因果图：OpenAI官网

Sora在官网上承认，交互是目前系统最大的短板之一，AI还不能完全把握时间的因果关系和物理世界的法则，例如人咬了一口饼干后，饼干的形状会发生怎样的变化。不过，在日本AI学界代表、东京大学教授松尾丰看来，相比过去的文生视频系统，Sora对交互的学习有了质的飞跃，在判断诸如多重的物体走过地面会扬起多大的尘土等方面，已经能够得出符合力学感觉的结果。

▮Sora生成的视频同时出现雪和樱花，道路尽头还出现了不符合规划常识的障碍物图：OpenAI官网

另一方面，日本国立情报研究所教授越前功在日本电视台17日的一档节目中表示：Sora的技术水平确实令人震惊，但仔细分辨也能在短短几秒内找出很多错误细节。例如，网友都发现了“东京街头”的建筑招牌上写的不是日语，大雪和樱花出现在同一个季节，街景中有完全不符合规划原理的障碍物等等。正如ChatGPT总被调侃“一本正经地胡说八道”，目前所有类型生成AI的巨大短板，就是虽然能创造出精美的内容，却还不能避免对人类而言完全是常识性的错误。

日本AI业，扮猪吃老虎？

OpenAI没有在官网上表明产品名称Sora的由来。不过根据产品发布前日《纽约时报》一篇可信度较高的报道，Sora取自日语词“天空”，团队中两名研究员表示这个词让人联想到“无限的创造潜力”。

▮Sora生成视频描绘电车中拍摄的东京郊外图：OpenAI官网

无论如何，OpenAI团队似乎从上到下都有一种“日本情结”。Sora公布视频不仅以“东京街头”为题图，还有不少其他关于日本的内容。此外，去年4月，OpenAI的年轻代表奥尔特曼拜访日本首相岸田文雄，成为业界热议的话题。当时许多人不解：日本的IT行业应该已经失去了上世纪八九十年代的荣光，在如今的发达和新兴发达大国里甚至显得滞后，为何迎来“业界大佬”青眼相加？

事实上，不止奥尔特曼，致力于生成式AI的谷歌顶级工程师们也纷纷离开硅谷，来到东京。去年下半年，前谷歌员工Llion Jones发表自主创业声明，他选择的新地标就是东京港区。今年1月，这家名为Sakana AI的初创企业已经得到来自NTT、KDDI、索尼等日本巨头企业的共45亿日元的资金支持。对这些行业领头羊而言，如今的日本能使他们获得超乎想象的资金和政策支持；比起日趋产业化和固化的美国AI业，日本这块“处女地”也让他们看到更多可能性。

▮前谷歌工程师社交平台发布称，自己的企业成为受日本政府支持的7家AI企业之一，技术用于研究基础模型，加强日本AI生态系统。图 X

日本企业也不甘人后。除了政府点名支持的半导体公司Rapidus，17日，彭博社（美）又发表重磅消息称：软银集团负责人孙正义宣布成立一家公司，专为AI提供半导体服务。据悉，他计划从集团内部和中东国家的资方筹集1000亿美元资金，用于完善刚刚收购的英国半导体大厂ARM。日本IT业界闷声不吭，但可能在下一盘大棋。

横扫千军背后的隐忧

Sora对同类产品形成“降维打击”，担忧随之而来。数据显示：Sora发布后，图像视频软件巨头公司Adobe股价暴跌7%，头部图片素材库Shutterstock市值一夜蒸发超7000万美元。既然60秒视频可以一键生成，这些做内容、卖内容的企业自然有“被优化”的危险。换言之，无论打工人是否个别地面临裁员困境，如果相关企业或整个行业都不能存续，员工也“毛将焉附”。

▮2月16日，Sora发布，Adobe股价暴跌。图：谷歌金融

不过，日本的最大担忧仍旧是生成AI相关的违法犯罪问题。除了闹得轰轰烈烈的泰勒·斯威夫特“不雅视频”，日本首相岸田文雄也在去年年底中招，被大阪的一名好事年轻人编排了不堪入目的内容广为传播。这类不良行为比较“新式”，是否违法、如何量刑成为争议焦点。日本防范相关专家京师美佳表示：如今，3秒左右的视频已经能达到85%相似度，此后，模仿名人或家人朋友的电信欺诈将更加严重。

也有声音从另一个角度指出：以Sora为例，如今最先进的生成视频技术仍旧有破绽，它之所以总能骗人，是因为人不愿意仔细分辨，而愿意看到自己想看到的东西，希望自己相信的东西有“证据”。

▮2023年年底，日本著名饮料公司伊藤园启用AI人物拍广告，引发热议图：伊藤园CM截图

Sora发布当天的16日，本届慕尼黑安全会议召开，OpenAI、微软、抖音等全球最大的20家IT企业发起声明，称将共同管理虚假视频和图片传播带来的不良影响。会议的背景是不实信息对今年美国大选舆论战的影响。然而，随着越来越多领域肉眼可见地卷入这场技术风暴，生成式AI的安全性终将成为一个普遍问题。

-完-

免责声明：本内容来自腾讯平台创作者，不代表腾讯新闻或腾讯网的观点和立场。