全网刷屏的Sora,为啥起个日本名

图片

▮Sora测试主视频中,一名亚洲女性走过东京街头 图:OpenAI官网

2月16日,OpenAI公布最新生成视频产品Sora,引发全球激震。Sora能够根据文字或图片瞬间生成一段最长60秒的视频内容,真实性与视觉效果均达到目前类似技术的最高水平。目前,Sora还在测试阶段,没有确定商用或民用的公开日期。OpenAI宣布已联合企业内外专家成立产品“红队”,检测不妥之处与被滥用的可能性。

日本元素多 专家怎么评

Sora公布的几段视频中,东京市中心与郊区的风景引发关注。视频中,人们看到一名戴墨镜的亚洲女性走过霓虹点亮的东京街头,也看到日本上班族在电车上拍摄窗外风景。尽管生成式AI的核心仍是英语,对日语的支持乏善可陈,这款最先进的生成视频软件在测试阶段大量展示了日本风貌,仍旧让日本网友经不住自豪。

图片
▮Sora视频还不能很好地理解物理因果 图:OpenAI官网

Sora在官网上承认,交互是目前系统最大的短板之一,AI还不能完全把握时间的因果关系和物理世界的法则,例如人咬了一口饼干后,饼干的形状会发生怎样的变化。不过,在日本AI学界代表、东京大学教授松尾丰看来,相比过去的文生视频系统,Sora对交互的学习有了质的飞跃,在判断诸如多重的物体走过地面会扬起多大的尘土等方面,已经能够得出符合力学感觉的结果。

图片
▮Sora生成的视频同时出现雪和樱花,道路尽头还出现了不符合规划常识的障碍物  图:OpenAI官网

另一方面,日本国立情报研究所教授越前功在日本电视台17日的一档节目中表示:Sora的技术水平确实令人震惊,但仔细分辨也能在短短几秒内找出很多错误细节。例如,网友都发现了“东京街头”的建筑招牌上写的不是日语,大雪和樱花出现在同一个季节,街景中有完全不符合规划原理的障碍物等等。正如ChatGPT总被调侃“一本正经地胡说八道”,目前所有类型生成AI的巨大短板,就是虽然能创造出精美的内容,却还不能避免对人类而言完全是常识性的错误。

日本AI业,扮猪吃老虎?

OpenAI没有在官网上表明产品名称Sora的由来。不过根据产品发布前日《纽约时报》一篇可信度较高的报道,Sora取自日语词“天空”,团队中两名研究员表示这个词让人联想到“无限的创造潜力”。

图片
▮Sora生成视频描绘电车中拍摄的东京郊外  图:OpenAI官网

无论如何,OpenAI团队似乎从上到下都有一种“日本情结”。Sora公布视频不仅以“东京街头”为题图,还有不少其他关于日本的内容。此外,去年4月,OpenAI的年轻代表奥尔特曼拜访日本首相岸田文雄,成为业界热议的话题。当时许多人不解:日本的IT行业应该已经失去了上世纪八九十年代的荣光,在如今的发达和新兴发达大国里甚至显得滞后,为何迎来“业界大佬”青眼相加?

事实上,不止奥尔特曼,致力于生成式AI的谷歌顶级工程师们也纷纷离开硅谷,来到东京。去年下半年,前谷歌员工Llion Jones发表自主创业声明,他选择的新地标就是东京港区。今年1月,这家名为Sakana AI的初创企业已经得到来自NTT、KDDI、索尼等日本巨头企业的共45亿日元的资金支持。对这些行业领头羊而言,如今的日本能使他们获得超乎想象的资金和政策支持;比起日趋产业化和固化的美国AI业,日本这块“处女地”也让他们看到更多可能性。

图片

▮前谷歌工程师社交平台发布称,自己的企业成为受日本政府支持的7家AI企业之一,技术用于研究基础模型,加强日本AI生态系统。图 X

日本企业也不甘人后。除了政府点名支持的半导体公司Rapidus,17日,彭博社(美)又发表重磅消息称:软银集团负责人孙正义宣布成立一家公司,专为AI提供半导体服务。据悉,他计划从集团内部和中东国家的资方筹集1000亿美元资金,用于完善刚刚收购的英国半导体大厂ARM。日本IT业界闷声不吭,但可能在下一盘大棋。

横扫千军背后的隐忧

Sora对同类产品形成“降维打击”,担忧随之而来。数据显示:Sora发布后,图像视频软件巨头公司Adobe股价暴跌7%,头部图片素材库Shutterstock市值一夜蒸发超7000万美元。既然60秒视频可以一键生成,这些做内容、卖内容的企业自然有“被优化”的危险。换言之,无论打工人是否个别地面临裁员困境,如果相关企业或整个行业都不能存续,员工也“毛将焉附”。

图片

2月16日,Sora发布,Adobe股价暴跌。图:谷歌金融
不过,日本最大担忧仍旧是生成AI相关的违法犯罪问题。除了闹得轰轰烈烈的泰勒·斯威夫特“不雅视频”,日本首相岸田文雄也在去年年底中招,被大阪的一名好事年轻人编排了不堪入目的内容广为传播。这类不良行为比较“新式”,是否违法、如何量刑成为争议焦点。日本防范相关专家京师美佳表示:如今,3秒左右的视频已经能达到85%相似度,此后,模仿名人或家人朋友的电信欺诈将更加严重。
也有声音从另一个角度指出:以Sora为例,如今最先进的生成视频技术仍旧有破绽,它之所以总能骗人,是因为人不愿意仔细分辨,而愿意看到自己想看到的东西,希望自己相信的东西有“证据”。

图片

▮2023年年底,日本著名饮料公司伊藤园启用AI人物拍广告,引发热议 图:伊藤园CM截图
Sora发布当天的16日,本届慕尼黑安全会议召开,OpenAI、微软、抖音等全球最大的20家IT企业发起声明,称将共同管理虚假视频和图片传播带来的不良影响。会议的背景是不实信息对今年美国大选舆论战的影响。然而,随着越来越多领域肉眼可见地卷入这场技术风暴,生成式AI的安全性终将成为一个普遍问题。
-完-