2月16日,OpenAI公布最新生成视频产品Sora,引发全球激震。Sora能够根据文字或图片瞬间生成一段最长60秒的视频内容,真实性与视觉效果均达到目前类似技术的最高水平。目前,Sora还在测试阶段,没有确定商用或民用的公开日期。OpenAI宣布已联合企业内外专家成立产品“红队”,检测不妥之处与被滥用的可能性。
Sora公布的几段视频中,东京市中心与郊区的风景引发关注。视频中,人们看到一名戴墨镜的亚洲女性走过霓虹点亮的东京街头,也看到日本上班族在电车上拍摄窗外风景。尽管生成式AI的核心仍是英语,对日语的支持乏善可陈,这款最先进的生成视频软件在测试阶段大量展示了日本风貌,仍旧让日本网友经不住自豪。
Sora在官网上承认,交互是目前系统最大的短板之一,AI还不能完全把握时间的因果关系和物理世界的法则,例如人咬了一口饼干后,饼干的形状会发生怎样的变化。不过,在日本AI学界代表、东京大学教授松尾丰看来,相比过去的文生视频系统,Sora对交互的学习有了质的飞跃,在判断诸如多重的物体走过地面会扬起多大的尘土等方面,已经能够得出符合力学感觉的结果。
另一方面,日本国立情报研究所教授越前功在日本电视台17日的一档节目中表示:Sora的技术水平确实令人震惊,但仔细分辨也能在短短几秒内找出很多错误细节。例如,网友都发现了“东京街头”的建筑招牌上写的不是日语,大雪和樱花出现在同一个季节,街景中有完全不符合规划原理的障碍物等等。正如ChatGPT总被调侃“一本正经地胡说八道”,目前所有类型生成AI的巨大短板,就是虽然能创造出精美的内容,却还不能避免对人类而言完全是常识性的错误。
日本AI业,扮猪吃老虎?
OpenAI没有在官网上表明产品名称Sora的由来。不过根据产品发布前日《纽约时报》一篇可信度较高的报道,Sora取自日语词“天空”,团队中两名研究员表示这个词让人联想到“无限的创造潜力”。
无论如何,OpenAI团队似乎从上到下都有一种“日本情结”。Sora公布视频不仅以“东京街头”为题图,还有不少其他关于日本的内容。此外,去年4月,OpenAI的年轻代表奥尔特曼拜访日本首相岸田文雄,成为业界热议的话题。当时许多人不解:日本的IT行业应该已经失去了上世纪八九十年代的荣光,在如今的发达和新兴发达大国里甚至显得滞后,为何迎来“业界大佬”青眼相加?
事实上,不止奥尔特曼,致力于生成式AI的谷歌顶级工程师们也纷纷离开硅谷,来到东京。去年下半年,前谷歌员工Llion Jones发表自主创业声明,他选择的新地标就是东京港区。今年1月,这家名为Sakana AI的初创企业已经得到来自NTT、KDDI、索尼等日本巨头企业的共45亿日元的资金支持。对这些行业领头羊而言,如今的日本能使他们获得超乎想象的资金和政策支持;比起日趋产业化和固化的美国AI业,日本这块“处女地”也让他们看到更多可能性。
▮前谷歌工程师社交平台发布称,自己的企业成为受日本政府支持的7家AI企业之一,技术用于研究基础模型,加强日本AI生态系统。图 X
横扫千军背后的隐忧