亚马逊云科技代闻:不会有一个大模型能够“包打天下”

只有客户有需求了,我们才会去进行相应开发,不会闭门造车。

就像客户往往只会说需要更快、更便宜的GPU,却不会讲其实需要像ASIC(定制芯片)这样更具体的东西,那我们就会通过创新办法来解决这类隐藏需求。

在亚马逊云科技2024 re:Invent中国行上海站上,亚马逊云科技大中华区解决方案架构总经理代闻接受了媒体采访,阐述在大模型创新、降低大模型应用门槛和推动AI普惠化方面的最新进展。

他表示,亚马逊云科技投身生成式AI领域,不单单提供基础的开箱即用组建,而是根据不同企业用户的需求,为其量身定制合适的工具。

‘普惠’这个形容词,更应该是关注用户的需求在哪里。

12月4日,亚马逊宣布推出新一代基础模型Amazon Nova,包括超快速文本生成模型Amazon Nova Micro,以及能够处理文本、图像和视频并生成文本的多模态模型Amazon Nova Lite、Amazon Nova Pro和Amazon Nova Premier。

而Amazon Nova最大的特点是性价比高。数据显示,Amazon Nova的每百万token的输入价格低至0.0175美元,输出价格低至0.07美元‌‌,成本比Amazon Bedrock中表现最佳的模型至少便宜75%。

对于这个数字,代闻表示,这是一个综合评估得出的数值,能做到成本降低,主要还是因为这样的大模型诞生,是由用户业务侧反向推动产生需求的结果。比如Amazon Nova中的Micro模型,就是一个专门用于文本到文本转换的模型;Amazon Nova Lite则是一个专门处理图像、视频和文本的多模态模型。

通过让不同大模型应对不同场景,才能在保证其使用效率的同时降低成本。

我们会去思考,如果某个应用场景中已有大模型表现不错了,那我们新推出这个模型的增值点,或者说能够服务客户的点在哪里呢?

我们察觉到,有些客户确实只需要一个纯文本的模型,那在这种模型的打造上,我们就要去想办法实现更极致的性价比以及更低的延迟。

在代闻看来,当下大家追求的无非就是性能要好、延迟要低、价格要便宜,但在目前的状况下,这几方面肯定是要有一定取舍的。而Amazon Nova里的Micro模型瞄准的就是文本到文本转换这样的场景。

其实就像不存在一个模型能包揽所有方面一样,这话也适用于Amazon Nova系列,我们也不认为Amazon Nova能够解决所有问题。

所以Amazon Nova在诞生之时,其不同模型的能力和价格定位,实际上是针对实际用户在不同场景下的需求呼声,进而打造出的不同定位的模型。

不只是Amazon Nova,当前追逐大模型性价比已经成为一种趋势。不久前,字节跳动正式发布豆包视觉理解模型,据介绍,豆包视觉理解模型千tokens输入价格仅为3厘。

大模型使用性价比的提升,意味着使用门槛的降低,但是否已经进入普惠时代?

代闻认为,“普惠”只是个形容词,相较于此,大模型更应该关注用户需求在哪里,以及企业里业务人员、开发人员的需求所在现在,在各个应用中,应用生成式AI的能力已经变得无可避免了。

代闻告诉记者,如果要探讨普惠这件事,现在很多人在进行信息检索以及人机接口交互等方面,都已经在借助大模型了,包括很多APP等也都如此。这就带来了从面向消费者(ToC)到面向企业(ToB)领域中,对于整个应用程序的重构,这种重构会涉及能否开箱即用、开发人员能否更好地利用大模型为自己的应用程序赋能,以及底层平台能否具备更好的性价比等问题。

事实上,经过近两年发展,大模型的使用方向已经没有争议,大家都在不断拓展各种各样的用户场景。比如知识库、客户服务场景等,在实现了相应功能后,人们就会去考量能否以更低的成本、更好的延迟来满足需求。

当相关需求变成一种常态需求,应用软件、平台软件也变成企业内部常规的IT需求后,性价比问题就凸显出来了。

代闻回顾亚马逊云科技的创新历程,其实每次创新都是为了给用户提供更好的投资回报率(ROI),也就是性价比,有时是针对单个产品,有时是着眼整个总体拥有成本(TCO)。

实际上云服务本身,从最开始的基础计算,到后来的无服务器计算,再到大数据,直至现在的生成式AI模型、工程平台提供,核心逻辑都是怎样服务好客户,而性价比或者说整个TCO的优化,一直是我们不断追求的重要方面。