否认放弃预训练之后,已经掉队的百川要怎么向前追?

近期,有媒体报道称,有消息称“AI 六小虎”中已经有两家,逐步放弃预训练模型,缩减预训练算法团队人数,将业务重心转向AI应用。百川智能对外回应称,百川智能的预训练团队稳定,预训练工作正在稳步推进,并不存在放弃预训练一说。

但在多位大模型行业从业者看来,百川智能在大模型预训练领域的进展未达到市场的普遍预期。“已经掉队了”,这在一定程度上已成为业内共识。

据公开报道,截至目前,百川智能已完成A轮融资,公司估值超200亿元。但是聚焦于Baichuan大模型,2023年下半年时,百川智能曾密集发布了多款模型,但是进入到2024年,模型发布节奏显著放缓。最新一代基座大模型Baichuan 4选择打榜国内商业化榜单SuperCLUE,如LMSYS ChatBot Arena、AlpacaEval等有学术背景、相对公正的国际权威榜单上,Baichuan 4却未上榜。

要做好模型预训练,需要在模型、算力、人才资源等多方面实现高效的协同与整合。但据公开资料分析,百川智能的算力供给安全度也引发极大关注。“算力妖股”鸿博股份此前曾于2023年12月末发布公告称,全资子公司英博数科与百川智能签订了近14亿元的算力服务订单,履行期限为2024年1月30日至2027年1月31日,履约跨度为整整三年。

 

但步入2024年,鸿博股份却持续承压,负面消息频传。2024年10月12日,鸿博股份发布公告称,公司全资子公司英博数科与紫光晓通科技有限公司解除了高达4.94亿元的购销合同。作为紫光股份旗下公司,紫光晓通业务就包含了英伟达产品的中国区销售业务。这无疑为鸿博股份的算力租赁业务增加了不确定性。

 

或受此影响,据鸿博股份于6月8日发布的《关于2023年年报的问询函回复的公告》中显示,英博数科与百川智能签订的大订单也进展缓慢,2023年12月签署协议后至2024年6月8日,该合同尚未开始产生收入,预计进展与实际情况存在一定延后,主要原因在于合同涉及的 GPU 服务器设备到货时间较原计划延后,以及设备在到位后需进行上架安装以及联网调试等工作,服务器集群需满足性能标准后才可确认收入。

 

近期鸿博股份的控股股东寓泰控股也被申请破产重整,其股权的司法扣划可能导致鸿博股份的股权结构发生较大变动。这是否影响公司的治理结构仍有待观察。从凭借算力概念横空出世至今,“算力妖股”鸿博股份股价较今年3月份的高点已跌去56.5%,考虑到重大采购合同被解除等情况,鸿博股份及其全资子公司英博数科能否按时为百川智能交付算力服务、交付到何种程度均不明朗。

一个行业共识是,模型预训练是衡量大模型公司技术实力的重要指标,也是最为显著的技术壁垒。“目前,大模型初创中如智谱AI、零一万物、DeepSeek,大厂中如阿里、通义千问都推出了性能领先的模型,从模型预训练角度来看,技术上的差距一旦被拉开,掉队后再追赶难度极大。”有业内人士称。

抛开模型预训练不谈,与专注ToC应用的月之暗面、专注B、G端客户的智谱AI相比,在模型能力落地方面,百川智能的前景也并不明朗。

 

ToC应用方面,百川智能所推出的C端AI助手百小应并未有明显起色,据七麦数据显示,近30日iPhone端日均下载量仅3次,Similarweb数据也显示,Web端9月访问量同比下降3.03%。

“大模型皇冠上的明珠”医疗大模型也并不好摘,需要面临的挑战还很多。中国信通院云大所数字健康部副主任冯天宜曾在接受采访时表示,AI大模型在医疗场景应用,还需兼顾安全性与专业性;另一方面,AI大模型的计算需要大量的算力作为支撑,而医院在算力部署等方面仍存在短板,轻量化、本地化部署的大模型,也是未来需要去挑战完成的。实际数据来看,据腾讯新闻深网不完全统计,2024年前9月智谱中标项目为21个、百川智能仅2个。

据多方信源,由于聚焦国内AI医疗业务落地,该“小虎”也开启了内部裁员,涉及技术、产品、BD等多个组别,“比如API组是裁员重灾区,而百小应等C端产品也裁不少人,百小应沦为摆设。”其他大厂、AI 小虎的HR近段时间迎来不少百川员工“毕业”面试潮。

业内人士分析:在资源没法跟大厂相比的情况下,初创公司聚焦业务是好事,不过,目前技术侧和产业侧亮点不多的百川何去何从?也停在了十字路口。或许再引进一位算法训练负责人也能在一定程度上缓解百川智能预训练技术掉队的情况,但是现在模型竞争已经进入新阶段,只有一位算法负责人还远远不够,大模型本身就是人才密度要求极高的行业,技术分野也更细致,还要引进多位同级别的算法、Infra等维度的人才且一起共创才能让自己模型更有竞争力。“一个算法训练负责人大包大揽的时代已经过了。”

 

近期百川智能公布的50亿融资或许是为数不多的“好消息”。但有知情人士爆料称,所谓50亿融资实际为过去一年多的融资总额,而并非今年新一轮融资所得,不过为了融资额好看,这样的操作可以理解。但模型预训练、应用落地方面都面临质疑与挑战的当下,市场上传的200亿的估值又能否继续找到投资人买单?接下来,我们拭目以待。