左手视觉,右手模型,商汤在智慧城市“掘金”

过去十年,全球人工智能经历了多轮技术和产业的交织演进。从深度学习浪潮的萌芽,到工业应用的落地,再到生成式AI的突破。一批AI企业崛起并经历产业淘洗:有的在热潮退却中折戟,有的却穿越周期,实现商业闭环并成功上市,探索出技术及业务新范式。

商汤科技正是后者。近日,这家备受瞩目的AI企业龙头宣布完成了新一轮组织架构调整,以“1+X”的战略,在新一代AI浪潮中寻求更灵活的资源配置及更长远的经营发展。

所谓“1+X”,“1”即商汤集团核心业务,打造AI云,实现大装置、基础模型和AI应用的无缝集成。在计算机视觉技术(CV)领域,打造通用视觉模型,深耕各个应用场景。 “X”则是商汤集团重组拆分的生态企业矩阵,包括智能汽车“绝影”、家庭机器人“元萝卜”、智慧医疗、智慧零售等。

这一架构的调整引发了行业关注。在商汤科技副总裁张果琲看来,这次的调整是基于对公司战略方向和核心领域的重新定位。他在接受南都湾财社记者专访时指出, “独立运营的公司不会脱离原有的产业生态,恰恰相反,它们将在集团统一的技术基座上相互协同、相互补充。”张果琲坦言,未来每条业务线不必在同一节奏下前行,而是能根据自身行业特征灵活应对,借由大模型、云算力与行业经验产生共鸣,走出各自的发展路径。

这一战略转向,也映射出商汤正在通过战略调整兼顾短期回报与长期探索,作为成熟AI企业打磨可持续盈利能力和强劲增长潜力。

图片

AI 1.0时代——作为发动机的计算机视觉技术

回顾AI 1.0时代,中国AI企业在全球浪潮下奋起直追,人脸识别、图像识别等技术先后跨越工业应用红线,在实践落地中验证感知智能的可行性。

在这一进程中,视觉技术扮演着发动机的角色,为千行百业的数字化升级带来实质驱动力。据IDC研究报告显示,2021年中国计算机视觉市场规模就已经达到百亿元,以两位数增速拓展。

过去十年,商汤正是凭借过人的视觉能力在AI行业崭露头角,并站稳脚跟,直到大放异彩。张果琲回忆:“AI 1.0时代其实就是一个验证期,要看技术能否真正过‘工业红线’。当时商汤和同行们都在聚焦于把算法精度、性能指标拉升至可以在真实场景中承受实战考验的水平。”

在这样的摸索与探路中,商汤逐渐在多个行业及场景的真实生产环节中锤炼算法。在城市管理场景,通过数据采集设备与后端视觉分析平台为城市安全提供实时预警和线索梳理;在金融行业,从人脸识别切入身份验证场景,提高远程开户与交易的安全性与效率;在医疗场景中,一站式智能影像分析平台提供覆盖全身多部位、多病种、多模态数据的全流程AI辅助,全面满足临床诊疗需求……

这一系列深耕,让商汤在B端市场建立起牢固的根基。与C端短期流量爆发不同,B端市场更注重成本与效率、流程优化与风险控制,因而对AI技术的稳定性与持续服务有更高要求。面对深而广的市场,计算机视觉的角色不仅是基础能力提供者,更成为连接数据、算法与应用价值的关键接口。

张果琲在采访中强调:“视觉技术在1.0时代做的是最扎实的基础工作。我们通过无数项目认识到,AI的价值不只在技术指标,更在与产业流程深度耦合、为客户带来实际效益。这些积累为我们在2.0时代的再出发打下了坚实的基础。”

AI 2.0时代——作为压舱石的通用视觉模型

在当前生成式AI浪潮下,商汤无需另起炉灶,而是将已经过千锤百炼的视觉技术底座与大模型范式相融,让B端应用场景迎来加速拓展的新机遇。这也意味着,商汤将延续计算机视觉的优势能力,将其作为压舱石,在AI 2.0时代跌宕起伏的浪潮中行驶得更稳更远。

如今,尽管业界的目光多被面向C端的生成式大模型所吸引,但在产业图景中,B端尤其是智慧城市领域对AI的刚性需求其实从未消减。

根据《中国智慧城市发展白皮书(2023)》的统计数据,截至2022年底,全国已开展智慧城市建设的城市超过500个,相关项目投资累计达数千亿元级别。这也意味着,大量的智慧城市项目,正在等待新一轮AI技术的成熟与应用,实现大规模落地。

AI 2.0时代,智慧城市的建设已不满足于简单的视觉识别,如在城市管理领域,城市管理者期待AI能整合多源信息,从图像、文本、传感器数据中提炼出更全面的语义理解,并作为决策参考。正因如此,多模态大模型的出现满足了智慧城市进一步的诉求:在区域广泛、场景繁杂、需求碎片化的环境下,AI不仅要“看得见”,更要“看得懂”,并根据情境迅速做出反应,快速准确地协调人力资源解决问题。

商汤今年7月针对智慧城市融合多模态进行产品升级,正体现了这一趋势。过去,方舟城市平台主要依托强大的视觉能力,为城市构建了全时段、广覆盖的感知网络。如今,商汤在方舟平台基础上融入多模态能力,升级为「方舟多模态新智平台」。

这一举措,也让原本由视觉能力主导的系统平台,对复杂信息有了更深的理解能力。多模态技术的叠加不仅扩大了方舟平台的应用范围,也使其在处理复杂任务时表现出更强的适应性与弹性。

过去,暴雨过后街道积水,可能有成百上千的市民同时致电12345便民服务热线反馈问题,大量接线员重复地将问题分发给对应的城市管理部门,不仅占用热线资源,城市管理部门还需要花费大量时间和精力处理所有信息。

如今,大模型可以对来电信息进行信息理解,实现智能化分类分拨,减少接线员及执行部门的重复工作。「方舟多模态新智平台」助力12345工单的分类分拨速度提升至原先的10倍以上,在一个月内完成超过30万次的分拨诉求,单个分拨员原本一个月的工作量现在仅需一天即可完成,经二次复核,准确率可高达90%以上。

商汤智慧城市:在蓝海中扬帆远航

随着智慧城市建设的深度与广度不断拓展,此业务板块仍处于快速增量阶段。面对层出不穷的城市智能化需求,方舟新智平台将以更低成本、更广适用性和更高附加价值,为推动产业级AI落地提供坚实支撑。

据中国信息通信研究院预测,未来3-5年内,智慧城市相关产业投资与建设进程仍将稳步推进,新增项目规模和深度持续提升。

对商汤而言,当下正是将积累优势兑现为长远发展潜力的契机。“过去十年沉淀让我们对AI + B端的商业化边界有了清晰认知,”张果琲指出,“当行业从1.0走向2.0,我们不仅有标准化的计算机视觉产品,还有迭代迅速的多模态大模型,加上成熟的To B经验,使得传统AI业务在新的技术范式下实现快速增值。”

值得注意的是,在智慧城市这个巨大蛋糕中,即便有后起之秀入场,商汤依然具备独特优势。智慧城市数量巨大的长尾场景及持续的运营需求必然对算力提出极高的要求。而商汤算力基础设施的超前布局以及长期投入,都使其得以在行业竞争、产业周期起伏中保持稳健步伐。

商汤科技是唯一一个独立于互联网巨头的大型AI云平台,具备从算力基建、大模型、到应用的全栈能力。目前商汤在中国智算服务市场位于TOP3,仅次于字节跳动和阿里云,领先于百度和腾讯。

商汤科技董事长兼CEO徐立曾用“两条腿”来形容企业的发展策略:商汤目前有两条腿,一条腿是传统AI,技术成熟,不断降低成本、拓展市场(包括海外市场),聚焦利润贡献;另一条腿新一代的AI大模型,目标是盈亏平衡,这条腿增长很快,且能看得到未来。前者保证商汤“走得够快”,后者保证“走得够远”。

这并非停留在概念层面的比喻,而是一套实际可行的路径:在大模型商业模式尚需时间验证的当下,传统AI业务所贡献的稳定收益、客户关系和底层数据,让商汤有底气继续向前试探,无需为短期风向仓促转向。

张果琲表示:“大模型为我们带来新想象空间,但没有视觉技术和To B经验的沉淀,我们很难如此从容。”在他看来,视觉技术之于商汤不仅是技术标签,更是穿越技术与产业周期的定力。多模态大模型让传统业务焕发生机,在智慧城市场景中快速适配并为商业化进一步铺路。这种体系,使商汤在技术范式变换中不至于措手不及,也在市场竞争白热化来临前预留腾挪空间。

从宏观视角看,AI行业仍在探索清晰的商业模式与盈收模式。多家咨询机构数据显示,未来几年B端市场对高质量智能服务的需求仍将保持稳健增长态势,智慧城市、工业互联网、金融风控等领域均可为AI企业提供较为稳定的盈利渠道。

于商汤智慧城市而言,在“1+X”新战略的框架中,该如何将过往在计算机视觉领域所沉淀的技术与数据优势转化为可持续的盈利能力?

张果琲表示,视觉技术的业务落地是非常场景化的,原来1.0时代,在每个细分领域都需要很强的投入,回报周期比较长。通过1+X战略,结合AI 2.0能力范式的改变,商汤智慧城市业务聚焦原来视觉技术落地比较深的政府及行业头部客户,同时利用沉淀的技术、数据打造通用视觉模型能力。此外,其他细分市场也会通过赋能的模式,由生态企业在各自细分市场进行开拓,更加充分利用市场的活力和灵活的拓展模式去扩大整体市场规模,达到更好的盈利目标。

具体到实践层面,张果琲认为,可以从两个方面来落实。“首先是利用之前的技术和数据快速落实通用视觉模型能力,将原来场景投入的重模式变成新技术范式下的敏捷模式,用来快速支持各细分场景。其次,可以将计算机视觉领域之前积累的成熟场景通过新技术升级后扩展到海外更多的区域市场。”

可以预见,在这个人工智能大时代中,商汤以通用视觉模型为新引擎,以行业经验为航标,智慧城市与其他传统AI业务将行稳至远,商汤也将在多变的技术及业务图景中继续“支棱”。

采写:南都湾财社记者 严兆鑫