▋数据资源开发利用
《“数据要素×”三年行动计划(2024—2026 年)》《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》等文件中明确指出,数据已经成为一种关键生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各环节,对于推动数字经济高质量发展具有重要意义。然而,数据要素在市场化配置中的增值路径不清晰、赋能应用不充分,掣肘了数据对经济社会发展的推动作用。
数据本身具有规模报酬递增、低成本复用、协同效率高、价值非耗竭性等特点,为创造多样化的价值增量模式提供了抓手。在新一轮科技革命和产业变革的大背景下,深挖数据价值并推动数据增值可以从以下四个方面入手。
推动海量高质量数据汇聚共享,以规模效应创造价值增量。一是促进高质量大规模公开数据集建设,发挥我国海量数据规模和丰富应用场景优势,以公共部门为牵引,引导科研院所、行业协会、龙头企业、图书馆、国家版本馆等协同联动,逐步推进我国优质图书、期刊文献、行业数据、科学领域数据、脱敏统计数据、地方志等实现规模化汇聚、有组织利用,并基于FAIR原则推动开放共享,提升高质量数据的可用、可信、可流通水平。二是全面推广以云的方式提供数据服务,建设数据云平台或云枢纽,实现跨境、跨区域数据资源的合理调度和标准化弹性供给。三是通过规范的数据汇聚协议和目录体系,突破多模态检索、跨域协同隐私保护等关键技术,扩大面向不同创新主体的优质海量多模态数据供给。上述举措有助于解决我国高质量数据“获取难”“获取贵”的问题,激发市场主体创新活力,同时在规模化背景下实现数据边际效益的价值增量。
推动新型生产要素一体化供给,以协同效应创造价值增量。新一轮人工智能技术浪潮成为推动经济社会发展的新引擎。越来越多领域的发展动能已经由“资本-劳动”转向“智算-数据”,大模型驱动的计算经济被认为正在颠覆传统经济学的核心范式,成为最具想象力的产业爆发增长极,也成为大国博弈角力场。建议参考美国人工智能研究资源试点项目(NAIRR)的做法,通过统一门户实现优质数据、智能算力、模型工具、专业知识、教育培训等多元要素的高效供给,方便用户组合使用。特别是突出高质量数据与计算资源的一体化供应,这将有助于减少关键创新要素间存在的结构性供需矛盾和错配,减少对接成本和中间环节,营造多元触达、相互成就、一站解决的创新生态氛围。
推动重点领域高质量数据供给,以乘数效应创造价值增量。在不同行业或领域,数据要素能够创造的价值增量具有明显的差异性,例如在数据要素×新材料、数据要素×生物制药、数据要素×航空航天、数据要素×高端制造等领域,由于数据资源丰富、组合假设空间和求解空间巨大、可应用场景多元,依靠数据驱动创新的属性和潜力较为明显,可以在更大程度上释放新型生产要素在价值链流转中产生的价值增量,并突破传统资源要素约束条件下的产出极限。因此,在社会资源有限的情况下,应确定数据优先发展领域清单,选择若干方向率先建立大规模高质量领域数据集。可以参考欧盟人工智能创新计划中GenAI4EU的14个重点领域,以场景化需求为牵引,推动作用效益明显的领域率先突破,“以点带面”促进示范带动和规模化落地,服务社会面整体发展势能释放。
推动数据从“粗加工”到“深加工”,以复用效应创造价值增量。从原始混沌大数据到多元创新主体可用数据,要经历数据清洗、数据选择、数据标注、数据生成、数据改进等一系列的复杂工序,有些工序还具有一定的技术门槛。而对于不同创新主体而言,前置性的数据流水线可能存在重复性劳动,如果能够将不同阶段的加工数据开放流通,形成不同类型、不同层次的“数据预制品”,将大幅减少全社会数据使用的总成本,降低数据使用的门槛,有助于促进多场景应用、多主体复用,充分释放数据要素的放大、叠加、倍增作用。需要指出的是,数据从“粗加工”到“深加工”的转变过程,也是数据从资源到资产的转换过程,意味着数据将具有潜在的金融属性并有望产生更大规模的价值增量,对于赋能上海“五个中心”和现代化建设具有巨大价值。
为此,上海应抢抓发展新机遇,借助自身市场主体活跃、配套机制完善、应用场景丰富、数字经济发达的优势,充分释放数据规模集聚、共享协同、倍乘使能、复用放大的积极效应,全面加速数据从要素化到价值化、增值化的发展进程,有助于实现数字经济高质量发展并培育新的增长极。