AI摘要:4月28日,在第九届数字中国建设峰会“数字福建”分论坛上,张向宏称规模化构建高质量数据集是释放数据价值的关键,提出“数据工厂”新型生产业态,建议国家或区域层面部署数据工厂应与数据基础设施紧密结合,形成体系化支撑。
(AI摘要及本文部分素材由福建省智能媒体资源库省级平台提供“智媒+”支持,福建报业集团智能审校平台提供审校技术支持)
海峡网讯(记者 王挺)在4月28日举行的第九届数字中国建设峰会“数字福建”分论坛上,北京交通大学信息管理与技术国际研究中心教授张向宏发表了题为《建设“数据工厂”,推动数据价值释放》的主旨演讲。

张向宏发表主旨演讲。海峡网记者 王挺 摄
他指出,面向人工智能的数据产业链已经初步形成,而规模化构建高质量数据集,正是当前数据价值释放与行业应用落地的关键突破口。
张向宏回顾,自国家数据局成立以来,已在数据确权、流通、交易等方面形成了一套行之有效的工具箱和方法论。然而,数据资源的开发利用却长期缺乏像云计算那样成熟的商业化模式。“经过一年多的研究,我们发现,这个瓶颈正在被打破。”张向宏表示,数据要素化的最终出口已经明确,那就是人工智能在千行百业的应用。一条由“原始数据——基础大模型——高质量数据集——智能体与垂直模型——行业应用”构成的产业链闭环,正成为主流的商业化实践路径。
尽管基础大模型技术迭代迅速,但张向宏认为,当前人工智能的应用多停留在“玩”的阶段,距离个人生活、企业经营和政府服务的深度赋能仍有巨大差距。究其根源,在于缺乏高能量的、经过精细化处理的高质量数据集。“到了基础大模型微调和对齐的阶段,人工智能的前进脚步就停下了,因为让模型能真正‘扣准、答对’的那批少量但精准的专有数据,太稀缺了。”
对此,张向宏提出了“数据工厂”这一新型生产业态。他将数据工厂类比为农业社会的农场、工业社会的工厂,是数字时代规模化生产“高能量数据”的核心载体,也是国家数据基础设施的重要组成部分。其内部形态包含集中式、半集中式和分布式,并具备多样化、设施化、规模化、标准化和柔性化等特点。
“没有数据,工厂就是无源之水。”张向宏指出,数据工厂由储备条件、生产车间和中试条件构成,涵盖数据清洗、合成、增强、标注、质检等一系列工艺,最终产出可直接用于垂直大模型对齐和推理的产品。他特别提到,数据标注企业的升级、算力中心向数据工厂的架构转型、人工智能企业向前端数据生产延伸,以及创新型技术企业的崛起,是当前数据工厂落地的几种主流模式。
最后,张向宏建议,在国家或区域层面部署数据工厂,应与数据基础设施紧密结合。在底层建设公共数据工厂,在重要行业建设行业公共数据工厂,并在流通利用设施中布局专属数据工厂,从而形成体系化支撑。
责任编辑:赵睿
- 魏亮:数据基础设施建设进入价值共创关键阶段2026-04-29
- 单志广:数据要素价值化亟待构建三维空间产权理论2026-04-29
- “模数共振”行动在榕启动 AI赋能新型工业化迈入新阶段2026-04-29
- 一图带你抢先看!数字峰会这些亮点不容错过2026-04-28
- 数字峰会现场体验区今起开放2026-04-28
- 第九届数字中国建设峰会“数字福建”分论坛在福州举行2026-04-28
- 数字峰会即将开幕 交警发布出行攻略2026-04-28
- 数字峰会福州新区(长乐区)分会场准备就绪2026-04-28
- 数字峰会开幕在即,海峡会展中心周边交通有变!周边居民、观展市民必看→2026-04-28
- 乘“数”而上 向“智”而行——写在第九届数字中国建设峰会即将举办之际2026-04-28
- 最新福州新闻 频道推荐
-
单志广:数据要素价值化亟待构建三维空间产权2026-04-29
- 进入图片频道最新图文
- 进入视频频道最新视频
- 一周热点新闻


已有0人发表了评论