新华社半月谈: 国家数据基础设施为何重要?
党的二十届三中全会审议通过的《中共中央关于进一步全面深化改革、推进中国式现代化的决定》提出,建设和运营国家数据基础设施,促进数据共享。什么是数据基础设施?建设和运营国家数据基础设施为何重要?未来建设重点在哪里?
在演员身上安装定位设备,记录演员表演的动作数据 毛思倩 摄
怎样理解数据基础设施?
数据,看不见、摸不着,但每个人早已身处数据海洋之中。一旦我们的生产生活与电子设备、与网络相连,我们的日常点滴就都数据化了。随着大数据、云计算、人工智能等数字技术的迅猛发展,数据要素成了推动经济社会高质量发展的新引擎。
以医疗数据为例,如果用于诊断,可以帮助医生治疗疾病;如果用于药企生产,可以作为新药研发的重要参数;如果用于保险行业,则可以方便企业定制个性化保险产品。
可见,数据的价值必须在应用场景中才能实现,这就需要数据流动起来。有机构预测,数据流动量每增加10%,将带动GDP增长0.2个百分点。
正如生鲜食品的流通离不开冷链,数据流通也离不开基础设施。细分来看,数据基础设施可分为网络设施、算力设施、流通设施等。以5G、光纤、卫星互联网等为代表的网络设施为数据提供高速泛在的连接能力,以通用算力、智算算力、超算算力为代表的算力设施为数据提供高效敏捷的处理能力,以区块链、数据空间、高速数据网为代表的数据流通设施打通数据共享流通堵点,以隐私计算、联邦学习等为代表的数据安全设施保障数据安全。
在网络、算力、流通等设施的支持下,数据基础设施面向社会提供一体化数据汇聚、处理、流通、应用、运营、安全保障服务,实现数据要素化、资源化、价值化。
需要注意的是,数据基础设施建设既包括平台、系统等“硬”的设施建设,也包括标准规范、体制机制等“软”的制度设计,还包括隐私保护、数据标识登记等技术创新的应用。
为何要建国家数据基础设施?
2023年,我国数据生产总量超过32ZB。这表明我国已是全球数据大国,让流动的数据创造更多价值是未来的工作方向。
近年来,我国数据要素市场蓬勃发展。2023全球数商大会发布的《2023年中国数据交易市场研究分析报告》显示,2022年中国数据交易行业市场规模为876.8亿元,占全球数据市场交易规模的13.4%,占亚洲数据市场交易规模的66.5%。
数据要素要“用得好”,必须“供得出”“流得动”“保安全”。目前,互联网上绝大部分数据都保存在相关机构的后台数据库中。建设国家数据基础设施,有利于构建“数据来源可确认、使用范围可界定、流通过程可追溯、安全风险可防范”的数据可信流通体系。
数据是把双刃剑,关键要看怎么用。既要促进数据流通使用,提高资源配置效率,培育新产业新业态,也要防范隐私泄露、数据滥用等潜在风险,实现更高效率、更加安全的发展,这让国家数据基础设施的重要性愈发凸显。
建设和运营国家数据基础设施,是数字中国建设的关键环节,也是实现高水平科技自立自强的战略抓手,将有效推进数据资产的全生命周期管理,带动数据要素的权属界定、价值评估、统计入表、交易流通、使用利用、收益分配、风险防控、安全管理等一系列制度建设,最终实现数据要素可用、可信、可流通、可追溯。
工作人员在东数西算(贵州)智算中心内巡检 刘续 摄
下一步建设重点是什么?
国家数据局数字科技和基础设施建设司司长杜巍表示,近年来,各地方、行业、领域在数据基础设施建设方面开展了积极探索,形成了隐私计算、数据空间、区块链、数联网等多种技术解决方案,为数据基础设施一体化建设奠定了很好的基础。
今年5月,山东算网平台正式启用。该平台可以把山东全省算力服务商和算力用户聚拢在一起,为千行百业、千家万户提供算力服务,目前已集成1500多种应用软件,有1000多种应用场景。
从“东数西算”工程启动实施,到构建全国一体化算力网,国家数据基础设施建设加快推进。
2022年2月,我国在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等地区启动建设国家算力枢纽节点,并规划了10个国家数据中心集群,正式启动“东数西算”工程。国家数据局提供的数据显示,截至今年3月底,10个国家数据中心集群算力总规模超过146万标准机架,整体上架率为62.72%。
目前,东西部枢纽节点间网络时延已基本满足20毫秒要求,全国算力资源正逐步盘活。
“当前,我们聚焦数据流通利用环节,围绕重要行业领域和典型应用场景,在统一目录标识、统一身份登记、统一接口要求,即统一基础设施底座的基础上,部署开展隐私计算、数据空间、区块链、数联网等多项技术路线试点,自上而下谋划数据流通利用基础设施工程项目。我们还支持地方城市先行先试,以真实场景牵引技术进步,丰富解决方案供给,促进数据跨部门、跨层级、跨区域、跨主体的高效可信流通利用。”杜巍说。
近期,国家数据局正在组织编制《数据基础设施建设指引》,以进一步明晰数据基础设施的概念、发展愿景和建设目标,凝聚社会共识,明确建设方向,推动构建协同联动、规模流通、高效利用、规范可信的数据基础设施服务体系。