1
《标准语义知识库第3部分:语义集成技术要求》(征求意见稿)编制说明
一、工作简况
(一)任务来源
《标准语义知识库第3部分:语义集成技术要求》是根据《国家标准化管理委员会关于下达2024年第九批推荐性国家标准计划及相关标准外文版计划的通知》制定,项目计划编号为T-469”,计划完成时间为2026年。该计划项目由全国标准数字化标准化工作组(SAC/SWG29)提出并归口。
(二)标准制定背景
在全球化与数字技术深度融合的背景下,工业体系、社会服务和信息交互的范式正经历颠覆性变革。标准作为支撑现代经济高效运行的基础性规则,其制定、应用与迭代模式亟待适应这一变革需求。我国在《国家标准化发展纲要》中明确要求“推动标准化工作向数字化、网络化、智能化转型”。传统标准多以静态文本为载体,依赖人工解读与执行,难以满足数字化时代对动态性、实时性和智能化的需求。随着工业互联网、人工智能和区块链等技术的快速发展,标准数字化(StandardDigitalization)逐渐成为重构标准化体系的核心议题,其本质是通过将标准转化为机器可读、可执行、可交互的数字形态,实现标准与数字技术的深度融合。
国际标准化组织(IS0)和国际电工委员会(IEC)提出SMARTStandardMachineApplicable,ReadableandTransferable)标准的概念模型,以及标准架构模型(StandardizationArchitectureModel,SAM),将标准数字化过程划分为5个层次,即第0层为传统纸质层,第1层为开放数据格式(如PDF)。第2层为机器可读文档,包含标准文本结构化的内容,可利用软件识别文件结构并进行基本处理。第3层为机器可读内容,可根据应用场景选择性地访问赋有语义的标准内容,可利用应用程序界面对标准内容执行较复杂的操作。第4层为机器可解释内容,也称为智能标准,机器能够以更为复杂的方式执行或解析标准内容。由此可见,SMART标准数字化中第2层、第3层以及第4层,直接决定准数字化成败。本质而言,SMART模型中的第2层、第3层以及第4层分别对应语法、语义、语用等不同阶段,第2层机器可读文档对应语法阶段,
2
即结构化,将标准文档拆解为篇、章、节等内容,并转化为XML或JSON文件。第3层机器可读内容对应语义阶段,即知识化,将标准内容通过语义化表达单元模型转化为具有语义关联关系的数据或知识,形成标准语义知识库。第4层机器可解释内容对应语用阶段,即知识应用,将标准知识通过各种数字化技术或模型开展场景应用,如基于知识图谱推理、预测、问答等。由此可见,语义化是打通语法到语用的关键环节,是实现标准数字化与现实场景融合的必经之路。
近年来,各类机构纷纷着手构建自身研究领域或行业领域的语义化表达方式或模型,主要体现为两大类:一是开放领域语义化表达。一般是用于解决科普类、常识类等问题。二是特定领域语义化表达。根据对某个行业或细分领域的深入定制,解决当前行业或细分领域的专业问题。标准内容语义化表达则属于后者,但现阶段针对不同类型标准文献(术语、符号、分类、试验、规范、规程、指南、评价)内容缺少语义化集成的技术要求,未就如何识别标准内容语义化表达的主要内容与单元,合理利用关键技术进行语义集成等形成有效规范。因此,亟需制定相关标准规范标准内容语义集成相关活动的开展。
鉴于此《标准语义知识库》系列标准旨在规范我国标准内容语义化表达工作,提出不同类型标准内容语义化表达单元模型,建立跨行业、跨领域标准的统一语义表达规则,将标准内容转化为具有语义关联关系的知识,解决标准内容分散、语义模糊、应用低效的问题,支持标准知识的智能检索、动态集成与场景化复用。本标准是《标准语义知识库》系列标准的第3部分,目的在于提供统一的应用场景对象与标准语义知识库语义集成的方法。主要内容为应用场景对象语义化表达模型构建与表达规则确定的规划、语义集成实现及集成后处置的要求,加快标准机器可识别、可执行、可决策发展进程,提高发现和应用标准语义知识能力,有效满足数字时代的经济活动和产业发展对标准数据资源以及对标准知识分析的需求。
(三)起草过程
1.2024年7月:《标准语义知识库第3部分:语义集成技术要求》于2024年12月3日计划下达后,由标准牵头单位广东省标准化研究院向社会征集参编单位,并成立起草工作组。
2.2024年8月-2025年4月,前往近11家企事业单位进行调研,开展标准
3
要素与应用场景