伊春园2023入口直达大象

旧版网站入口

站内搜索

11&补尘辫;窜顿189&苍产蝉辫;萧国政、姬东鸿:项目简报-第12期--2017

2017年12月14日10:58来源:

基于本体演化和事件结构的语义网模型研究

——子课题“面向事件的本体结构资源建设”新的阶段性成果

以武汉大学萧国政、姬东鸿为首席专家的国家社会科学基金重大招标项目《基于本体演化和事件结构的语义网模型研究》(项目批准号:11&ZD189),2017年第一季度主要抓了三件事:1、进一步系统梳理和总结现有成果(包括数据等),组织部分力量和精力结集出版和组织发表成果; 2、部分子课题侧重升级和应用拓展;3、在学科交叉、学科前沿和社会服务方面做新的探索。由于本课题涉及学校多、人员多,发挥首席专家和子课题组的共同作用,是本项目扎实推进,保持前沿、高端、重大的主要措施之一。本期简报着重报告第一子课题组旧年的基础和新的进展,以便领导和专家掌握我们的工作状况。

子课题一的目标是:建立涵盖实体(属性、属性值)、事件及其上下位关系的基础本体结构,建立涵盖事件和事件链的语义标注资源,通过在本体结构中增加事件和事件链的描述,丰富本体结构的内涵,为文本的深度语义标注、上下文理解和语义查询及推理奠定基础。前期的研究工作已完成了对“事件”内涵的界定,简单事件结构描写以及外延事件类别描写。近半年来,在首席专家的指导和参与下,该子课题在事件本体建构及其应用研究方面取得的阶段性新成果汇报如下。

在理论探索上,主要有叁个方面的进展:

一是对于事件研究的价值,课题组突破了语句形式的局限,以事件作为语义研究对象和观察视角,对事件元素、事件框架、事件关系、事件本体与篇章事件结构进行分析和本体建构,探索篇章的语义分析、语义理解,以服务于大规模的语义计算。

二是对于事件的性质和特点。研究发现作为语义研究对象的事件,具有以下五个基本特点:1)事件是一种基本语言单位,词、短语、句子各个不同层级的语言单位中都存在事件;2)事件遵循统一的结构规则,同类事件具有统一的内部结构规则;3)事件的跨语法实体的嵌套性和递归性,复杂事件由多个简单事件构成,事件组合构成具有因果、条件、目的等语义关系的递归结构;4)篇章中的事件演化,沿着一定的拓扑结构推进,主要有向心结构、离心结构、叁角形结构、菱形结构和蝶形结构;5)事件具有全息结构。总之,从要素与整体、静态构成和动态组合多个方面对“事件”进行了全方位的理论思考。

叁、对于事件关系和事件运算,发现以事件知识为基本内容的语义分析和语义推理研究,还需要定义一些基本的事件本体公理,而这些描写为运算规则的事件公理可以直接用于事件语义分析和推理。在事件类属关系方面,对事件之间的领属关系和聚合关系进行了逻辑运算规则的描写。在事件链方面,运用逻辑运算规则对事件的原因关系、结果关系、条件关系和时序关系进行了描写。在事件拓扑结构方面,分别对构成离心拓扑结构、向心拓扑结构、叁角形拓扑结构和菱形拓扑结构的事件进行了逻辑运算规则的描写。

在事件语义资源建设上,在定义事件由六元组(即E (B, P, T, Sp, N, S))构成的基础上,基于特定领域的真实文本建立了部分领域的事件本体知识库,目前主要完成了物流、军事、刑事诉讼三个领域的事件本体构建的第一期工作。

以物流领域为例,事件本体知识建构的语言材料主要来源于物流领域的相关文献、标准规定、专业教材和物流专业词典,具体方法是先从文档信息中筛选事件词条,然后通过同义词词林扩展词条,最终得到了一个包含960条词条,95个概念节点的物流事件概念集。以物流活动的相关流程和时空特征为主要线索,对该概念集中的事件概念进行分析归类,得到了六个事件概念类别,分别是:仓储事件、装卸事件、运输事件、审核和货损事件、包装事件、综合事件。同理,以各大军事网站、同义词词林、军事新闻报道为语料来源,构建了总词数为2749个的军事领域事件本体,以中国刑法法典、各种刑事司法参考书、刑事案件新闻报道、中国裁判文书网为语料来源,构建了总词数接近1000的刑事诉讼领域事件本体。

基于事件的理论探索和本体资源建构,是语义网和语言信息处理智能化的重要基础,应用前景广阔,同时对于词典编撰、语言教学系统开发、深度机器学习、智能人机交互以及情报分析等都有着令人期待的应用价值。

(课题组供稿)

(责编:王瑶)