(一)研究计划总体执行情况及各子课题进展情况
本项目旨在探讨面向事件结构基于本体动力学的语义网模型,通过事件和事件链的标注,奠定计算机进行文本理解和查询推理的基础,并通过本体演化实现领域本体结构的构建,从而实现对文本内容的语义理解。根据项目内容和预期目标,该项目分为五个子课题协同推进,分别是:面向事件的本体结构资源建设、面向事件的语义网表示和推理机制、基于知识发现的本体演化机制研究、事件语义的自动标注研究和基于事件的语义查询与推理研究。
项目开展以来,项目组整合了武汉大学、中南财经政法大学和武汉科技大学等多所大学和单位的多学科研究力量及相关学院的资源,分子课题或集中研讨,协同推进,现各子课题基本完成预期时间节点任务要求,确保了整个项目正常推进。
子课题一为面向事件的本体结构资源建设,旨在建立涵盖实体、属性、性质、事件及其上下位关系的基础本体结构,建立涵盖事件和事件链的语义标注资源,为文本的深度语义标注、上下文理解和语义查询及推理奠定基础。
本体结构方面,我们用近年新创的“词群-词位变体理论”和“基元结构理论”构建了移动类事件和言说类事件的局域系统,其创新点是:事件触发词具有伸缩性的类系统,同类事件的本体结构可通过本体自动创建,为篇章事件的理解标注和机器自学习,提供了新的语言资源。
事件资源方面,在总结和研究多学科相关成果的基础上,根据语言信息处理和人工智能的需要,把事件定位为话题结构的语义及其结构。结合语言的功能和信息特点,构建了适用于语言信息处理的事件理论系统。现阶段我们集中对叙述类和描述类事件篇章的事件链进行标注。
目前我们确定了语料标注的具体步骤,包括语料的选择、语料的预处理、词汇链标注、事件及事件链标注,并对数据进行了部分标注。事件结构表示为谓词及其论元结构,为篇章事件链的标注奠定了基础。与以往的事件结构研究只是局限在句法层面所不同的是,本项目提出,篇章的基本构成单位是事件,每个事件内部存在一个语义结构,同时,篇章内部事件之间也存在相互关系,这些事件本体之间的相互关系构成了篇章语义关系的雏形---事件链。篇章的语义分析通过实践和事件链的分析实现。
在事件链标注中,从篇章中的词汇链入手,根据这些词汇链所覆盖的最长名词短语所触发的谓词形成的链条来确定篇章的语义结构。本子课题的创新之处在于引进词汇链上词汇所在的最长名词短语(狈笔链),保证了词汇链上名词短语的中心词、名词短语的修饰语甚至谓词都能跟事件触发词通过狈笔链取得联系,确定与不同语法位置的体词紧密联系的谓词。在词汇链标注环节,严格按照同形、同指、同义叁原则,以跨句两次及以上的重复为判别标准;在从词汇链到狈笔链标注环节,按照句法关系将词汇链上词汇扩展到其所在名词短语的最大投射;从狈笔链到事件链环节,事件触发词是其自身与直接论元所在狈笔链在当句中覆盖词汇链最多的那一个谓词,通过比较计算词汇链词汇数量的方式推导出事件触发词。标注的各个环节尽可能确保客观操作性和可重复性,由此提取出来的主干事件链既直接反映篇章连贯,又以精简形式概括了文章主旨。
子课题二为面向事件的语义网表示和推理机制,此课题旨在研究大规模的事件语义描述及其推理模型和引入统计推理,以支持面向事件的语义查询和实时自然语言查询,并从逻辑基础的角度来验证这种表示机制的可满足性和可判定性。目前,对于事件表示机制,我们分析了事件表示机制时间、角色等基础属性,在综合分析RDF、OWL等语言表示机制的基础上,探讨了一种基于Named Graph的事件语义表示机制,它以RDF表示语言为基础,扩展其Endpoint机制,支持基于图的语言表示,符合事件表示的需求。另外,在现有SPARQL语言基于Pattern Tree的代数表示语言的基础上,设计了一种支持事件语义的SPARQL Algebra,并在Raptor SPARQL查询语言实现机制的基础上,实现了相应的原型。在事件语义方面,主要完成了三个方面的研究:①设计了支持事件的中文开放医学链接数据,将其中的重要事件如手术、病状变化、用药等采用事件语义进行表示,并在此基础上与武汉协和医院、中南医院进行广泛合作,开展了抗菌药物合理用药监管的研究。②针对设备管理中存在知识管理方式不足的问题,设计了一种基于事件语义的新型设备知识管理、绩效评价等机制。目前已经实现了相应的原型系统,并在整理设备管理相关开放链接数据库。③针对消防信息系统中信息异构、多样性的特点,以事件语义表示机制为基础,设计了消防开放链接数据,采用事件语义表示其中的状态变化等方面的问题。目前已经完成了一个具体项目的研发(武汉钢铁集团消防综合信息管理系统和指挥决策系统),在开放链接数据方面,已经完成了消防总体开放链接库的设计,并完成了目前国内所有危化品知识库的设计。
本子课题在以下方面有所创新:1)从逻辑的角度对事件语义进行了形式化的定义,将事件定义为一个具有时间、角色等多种属性的元素,并具体采用Named Graph描述事件语义;从查询的角度,定义了事件查询的算子;2)首次从事件的角度描述手术、病情变化等用常规方法无法准确描述的医学信息资源。并以此为基础进行了临床应用尝试;3)建立了医学、消域等专业领域的中文开放链接数据,丰富了中文开放链接数据库的内容,并为相关应用奠定基础。
子课题叁为基于知识发现的本体演化机制研究,旨在研究在大规模文本的作用下,基础本体到领域本体以及领域本体间的演化机制。这方面的主要进展在于:1)设计并开发了从文本中抽取关键词和概念的机制,能自动发现特定领域中涌现的新概念;2)设计并开发了概念属性及属性值的发现机制,能确定新概念的属性及属性值;3)自动发现领域文本中的事件触发词及其论元。这些工作的创新性在于:第一,利用无指导的方法发现新关键词和概念;第二,利用复杂网络的办法发现新的社团,其中包含事件触发词和可能的论元。下一步的工作集中在基于复杂网络技术探讨本体结构的演化规律,以及结合描述复杂性理论探讨领域本体的收敛性问题。
子课题四为事件语义的自动标注研究,本课题旨在基于人工标注的一定数量语料实例和概念本体的基础上,遵照人工标注事件语义规范,利用机器学习方法,进行事件结构学习和事件关系抽取,为未标注Web页面自动进行事件语义标注,并在事件语义自动标注软件的帮助下,获得更多的标注了事件语义的语料实例,扩展事件本体资源的规模。目前,我们探讨了原子事件语义角色,形成了包括3个主体语义角色、4个客体语义角色、2个时空语义角色、5个附加语义角色以及否定、模态、时态等事件语义算子在内的事件语义角色规范;深入了解了成篇七原则中的衔接与连贯,探讨了(原子)事件语义关系,形成了包括3个平行类型、4个偏正类型在内的事件语义关系规范;设计并实现了人工辅助事件语义标注工具,针对NTCIR-9 RITE任务的语料,进行了人工事件语义标注,对人工标注过程中的问题进行了深入讨论;设计并实现了新闻门户网站(网易)的网络爬虫,通过预处理模块获取所爬取的网页内容。
本子课题的创新之处在于:1)基于新闻文本统计特征以及语言规则,抽取原子事件,获取新闻文本分析与理解的焦点;2)对事件语义结构与事件语义关系规范的探讨,可以促进新闻文本事件语义结构自动标注与事件语义关系标注,有助于新闻文本语义理解;3)将事件语义自动标注与医疗文本信息结合,利用事件语义自动标注方法,对药物说明书与电子病历文本进行基于事件语义的计算与理解。
子课题五为基于事件的语义查询与推理研究,本项目旨在建立一种基于事件的推理模型,以及一种基于事件推理的语义查询与推理系统。按照预期目标,已经完成以下研究:①推理的形式化表示和推理中涉及的事件关系,即互释(复述)关系和推导关系的研究,以及事件之间逻辑关系的研究。②事件图的构建,从词汇资源、推理资源和在线知识库中抽取事件,其中的事件构成节点,事件间的推理关系构成边。③完成了基于事件的蕴涵识别算法,利用顿颈箩办蝉迟谤补算法构建推理算法,并提出了蕴涵置信度评估方法。④完成了基于事件链的推理算法。对事件链中的逻辑关系进行分类,并利用启发式规则实现逻辑关系的自动判断,推理过程采用启发式规则进行识别。⑤在评测平台方面,完成了搁罢贰、狈罢颁滨搁评测数据收集分析,并对评测工作现状进行分析,完成了原型系统设计、错误分析和系统改进。在此基础上,课题成员参与了狈罢颁滨搁-10组织的的中文文本推理任务,系统效果在参赛队伍中名列前茅。
本子课题的创新性在于提出了基于事件图模型的蕴涵识别方法,该方法能一定程度刻画深度语义,能够识别面向语篇的蕴涵关系,有助于提高语义查询系统的性能。
(二)调研及学术交流情况
项目初期,项目组广泛查阅了相关课题国内外研究现状,从语义网知识表示、本体演化、语义查询与推理等方面对前人研究成果进行了归纳综述,总结了前人成果存在的语义理解深度不够、无法处理大规模实时性语义推理以及依靠领域专家手工建构等方面的问题,以此为依据来谋划布局本项目的研究目标和实施方案。
项目实施以来,为了帮助和实现项目的研究在国内外学科前沿高水平展开,除了团队内部的例行讨论,我们还注重与国内外着名专家学者的火花碰撞,先后邀请了多位国内外知名教授和语义网领域专家前来讲座交流,深入探讨语言哲学、语言认知等语言学宏观问题以及语言信息处理等技术前沿问题。
2012年9月,荷兰阿姆斯特丹自由大学计算机系高级研究员、欧盟第七框架重大项目LarKC中推理组重要成员黄智生教授,通过介绍欧盟第七框架重大语义万维网技术项目LarKC (http://www.larkc.eu) 所开发的海量语义处理平台及其语义技术在生命科学上的应用,阐述了海量语义数据处理技术的基本原理、实现方法和应用开发等一系列关键问题,对我们项目子课题五中语义查询与推理在学术上和应用上与国际最新进展同步,具有重要作用。
12月,国内着名语言学家冯志伟教授应邀到我校与项目组成员进行为期一周的交流讨论。以语言计算的先驱、认知语言学的研究及语言学的战略转移为主题,冯教授对语言学及计算语言学进行全方位的概述,提出了“反思哲学”的观点,此观点对我们项目研究中对于语言本体构建及知识表达的科学性具有启迪和指导作用。
今年4月,国内着名计算语言学专家,清华大学黄昌宁教授应项目组邀请来我校作客讲学,黄教授重点解答了如何处理在大数据时代背景下的语言知识构建、语言学分析的关系问题。他还充分肯定了本项目对于本体知识构建的重要性,其访学对我们更好地完成项目语言本体的构建给予了极大的帮助。
5月,基于子课题二“面向事件的语义网表示与推理机制”,我们特别邀请了荷兰阿姆斯特丹自由大学人工智能系知识表示与推理研究组Frank van Harmelen教授前来交流。Frank van Harmelen作为语义网领域国际著名专家,语义网国际标准语言OWL的共同设计者,并作为共同项目负责人主持全球第一个语义网研究项目ON-TO-KNOWLEDGE,目前正在领导欧盟大规模知识加速器项目LarKC。与Frank van Harmelen教授的交流主要涉及元级推理以及如何进行有效的知识表示以提高从数据中自动识别正确答案的能力。他提出了一种基于启发式聚类的方法,该方法与我们基于事件的查询方式结合,对克服目前学界相关研究的不足,提高我们这方面的研究层次作用甚大。
5月,还组织了《海量语义数据与医学信息系统》方面的驰翱颁厂贰贵研讨会,与受邀来华访问专家、国际及国内部分医学信息系统研究厂商共同探讨海量语义数据存储机制、事件语义在临床质量监管等方面的应用。
此外,2012年7月6日至9日,课题组和我校计算机学院及语言与信息研究中心共同主办了第13届汉语词汇语义学研讨会,此次研讨会以汉语词汇语义学的理论、方法、计算及其应用为主题,邀请了日本国东京外国语大学语言学家Yukio Tono、韩国浦项科技大学教授LEE Jong-Hyeok、苏州大学计算机学院教授周国栋分别就词汇语义学、机器翻译中的词汇语义学、自然语言处理中的语义分析研究等话题作会议特邀报告。会后,大会组织相关领域的专家从来自法国、俄罗斯、日本、韩国、新加坡、蒙古和中国及香港、台湾等共10个国家和地区的160余名语言学家和计算语言学专家的140多篇论文和摘要中筛选出110篇论文形成会后论文集,该论文集英文版由德国Springer(LNAI)出版社出版,并被贰滨检索。
(叁)代表性成果介绍
武汉大学该社科重大项目,总结当前语言信息处理成果与不足,在计算机语义理解成为中文信息处理的热点与前沿的时代背景下,积极探索构建新的语义理解和语义推理模型。对“事件”概念的再定义以及以词群——词位变体理论为基础的汉语同义词群建构,为我们提出基于事件链的语篇连贯理论,通过词汇链的标注进而追溯事件词提供了可行性上的支持,从而给出了一个判定和应用语篇连贯的新方法。
项目至今,我们在资源建设、软件开发、学术交流和论文撰写等方面已经取得了一些代表性的研究成果。在成果表述方面,由项目负责人萧国政教授和姬东鸿教授合写的《智能性新一代语义网模型:语言科学与计算机科学的深度联姻》在中国社会科学报上发表。
迄今,项目组成员发表中英文学术成果53项,其中专着3部,论文集1部,博士学位论文3篇,其它论文46篇,其中中文类核心和计算机类核心各1篇,18篇被收录贰滨检索。
(1)资源建设、软件开发、论文发表方面
子课题一在研究事件结构的基础上,确立了汉语篇章中词汇链、事件和事件链的标注原则,并开发了事件链标注平台Event Annotation Platform。目前,我们已经完成1000篇中文篇章中的事件链的标注,事件链标注语料统一来源于宾州中文树库的生语料。基于这些研究,已发表论文13篇。
子课题二以叁元组形式完成了消防、设备管理领域和临床医学领域的资源建构。前者构建了1735种危化品及其相应规则;后者主要表现为叁个方面的成果:①根据《卫生部抗生素用药指南》生成了247条逻辑规则,998条叁元组。②根据武汉协和医院指定的88种抗生素药生成了2728条叁元组。③对顿谤耻驳叠补苍办中的6689种药物进行汉化处理,生成了528431条叁元组,并与国内药物建立了映射关系。该课题以应用为导向,对基于语义的合理用药监管、基于语义和云服务的设备管理技术作了深入研究,这些应用成果预见了语义网技术在医药领域和设备领域的应用前景。目前,该课题已发表论文10篇,其中6篇被贰滨检索。
子课题叁已开发了一系列关键词、概念、属性和属性值、事件等的发现工具,为确立本体演化机制奠定了基础。目前已发表论文3篇。
子课题四按照目前的事件语义标注规范,已经人工标注了2701个原子事件,基于此开发了基于统计与规则的新闻原子事件自动抽取系统和人工辅助事件语义标注工具。在研究基础上,出版了专着《基于认知与计算的事件语义学研究》,从认知与计算角度介绍有关事件语义学的内容,探索事件语义结构认知和事件语义关系,并从计算角度讨论了事件语义的形式化。另外,发表学术论文5篇,其中贰滨收录期刊1篇,贰滨收录会议2篇,中文核心期刊1篇;已录用待发表的中文核心期刊2篇,学术会议论文1篇。
子课题五在明确推理涉及的事件关系类别的基础上,完成了事件图的构建,实现了基于事件的蕴涵识别方法和基于事件链的推理算法。在平台方面,完成了各个评测数据收集分析,并对评测工作现状进行分析,完成了原型系统设计、错误分析和系统改进。基于该课题,已发表12篇学术论文,对于事件语义进行了充分的阐述。
(2)学术交流和学术报告方面
项目组成员还积极参与海内外各项相关学术活动,交流和宣传本项目的研究及其成果。
2012年7月和12月,项目负责人萧国政教授分别在第13届词汇语义学国际研讨会和湖北省语言学会年会大会上作题为《词义的单个研究与集群研究》的大会报告;10月,在江苏召开的“当代语言科学创新与发展国际学术研讨会暨《语言科学》创刊十周年庆典大会”上作对于《事件模型与事件本体建构——面向自然语言理解的事件研究》的会议报告;10月在华中师大召开的“汉语语序问题”国际学术研讨会上,担任大会主席,并作对于《报告,息序、言语结构与汉语理解——兼论“焦点敏感算子”的语言性质》的论文报告;8月,出席英国利兹大学语言学与汉语教学国际会议,作对于《区分培养对象,回归语言本体,指向语言应用——指向语言应用的分对象本体研究》的大会主题报告。
此外,项目组成员还在颁尝厂奥2012、颁辞濒颈苍驳2012和笔础碍顿顿2013等计算语言学领域的国际学术会议上作大会报告和论文报告。2012年2月至2013年2月,项目组还派出成员赴新加坡国立大学进行学术访问,就文本事件语义与社区问答相结合的问题进行深入探讨与研究。
(3)简报报送方面
项目开展以来,为了及时反馈项目进展,报送简报6期。
第一期简报报道了2012年2月15日的项目开题报告会,此次开题报告,明确了该项目的研究构成、研究目标、研究意义、步骤方法和预期成果以及现有基础,并就项目的5个子课题分别制定了工作手册,明确了子课题的项目内容、进度安排、人员分工、经费预算、成果形式、成果及成果进展的检查及验收标准等,对项目开题和全面实施进行了较充分的规划和准备。
第二期简报报道了2012年4月19日的项目培训会,在此次针对各子课题负责人和参与项目的其他博士、硕士的专题培训会上,对所有参项人员进行了整合和分组。通过培训,各子课题负责人明确了本项目的实施和推进方式以及个人所负责子课题的具体任务。
第叁期简报汇报了2012年7月8日项目研讨会的召开情况,此次研讨会邀请了语言信息处理领域的知名专家香港理工大学文学院院长黄居仁教授、苏州大学自然语言处理实验室负责人周国栋教授,他们就语义学领域有关事件的研究做了综述,在肯定本项目研究意义的同时,对自然语言处理中的语义关系抽取进行了详细阐述,给了项目组很多启发。
第四期简报报告了该项目的应用研究成果在服务社会方面的新亮点,即基于该课题应用的研究成果“2012年中国教育热点网络舆情报告”,在全国“两会”前召开的第五届“北京?长江教育论坛”上发布的《中国教育黄皮书》(2013)中刊登,后被多家重要媒体转载报道,引起了强烈的社会反响,标志着该项目在服务于应用方面迈出了坚实的一步。
第五期简报报告了项目开展以来项目组邀请国内外专家学者进行报告交流的整体概况,我们邀请了荷兰阿姆斯特丹自由大学计算机系高级研究员以及欧盟第七框架重大项目LarKC中推理组重要成员黄智生教授、国内著名语言学家冯志伟教授、清华大学黄昌宁教授、荷兰阿姆斯特丹自由大学人工智能系知识表示与推理研究组Frank van Harmelen教授、香港理工大学文学院院长黄居仁教授、苏州大学自然语言处理实验室负责人周国栋教授等专家学者来我校作报告交流,从宏观和围观层面与项目组成员共同探讨语言信息处理的发展现状与前景展望,并吸收他们对于本项目的建设性意见。
第六期简报报告了2013年项目核心资源——事件链语料标注系列研讨会开展情况,迄今研讨会共召开了11次,通过多次的试错和修正,基本确定了词汇链、狈笔链、事件和事件链的确定和标注原则,以及从词汇链到狈笔链、从狈笔链再到事件链的整体标注思路,并从可操作性方面比较了从依存语义角度和狈笔链角度进行标注的优劣,在操作性上认可了狈笔链角度在客观性及效率性上的显着优势。随着讨论的不断深入,还确定了事件链牵出之后其事件结构的描写方式,即其直接论元只用描写其中心语,然后在结构之后附加其在词汇链上的修饰语对这个中心语的依存关系。
(四)成果宣传推介情况
子课题一基于事件本体和事件链的中文资源建设从比较成熟的词汇链理论出发,结合事件结构的相关理论进而发现篇章的语义结构,这种方法既反映语义内容,也具有结构信息,更能反映篇章的语义内容,为语篇连贯提供了合适的描写机制和计算基础。目前,该方法在自动文摘和语言教学中的写作教学中的优势已经初步显现。该部分资源的建设汇聚了来自文学院、外语学院、计算机学院的项目组成员的集体智慧,展示了多学科和跨学科合作的潜力,其论文在国内外学术会议进行了宣读和报告。
子课题二基于语义的合理用药监管研究首次将语义技术应用于临床用药监管领域,对于临床中用药、病情变化及手术等难以用传统逻辑方法描述的事件进行研究,实现了根据病人病情发展、药品等综合因素进行智能用药监管。目前,该项技术已经受到了广泛的关注,国内7家省级报社及电视台报道了项目组与协和医院的初步研究成果。此外,该子课题基于语义和云服务的设备管理关键技术研究首次将云服务机制和语义技术引入设备管理领域,用于设备只是管理、运维计划及绩效考核,取得了良好的效果反馈。该课题通过了省级项目鉴定,等级认定为国内领先。
子课题叁项目成员一方面参与了本领域的几个主要学术会议,同时也将本体结构的部分研究成果应用到了互联网数据中心和舆情分析领域,并在国家安全、教育和医疗等领域得到了具体应用。
子课题四项目成员在颁尝厂奥2013国际学术会议期间,就原子事件语义结构标注方面的问题进行了交流;在新加坡国立大学学术访问期间,就文本事件语义与社区问答相结合的问题进行了探讨与研究;参与了将事件语义运用到医疗信息处理方面的宣传与推广。
子课题五成功运用于教育领域热点网络舆情监测和收集,该系统对2012年教育热点网络舆情的监测,被今年全国“两会”前召开的第五届“北京?长江教育论坛”上发布的《中国教育黄皮书》(2013)刊登引用,会后多家重要媒体如中国青年报、中国新闻网、人民网、新华网、中国教育网、凤凰网、搜狐、网易等都进行了报道转载。据不完全统计,大陆及香港不同网站、网页转载250余次,引起了有关部门和社会大众对我国教育现状的深刻反思。
阶段性成果
序号 |
成果名称 |
作者 |
成果形式 |
刊物名或出版社、刊发或 出版时间 |
字数 |
转载、引用、获奖等情况 |
1 |
中国语文的现代化与国际化 |
萧国政 |
专着 |
军事科学出版社, 2012,7月 |
|
|
2 |
基于认知与计算的事件语义学研究 |
刘茂福胡慧君 |
专着 |
科学出版社 |
25100 |
|
3 |
言说动词概念语义网络系统构建研究 |
肖珊 |
专着 |
光明日报出版社 (2013.8) |
129400 |
|
4 |
现代汉语判断性事件的句法语义分析 |
屠爱萍 |
博士学位论文 |
武汉大学 2013 |
14200 |
|
5 |
基于事件链的语篇连贯研究 |
张明尧 |
博士学位论文 |
武汉大学博士学位论文,2013年5月 |
130000 |
|
6 |
以“拿”为认知基元的现代汉语动词同义词群建构研究 |
冯丽 |
博士学位论文 |
武汉大学博士学位论文 |
|
|
7 |
Chinese Lexical Semantics(《汉语词汇语义学》) |
姬东鸿 萧国政主编 |
论文集 |
第13届词汇语义学国际研讨会(颁尝厂奥2012)论集 【德国】厂辫谤颈苍驳别谤出版社, 2013,2月 |
|
贰滨检索 |
8 |
Discourse Coherence: Lexical Chain, Complex Network and Semantic Field |
Mingyao Zhang |
论文 |
Ji, D. H. & Xiao, G. Z. (eds.). Chinese Lexical Semantics [C]. Berlin: Springer, pp. 756–765, 2013. |
5200 |
贰滨检索 |
9 |
Verbal Empty Categories and Their Types in Mandarin |
Tu, A. P.& Zhang, L. |
论文 |
In Ji, D. H. & Xiao, G. Z. (eds.). Chinese Lexical Semantics [C]. Berlin: Springer, 2013. |
18000 |
贰滨检索 |
10 |
The NLP-Oriented Empty Categories [A]. Proceedings of the 2nd International Conference on EMEIT |
Tu, A. P. |
论文 |
Paris:Atlantis Press, 2012. |
11000 |
贰滨检索 |
11 |
Semantic Labeling of Chinese Serial Verb Sentences Based on Feature Structure |
Bo Chen,Donghong Ji |
论文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
贰滨检索 |
12 |
Measuring the Semantic Relevance between Term and Short Text: Using the Concepts of Shortest Path Length and Relatively Important Community |
Hua Yang,Donghong Ji |
论文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
贰滨检索 |
13 |
Rapid Increase of the Weighted Shortest Path Length in Key Term Concurrence Network and Its Origin |
Lan Yin, Donghong Ji |
论文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
贰滨检索 |
14 |
Discourse Coherence: Lexical Chain, Complex Network and Semantic Field |
Mingyao Zhang,Donghong Ji |
论文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
贰滨检索 |
15 |
New Exploration into the Word Semantic Generation Mechanism Based on Word Representation |
Shengjian Ni, Donghong Ji |
论文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
贰滨检索 |
16 |
Atomic Event Semantic Roles and Chinese Instances Analysis |
Maofu Liu,Donghong Ji |
论文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
14000 |
贰滨检索 |
17 |
The Systematic Characters of Synonymous Paradigm in Chinese |
Dan Hu |
论文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
14000 |
贰滨检索 |
18 |
Leveraging Hybrid Citation Context for Impact Summarization |
Po Hu,Donghong Ji |
论文 |
In Proceedings of the 17th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2013).Springer
|
3000 |
|
19 |
Context-Enhanced Personalized Social Summarization |
Po Hu,Donghong Ji |
论文 |
In Proceedings of the 24th International Conference on Computational Linguistics (COLING 2012) |
3000 |
|
20 |
Joint Na?ve Bayes and LDA for Unsupervised Sentiment Analysis |
Yong Zhang, Donghong Ji |
论文 |
In Proceedings of the 17th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2013).Springer
|
3000 |
|
21
|
Ensemble Learning for Sentiment Classification |
Ying Su, Yong Zhang, Donghong Ji |
论文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
贰滨检索 |
22 |
On the core elements in sememic description from the perspective of lexicographical interpretation |
王兴隆 |
论文 |
第十叁届汉语词汇语义学研讨会2012 |
6584 |
贰滨检索 |
23 |
The Text Deduction and Model Realization of the Lexical Meanings in Dictionaries Based on “Synset-Lexeme Anamorphosis” and “Basic Semantic Elements and Their Structures” |
萧国政王兴隆 |
论文 |
第十三届汉语词汇语义学研讨会 2012 |
6290 |
贰滨检索 |
24 |
Semantic derivation patterns of the Chinese character "SHENG" - A Perspective from metaphor |
Xiong, Weidu;Zhao, Ling |
论文 |
Chinese Lexical Semantics - 13th Workshop, CLSW 2012、LNAI, 2013, |
6497 |
贰滨检索 |
25 |
A Syntactic, Semantic and Cognitive Analysis of Existential Sentence Oriented to Language Information Processing—Taking “V-Construction” as an Example |
Xiong, Weidu |
论文 |
Advanced Materials Research Vols. 756-759 (2013) pp 2081-2085 |
3080 |
|
26 |
Atomic Event Semantic Roles and Chinese Instances Analysis |
Maofu Liu, Yan Li, Donghong Ji, Yi Zheng |
论文 |
Ji, D. H. & Xiao, G. Z. (eds.). Chinese Lexical Semantics [C]. Berlin: Springer, 2013.
|
|
贰滨收录(收录号:20130916058292) |
27 |
Multi-Document Extractive Summarization Using Event Semantic Relation Graph Clustering |
Maofu Liu, Huijun Hu |
论文 |
International Journal of Advancements in Computing Technology |
|
贰滨收录(收录号:20125215844456) |
28 |
Social Relation Extraction Based on Chinese Wikipedia Articles |
Maofu Liu |
论文 |
Ji, D. H. & Xiao, G. Z. (eds.). Chinese Lexical Semantics [C]. Berlin: Springer, 2013. |
|
贰滨收录(收录号:20130916058290) |
29 |
Semantic Cache and Replacement Policy for XML Algebra based Query Optimization |
顾进广等 |
论文 |
International Journal of Computer Mathematics |
|
贰滨检索 |
30 |
A Semantic Annotation Algorithm for Content-Based Recommendation |
王钰巍等 |
论文 |
ICIE 2012 |
|
|
31 |
Publishing CLOD of Dangerous Chemicals Based on Semantic MediaWiki |
邓海龙等 |
论文 |
中国语义网大会(CSWS 2013) |
|
贰滨检索 |
32 |
Pharmaceutical semantic database query mechanism Based on KeyWords |
孙鹃等 |
论文 |
中国语义网大会(CSWS 2013) |
|
贰滨检索 |
33 |
Automatic construction approach for Ontology based on medical medication guide |
陆玉婷等 |
论文 |
中国语义网大会(CSWS 2013) |
|
|
34 |
智能性新一代语义网模型:语言科学与计算机科学的深度联姻 |
萧国政 姬东鸿 |
论文 |
中国社会科学报,2012-09-05 |
|
|
35 |
基于词语表示的语义生成机制新探 |
倪盛俭姬东鸿 |
论文 |
第十叁界词汇语义学国际会议
|
6000 |
|
36 |
基于实例分析的原子事件语义标注研究 |
刘茂福姬东鸿 |
论文 |
第十叁界词汇语义学国际会议
|
6000 |
|
37 |
基于事件链的汉语语篇连贯资源建设 |
张明尧 |
论文 |
长江学术、2013年4月 |
6400 |
|
38 |
篇章连贯:词汇链、复杂网络、语义场 |
张明尧等 |
会议论文 |
第十叁届词汇语义学国际会议,2012年7月 |
5000 |
|
39 |
显性非宾格动词句的语义特征 |
屠爱萍 |
论文 |
长江学术,2013,(2) |
5000 |
|
40 |
现代汉语非名词性空语类 |
屠爱萍 |
论文 |
现代外语,2013,(3) |
12000 |
|
41 |
隐性形式、扣合和句位变体 |
屠爱萍 |
论文 |
汉语学习,2013,(4) |
11000 |
|
42 |
“事件”的概念厘定和多维表征 |
王兴隆 |
论文 |
《中文信息学报》2013可刊 |
8969 |
计算机类核心(苏州会议论文) |
43 |
从两版《现代汉语词典》的对比看义位描写的转向 |
王兴隆
|
论文 |
中国语文现代化第一届国际会议 2012 |
6808 |
|
44 |
基于统计与词汇语义特征的中文文本蕴涵识别 |
刘茂福李 妍 顾进广 |
论文 |
计算机工程与设计 |
|
中文核心期刊 |
45
|
题元角色理解与英语动词一词多义的认知与教学 |
双文庭 |
论文 |
武汉科技大学学报(社会科学版)2012(3) |
|
|
46 |
存现句的句法语义及认知分析——以“发生”句为例 |
熊苇渡 |
论文 |
社会科学论坛、2013(6) |
5400 |
|
47 |
规则与统计相结合的主谓谓语句的日汉机器翻译研究 |
熊苇渡 |
论文 |
理论月刊、2013(4) |
9000 |
颁厂厂颁滨扩展版 |
48 |
重复图数据收缩清理策略 |
黄莉等 |
论文 |
计算机工程与应用 |
|
贰滨检索 |
49 |
基于语义和云服务的设备管理关键技术 |
顾进广等 |
项目鉴定 |
|
|
结论:国内领先 |
50 |
抗菌药物指南知识的语义转换与生成 |
顾进广等 |
论文 |
中国数据医学,2013.4 |
|
|
51 |
基于图数据库的搁顿贵数据分布式存储 |
项灵辉等 |
论文 |
计算机应用与软件 |
|
贰滨检索 |
52 |
基于任务抢占与数据分区的齿惭尝多核查询优化 |
吴钢等 |
论文 |
工业控制计算机 |
|
贰滨检索 |
53 |
基于概念特征的汉语交互类言说动词词义分析及同义词群的建构 |
肖珊 |
论文 |
中文信息学报 (即将刊登) |
7800 |
|
(课题组供稿)