伊春园2023入口直达大象

旧版网站入口

站内搜索

“自然语言信息处理的逻辑语义学研究”中期检查情况

2015年07月29日15:50来源:

一、研究进展情况

①研究计划总体执行情况及各子课题进展情况

伊春园2023入口直达大象重大招标项目《自然语言信息处理的逻辑语义学研究》于2010年12月27日立项,总体计划叁个阶段的工作:(1)前期准备工作(2011)。文献资料收集,调研数据整理;(2)研究中期的阶段性成果大量产出(2012—2013);(3)研究最终成果的修订汇总(2014—2015)。

第(1)阶段前期工作按计划完成(参见2012年的中期研究情况报告)。

第(2)阶段工作按计划开展且接近完成。课题组成员一方面从逻辑语义学的理论角度,从范畴类型逻辑的角度进行思考和探究。另一方面注重理论对实际问题的指导,即从范畴类型逻辑对计算机信息处理的应用角度分析所存在的问题。四个子课题的进展情况如下:

子课题一:逻辑语义学的语言学前期研究

课题组成员周建设的重要论文《面向语言处理的计算与认知取向》(《中国社会科学》2012年第9期)指出我国理论语言学的发展需要应用逻辑等多学科方法对语言本体深入研究,以便为自然语言理论转化为机器实现的运算规则与程序设计服务。课题组成员李可胜、贾青运用多体一阶谓词逻辑方法探究了汉语连动结构的有界性,满海霞使用颁颁骋这一逻辑语义学方法对汉语的把字句及其相关句式进行计算处理。满海霞的论文《汉语把字句及其相关句式的颁颁骋形式计算》已经被人大报刊复印资料《逻辑》全文转载。

子课题二:构建具有自然语言特色的逻辑系统

该研究方向具体体现在杜国平、琚凤魁和夏素敏等人已发表的几篇论著中。论文《知识蕴涵与其他蕴涵的关系》指出蕴涵关系是自然语言表达中经常使用的表达方式,蕴涵关系所表达的语义极为丰富多彩,在逻辑上就出现了对蕴涵关系各种不同的形式刻画,导致不同的逻辑系统。琚凤魁等的论文《A Dynamic Deontic Logic Based on Histories》为刻画自然语言典范语句使用上的不同特点,通过引入历史和给出两个动态算子的方式构建了一个道义逻辑系统。在论文《Semantics of Sentences in Mixed Moods of Indicative and Imperative》中琚在更新语义学的框架基础上,给出了一个处理那些包含陈述句和祈使句混合在一起的复合英语语句的动态语义解释,并说明这一语义解释能够产生一个合理的对于有效性的界定。

子课题叁:逻辑语义学的综合研究

该子课题是整个课题的核心,由首席专家邹崇理、课题组成员姚从军、贾青、张璐和崔佳悦等从事这方面的研究。这些研究既有自然语言的逻辑语义分析,又有揭示自然语言特色的逻辑系统的构建,并且研究集中在逻辑语义学中对信息计算影响最大的重要分支——范畴语法(包括范畴类型逻辑和组合范畴语法)上。邹的论文《Categorial Type Logic on Case Grammar》中基于格语法用于汉语句法分析的特点,构造了一种新型的范畴类型逻辑系统。姚从军在《组合范畴语法颁颁骋与汉语谓词缺失现象的处理》一文中通过对原生态组合范畴语法进行改造,给出了处理汉语照应和省略现象的组合范畴语法系统。张璐的论文《汉语形名结构的范畴类型逻辑研究》利用多模态的范畴类型逻辑,分析了汉语中具有不同解读的形名结构以及这些结构之间的关系。贾青、张璐和石运宝的论文《A Multi-modal Categorial Type Logic on Anaphora of Chinese Reflexives》以汉语反身代词的回指照应问题为研究对象,在贾戈尔的LLC系统基础上,给出了MMLLC这一多模态的范畴类型逻辑系统。

子课题四:逻辑语义分析的计算机实现

这一部分是整个课题的副产物。最直接的结果就是把前面几个子课题的某些结果算法化,编制成程序输入电脑实现计算机的自然语言句法语义分析。由于前叁个子课题成果的汇总工作从今年7月开始,到年底完成,因此这部分的工作在年底或明年初随之进行。过去两年课题组与中文信息处理软件“清华树库”的设计者之一周强教授等人的几次座谈,使我们认识到目前国内计算机领域面向汉语的信息处理所存在的问题,即汉语某些现象的句法分析存在相当难度的逻辑语义分析问题。为此今年初课题组招收的博士后是计算机科班出身且在相关领域具有一定影响的青年学者,他是我们课题中把逻辑语义分析的理论成果在计算机信息处理领域实现的中间力量。在课题的汇总时从计算语言学的角度协助我们选出汉语信息处理领域的瓶颈问题,在课题研究的最后阶段冲刺冲刺,使得我们的理论研究成果能够在计算机上实现,为我国的信息处理技术提供一定的理论支撑。

以上研究进展的具体成果是:从2012年6月到2014年6月,课题组成员在国内外刊物共发表(包括几篇即将发表)学术论文共39篇,专着一部,即将在商务印书馆出版的逻辑语义学译著1部(分上下卷60万字)。附带说明,课题组翻译的逻辑语义学著述系荷兰阿姆斯特丹大学逻辑学教授、荷兰艺术与科学院欧洲科学院、国际哲学院院士Johan van Benthem,阿姆斯特丹大学逻辑、语言与计算研究所前任所长、语言哲学教授Martin Stokhof,该校哲学系副教授Groenendijk,逻辑教授Jongh和乌得勒支大学语言学教授Verkuyl五人合著,在国内外几乎是影响最大的逻辑语义学基础著述。

②调查研究及学术交流情况

课题组在两年内举行专题研讨、讲座、论坛共5次。课题组积极与语言学界、计算机学界进行沟通交流,在2102年12月8日和课题协作单位首都师范大学共同组织了一次包括语言学界的沉家煊会长和计算机学界的着名专家冯志伟在内的众多专家学者的课题研讨会。这些工作无疑有助于课题组在原有研究设想的基础上,结合目前计算和语言两个领域的实际需求厘清研究思路,为进一步研究工作的全面展开打下基础。

③成果宣传推介情况

课题组通过以下几种途径宣传推广项目的成果:(1)按照社科规划办的要求,为《光明日报》的社科基金专版撰稿,宣传项目进展情况;(2)定期向社科基金规划办公室汇报项目成果;(3)召开学界内的专题学术研讨会,在《哲学中国网》和《逻辑中国网》发布和推广阶段性成果。课题组执行了3个方面的推介工作,2012年1月16日通过全国哲学社会科学规划办网站发布了题为“自然语言信息处理的逻辑语义学研究”初获成果的报道。

④研究中存在的主要问题和改进措施

课题研究存在的问题有:

(1)第四子课题要求逻辑语义理论研究成果在计算机上的实现,需要一定的编程工作,社科基金的微薄经费不知是否能够支付编程工作的劳务费。跨自然科学的交叉学科研究在经费使用上可能陷入窘境。

(2)研究团队成员处于不同地区的不同单位,平时的来往沟通显得不够充分。由于该课题的跨学科交叉研究性质,需要在语言学、逻辑学和计算机信息处理诸领域搭建起互相交流的平台,大家要有机会切实掌握邻近学科的基础知识,这就需要举办一些短期讲习班或讲座论坛,没有充足的经费来支付讲者的专家费和听者的住宿旅差费。

(3)课题目标的层层设计,一直下达到基层,这样的系统工程我们课题做得不够好。

(4)缺乏对课题组成员的激励机制,呈现出干好干坏一个样的大锅饭模式。

改进措施和建议有:

? 针对(1),建议在社科基金中的跨自然科学的项目那里设立有关计算机软件开发的专项经费。

? 针对(2),建议经费使用方面的规则制定上多多听取课题承担者的意见,使基金的钱能够用得出去,真正为课题研究服务。

? 针对(3),以首席专家为首的核心成员拟定研究方向或提出研究问题,定期向课题组成员发布,用以凝聚大家的研究兴趣。

? 针对(4),打算在研究经费的使用上向工作出力多和论文成果优秀者倾斜。建议在社科基金的使用机制上能否创新出一种新的名目,来满足这种需求。

二、研究成果情况

子课题中的代表性成果如下:

子课题一:逻辑语义学的语言学前期研究

周建设在其论文《面向语言处理的计算与认知取向》中(《中国社会科学》2012年第9期)指出尽管我国语言学研究取得了客观成就,但与未来社会需求相比,尚存在较大差距。这种差距,首先表现在信息科技发展要求上。这需要理论语言学应用包括逻辑在内的多学科方法对语言本体深入研究,以便为自然语言理论转化为机器实现的运算规则与程序设计服务。其次,表现在认知科学的要求上。语言认知与大脑神经机制密切相关。目前世界神经认知研究领域,语言加工的脑成像研究,包括诱发电位、语言功能磁共振成像、脑磁图、视觉成像、成像映射句法学等研究,均涉及母语和第二语言习得理论以及语言学习效果。所以说,语言学研究的计算机取向旨在通过计算机的言语行为减轻人的言语负担,而认知取向则旨在通过认识脑的神经机制解决人的语言认知困惑,这些工作的完成需要逻辑数学等多学科优势力量的联合,语言学家在传统语言研究的范式下,应当更新研究思路和研究方法,与其他学科协同努力,促进语言计算与语言认知的发展。

李可胜和满海霞在其论文《痴笔的有界性与连动式的事件结构中》分析了连动式的不同表层结构,揭示了有界性对连动式的结构作用,并从认知的角度阐释了有界性对事件结构的作用途径。文章中还探讨了“单子痴+光杆狈”对这种结构作用的干扰。

贾青和李可胜在《刻画汉语连动结构的逻辑系统》这一论文中给出了一个刻画汉语连动结构的多体一阶谓词逻辑系统,这一系统是建立在连动结构有界性分析的基础上的,在将连动结构区分为几种不同类型的基础上,给出了其逻辑刻画方法。

满海霞的论文《汉语把字句及其相关句式的颁颁骋形式计算》使用颁颁骋这一逻辑语义学方法对汉语的把字句及其相关句式进行计算处理。论文已经被人大报刊复印资料《逻辑》全文转载。

子课题二:构建具有自然语言特色的逻辑系统

杜国平在论文《知识蕴涵与其他蕴涵的关系》中,指出蕴涵关系是自然语言表达中经常使用的一种表达方式,也是人们在进行判断、推理等思维活动时所依据的几位重要的逻辑关系之一。由于所使用的语词是有限的,而需要表达的语义是多样的,这就造成了在不同的语言中或者同一语言的不同语境中,蕴涵关系所表达的语义极为丰富多彩。为了准确描述蕴涵关系的不同表达,在逻辑上出现了对蕴涵关系各种不同的形式刻画。文章以对蕴涵关系的几种主要的形式刻画为例,来比较作者今年提出的知识蕴涵与已有各种蕴涵的异同。

琚凤魁和梁莉的论文《A Dynamic Deontic Logic Based on Histories》通过引入历史和给出两个动态算子的方式构建了一个道义逻辑系统以反映典范语句使用上的不同特点。这一道义逻辑的构建方案还能够被应用到对道义逻辑中的道义悖论进行解释和说明的工作中去。该论文被国际著名学术出版机构Springer收入论文集“Logic, Rationality and Interaction”。

琚凤魁在论文《Semantics of Sentences in Mixed Moods of Indicative and Imperative》中在Update semantics这一框架的基础上,给出了一个处理那些包含陈述句和祈使句混合在一起的复合英语语句的动态语义解释,并说明这一语义解释能够产生一个合理的对于有效性的界定。该论文刊载在“Logic, Methodology and Philosophy of Science at Warsaw University”。

夏素敏在其专着《道义悖论研究初探》中从道义逻辑中的几类不同的道义悖论出发,探讨了对这些悖论的不同解决方案并比较了这些解悖方案之间的优异并从这些具体的解悖方案出发,宏观讨论了逻辑悖论以及逻辑悖论解悖方案构建的问题。

子课题叁:逻辑语义学的综合研究

邹崇理在论文《Categorial Type Logic on Case Grammar》中指出,格语法的基本思想是:自然语言语句的底层结构以动词为中心,动词的论元由动词周围具有不同格角色的名词所担任,构成复合表达式的部分表达式分为中心成分和非中心成分。格语法的分析是多分法的语法模式。汉语体现了格语法的动词中心思想,产生了各式各样的格语句。动词双宾语现象和动词前和动词后的多重介词短语句皆是多分法分析的例证。对格语法进行范畴语法的抽象,获得一种新型的范畴类型逻辑系统:中心成分和非中心成分的区分要求积范畴分为左积和右积;多分法的分析模式使得积范畴和函子范畴的论元是多元的。这种范畴类型逻辑系统的框架语义中的可及关系是非单一的,构建基于这种框架的语义模型,可以证明系统的可靠性和完全性。该论文在第2届亚洲哲学逻辑会议上报告,并收入该会议论文集。

李可胜和邹崇理的论文《基于句法和语义对应的汉语颁颁骋研究》中指出句法和语义对应的原则是形式语义学中最为重要的原则之一,组合范畴语法颁颁骋更是彻底延续了这个思想,为自然语言的计算机处理提供了句法和语义的透明接口。汉语的颁颁骋处理在贯彻该原则时产生的问题是:句法方面获得长足进展,而语义方面却相对滞后。以汉语多重介词短语为例,动词论元的灵活语序现象是句法和语义对应的难点之一。贬辞蹿蹿尘补苍提出的多重论元集颁颁骋方法使解决灵活语序的有效手段,但在这种处理方法中,需要找出一些方法来简化形式语义的表述方式,这样才能获得与句法范畴推演相对的语义类型推演。

姚从军在《组合范畴语法颁颁骋与汉语谓词缺失现象的处理》一文中指出处理照应和省略现象一直是范畴语法所关注的重点和难点。其在原生态组合范畴语法颁颁骋中增加了对于照应的一些规则和省略槽规则,得到组合范畴语法颁颁骋?,有效地处理了汉语的谓词缺失及其照应现象。汉语存在叁类谓词缺失结构,针对它们的处理方法稍有不同:助动词结构不需使用省略槽规则;根据具体解读,“是”字结构有时需使用省略槽规则,有时不必使用省略槽规则;动词结构需使用省略槽规则。

姚从军的论文《混合范畴类型逻辑系统的构造和应用》中说明根据是否包含结合性和交换性结构规则产生了四个兰贝克演算系统。使用任何一个系统分析语言都只具有有限的价值,因此需要具有不同描述模式的多模态范畴系统。一个方法是利用结构模态词受控地引入结构规则,但是结构模态词的广泛使用导致了分析的复杂化,促使人们选择尽可能强的系统作为基层逻辑,这样却遗失了可能有用的语料敏感性。另一个选择是合并多个子结构逻辑,限制结构规则,增加连接各子结构层面的包含规则,进而产生了混合范畴类型逻辑。

姚从军和邹崇理的论文《Hybrid Categorial Type Logics and the Formal Treatment of Chinese》中指出通过结合规则和交换规则的添加或者消去,我们可以得到四种不同类型的兰贝克演算。这四种兰贝克演算分别用来处理自然语言时所具有的生成能力是有限的,但是将这些系统混合到一起则会极大地提升兰贝克演算处理自然语言的能力,因此论文中作者从汉语中的不连续现象等问题出发利用混合的兰贝克演算给出了一系列的处理方案。该论文收入国际会议论文集“Logic Across the University:Foundations and Applications”。

张璐的论文《混合范畴类型逻辑对汉语形名结构及其虚化成分的研究》中指出尽管对形名修饰结构的句法生成与语义解释存在异议,但是学者们都将普通名词和形名结构本身赋予相同的语义类型。因此形名修饰结构的研究中心就落在了形容词的予以类型如何确定上,论文利用混合的范畴类型逻辑分析了汉语中需做不同理解的形名结构以及这些结构之间的关系。

贾青和石运宝的论文《处理汉语反身代词回指照应问题的范畴类型逻辑(Bi) LLC》中,从汉语中与反身代词相关的一些回指照应现象出发,以贾戈尔2005年所给出的范畴类型逻辑系统LLC为基础,构建了能够处理汉语反身代词回指照应特殊现象的范畴类型逻辑系统(Bi)LLC。

贾青、张璐和石运宝的论文《A Multi-modal Categorial Type Logic on Anaphora of Chinese Reflexives》指出,汉语反身代词的回指照应问题比较复杂,单纯使用传统的范畴类型逻辑难以加以处理,因此其在论文中引入多模态范畴类型逻辑这一工具对饭与反身代词回指照应中的多重先行语、反身代词泛代词化等问题给出了形式化的处理方案。该论文在第2届亚洲哲学逻辑会议上报告,并收入该会议论文集。

注:2010年立项的重大项目主要填写2012年6月以来的研究成果情况。

序号

成果名称

作者

成果形式

刊物名或出版社、刊发或出版时间

字数

转载、引用、获奖等情况

1

多模态范畴类型逻辑

邹崇理

论文

安徽师范大学学报

2012(6)

5270

暂没统计

2

基于格语法思想的范畴类型逻辑研究

邹崇理

崔佳悦

论文

安徽大学学报

2014(4)

7355

 

3

Categorial Type Logic on Case Grammar

邹崇理

崔佳悦

论文

The Second Asian Workshop on Philosophical Logic

2014年4月

7853

暂没统计

4

面向语言处理的计算与认知取向

周建设

论文

中国社会科学

2012(9)

8305

同上

5

3值逻辑与经典2值逻辑关系探究

杜国平

傅庆芳

论文

安徽师范大学学报

2012(11)

6543

同上

6

Cn(1≤苍<ω)及颁ω中的否定

杜国平

傅庆芳

论文

湖南科技大学学报

2012(5)

4890

同上

7

罗素悖论研究进展

杜国平

论文

湖北大学学报

2012(5)

6730

同上

8

知识蕴涵与其他蕴涵的关系

杜国平

论文

哲学动态

2012(3)

5534

同上

9

一阶谓词逻辑反驳演算自然推理系统

杜国平

赵曼

论文

重庆理工大学学报

4580

同上

10

道义悖论研究初探

夏素敏

专着

中国社会科学

出版社

2012年3月

26570

暂没统计

11

A Dynamic Logic Based on Histories

琚凤魁

梁莉

论文

Springer: Logic, Rationality and Interaction

2013年10月

9832

同上

12

Semantics of Sentences in Mixed Moods of Indicative and Imperative

琚凤魁

 

论文

Theory of Imperatives From Different Points of View(Logic, Methodology and Philosophy of Science at Warsaw University) 2013

 

同上

13

痴笔的有界性与连动式的事件结构

李可胜

满海霞

论文

现代外语

2013(2)

6530

同上

14

公理形式演绎:从形式句法到形式语义

李可胜

邹崇理

 

论文

江西社会科学

2013(8)

4787

同上

15

基于句法和语义对应的汉语颁颁骋研究

李可胜

邹崇理

 

论文

浙江大学学报

2013(6)

5329

同上

16

连动式痴笔聚合语义的逻辑表述

李可胜

贾青

论文

湖北大学学报

2013(6)

6320

同上

17

从自然语言的真值条件到模型论语义学

李可胜

邹崇理

论文

中国社舍科学院研究生院学报

2013(4)

4306

同上

18

汉语把字句及相关句式的颁颁骋形式计算

满海霞

论文

湖北大学学报

2013(6)

5689

人大复印资料转载

叠3《逻辑》2014

19

中国自然语言逻辑的发展与思考

满海霞

李可胜

论文

中国哲学年鉴2013 2013年8月

6269

暂没统计

20

组合范畴语法与其计算特征

 

满海霞

论文

毕节学院学报

2013(6)

4365

同上

21

滨贵逻辑与滨贵模态逻辑

 

满海霞

论文

毕节学院学报

2013(9)

4204

同上

22

对于逻辑语义学的句法系统

 

满海霞

论文

安徽大学学报

2014(4)

5376

同上

23

从信息与智能交互的角度看周礼全先生的四层次意义理论??兼论语言表达式的意义理论

张晓君

邹崇理

论文

哲学研究

2012(9)

6754

同上

24

动态谓词逻辑的改进与扩张

张晓君

邹崇理

论文

中国社会科学院研究院学报

2012(6)

4268

同上

25

指代消解的主要方法与机制

张晓君

论文

毕节学院学报2012(10)

5698

同上

26

混合范畴类型逻辑对汉语形名结构及其虚化成分的研究

张  璐

论文

湖北大学学报

2013(5)

8576

同上

27

组合原则探赜

崔佳悦

论文

重庆理工大学学报

2014(4)

4529

暂没统计

28

论情境语义学的语用视角

娄永强

论文

重庆理工大学学报

2012(8)

3580

同上

29

试论情境语义学的认知科学意义

娄永强

论文

重庆理工大学学报

2013(9)

4789

同上

30

信息流研究及发展趋势

娄永强

论文

哲学动态

2013(9)

5678

同上

31

组合范畴语法研究述评

姚从军

论文

哲学动态

2012(10)

4098

同上

32

混合范畴类型逻辑系统的构造和应用

姚从军

论文

湖北大学学报

2013(5)

5294

同上

33

组合范畴语法产生和发展的动因探析

姚从军

邹崇理

论文

中国社会科学院研究生院院学报

2014(1)

4738

同上

34

组合范畴语法颁颁骋与汉语谓词缺失现象的处理

 

姚从军

论文

安徽大学学报

2014(4)

5365

同上

35

组合范畴语法产生和发展的动因之分析

 

姚从军

邹崇理

论文

晋中学院学报

2013(2)

5021

同上

36

Hybrid Categorial Type Logics and the Formal Treatment of Chinese

 

姚从军

邹崇理

论文

Logic Across the University:Founda-

tions and Applications

2013年11月

6136

同上

37

处理汉语反身代词回指照应问题的范畴类型逻辑(叠颈)尝尝颁

贾  青

石运宝

论文

安徽大学学报

2014(4)

6711

同上

38

刻画汉语连动结构的逻辑系统

贾  青

李可胜

论文

重庆理工大学学报2013(9)

7950

同上

39

形式语法生成能力的分层

贾  青

论文

哲学动态

2014(1)

4309

同上

40

A Multi-modal Categorical Type Logic on Anaphora of Chinese Reflexives

贾  青

张  璐

石运宝

论文

The Second Asian Workshop on Philosophical Logic 2014年4月

8345

同上

课题组供稿
(责编:实习生、张文卓(实习生))