伊春园2023入口直达大象

站内搜索&苍产蝉辫;                      
加入收藏 加入收藏     设为首页 设为首页   

成果选介>>项目动态

2010年度重大项目(第二批)开题报告之六十五:大规模英汉平行语料库的建立与加工

&苍产蝉辫;&苍产蝉辫;2011年09月06日13:46&苍产蝉辫;&苍产蝉辫;来源:

  2011年3月19日,伊春园2023入口直达大象重大项目《大规模英汉平行语料库的建立与加工》(批准号:10锄诲&补尘辫;127)开题论证会在北京外国语大学召开。陈雨露校长、金莉副校长及中国社科院语言研究所顾曰国教授、北京大学王厚峰教授、北京航空航天大学卫乃兴教授、解放军外国语学院易绵竹教授、清华大学江铭虎教授、燕山大学刘泽权教授、大连海事大学罗卫华教授、北京日本学研究中心曹大峰教授、施建军教授等专家等9位语料库语言学方面知名专家,及中国英语教学研究会会长、中国外语教育研究中心主任文秋芳教授和我校科研处张朝意处长等出席会议。重大项目首席专家王克非教授率课题组19名成员(除2位在国外)参加开题会。
  会议由张朝意处长主持。陈雨露校长和金莉副校长分别在会上做了重要讲话。陈校长对伊春园2023入口直达大象重大项目及其重要意义给予了高度评价,对项目的科学启动和顺利开展寄予厚望。校领导对与会专家致以衷心感谢,并要求学校各有关部门都必须对国家重大项目的开展给予全力支持。
  中国语料库语言学研究会会长、北京航空航天大学卫乃兴教授代表与会专家发言。卫乃兴教授充分肯定了该课题的重大意义,认为建立国家级大型平行语料库是我国语料库语言学界责无旁贷的大事。卫乃兴教授还指出,王克非教授组建的课题组聚集了国内语料库语言学界众多精英力量,相信课题组一定能够出色地完成课题的既定目标,建成世界一流的超大型双语平行语料库。
  随后,与会专家和课题组成员听取了王克非教授对课题的研究思路和研究框架所做的详细介绍。大家一致认为该项目将为语言对比研究,翻译研究、教学研究、自动翻译和双语词典编纂等提供极为有用的语料资源和平台,是一项重要的基础工作,意义重大,设计合理,配置适当,方案可行。专家们还为课题的顺利开展积极建言献策,就项目的启动、运行、写作等提出了建设性的意见和建议。
  会上,课题组首席专家王克非教授还组织课题组全体成员认真学习了国家社会科学规划办下发的立项通知书和课题研究各项要求,明了研究目的和研究方法,细化研究任务,力争保质保量地完成课题。
  该重大项目分四个子课题组,分别由北京外国语大学中国外语教育研究中心梁茂成教授、浙江大学肖忠华教授、上海交通大学胡开宝教授和曲阜师范大学秦洪武教授负责。下午的分组讨论会上,专家们和各个子课题组成员就子课题的研究任务、研究方法和人员分工等进行了认真而充分的讨论,进一步细化了研究方案,明确了各子课题组之间的分工与合作。最后,课题总负责人与各子课题负责人分别签订了责任书。
  为了细化课题的研究目标和研究任务,进一步了解课题实施过程中的技术路线,明确各子课题组的分工,分析研究过程中可能出现的各种困难及解决方案,项目组按课题进行了分组讨论,并邀请专家们为各子课题的顺利开展提供建议和意见。
  讨论在以下几个方面形成了共识:
  1)课题的实施方案。专家及课题组所有成员一致认可课题总负责人提出的“建库为主,建研结合”的原则思想,认为在该课题研究的实施过程中,首要目标是建立一个世界上最大、具有权威性和示范作用的英汉平行语料库。在建立这一超大型语料库的前提下,进行有深度的标注加工处理,并结合语料库中的各类数据,开展多维的语言和翻译研究。
  2)各子课题组的分工。大家一致认为课题总负责人提出的课题总体思路和设计方案可行,即将课题分为“超大型英汉平行语料库的分类架构与语言对比研究”、“超大型英汉平行语料库的加工标注和语料检索平台研究”、“专门英汉平行语料库的研制与应用研究”和“大型英汉平行语料库平衡语料的收集整理与历时语言/翻译研究”四个子课题。其中,子课题一负责确定语料库的分类构架和采样方法,以确保语料库的代表性。此外,子课题一还将进行一些语言研究。子课题二负责课题实施过程中的工具设计和平台建设。工具主要包括建库工具和检索工具,而平台则包括语料库单机检索平台和网络检索平台。子课题叁将建立四个专门语料库,即英汉海事语料库、英汉财经语料库、英汉时政语料库和英汉口译语料库。子课题四将主要负责平衡语料库的收集和整理,并进行一些历时语言研究和翻译研究。
  3)课题组拟接受专家们提出的意见,对原课题设计做局部调整,主要包括:
  础)有关语料库的标注。专家们认为,为了增强语料库的开放性,鉴于目前句法标注技术和语义标注技术尚不成熟,本项目主要研究和处理好语料库的中英文词性标注,开展句法标注的研究,适当进行标注尝试,整个语料库采用通用的翻译记忆库格式保存,以方便使用和交流。
  口译语料库的规模。口译语料库建设意义重大,但鉴于口译语料收集困难,转写和标注耗时费力,需要投入的资金也很大,专家建议将原设计方案中的3百万词的口译语料库改为1百万词,以保证口译语料库的质量。
  经过一天的讨论,研究工作中的许多细节变得十分明确,课题组成员们也更加感觉到及时交流和深入讨论的必要。基于此,项目首席专家王克非教授布置了下一步工作任务:
  项目工作会议制度。为了确保本项目顺利进行,课题组将根据项目进展情况,不定期举行项目工作会议,由项目总负责人召集,各子课题负责人参加。可根据情况邀请责任单位领导、校内外专家和课题组其他成员参加。项目工作会议每年召开一次,主要解决以下问题:
  补)按照项目设计的既定路线,讨论或调整有关子课题的研究内容、方法、进度和经费安排等;
  产)对各子课题的进展情况进行定期或不定期检查,商讨解决课题执行过程中的问题;
  肠)汇总研究成果,编写简报,上报规划办;
  诲)讨论需要向规划办和责任单位汇报的有关问题。
  课题进展汇报制度。各子课题负责人将子课题的研究进展分 8 次书面报送项目总负责人,项目总负责人汇总编审后,以工作简报的形式报送规划办。
  研究成果的发表与管理。在课题研究过程中产生的研究成果,课题组成员不可独自处理和发表,须经项目首席专家或首席专家委托的子课题负责人评审鉴定后才可投稿发表,以保证项目成果的质量。
  最后,项目首席专家王克非教授在总结发言中强调,国家级重大项目要求极高,任务艰巨,责任重大,全体课题组成员务必胸有国家项目意识和团队意识,倾尽学识才智,密切交流,通力合作,确保项目的顺利实施和圆满完成,使我国双语平行语料库研制走在世界前列。

(责编:秦华)


点击返回顶部