一、研究计划总体执行情况及子课题进展情况
总体执行情况。重大项目“汉语方言自然口语变异有声数据库建设”于2012年10月立项,同年11月举办开题会。侯精一、陆俭明、黄德宽、曹志耘、游汝杰、潘悟云、柳士镇、石定栩、赵世举、沉阳、王建勤、刘俐李、吴长安、王韫佳等专家参会,就课题框架设计、研究内容、研究方法、技术规范等问题进行充分讨论,会议确定了两个原则:一是数据库代表点为南京、苏州、上海叁大城市;二是强调变异,充分考虑地域差异,将历史演变与自然口语共时变异相结合。设立4个子课题:总体框架设计、汉语方言自然口语分区调查、特大城市汉语方言自然口语接触与变异调查、数据库建设。
工作周期为5年,从2013年1月开始,到2017年12月结束。分为四个阶段:
第一阶段(2013.01-2013.06),完成工作规范,购置设备,搜集资料。
第二阶段(2013.07-2015.06),调查、归纳音系,完成调查任务,建库团队开始进行数据库设计和程序编写工作。
第叁阶段(2015.07-2017.06),完成语料切分,数据核查,按期交给建库团队。
第四阶段(2017.07-2017.12),数据入库,建立数据库检索系统,开发数据检索界面。
目前,课题组严格按照时间表,有序推进各项工作。已召开4次小型学术研讨会,就调查规范、调查手册、任务分工等事项进行讨论。同时,就课题工作遇到的问题,不定期召开课题阶段交流会,各子课题负责人协同合作,项目进展顺利。
子课题进展情况,具体如下:
1. 总体框架设计已经完成。
2013至2014年初,召开2次小范围学术研讨会,制定本课题的总体工作方案,包括工作进度、调查手册、技术规范等,以统筹安排各项工作,使各团队、各调查点按照统一规范进行调查、采录、整理、入库工作。
技术标准:技术规范规定语音采录和语音分析采用统一技术指标,以便后期语音材料的整理入库。规定在采录过程中采用低噪仪器,语音材料用统一用斐风(贵颈别濒诲笔丑辞苍)软件录制,采样率为44100贬锄,采样精度为16产颈迟;如对语音材料进行分析,采用笔谤补补迟语音分析软件制作提取。语图用叁维宽带频谱图,纵轴表频率,横轴表时长,频率取值范围为0-5000赫兹。语图的制作参数为骋补耻蝉蝉颈补苍窗,窗长为0.005秒,时间步长为0.002秒,频率步长为20贬锄。
调查手册:调查手册分单字表、词汇表、语法表叁部分,根据各地方言情况略有调整。单字表收录音韵代表字2600个,以便进行历史演变分析;词汇表收录词汇2200条,按天文地理、时令节气等分为12类;收录语法代表句100句,调查、研究各地方言语法。
调查对象:选定四个年龄段,分性别进行录音。
老年男子1人(60周岁以上),采录2600音系代表字、2200词、100语法例句、独白《牛郎织女》、《狼来了》两个话题、30分钟同辈人对话(两人对话,性别不限)。
中年女子1人(41—55岁周岁),采录2600音系代表字。
青年男子1人(24—40周岁),采录2600音系代表字。
少女1人(1990年以后出生),采录2600音系代表字、2200词、100语法例句、独白《牛郎织女》、《狼来了》两个话题、30分钟同辈人对话(两人对话,性别不限)。
2.“汉语方言自然口语分区调查”和“特大城市自然口语接触与变异调查”同时进行,全面展开。
综合运用方言学、社会语言学、统计学的方法,从年龄、性别、职业、文化程度等方面,在乡村和城市进行布点密集、大规模、多样本的调查,采集自然的、实态的汉语方言自然口语语料。城市方言自然口语调查,又区分新城区和老城区,这在全国性、大规模的方言数据库建设领域尚属首创。目前,各调查团队正分赴各地进行调查。南京点录音、整理和转写作已经完成,苏州点、上海点采录工作正在进行。以上海为试点进行的“特大城市自然口语接触与变异调查”已经展开,已筛查到的语音变异项近40个,极具研究价值。
3. 数据库建设工作进展顺利。
“数据库建设”子课题在语音资料整理、转写、切分基础上,对调查资料进行整理入库、加工开发,建立“汉语方言自然口语数据库”,开发和使用专门的分析软件和规范化工具,对调查资料进行分析、校对、规范化处理,以保证资料的数字化质量,并构建相应的检索系统,实现资料的存储、关联、访问和检索。
现已完成南京点语音资料的整理、转写工作,其他点的录音、整理、转写正在进行,为后期数据库入库准备了大量语音图文资料。
二、调查研究及学术交流情况
1. 田野调查工作
为采录方言自然口语,项目组历时一年半,在南京和苏州地区展开大规模的田野调查,采录了大量语音样本,按照数据库建设的技术参数录制了高质量的音频资料。在上海市,为调查语言变异项,前期已经展开录音工作,采集语音样本,甄选具有代表性的变异项。
2.学术交流活动
2013年至2014年6月,本项目组召开了4次小型学术研讨会,多次阶段性汇报会、交流会。与会专家来自北京大学、南京大学、复旦大学、北京语言大学、陕西师范大学、暨南大学、南京师范大学、苏州大学、南通大学等高校,制定调查文本,如调查字表、词表、语法例句、话题等规定内容;确定数据库建设的各项技术标准,如录音软件、采样率、语图制作规范、数据入库技术等;就本课题的相关前沿问题充分探讨,互相交流。
叁、研究中遇到的主要问题及解决办法
1.自然口语调查手册的制定
迄今为止,我国尚无一份专门用于调查方言自然口语的调查表,国外亦无可供借鉴的资料。我们按照本课题的目标、范围、方法等制定调查表的总体框架、分类系统以及具体条目,召开2次研讨会,反复论证,最后确定音韵代表字2600个,词汇十二类2200条,语法例句100句,从字、词、句叁个方面调查方言自然口语。
2.数据库的建设
方言自然口语的数据库建设属前沿课题,要求研究者掌握方言学、计算机科学、民俗学、人类学的相关知识。我们依托南京大学相关院系资源,通过院系交流、学术研讨,对本课题组成员进行了专门培训。此外,方言自然口语有声数据库对口语语料的自然性和音像质量要求很高,录音工作难度较大。为保证语音数据质量,我们严格按照统一的采录规范,采用低噪设备,确保音像质量;在各调查团队安排以当地方言为母语的调查人,或在调查点长期工作的人,保证数据的真实性、自然性和准确性。
二、研究成果情况
1. 顾黔《南京方言知庄章叁组历时演变与年龄差异研究》(《语言暨语言学》Language and Linguistics, Monograph Series53,2014,台湾中研院语言所)
南京方言知、庄、章叁组存在摆迟蝉、迟蝉丑、蝉闭与摆迟?、迟?丑、?闭的对立,这在江苏境内的江淮方言是一重要特征。凡北京话读[迟蝉、迟蝉丑、蝉]者南京话亦读[迟蝉、迟蝉丑、蝉];然而北京话读[迟?、迟?丑、?]者南京话存在明显的年龄差异,这是历史上知、庄、章叁组的对立,尤其是庄组与知章组的对立在南京方言的遗存和反映。该文以少、青、中、老四个年龄段为调查对象,在中古知、庄、章叁组选择南京人常用口语词(字)119个,逐一调查、统计、分析其在四个年龄层的音读分布情况,探讨差异产生的原因及历时演变的轨迹和方向。
调查发现,操南京方言的老年人,中古知、庄、章三组字[ts]、[ t?]两类是共存、叠置的,只是与北京话相比[ts]类稍多于[t?]类。到了中年阶段,大量[t?]组字归入[ts]组(不包括韵母是舌尖后[?]的字),使得中年组[ts]占了主导地位。青少年由于受普通话的影响,并未沿袭中年人在发音上的转变,而是又将许多字归入[t?]组,因此[ts]、[t?]两组的比率又恢复了基本平衡。少儿组[ts]类出现的几率最小。
文章指出,目前,南京话知庄章叁组既有古音的遗存,又由于语言接触受汉民族共同语普通话的影响,不少语音特征发生了变化。认为南京话知、庄、章叁组的读音从老年到中年的转变是南京方言自身发展的结果;而中年到青少年的变化是近几十年来普通话正音教育的结果。
该文于2013年6月,在美国新泽西大学举办的“Various Aspects of Chinese Studies in the Global Age(全球化视野下的中国研究)”国际学术研讨会上,由顾 黔教授作主题演讲。与会专家十分关注南京方言的变异情况,对该文给予高度评价。
2. 顾黔《南京方言宕江两摄入声韵的共时变异及历时演变研究》(《澳门理工学报》,2013年第4期)
南京是中国四大古都之一,其方言古为吴语,由于历史上多次北人南下,充实江淮间,现已演变为江淮官话。文章运用历史层次分析法,考察南京方言宕江两摄入声韵在老、中、青、少四个年龄段的共时变异,分析宕江两摄入声韵的语音层次,探讨普通话渗透、嵌入南京方言的方式和步骤,讨论南京方言入声韵的演变轨迹和发展趋势。
文章探讨南京方言宕江两摄入声韵纷繁复杂的音读形式,与外地方言(特别是普通话)的接触影响引起的竞争、迭置、借入的具体情况,指出其演变过程,分为四个步骤:
第一步 声母白读+韵母白读+声调白读 削sio?5
第二步 声母文读+韵母白读+声调白读 削?yo?5、确t?hyo?5⑥
第三步 声母文读+韵母文读+声调白读 削?ye?5、确t?hye?5
第四步 a.声母文读+韵母文读+声调文读(对应的南京话调值)削?ye31、确t?hye44
产.声母文读+韵母文读+声调文读(对应的普通话调值)削?测别55、确迟?丑测别51
文章从方言接触、历史层次、异源迭置等角度,探讨南京方言的共时变异和历史演变,具有重要的学术价值。
3.陈忠敏《历史比较法与汉语方言语音比较》(《语言研究》,2013年第5期)
文章根据历史比较法的原理,讨论高本汉方言语音比较法、罗杰瑞闽语语音比较法的得失,认为“方言的语音比较其实就是建立方言间语音层次的对应,只有是对应的层次才是对等的语音形式”,“在语言接触频繁的方言里,语音层次分析是语音比较的前提”,提出“方言语音层次比较法”这一概念。文章考察闽语鱼韵读音,说明语音层次比较法的具体步骤:
一、必须先在单个方言点梳理出所研究项目的语音层次
二、研究异读
叁、确定语音层次的音韵特点和语音层次的时间先后
四、根据单个方言点层次的音韵特点和时间先后,由近及远寻找方言间的对等层次(对等语音形式)。
文章指出,语音层次分析不是为了给《切韵》的音类拟音,它不仅关注方言的原始成分,也分析各时期由于语言接触引起的层次现象,也即可以对方言的整个语音发展的历史作出分析和解释。
4. 陈忠敏《上海方言的形成及其特点》(《澳门理工学报》,2013年第4期)
上海市中心方言是由原松江地区的方言发展出来的。由于170年来独特的政治、经济、文化、移民等因素,造成了市中心方言跟周围松江方言区方言的发展不平衡,是一个非常典型的方言地层学现象,具有极高的研究价值。
文章从语言接触的角度和方言形成的历时人文背景,根据实地调查,指出上海地区的方言可根据声调的调类分合及调值特点分为5个区。在此基础上,描写市中心方言区语音的主要特征,分析市中心方言的历时演变,探讨上海市中心方言的变异现象及其原因。
文章通过梳理、分析历史文献,归纳出170年来上海话声母、韵母、声调等重要演变规律,在上海传统方言衰亡前尽可能全面、真实地记录方言面貌,为中华文化和人类文明留下一份珍贵的遗产。
5. 陈立中《甘肃合水太白方言自然口语语料类编》(南京大学出版社,2014)
《甘肃合水太白方言自然口语语料类编》,辑录甘肃省合水县太白方言的自然口语语料。作者在实地录得约200小时的语音材料,用国际音标记录录音材料,用汉字转写每句方言话语。
语料按内容分类排列,涉及天文、地理、时间、传统节日、农业、植物、动物、民居、日常生活用品、人品、亲属、身体、医疗、服饰、饮食、红白大事、宗教迷信、行政、日常生活、交际、为人处事、工商业、教育、文体娱乐、动作行为、位置、代词、形容词、副词、介词、量词、数词、声音等34类。
全书180万字,内容丰富,语料翔实,堪称一部地方方言和文化的百科全书。
6. 顾黔“南京方言自然口语变异有声数据库”(2013年)
按照统一规范,从2013年5月至2014年5月,课题组采用科学方法和现代化技术手段,实地采录自然的、实态的汉语方言口语语料,标记、转写、整理,完成了南京方言自然口语变异数据库建设。
课题组选择四个年龄段,分性别进行录音。老年男子(60周岁以上)和少年女子(1990年以后出生)各一人,采录2600音系代表字、2200词、100语法例句、独白《牛郎织女》、《狼来了》两个话题、30分钟同辈人对话(两人对话,性别不限)。中年女子(41—55岁周岁)和青年男子(24—40周岁)各一人,采录2600音系代表字。
在采录过程中,采用低噪仪器,统一用斐风(贵颈别濒诲笔丑辞苍)软件录制,采样率为44100贬锄,采样精度为16产颈迟;采用笔谤补补迟语音分析软件对语言材料进行分析,制作提取语图。语图用叁维宽带频谱图,纵轴表频率,横轴表时长,频率取值范围为0-5000赫兹。语图的制作参数为骋补耻蝉蝉颈补苍窗,窗长为0.005秒,时间步长为0.002秒,频率步长为20贬锄。
在保存和呈现环节,广泛使用最新的多媒体、现代化技术手段,包括录音、录像、照相、音像加工技术等,利用数据库和网络技术展示方言自然口语的实际面貌,真正做到方言自然口语的多媒体化和“实态”化。
注:2010年立项的重大项目主要填写2012年6月以来的研究成果情况。
序号 |
成果名称 |
作者 |
成果形式 |
刊物名或出版社、刊发或出版时间 |
字数 |
转载、引用、获奖等情况 |
1 |
南京方言自然口语变异有声数据库 |
顾 黔 |
数据库 |
2013年 |
18GB |
无 |
2 |
《南京方言宕江两摄入声韵的共时变异及历时演变研究》 |
顾 黔 |
论文 |
《澳门理工学报》 2013年第4期 |
6700字 |
无 |
3 |
《南京方言知庄章叁组历时演变与年龄差异研究》 |
顾 黔 |
论文 |
Language and Linguistics, 2014 (《语言暨语言学》) |
5400字 |
无 |
4 |
Nanjing Dialect and Folk Culture: Everyday Utensils |
顾 黔 |
论文 |
Various Aspects of Chinese Studies, 2014 |
9000字 |
无 |
5 |
《历史比较法与汉语方言语音比较》 |
陈忠敏 |
论文 |
《语言科学》 2013年第5期 |
2.1万字 |
无 |
6 |
《也谈历史比较法与历史层次分析法》 |
陈忠敏 |
论文 |
《语言学论丛》 第47辑2013年 商务印书馆 |
1.2万字 |
无 |
7 |
《上海方言的形成及其特点》 |
陈忠敏 |
论文 |
《澳门理工学报》 2013年第4期 |
9000字 |
无 |
8 |
On the relationship between tones and initials of the dialects in the Shanghai area |
陈忠敏 |
论文 |
Language and Linguistics, 2014 (《语言暨语言学》) |
1.6万字 |
无 |
9 |
《江浙沪交界处方言送气分调及相关问题》 |
陈忠敏 |
论文 |
《承泽堂方言论丛》 语文出版社 2014年 |
6400字 |
无 |
10 |
Feature combination via importance-inhibition analysis |
陈家骏等 |
论文 |
Journal of Southeast University (英文版) 2013年第1期 |
5000字 |
无 |
11 |
《关中东府方言古知庄章组合口字与精组字合流的内外因素》 |
邢向东 |
论文 |
《语言研究》 2014年第1期 |
6000字 |
无 |
12 |
《近八十年来关中方言端精见组齐齿呼字的分混类型及其分布的演变》 |
邢向东 |
论文 |
《陕西师范大学学报》2013年第5期 |
7700字 |
无 |
13 |
《甘肃合水太白方言自然口语语料类编》 |
陈立中 |
着作 |
南京大学出版社 2014年 |
180万字 |
无 |
14 |
《现代湘语和吴语浊音声母发音特征的比较》 |
钟江华 陈立中 |
论文 |
《湖北民族学院学报》 2012年第4期 |
5000字 |
无 |
15 |
《江苏海安方言的“子”尾词》 |
|
论文 |
《方言》 2012年第4期 |
6000字 |
无 |
16 |
《上海话“辣海”的语源及虚化特征的比较研究》 |
|
论文 |
《东南大学学报》 2012年第4期 |
1.2万字 |
无 |
17 |
《适应原理下句法系统的自繁殖》 |
马清华 |
论文 |
《语言研究》 2014年第1期 |
8000字 |
无 |
18 |
《拟声词在语言发生学上的意义》 |
马清华 |
论文 |
《外国语》 2013年第1期 |
7200字 |
无 |
19 |
《江苏丹阳方言的语气词》 |
徐娟娟 |
论文 |
《方言》 2013年第4期 |
1.1万字 |
无 |
20 |
《语音层次与边界方言属性——以丹阳方言为例》 |
徐娟娟 |
论文 |
《语言科学》 2012年第5期 |
7000字 |
无 |
21 |
《丹阳方言文白异读与语音演变》 |
徐娟娟 |
论文 |
《暨南学报》 2012年第3期 |
1.2万字 |
被引用1次 |
22 |
《明清木鱼书中的粤方言》 |
邓小琴 |
论文 |
《暨南学报》 2014年第4期 |
7200字 |
无 |
23 |
《粤方言否定副词“咪”之溯源及其语义虚化》 |
邓小琴 |
论文 |
《前沿》 2013年第20期 |
5000字 |
无 |
24 |
《身份认同与儿化使用——以北京儿化为例》 |
王 玲 |
论文 |
《暨南学报》 2014年第3期 |
7200字 |
无 |
25 |
《城市化进程中本地居民和外来移民的语言适应行为研究》
|
王 玲 |
论文 |
《语言文字应用》 2012年第2期 |
1.2万字 |
被引用5次 |
26 |
《语言生活中的弱势群体——概念、界定和原因分析》 |
王 玲 |
论文 |
《外语研究》 2013年第1期 |
8400字 |
无 |
27 |
《现代汉语评论话语使用状况研究》
|
王 玲 郭 晶 |
论文 |
《扬州大学学报》 2013年第6期 |
7200字 |
无 |
28 |
《城市语言环境变化与城市语言冲突事件》 |
王 玲 刘艳秋 |
论文 |
《安徽师范大学学报》 2013年05期 |
9600字 |
无 |
29 |
《城市化中语言适应行为与语音变异关系研究》 |
王 玲 |
论文 |
《陕西师范大学学报》 2014年第2期 |
8400字 |
无 |
30 |
《南京方言中的“有点儿”和“一点儿”》 |
张 薇 |
论文 |
《语文学刊》 2013年第12期 |
3000字 |
无 |
31 |
《丹阳方言语音层次与历史演变》 |
徐娟娟 |
南京大学 博士论文 |
2012年 |
20万字 |
无 |
32 |
《常熟方言音韵演变研究》 |
莫娲 |
南京大学 博士论文 |
2013年 |
15万字 |
无 |
33 |
《江阴方言历时演变及共时年龄变异研究》 |
张志凌 |
南京大学 博士论文 |
2013年 |
15万字 |
无 |
34 |
《高淳方言语音研究》 |
张薇 |
南京大学 博士论文 |
2014年 |
22万字 |
无 |
35 |
《连云港方言地理语言学研究——一语音为例》 |
王萍 |
南京大学 博士论文 |
2014年 |
15万字 |
无 |
课题组供稿