伊春园2023入口直达大象

旧版网站入口

站内搜索

两岸关系族谱资料数据库建设中期检查报告

2019年12月12日10:45来源:

一、研究进展情况

主要内容:

①研究计划总体执行情况及各子课题进展情况

本课题的研究前期主要是收集和整理两岸关系的族谱资料和研发设计数据库。在资料数据化、电子化的同时,开展相关的课题研究和学术交流活动。

资料收集电子化是一项庞大的工程,收集整理逾万种的家谱资料不仅仅是完成资料扫描电子化那么简单。庆幸地是我们在建设数据库的过程中研发了人工智能识别系统,使我们将电子化的族谱资料进行人工智能识别时提高了效率,推进了数据库的建设工作。

我们将以往收集到的族谱资料整理出版,完成了《客家珍稀谱牒文献丛刊》(100册),由广东人民出版社正式出版。课题组成员已撰写相关论文10多篇,并完成《闽台族谱文献研究》(20万字)撰写工作,正与九州出版社签订出版合同。

相关课题组正在编纂族谱目录,并撰写有关族谱与两岸关系、闽台社会等方面的研究论着。

②调查研究及学术交流情况

族谱资料的收集情况:课题组基本完成了各地族谱资料的收集工作,并派员赴台湾收集族谱资料。我们先后有6人赴台收集资料20天,有1人赴台1个月访学并收集课题相关的族谱资料。

2018年2月6日,利用课题开题之际,我们与福建省姓氏源流研究会共同举办了两岸关系族谱资料数据库建设会议,邀请了台湾10余位姓氏研究会代表出席会议。

2018年12月7日——9日,我们在福州举办了第六届两岸文化发展论坛,与会代表100余人,其中台湾代表出席会议亦有30人之多,会议以两岸族谱研究、宗亲关系等为题展开深入地探讨。

2019年4月20日,我们同台北大学人文学院陈俊强签订了福建师范大学与台北大学人文学院学术交流的协议,双方拟在在台湾文献资料研究方面,在台湾民俗文化研究方面,加强合作。

2019年6月16日——18日,我们在福州举办了第十一届海峡论坛之第七届两岸文教发展论坛,台湾代表有30多位出席会议并发言。

围绕两岸关系我们亦邀请厦门大学台湾研究院的李鹏、刘国深、唐永红、张宝蓉;福建社会科学院的刘小新、刘传标;全国台湾研究会的汪毅夫;上海交通大学台湾研究中心的林冈;台湾世新大学的曾永义、台湾淡江大学的吕正惠、台湾东海大学的赵刚、台湾中华两岸和平发展联合会的蓝博洲、台湾艺术大学的王庆台、台湾佛光大学的谢大宁等来福建师范大学闽台区域研究中心(课题组依托单位)做学术报告。与研究台湾问题的学者交流,与来自台湾的学者专家交流,大大丰富了我们对课题研究的思路和眼界,有力地推动了两岸关系族谱资料数据库的建设工作。

③成果宣传推介情况

在课题研究的过程中,由于资料数据化的工作极其重要,人工智能识别系统的应用特别引人瞩目。我们开发使用的人工智能识别系统亦引起相关部门的注意,浙江师范大学图书馆、暨南大学图书馆、台湾淡江大学贰惭叠础福建考察团、福建省图书馆、广州市图书馆都前来商谈人工智能识别系统的应用事宜,并考察两岸关系族谱资料数据库的功能。

二、研究成果情况

主要内容:①代表性成果介绍

本课题主要的代表性成果——《两岸关系族谱资料数据库》的建设,具体情况如下:

截至2019年7月,征集加工入库的族谱主要是福建、台湾两省1949年之前老谱,共计1517册、144323页,详见:族谱深加工族谱目录。2020年6月前计划征集加工入库的涉台族谱共1.5万册,125万页(其中福建地区5542册、70万页,台湾家谱6781册、25万页,其他2677册、30万页)。

在《两岸关系族谱资料数据库》数据库建设中,我们创建了翱颁搁人工智能平台,对于已经预处理的图片进行文字比对识别,识别内容主要包括:文字、符号、数字以及表格等内容。现目前,翱颁搁人工智能识别系统的识别率高达99%以上,极大提高了家谱资料识别准确率,从而降低人工校对的要求。两岸关系家谱图片成果达到全文识别,将使图片数字化发展提升到一个新的阶段,为我们的最终成果两岸关系族谱资料数据库的文献查询提供了技术支持。

其次,数据库的建设过程中,生成了世谱树,世谱树是族谱中最重要的组成部分,基于翱颁搁人工智能识别与校对,对出现在家谱中的谱系图、谱系图表、谱系描述文字等部分中的每一个人物进行置标以及二维关系的维护。对谱系人物的信息进行标引着录,使人物及人物关系结构清晰化,生成完整家谱世系树。通过对人物的坐标定位,可实现搜索、快速查找。世系树的各节点都可以展示人员的详细信息。

人物信息置标内容包括:姓、名、讳、字、号、别称、谥号、性别、生、卒、世代、支派等。按照支派、世代的先后顺序,同一支派的同一世代按照从右向左、从上至下的顺序依次置标。

提供世系树各节点数据的导入和导出功能。“导出”和“导入”功能用于支持本系统与外部系统的数据交换,导入数据用于选择一个数据交换文件 (xml、excel)将其中的人物数据导入并将之作为选中人物的后代。导出可以对世系树上的各个节点信息以及隶属于该节点的族谱信息的导出,导出文档模式可以根据客户需要进行选择。

第叁方面,我们已完成了数据库的“在线修谱”工作。族谱的编修是继承传统文化、家族命脉的需要,通过在线修谱可进行家族族谱的共同编修、修整和快速续谱,传播谱牒文化知识。平台在对老谱进行数字化深加工(族谱人工智能识别与校对)后,在线修谱软件会分析原谱体例,产生规范家谱章节文本数据与世系树,提供完整的族谱编修界面。

两岸关系族谱资料数据库的后台管理也相继完备,主要体现在⑴系统管理;⑵任务分配;⑶统计功能;⑷文件管理;⑸数据库备份;⑹系统日志功能等方面。

《两岸关系族谱资料数据库》主要功能有族谱全文检索、输名寻祖、在线修谱等功能。应用系统总体建构采用分层设计思想,具体分为:表现层、接入层、应用层、数据层。今后的工作即充实数据库的内容,不断地完善数据库功能。

叁、下一步研究计划

1. 族谱征集工作,尤其是台湾地区的族谱还需实地调研征集。

2. 族谱资料数据化加工。人工智能识别族谱资料尚完成总体工作的12%还需进一步的推进。

3. 族谱总目编目工作需要尽快完成。

4. 继续编写相关的论文和著作。

5. 举办对于两岸族谱研究的学术会议。

课题组供稿&苍产蝉辫;

(责编:孙爽、艾雯)