伊春园2023入口直达大象

旧版网站入口

站内搜索

大数据时代中国形象数据挖掘理论、方法和应用研究中期检查报告

葛岩2017年12月07日15:03来源:

一、 研究进展情况

1. 研究计划总体执行情况及各子课题进展情况

研究计划总体执行情况良好。主要体现为(1)国家形象文本挖掘的核心模型的建立;(2)创新性发现;(3)所需数据采集和编码基本完成;(4)以及中期成果(论文)写作开始进行。

(1) 子项目一“基于认知图式的形象理论及其在国家形象研究中的应用”

该子项目使用认知心理学中的图式理论,发展出用以计算文字媒体中国家/地区形象的理论模型,基于认知图式的形象模型(Schemata-based Image Model,SIM)。经前期检验,模型计算效果较为满意。

 

(2) 子项目二“英文报纸报道、社交媒体中国信息文本采集与编码”

该子项目采集了美国《纽约时报》15年全部中国报道,印度报道,共21000余篇;英国《经济学人》15年有关中国主题的文章,共3854篇。同时,完成了中国和印度报道人工编码分类,为机器分类器提供了训练材料。

(3) 子项目三“英文报纸报道文本中国形象信息的数据挖掘”

该子项目已开始依据人工分类结果训练分类器, 并开始制作处理固定词组的语料库。同时,使用导航挖掘获得的数据,开发出一组具有创新意义国家/地区形象图式计算方法,可以可通过关键词,维度,关键词-共现词关系等不同角度对不同形象图式最初数量化比较。

(4) 子项目四“社交媒体与国家形象的计算传播学研究”

通过购买关口,采集推特(Twitter)和脸书(Facebook)上粉丝最多的100个英文媒体账号,根据这些帖子收集所有用户对中国问题的评论,共计1206881条,其中与中国相关帖子677877条,与香港相关帖子356607,与印度相关帖子557299条。采集到推特有效媒体账号94个,收集79549条与中国相关帖子,6593条与香港相关帖子,25816条与印度帖子。同时收集所有与中国相关帖子的转发4440220条,所有转发者之间的好友关系共计约30 GB。数据分析方面已完成关键词提取、主题提取、语义网络和情感分析。主题词采用无监督方法,根据Mutual Information方法选出最能代表中国(区别于香港和印度)的词语。主题词提取显示,中国相关话题主要为外交关系(如南海问题),媒体,以及商业、经济(如股市)。情感分析显示,28%的帖子包含某种情感,最多情感类型为喜,其次为恐惧和悲伤。依据上述数据分析结果,中期成果论文在撰写中。

(5) 子项目五“英文媒体国家形象数据的视觉化呈现”

该子项目的工作应在在其他子项目基本完成后开始,故目前尚未启动。

2. 学术交流和成果宣传

(1)境外交流与宣传

项目首席专家葛岩和团队成员秦裕林,徐剑,韩瑞霞,印闯,宋黎出访台湾大学政治系(2016-6);子项目负责人秦裕林出访美国卡内基-梅隆大学约翰?安德森认知科学实验室(2017-5);项目首席专家葛岩和子项目负责人秦裕林出访德国马普研究机构人类发展研究院,意大利欧洲政治经济学研究所(2017-7)。此外,大陆项目团队与承担子项目的香港城市大学互联网挖掘实验室保持常规工作联系。

(2 )境内交流与宣传

通过参加学术研讨会,举办讲座等形式,项目首席专家葛岩与国内同行广泛交流了本项目的研究的成果。主要活动包括:

《实验方法在传播研究中的应用》,讲座,复旦大学新闻学院第十叁期“复旦大学中外新闻传播理论研究与方法暑期学校”,复旦大学教育部信息与传播研究基地,上海:复旦大学新闻学院,2017年7月7日

《在文本中挖掘认知图式:新闻报道中的中国形象为例》,特邀发言,“互联网+城市未来高端圆桌思想会系列第三期 - 幸福 vs. 孤独:互联网上的情感与心理 ”, 广州市社会科学联合会,中山大学国家治理研究院,广州:中山大学国家治理研究院,2017年6月29日

《新闻与传播心理应该做什么、怎么做》,特邀发言,“2017新闻与传播心理学理论与实践发展论坛”, 中国社会心理学会新闻传播学专业委员会,北京:中国传媒大学,2017年6月10日

《厂滨惭模型指导下的媒体形象挖掘》,特邀发言,“上海交通大学中国形象研究中心成立大会”,上海:上海交通大学外国语学院,2017年1月12日

《国家形象研究的认识论困境和出路探索》,讲座,“新闻传播学前沿论坛”,深圳:深圳大学传播学院,2016年12月15日

《国家形象研究的认识论困境和出路探索》, 主题发言,“上海交通大学中国形象研究高端论坛”,上海:上海交通大学外国语学院,2016年12月8日

《基于认知图式的媒体形象挖掘: 导航数据挖掘》,讲座,上海:上海交通大学媒体与设计学院, 2016年10月24日

《基于认知图式的媒体形象挖掘: 导航数据挖掘》,讲座,哈尔滨: 哈尔滨工程大学社会学院, 2016年10月22日

《基于认知图式模型的国家形象挖掘》,“第七届全球传播论坛”,主题演讲,贵阳民族大学传媒学院,2016年7月16-17

《基于认知图式模型的媒体地区形象挖掘》,发言,“文本挖掘在媒体形象研究中的理论与应用研讨工作坊”,台湾大学政治学系,台北:台湾大学,2016年6月6日

《认知心理学理论与媒体形象的数据挖掘》,讲座,上海市精神卫生中心,心理学研究生学术报告会,上海:上海市精神卫生中心,2016年4月6日

二、 研究成果情况

截至中期检查评估,本项目仅发表一篇阶段性成果,《对国家形象研究的文献计量学分析》,作者为项目团队成员印闯,葛岩和秦裕林,发表在新闻传播学类期刊《现代传播》(2016年12期:101-116页)。

1、基本内容

论文所报告的是一个使用文献计量学方法于我国国家形象研究发展和现状的量化研究结果。具体言之,使用知网作为论文样本来源,研究通过对样本关键词的共现分析,发现了对国家形象研究做出显着贡献的机构与期刊,并通过聚类,多维尺度测量和社会网络分析等技术,解析出不同关键词的影响力度,刻画出该研究领域五大主题群落。

2、主要发现

多个研究发现中包括对关键词所做的年度变化分析,聚类分析,多维尺度分析,以及关键词社会网络分析。例如:

? 重要关键词年度变化分析通过追踪刻关键词出现频度历年来的变化,刻画出国家形象研究者最为关注的概念,透露出该研究领域的理论着眼点的变化。分析结果显示,对“公共外交”和“软实力”的关注日渐增强,是目前论者最常使用的关键词。

? 在相异矩阵分析的基础上,关键词聚类分析旨在发现关键词之间的联系,用来蠡测同一或近似的研究主题。聚类分析将样本关键词分解为13个类团,武术和国家形象;奥运会和国家形象;日本、韩国和国家形象;宣传片和国家形象;公共外交和国家形象;文化软实力和国家形象;中国制造和国家形象;新媒体和国家形象;传统文化、电影和国家形象;对外传播和国家形象;全球化和国家形象;软实力和国家形象;国际传播和国家形象。

? 关键词网络分析使用点关键词出现频率和关键词之间的共现关系描绘不同概念在研究中的影响。从可视化图谱中可看到,“软实力”最受重视,下来是“公共外交”,第三群落为“国际传播”,“传播”,“塑造”,“建构”和“对外传播”,第四群落为“跨文化传播”, “文化传播”,“传播策略”,“议程设置”,“媒体”以及“俄罗斯”。在高度简化的意义上,该网络刻画出一个以塑造软实力为目标,以公共外交、媒体传播为途径,试图通过武术、食物、电影、文化产业、制造业、奥运会、世博会、孔子学院等一系列事物、事件、产业或机构来推介中国文化,建构适应全球化环境,符合国家利益,服从于和平崛起战略的中国国家形象研究领域。

3、学术价值

论文报告的研究有双重目的,其一是帮助本项目研究梳理我国国家形象研究的发展与现状,其二是尝试向传播学研究者,特别是国家形象研究者,介绍展示如何使用文献计量学方法刻画学术研究。文献计量学源于图书馆学与信息科学的结合,在发达国家和我国情报学领域已获得广泛应用。但在新闻传播学领域,其应用尚不多见。在这种意义上,本研究做出了跨学科方法应用的尝试。

课题组供稿&苍产蝉辫;

(责编:王瑶)