一、研究进展情况
(1) 项目总体执行情况执行良好,子课题之一:计算社会科学的历史演进及其发展规律课题已经基本完成;子课题之二:世界范围内计算社会科学的发展趋势和前沿动态完成一大半;子课题之三:社会科学的学科结构和基本范式完成一半以上;子课题之四:计算社会科学的学科方法及其方法体系完成一半以上;子课题之五:中国计算科学的愿景目标及其发展路径,完成三分之一。
(2) 调查统计了中国社会学科期刊上利用大数据发表的计算社会科学类的文章数量,使用方法,研究范式等,梳理清楚了中国计算社会科学的产生、现状和发展的文献资料,将于2017年8月召开计算社会科学的高峰论坛,邀请了5次计算社会科学的讲座,组织10次小型专家研讨会。
(3) 已经出版专著一本,第二本专著正在撰写,发表国内外期刊论文6篇,其中,英文SCI论文2篇,完成两篇工作简报,准备递交;正在撰写论文5篇。
(4) 主要存在问题:中国计算社会科学整个发展的现状没有像项目开始前想象那么快,学术界对计算社会科学的认识和发展前景有不同意见,对于大数据推动计算社会科学的影响有待研究观察。
二、研究成果情况
专着一:社会影响评价:理论、方法与实证,社会科学文献出版社2017年12月出版
内容介绍:在经济和社会快速发展的时期 许多政策和项目在实施过程中会遇到社会问题。如何对政策或项目的社会影响进行分析和评价 已经成为当前亟待解决的发展性问题。作者认为 靠前上社会影响评价的许多研究成果可以借鉴 但很为关键的是 应当探索进行适合中国国情的社会影响评价研究 并建立分析框架和指标体系。史玲玲著的'社会影响评价--理论方法与实证'概述了社会影响评价的基本内容、过程和方法 总结了靠前外社会影响评价的一些经验 并结合中国当前的发展现状探讨了社会影响评价在中国应用的分析框架 即项目嵌入与大众反应。社会影响评价的核心内容就是分析项目嵌入的形式和强度与大众反应的组织化程度之间如何互动 很终实现怎样的社会效果 以及能否为地方带来发展的机会。
论文一:大数据为社会网络分析带来‘黄金时代’.2018《实证社会科学》4:72-80.
论文摘要:
社会网络分析因为其独特的理论视角和分析方法,在社会学、经济学、政治学、传播学、计算科学、公共健康等领域得到广泛关注和运用。网络社交平台的兴起和随之产生的海量关系数据的出现,为社会网络分析带来了空前的机遇。其一、海量社交数据为解答网络分析中的经典问题提供了更高精度、更完备的数据来源;其二、网络平台使大规模的随机控制实验成为可能,有利于做出更有说服力的因果推断;其叁、推动学术界对互联网的社会后果等诸多新的问题的提出和研究。本文通过大量实例就这叁个观点展开论述,彰显大数据将社会网络分析带入了“黄金时代”。
论文二:社会关注度的新闻大数据分析-—社会、时间与空间的维度,2018.《浙江学刊》:
论文摘要:
随着手机移动新闻客户端的爆发式增长和个体用户大量数据的产生,利用大数据挖掘和分析方法对网络移动新媒体进行受众分析尤其是社会属性分析成为可能,这将在很大程度上推动移动传播媒介时代的受众分析研究。本文基于搜狐新闻客户端2014年5月至10月的用户行为抽样数据,探索性地从社会、时间和空间等叁个维度对移动新闻客户端用户的阅读行为及其社会关注特征和影响因素进行了分析。研究发现:性别、阶层群体、社会地理空间等因素在新闻关注主题的影响方面存在显着差异;移动新闻客户端用户在不同时间节点所关注的新闻类别也具有明显的差异化特征;“北上广深”等超大城市的用户群体在特定新闻话题上的关注度体现了鲜明了社会性特征。
论文三:中国实证社会科学的演进及使用大数据研究之现状与挑战,2018,《学术界》。 5:18-26
论文摘要:
我国的实证社会科学是改革开放以来在开展全国性社会调查和学习借鉴国外实证社会科学研究方法及技术的基础上发展起来的。这些实证社会科学的数据来源包括:研究者自己组织实施的社会调查,中央和地方党政机关公布的统计数据,以及国内外科研机构公开的数据库,还有最近越来越受到关注的大数据。通过对中美两国叁大社会科学代表期刊使用传统数据和大数据的实证研究论文的分析,发现中国社会科学采取实证方法研究的程度与美国相比还有一定差距,但是在使用大数据的实证社会科学研究方面,中美两国没有显着的差别。使用大数据的中国实证研究论文也大多结合了传统数据来源,采用了传统计量模型来研究和探讨因果机制。因此,使用大数据的实证社会科学的研究目前还只是传统数据的一个有益补充,还没有产生完全突破传统实证研究方法的颠覆性研究方法和范式。导致这个结果的障碍主要在于大数据的不够开放,简易经济的大数据获取和分析工具的缺乏,以及大数据本身的代表性缺陷。因此,要推动大数据实证社会科学的发展,需要加强政府和大型高科技公司跟高校和科研机构的合作,积极开发大数据应用的合适工具,建立大数据实证社会科学的媒介和平台,不断改进使用大数据的实证研究的方法。
论文四:改革开放40年与中国社会学的本土化、发展及创新,2018,《社会科学战线》,6:1-9。
论文摘要:
文章对改革开放40年来中国社会学的恢复、重建、发展与创新做了全面分析。提出了中国社会学恢复重建初期的四个基本特征,即具有突出的学习和开放特征,完成了中国社会学基础建设,创建了比较完整的中国特色社会学学科体系,探讨解决改革开放面对的诸多社会问题。指出中国社会学本土化发展有其学科内在的原因,同时也与改革开放事业、与注重实地社会调查的风格、与对中国现代化的探索均密不可分。深入分析了中国社会学考察社会的叁大理论视角,即社会公平正义视角、社会活力视角与社会秩序视角。梳理总结了中国社会学在社会建设、民生、和谐社会、社会治理研究方面的理论创新。
论文五: Big data prediction of durations for online collective actions based on peak's timing. Physica A Statistical Mechanics & Its Applications, 2018:492.
论文摘要:
Peak Model states that each collective action has a life circle, which contains four periods of “prepare”, “outbreak”, “peak”, and “vanish”; and the peak determines the max energy and the whole process. The peak model’s re-simulation indicates that there seems to be a stable ratio between the peak’s timing (TP) and the total span (T) or duration of collective actions, which needs further validations through empirical data of collective actions. Therefore, the daily big data of online collective actions is applied to validate the model; and the key is to check the ratio between peak’s timing and the total span. The big data is obtained from online data recording & mining of websites. It is verified by the empirical big data that there is a stable ratio between TP and T; furthermore, it seems to be normally distributed. This rule holds for both the general cases and the sub-types of collective actions. Given the distribution of the ratio, estimated probability density function can be obtained, and therefore the span can be predicted via the peak’s timing. Under the scenario of big data, the instant span (how long the collective action lasts or when it ends) will be monitored and predicted in real-time. With denser data (Big Data), the estimation of the ratio’s distribution gets more robust, and the prediction of collective actions’ spans or durations will be more accurate.
论文六:Predicting durations of online collective actions based on peaks’ heights.Communications in Nonlinear Science & Numerical Simulation, 2017:55.
论文摘要:
Capturing the whole process of collective actions, the peak model contains four stages, including Prepare, Outbreak, Peak, and Vanish. Based on the peak model, one of the key variables, factors and parameters are further investigated in this paper, which is the rate between peaks and spans. Although the durations or spans and peaks鈥 heights are highly diversified, it seems that the ratio between them is quite stable. If the rate's regularity is discovered, we can predict how long the collective action lasts and when it ends based on the peak's height. In this work, we combined mathematical simulations and empirical big data of 148 cases to explore the regularity of ratio's distribution. It is indicated by results of simulations that the rate has some regularities of distribution, which is not normal distribution. The big data has been collected from the 148 online collective actions and the whole processes of participation are recorded. The outcomes of empirical big data indicate that the rate seems to be closer to being log-normally distributed. This rule holds true for both the total cases and subgroups of 148 online collective actions. The Q-Q plot is applied to check the normal distribution of the rate's logarithm, and the rate's logarithm does follow the normal distribution.
叁、下一步研究计划
1. 撰写综合性结题报告和专著
题目:大数据时代计算社会科学的产生、现状与发展前景研究
第一章 中国计算社会科学的历史
第一节 传统计算社会科学的发展
一 什么是计算社会科学?
二 我国传统计算社会科学的兴起
三 我国传统计算社会科学的壮大
第二节 大数据的兴起
一 传统数据的制约
二 大数据兴起的背景与条件
三 大数据的独特优势
第三节 未来计算社会科学的发展
一 传统数据与大数据的结合
二 大数据的应用前景
第二章 大数据的产生和发展
第一节 大数据的产生背景
一 什么是大数据
二 大数据产生的时代背景
第二节 大数据的诞生与应用
一 大数据的诞生
二 大数据的应用
第三节 大数据的未来发展趋势
一 大数据在社会科学中的发展前景
二 大数据的风险
第三章 计算社会科学利用大数据的现状
第一节 计算社会科学大数据的获得
一 数据来源
二 数据可得性
第二节 中国计算社会科学期刊基于大数据的论文分析
一 社会学期刊基于大数据的论文分析
二 经济学期刊基于大数据的论文分析
三 政治学期刊基于大数据的论文分析
第三节 美国计算社会科学期刊利用大数据的论文分析
一 美国社会学期刊基于大数据的论文分析
二 美国经济学期刊基于大数据的论文分析
三 美国政治学期刊基于大数据的论文分析
第四章 使用大数据的计算社会科学的方法论
第一节 社会科学研究中的范式转换与方法论变革
一 社会科学研究中的“范式”
二 新一轮的范式转变、方法论变革与“科学革命”
第二节 寻求因果——社会科学研究中的方法论核心
一 因果推断中的基本概念与分析标准
二 经典定量社会学研究中的因果推断方法与现存问题
第三节 使用大数据的社会科学研究方法介绍——以量化社会学为例
一 重返“描述”与“相关分析”的潮流
二 大规模随机控制实验
三 数据挖掘提供参数估计,进行计算仿真模拟
第五章 大数据和计算社会科学的计算和分析工具
第一节 大数据的分析平台和软件介绍
一 MATLAB
二 SAS
三 SPSS
四奥贰碍础
五 R
六 五种分析软件的比较
第二节 大数据的分析工具和常用模型
一 大数据的分析工具
二 大数据的常用模型
第三节 大数据计算社会科学应用中的算法
一 集成算法
二 关联规则算法
三 分类算法
四 聚类算法
五 离群点挖掘算法
六 智能优化算法
第六章 大数据与社会治理
第一节 传统计算科学与社会治理
一 研究对象具有局部性
二 社会治理的单向性
第二节 大数据与社会治理创新
一 大数据时代社会治理的现状
二 大数据与社会治理手段创新
三 大数据与社会治理创新案例研究
第三节 未来社会治理的新格局
一 政府职能转变
二 信息化建设与安全
三 社会治理更加个性化
第七章 大数据与扶贫
第一节 大数据助力扶贫开发实现高精准、高效率、可持续
一 大数据思维与技术应用推动了扶贫开发的精准运行
二 大数据为实现贫困问题的科学分析提供了数据支撑
三 大数据促进了政府贫困治理手段现代化和效率提升
四 扶贫“大数据”的长期积累有助于精准扶贫的持续开展
第二节 应用大数据助力脱贫攻坚的顶层设计与实践探索(国家政策与地方实践)
一 大数据与国家精准扶贫战略相结合的顶层设计与举措
二 精准扶贫开发实践中对大数据应用模式的实践探索
第三节 大数据应用助力扶贫开发的模式思考
一 大数据扶贫模式的内涵
二 大数据扶贫的具体模式
第四节 我国扶贫开发实践中大数据应用的不足与建议
一 我国扶贫开发中大数据应用的不足之处
二 深化“大数据”应用助力全国打赢脱贫攻坚战的建议
第八章 大数据视域下传媒研究的转向
第一节 计算传播学的兴起:社会计算科学对传媒研究的影响
一 大数据时代下传播学研究的新范式
二 计算传播学的概念及应用
第二节 大数据时代新闻学的新特点和新趋势
一 数据新闻学的兴起及特征
二 中外数据新闻的实践探析
第三节 大数据时代网络舆情的发展、挑战及前景
一 网络舆情的传播特点及规律
二 网络舆情的应对体系及策略
第四节 大数据时代广告学的发展与流变
一 计算广告学:大数据时代下广告学的新发展
二 计算广告在互联网市场的实践与探索
第九章 大数据背景下中国计算社会科学的法律和伦理
第一节 大数据应用的法律和伦理问题
一 大数据侵权现象
二 大数据侵权的原因分析
第二节 大数据应用的法律建构
一 数据采集及使用的合法性
二 数据违法使用的法律责任
第十章 大数据背景下中国计算社会科学的挑战和对策
第一节 数据开放问题
一 数据开放问题的主要表现
二 数据开放问题产生的根源
三 国内外数据开放的实践
四 促进数据开放的建议与对策
第二节 数据代表性问题
一 计算社会科学的数据代表性问题
二 数据代表性问题产生的原因
三 解决数据代表性问题的方法与实践
第三节 分析工具和成本问题
一 计算社会科学分析工具的发展
二 计算社会科学分析工具遇到的主要瓶颈与障碍
三 解决分析工具障碍和成本问题的国内外实践
第十一章 总结和展望
2. 2018年8月份召开计算社会科学高峰论坛
3. 2019年8月份召开计算社会科学学术研讨会
(课题组供稿)