态势作为事物发展状态和趋势的表征,是事物动态变化趋势的体现。社会心理态势则是描述群体的心理状态及其发展趋势,能够对群体和个体的行为取向进行预测。社会心理态势主要由社会群体中个体的心理态势组成,并影响着他们心理态势发展的方向和趋势。人们对涉及的社会事物,因其是否符合自身物质方面或理念方面的需要,会产生不同的体验和态度,这些都属于社会心理态势的范畴。
当前社会心理态势感知手段主要通过大范围的问卷测评方法。问卷测评的方法历史悠久,可以准确获知被试者的心理状态。然而该方法受时效性、社会赞许性等因素影响;同时自陈方式的测评周期长、成本高,无法及时大规模获取用户的心理状态,而且纵向追踪研究不具有实施上的可行性。
近些年,我国信息科技事业得到了迅猛发展。信息科学技术的发展和互联网平台的出现,为社会心理态势感知研究的发展提供了新的契机,能够很好地弥补传统研究方法的局限,使通过网络数据实现对用户心理要素的计算预测成为可能。其中,作为当前网民最经常使用的网络应用之一,微博在国内的用户数量已达到3亿人,微博在快速改变传统网络舆论格局力量的同时也逐渐展现出其自身所具有的独特优势。用户在微博平台上可以真实、自发地表达或分享自己的情感、观点和社会态度,为社会心理研究提供了大量真实、可靠的潜在数据源。鉴此,心理所行为科学重点实验室朱廷劭研究组提出利用微博大数据,开展社会心理态势感知研究,在对社会媒体大数据分析的基础上实现社会心理要素识别,并预测相关心理要素的发展趋势,建立快速准确的社会心理态势感知系统。
• 社会媒体大数据采集平台
该研究组开发的新浪微博应用“心理地图”(http://ccpl.psych.ac.cn:10002)在线问卷填写和调查平台,可以满足大规模用户调查的需求。在获得用户的授权后,“心理地图”通过调用新浪微博API进行微博数据的下载。这样就可以得到一个用户的标注数据。
“心理地图”具有微博数据抓取的网络爬虫功能,,其中数据量超过10TB,完全具备了微博大数据的获取和处理能力。
• 社会心理态势要素的计算识别
社会心理态势要素包含人格、心理健康、主观幸福感以及社会态度等多方面的指标。通过网络数据对这些指标的预测是社会心理态势感知的重要组成部分。
人格代表了人际之间存在个性化差异的重要原因与心智基础,个体的人格特征有助于身份识别。本研究随机选取了已签署知情同意书的547名微博用户作为被试(214名男性,333名女性,年龄23.66 ±5.28岁),下载其微博行为记录,并提取839个行为特征作为预测变量;同时,对全体被试施测大五人格问卷,获取其在各人格维度上的得分作为结果变量。利用支持向量机与Pace回归算法分别训练基于微博行为的人格计算模型。研究结果表明,基于微博行为的人格计算模型拥有良好的测量属性。在SVM模型中,微博行为对各人格维度高低得分组被试的分类精度达到84%~92%;而在Pace回归模型中,基于微博行为的人格预测结果与基于自评问卷的人格测验结果之间的相关系数达到0.48~0.54。这表明,通过微博行为来预测用户的人格特征是完全可行的。
心理健康指人的基本心理活动的过程内容完整、协调一致,能适应社会,与社会保持同步,其中较为常见的心理健康问题有:抑郁、焦虑等。针对心理健康的问题,本研究使用新浪微博数据建立心理健康(抑郁)预测模型。利用被试的微博数据,并用机器学习的方法建立模型,通过模型计算得出被试的抑郁状态评分。本研究抽取1万个已签署知情同意书的新浪微博用户,并施测抑郁测评问卷(CES-D);同时提取其内容与行为两方面建立特征,建立了心理健康的回归预测模型。结果表明,预测模型值与真实值的相关系数接近0.4,达到中等相关水平。
主观幸福感指人们对其生活质量所做的情感性和认知性的整体评价。本研究采集了1785
已签署知情同意书的用户作为被试,其中649名男性,1136名女性;采用不同的特征集合建立了主观幸福感的预测模型。研究结果表明,使用行为特征(B)、内容特征(L),同时加入年龄、性别、收入和受教育程度等统计信息特征(D),可以达到最优的预测效果。模型相关性可达到0.31~0.54,表明利用微博数据预测得到的用户幸福感是可行的。
根据先前研究的经验,社会态度的指标体系包含了四方面的指标,分别为社会状况评价、社会风险判断、经济发展信心和对政府执政的满意程度。本研究在广东省开展用户实验,并采集了2018个已签署知情同意书的合格样本。利用微博数据,采用多任务回归进行群体社会态度的预测。预测结果和标注结果的平均相关系数达0.41,平均预测误差率为15.5%。本研究利用网络数据的可回溯性,尝试描述某地群体社会态度随时间的变化情况。下图为中山市2012年2月至2013年2月生活满意度(LS),收入满意度(IS),社会地位满意度(SPS),地方经济满意度(LES),国家经济满意度(NES)和社会公平满意度(SJS)的变化情况。