科研进展

心理所研究运用人工智能技术对文学人物性格进行分析

发布时间:2018-08-29 作者:中国科学院行为科学重点实验室 朱廷劭研究组

  文艺作品中的人物心理过程与人格形象塑造是文学创作、评价的核心,由于其主观性和复杂性,以往研究大多以文学评论或哲学思辨为主。由于文学人物是虚拟的或理想化的,研究者无法采用传统心理学中自我报告的方法对其进行直接测量。 

  一般来说,测量一个人的性格,可以让这个人自己描述性格、填写性格测试,或者让周围的人对他的性格进行评价。但是如果测量一个文学作品中的人物性格,因为无法让文学作品中的人物进行自我报告或者填写问卷,也无法找到熟悉他的人来对其进行评价,因此对其性格分析的唯一“抓手”便是作者对他的描写,尤其是人物的对话。 

  基于上述背景,中国科学院行为科学重点实验室朱廷劭研究组联合厦门大学吴胜涛研究组开展研究,旨在探索利用人工智能技术实现对小说人物人格特点的分析。 

  以往研究中,分析小说人物一般有两种办法:一种是定性研究,依据研究者的人文素养和对小说文本的阅读体验,从微观方面将小说中的一个或多个人物概括成不同的方面,然后将这几个方面的性格特点用文本描述进行佐证;另一种是语言学的定量研究,将对话的语料库进行频次分析,再对频次较高的词语进行性格归纳。 

  近年来,随着自然语言处理及机器学习技术的发展,研究者已经建立起了社交网络媒体数据与大五人格的映射关系。这种基于生态化的行为数据,利用机器学习实现个体心理特征自动识别的过程,人们称之为生态化识别(EREcological Recognition)。近期,研究者将生态化识别的方法引入文学人物的性格分析,建立起文学智能分析系统,实现主人公对话与性格特征的映射(工作流程如下图)。利用该系统可直接通过文学人物的对话计算出人物的宜人性、尽责性、外向型、开放性和神经质的分数。 

 

 

  研究以《平凡的世界》中的主人公孙少安、孙少平兄弟为例,分析两位主人公的总体性格与经历重大生活事件后的性格变化。结果如下表123所示。 

    

1. 主人公性格预测

   
 

2.结婚前后孙少安的性格变化

 

3.升学前后孙少平的性格变化

    

  研究表明,通过文本心理特征的生态识别,将文学智能分析应用于小说人物的人格预测是有效的。研究运用人工智能技术对小说人物的个性特点进行现实、量化描述,具有客观性、可重复性和处理大型语料库的技术优势,使其在文学智能评价、智能创作以及社会心态的大数据分析上具有巨大的潜能。 

  该研究受国家社科重点研究项目的课题资助。相关研究成果已经在线发表于《中文信息学报》和国际学术期刊Digital Scholarship in the Humanities 

    

  论文信息: 

  吴育锋,吴胜涛,朱廷劭,刘洪飞,焦冬冬. 小说人物性格的文学智能分析: 以《平凡的世界》为例[J]. 中文信息学报, 2018, 32(7): 128-136. 

  Mingming Liu, Yufeng Wu, Dongdong Jiao, Michael Shengtao Wu, Tingshao Zhu; Literary intelligence analysis of novel protagonists’ personality traits and development, Digital Scholarship in the Humanities , fqy020, https://doi.org/10.1093/llc/fqy020 


附件下载: