重回天人之际:反思新时期古代文论研究方式的转换

第四章 “数字人文”和大数据分析在文学研究中的应用

字体:16+-

为了进一步检验本书的观点,我们也可以运用最近在人文和社会科学领域兴起的大数据方法,寻找一些更加科学的证据。虽然人文研究跟社会科学的研究有很多区别,但两者之间却有一个共同点,就是要用更多、更好的证据来验证研究者提出的主要观点或者理论。理论创新和经验证据的有机结合,才能更好地推进学术的进步和发展。从这个角度来看,人文学科尤其是文学研究,也可以选择性地借鉴和学习社会科学中的一些有益方法。前几章提到的本书的核心论点是:文学和文论的发展并不一定直接由社会文化的发展而决定,很多时候二者的关系可能恰恰相反,社会文化的发展以及社会运动可能会受到文学,尤其是具有本体特性的文论发展的影响。从本质上讲,论点中描述的关系其实是一个因果关系:社会文化的发展和文学、文论的发展,这两者谁是因,谁是果?从逻辑上来讲,两者的关系有三种可能:可能文学发展是因,而社会的发展是果;亦可能社会发展引起了文学的变革;当然也有可能是二者相互联系、互为因果。前几章的分析通过文本与逻辑分析印证了本书的核心论点。如果只停留在这一步,前几章的内容已经可以自洽。然而,这些分析依然摆脱不了案例“特殊性”的挑战。如果我们将分析和案例的时间和空间都做扩展,本书的核心观点是否依然成立?为了使论证更加全面、更加具有科学性的一面,我们可以采用社会科学中正在不断被广泛使用的“大数据分析”的“量化”方法。

所谓大数据量化方法,其本质和经典的文学包括文艺学研究中“定性”方法的出发点其实是一致的,都是为了从历史和现实当中找到更多的证据支持,或者可以证伪研究者核心观点的经验证据。唯一的不同,可能是表现形式的差异。套用社会科学研究中的术语,定性研究和定量的数据分析方法最终都是为了“检验”研究者的核心论点。就本书的核心观点而言,有两个关键的元素:一个是社会的时代特征;另一个是文学的时代特征。所谓定量地“检验”本书的核心命题,是指从大量的数据分析中检验后者是否会直接影响前者的发展。而且,从研究的最终目的来看,我们关心的这个影响是社会科学中提到的“因果关系”的影响。

一方面,我们可以通过大数据“文本分析”的方式从每个时代比较有影响力的文学作品中提炼出这个时代的文学特征(比如以关键词或者关键短语的形式展现出来),同时也可以从同一时代的报纸、杂志,甚至政府的一些文件中提炼出能够反映这个时代社会思潮和文化的基本特征。在做完这两步“数据搜集和处理”的工作之后,我们可以用统计学或者计量史学的基本量化方法来检验这两个重要的因素到底是否存在统计意义上的相关性和因果关系。如果存在,我们还希望进一步研究出到底哪个因素是因、哪个因素是果。

在这一章中,我并不试图直接给出问题的一个简单答案,而是想提出上述这种新的分析范式。我希望,这种分析范式可能不只是能够帮助回答本书中的具体问题,而且还可以为以后文学和文论研究的推进提供一种新的视角和思考模式。这样一种新的分析范式也就是通常所说的“数字人文”。因此,本章的目的并不仅仅在于帮助学界同仁理解文学发展对社会和文化发展的影响,更重要的是,我想以此为出发点,梳理一下“数字人文”的最新发展和它在文学研究中的具体应用,以此,在现有最大程度的语境还原中发掘古代文论应有的本体意义。本章的主要内容兼顾方法论和具体问题,分为以下几个部分。首先我会对“数字人文”做一个综述性的简单介绍。然后我会通过介绍一个较新的研究的例子,具体阐释如何运用统计学的方法进行“数字人文”的研究。基于唐代的各种历史资料,他们运用定量的方法研究文学造诣是否对个人的道德品质产生影响。他们的研究发现,个体的道德品质和其文学上的造诣相关。这样的结论印证了本书的核心论点:文学的发展会对社会文化产生直接的影响。然后我们从方法论的角度对“数字人文”和它在文学领域的应用可能性,以及注意要点进行论述。在具体的例子之后,本章会对几种常见的“数字人文”的工具和方法进行介绍。这些量化方法包括:回归计量分析、文本分析和可视化技术。由于本章的重点是介绍“数字人文”而不是专门介绍量化方法,因此,对方法的介绍并不会侧重在技术层面,而是尽量从学术实用性的角度考虑初步地介绍这些方法的功效和适用范围。