从上述具体的研究案例中,我们可以看到“数字人文”这一跨学科的方法在文学及其相关领域中的具体应用。陈冬华等给我们展示了“数字人文”应用在人文学研究中很重要的几个特征。这些特点也是在以后的研究中需要注意的地方:首先,一般性的文学理论和本土化的具体问题相结合;其次,“数字人文”是跨学科的,需要多学科的合作;再次,“数字人文”的研究以文学理论为基础,辅以数据分析的方法加强研究的科学性和提供更严格的证据,不可本末倒置;最后,值得强调的是,“数字人文”的研究更有利于直接回答“实证”性的问题,但同时也对“规范”性的问题有间接的启发。
(1)一般性的文学理论和本土化的具体问题相结合。
首先,陈冬华等的研究使用的是我国唐代的历史资料,因此可以说是一个很好的本土化的研究。而他们研究问题的最终落脚点却可以直接回应本书的主要观点:文学对社会文化的发展有着直接的影响。在这一研究中,我们既看到了一般意义上的文论和观点,也看到了这一观点在我国文学史中的对照。值得强调的是,本章中所说的一般性文学理论和本土化具体问题的结合,并不是鼓励直接地、机械地套用西方的经典文学理论来解释我国的文学发展史中的一些事实。正如本书一开始所说,中国文学的发展需要走一条本土化的独特的道路。这条独特道路的开辟,就要求我们首先从我国文学发展路径的一些基本经验事实和史实出发,总结出具有中国特色的一般性文学理论或者观点。而这样的理论和观点不仅要能和西方的理论相呼应,还要能解释我国独特的历史文化发展脉络。这就是所谓“本土化”的核心要义。“本土化”不只是要求我们基于从古到今的文学发展路径来总结我国的文学理论,同时还要求研究者能利用我国特有的史料对我国的和世界的文学理论进行系统的比较、考证和“证伪”。当然,考证的方法可以有很多种,本章中强调的就是偏量化的“数字人文”的方法。陈冬华等则兼顾使用了定量方法和基于史料分析的定性研究方法。
(2)“数字人文”是跨学科的,需要多学科的合作。
在“数字人文”的相关研究中,或多或少要使用“数字人文”这样的量化方法。这就注定了研究者需要运用跨学科的知识。我们或许可以把基于大数据方法(或者广义“数字人文”的方法)发展运用到文学领域的研究称为“数字文学研究”。在“数字文学研究”中,研究者需要的不仅是人文学科的知识储备,更需要有社会科学的,甚至计算机和统计学等相关学科的知识。陈冬华等的研究是一个经典的跨学科合作的例子。作者当中有经济学背景的学者,有公司治理研究领域的专家,还有文学爱好者。他们通过运用统计学和计量经济学的方法研究了一个跨文学和社会科学的问题。他们关注的问题事实上也是公司治理领域一个基本的重要观察:除了制度因素之外,人的道德因素也会对社会和经济的发展起到至关重要的作用。道德的考量属于社会文化的范畴。社会文化本来并不属于经济学和公司治理的研究范围。随着学科不断发展和对社会经济现象的认识不断深化,包括经济学家和金融学家在内的社会科学家越来越意识到社会文化对经济发展的重要作用。因此,越来越多的社会科学家将研究视角转向对社会文化的理解。而在人文领域,尤其是文学研究领域,很多学者也对社会文化有着浓厚的兴趣。研究话题的特质就自然决定了研究内容跨学科的性质,从而需要不同学科知识的综合运用。同一个话题,从不同的视角、运用不同的方法工具来研究,可能会有意想不到的研究结果。这里所强调的跨学科,不仅是从方法论而言的。“数字人文”研究中需要运用到其他学科如统计学的知识,同时还需要结合具体的研究话题融合其他社会科学的具体知识,综合不同学科的视角。因此,“数字人文”不仅仅是工具意义上的跨学科,也是知识内涵和研究视角上的跨学科。
(3)“数字人文”的研究以文学理论为基础,辅以数据分析的方法,不可本末倒置。
正如前文中提到的,如果没有文学理论作为支撑,再精细的数据分析最终也不能加深我们对文学问题的理解。“数字人文”的研究需要理论。陈冬华等在研究的一开始就通过梳理已有文献的方法,给出了自己的逻辑体系。在构造的理论框架中,他们提出了自己的学术观点。通过理论逻辑的推演,他们将理论中的核心观点转化成可以用数据去检验的假设,最后他们再运用统计学和大数据的方法对他们的核心假说进行检验。如果没有一开始的理论作为支撑,数据分析的结果很难展示出其对文学理论的贡献。这样的研究思路是合理的,它强调了“数字人文”研究中理论的重要性。事实上,这样的研究思路早已被广泛应用在现代社会科学的各个领域当中。随着近些年大数据研究方法越来越流行,社会科学家也越来越警惕没有理论而只是纯粹的“数据挖掘”(data mining)式的数字游戏。所谓“数据挖掘”,就是指在没有什么人文或者社会科学具体理论的指导下,让计算机算法对已有的数据中的特征进行机械的探索。在“数据挖掘”式的社会科学研究中,研究者往往在处理和分析数据之前并没有成型的理论,而是通过尝试多种统计方法和模型,探索多个变量之间各种形式的统计关系,而最后汇报研究结果的时候,只展示那些统计结果比较好的研究,却不汇报那些结果不好的研究。这样的研究流程被现代社会科学家所诟病,当然也不应该成为人文研究遵循的方法。“数据挖掘”的方法来源于计算机领域,适当地应用到人文、社会科学领域固然会有些成效。比如,前文提到的哈佛大学“中国历代人物传记资料库”共收录从7世纪到19世纪的超过37万人的传记资料。如果我们利用这个大数据库进行一些“数据挖掘”的处理,我们也许可以更清晰地看到同一时期不同作家或者诗人之间的关联,从而更科学、更清晰地看出不同文学流派的特征和演变。但是包括“数据挖掘”在内的各种技术上的数据搜集和处理方法,不能代替学者的人文思考。没有思考和理论的“数字人文”研究就好像无源之水无本之木,很难长久、深远。文学理论和人文学科中思考的主体作用是本书一再强调的。只有建立在此之上,合理地运用“数字人文”的方法,才能锦上添花。
(4)“数字人文”更有利于直接回答“实证”性的问题,但同时也对“规范”性的问题有间接的启发。
无论是在本书中,还是在上文中介绍的陈冬华等的研究中,我们的研究问题,从社会科学的视角来看,都是“实证性”(positive)的问题,也就是“是什么”和“为什么”的问题。在社会科学中,跟“实证性”的问题相对应的是“规范性”(normative)的问题。“规范性”的问题一般是指“应该怎么样”之类的问题。具体来说,本书中的核心问题是文学的发展如何影响社会文化。根据定义,这是一个“实证性”的问题。前几章一系列的分析就是着眼于文论、文学及其发展与社会文化之间的关系,并且认为应该探索前者对后者施加影响的渠道或者机制是什么。简言之,本书并不想直接涉及“文学是不是‘应该’对社会文化产生影响”这样的问题。和其他的人文和社会科学研究类似,虽然研究的主题是实证的,但不是说研究结果对于我们理解对应的规范问题就没有启发。我们有各种逻辑和经验证据说明文学会对社会发展和社会文化起到积极的促进作用。那么从规范的意义上来看,我们就需要进一步地发展文论,鼓励文学在社会中不断产生更多的影响。当然,“文学是不是‘应该’对社会文化产生影响”,或者说文学是不是应该独立于社会和文化发展而存在,则是本章没有直接回答的一个问题,对于这样的问题,广义的“数字人文”的方法可能并不一定能提供直接的研究工具。此时只有文学范畴内的深度思考才能给出这个问题的答案。