為了進一步檢驗本書的觀點,我們也可以運用最近在人文和社會科學領域興起的大數據方法,尋找一些更加科學的證據。雖然人文研究跟社會科學的研究有很多區別,但兩者之間卻有一個共同點,就是要用更多、更好的證據來驗證研究者提出的主要觀點或者理論。理論創新和經驗證據的有機結合,才能更好地推進學術的進步和發展。從這個角度來看,人文學科尤其是文學研究,也可以選擇性地借鑒和學習社會科學中的一些有益方法。前幾章提到的本書的核心論點是:文學和文論的發展並不一定直接由社會文化的發展而決定,很多時候二者的關係可能恰恰相反,社會文化的發展以及社會運動可能會受到文學,尤其是具有本體特性的文論發展的影響。從本質上講,論點中描述的關係其實是一個因果關係:社會文化的發展和文學、文論的發展,這兩者誰是因,誰是果?從邏輯上來講,兩者的關係有三種可能:可能文學發展是因,而社會的發展是果;亦可能社會發展引起了文學的變革;當然也有可能是二者相互聯係、互為因果。前幾章的分析通過文本與邏輯分析印證了本書的核心論點。如果隻停留在這一步,前幾章的內容已經可以自洽。然而,這些分析依然擺脫不了案例“特殊性”的挑戰。如果我們將分析和案例的時間和空間都做擴展,本書的核心觀點是否依然成立?為了使論證更加全麵、更加具有科學性的一麵,我們可以采用社會科學中正在不斷被廣泛使用的“大數據分析”的“量化”方法。
所謂大數據量化方法,其本質和經典的文學包括文藝學研究中“定性”方法的出發點其實是一致的,都是為了從曆史和現實當中找到更多的證據支持,或者可以證偽研究者核心觀點的經驗證據。唯一的不同,可能是表現形式的差異。套用社會科學研究中的術語,定性研究和定量的數據分析方法最終都是為了“檢驗”研究者的核心論點。就本書的核心觀點而言,有兩個關鍵的元素:一個是社會的時代特征;另一個是文學的時代特征。所謂定量地“檢驗”本書的核心命題,是指從大量的數據分析中檢驗後者是否會直接影響前者的發展。而且,從研究的最終目的來看,我們關心的這個影響是社會科學中提到的“因果關係”的影響。
一方麵,我們可以通過大數據“文本分析”的方式從每個時代比較有影響力的文學作品中提煉出這個時代的文學特征(比如以關鍵詞或者關鍵短語的形式展現出來),同時也可以從同一時代的報紙、雜誌,甚至政府的一些文件中提煉出能夠反映這個時代社會思潮和文化的基本特征。在做完這兩步“數據搜集和處理”的工作之後,我們可以用統計學或者計量史學的基本量化方法來檢驗這兩個重要的因素到底是否存在統計意義上的相關性和因果關係。如果存在,我們還希望進一步研究出到底哪個因素是因、哪個因素是果。
在這一章中,我並不試圖直接給出問題的一個簡單答案,而是想提出上述這種新的分析範式。我希望,這種分析範式可能不隻是能夠幫助回答本書中的具體問題,而且還可以為以後文學和文論研究的推進提供一種新的視角和思考模式。這樣一種新的分析範式也就是通常所說的“數字人文”。因此,本章的目的並不僅僅在於幫助學界同仁理解文學發展對社會和文化發展的影響,更重要的是,我想以此為出發點,梳理一下“數字人文”的最新發展和它在文學研究中的具體應用,以此,在現有最大程度的語境還原中發掘古代文論應有的本體意義。本章的主要內容兼顧方法論和具體問題,分為以下幾個部分。首先我會對“數字人文”做一個綜述性的簡單介紹。然後我會通過介紹一個較新的研究的例子,具體闡釋如何運用統計學的方法進行“數字人文”的研究。基於唐代的各種曆史資料,他們運用定量的方法研究文學造詣是否對個人的道德品質產生影響。他們的研究發現,個體的道德品質和其文學上的造詣相關。這樣的結論印證了本書的核心論點:文學的發展會對社會文化產生直接的影響。然後我們從方法論的角度對“數字人文”和它在文學領域的應用可能性,以及注意要點進行論述。在具體的例子之後,本章會對幾種常見的“數字人文”的工具和方法進行介紹。這些量化方法包括:回歸計量分析、文本分析和可視化技術。由於本章的重點是介紹“數字人文”而不是專門介紹量化方法,因此,對方法的介紹並不會側重在技術層麵,而是盡量從學術實用性的角度考慮初步地介紹這些方法的功效和適用範圍。