重回天人之際:反思新時期古代文論研究方式的轉換

第三節 “數字人文”中幾種常見的量化方法簡介

字體:16+-

這一部分將專門介紹一些“數字人文”研究中,尤其是從文學研究的角度來看比較常見的研究工具。正如上文所說,“數字人文”的工具無外乎分為三大類:數據的搜集、分析和展示。“數字人文”的研究中有很多很重要的方法和工具,由於篇幅有限,在本章中無法一一列舉。對應“數字人文”研究中的三類工具,我將有選擇地分別介紹四種不同的工具方法:文本分析、統計回歸和因果關係分析、社會網絡分析以及數據可視化展示。文本分析主要是應用在數據的搜集和分析的方法上。統計回歸、因果關係分析主要是應用在數據已經搜集整理好之後,分析關鍵變量相關性和因果關係的方法上。前一部分已經介紹了這一方法,因此這裏不在重述。社會網絡分析是基於關係型數據庫進行的詩詞和人物關係的大數據分析方法,在社會科學和人文學科中都有廣泛應用。而數據可視化展示更多的是在數據的基本分析完成之後幫助研究者向同行展示研究發現的方法。這四種方法相輔相成,在現實中到底什麽時候該運用哪種方法,完全取決於具體的研究問題,沒有任何一個絕對的標準告訴我們在研究中的哪一個步驟隻能用哪一種方法。統計回歸和因果關係的模型是經典的統計學的分析方法,而文本分析、網絡分析和數據可視化則是最近在社會科學中越來越流行的大數據方法的具體表現。

在文學,包括文藝學的研究中,對新方法和工具的引進,最終的目的是為了回答重要的文學問題。本書中的觀點是文學發展會影響社會文化。我們可以預判上述的三類工具對於回答本書的核心問題能起的幫助作用。如果我們要考察這個命題在新文化運動和“五四”時期是否成立,就可以綜合地應用這三類工具。我們一方麵可以通過文本分析的方法,從這個時代比較有影響力的文學作品中提煉出這個時代最重要的文學特征。提煉出來的文學特征可以以關鍵詞或者關鍵短語的形式呈現。而另一方麵,也可以從同一時代的報紙、雜誌,甚至政府的一些文件中,通過文本分析的辦法提煉出能夠反映這個時代社會思潮和文化的基本特征。在做完這兩步數據搜集和初步處理的工作之後,便可用統計回歸分析定量模型和因果關係的模型,來檢驗文學是否對社會文化的發展有影響。而最後,則可以通過數據可視化的辦法來看在不同的區域、不同社會經濟發展的時代背景下,文學對社會文化的影響有何差異。同時,我們也可以充分利用社會網絡分析的方法來考察文學作品如何在社會中關鍵的人物群體的社會網絡中進行傳播,如何通過社會中關鍵的人物來對社會起到潛移默化的影響。由於篇幅和精力有限,本書中並沒有直接使用這些步驟和方法進行相關的分析。這一部分主要是想通過介紹這些方法對後續的相關研究有所啟發和幫助。