重回天人之際:反思新時期古代文論研究方式的轉換

七、“數字人文”的啟示

字體:16+-

從上述具體的研究案例中,我們可以看到“數字人文”這一跨學科的方法在文學及其相關領域中的具體應用。陳冬華等給我們展示了“數字人文”應用在人文學研究中很重要的幾個特征。這些特點也是在以後的研究中需要注意的地方:首先,一般性的文學理論和本土化的具體問題相結合;其次,“數字人文”是跨學科的,需要多學科的合作;再次,“數字人文”的研究以文學理論為基礎,輔以數據分析的方法加強研究的科學性和提供更嚴格的證據,不可本末倒置;最後,值得強調的是,“數字人文”的研究更有利於直接回答“實證”性的問題,但同時也對“規範”性的問題有間接的啟發。

(1)一般性的文學理論和本土化的具體問題相結合。

首先,陳冬華等的研究使用的是我國唐代的曆史資料,因此可以說是一個很好的本土化的研究。而他們研究問題的最終落腳點卻可以直接回應本書的主要觀點:文學對社會文化的發展有著直接的影響。在這一研究中,我們既看到了一般意義上的文論和觀點,也看到了這一觀點在我國文學史中的對照。值得強調的是,本章中所說的一般性文學理論和本土化具體問題的結合,並不是鼓勵直接地、機械地套用西方的經典文學理論來解釋我國的文學發展史中的一些事實。正如本書一開始所說,中國文學的發展需要走一條本土化的獨特的道路。這條獨特道路的開辟,就要求我們首先從我國文學發展路徑的一些基本經驗事實和史實出發,總結出具有中國特色的一般性文學理論或者觀點。而這樣的理論和觀點不僅要能和西方的理論相呼應,還要能解釋我國獨特的曆史文化發展脈絡。這就是所謂“本土化”的核心要義。“本土化”不隻是要求我們基於從古到今的文學發展路徑來總結我國的文學理論,同時還要求研究者能利用我國特有的史料對我國的和世界的文學理論進行係統的比較、考證和“證偽”。當然,考證的方法可以有很多種,本章中強調的就是偏量化的“數字人文”的方法。陳冬華等則兼顧使用了定量方法和基於史料分析的定性研究方法。

(2)“數字人文”是跨學科的,需要多學科的合作。

在“數字人文”的相關研究中,或多或少要使用“數字人文”這樣的量化方法。這就注定了研究者需要運用跨學科的知識。我們或許可以把基於大數據方法(或者廣義“數字人文”的方法)發展運用到文學領域的研究稱為“數字文學研究”。在“數字文學研究”中,研究者需要的不僅是人文學科的知識儲備,更需要有社會科學的,甚至計算機和統計學等相關學科的知識。陳冬華等的研究是一個經典的跨學科合作的例子。作者當中有經濟學背景的學者,有公司治理研究領域的專家,還有文學愛好者。他們通過運用統計學和計量經濟學的方法研究了一個跨文學和社會科學的問題。他們關注的問題事實上也是公司治理領域一個基本的重要觀察:除了製度因素之外,人的道德因素也會對社會和經濟的發展起到至關重要的作用。道德的考量屬於社會文化的範疇。社會文化本來並不屬於經濟學和公司治理的研究範圍。隨著學科不斷發展和對社會經濟現象的認識不斷深化,包括經濟學家和金融學家在內的社會科學家越來越意識到社會文化對經濟發展的重要作用。因此,越來越多的社會科學家將研究視角轉向對社會文化的理解。而在人文領域,尤其是文學研究領域,很多學者也對社會文化有著濃厚的興趣。研究話題的特質就自然決定了研究內容跨學科的性質,從而需要不同學科知識的綜合運用。同一個話題,從不同的視角、運用不同的方法工具來研究,可能會有意想不到的研究結果。這裏所強調的跨學科,不僅是從方法論而言的。“數字人文”研究中需要運用到其他學科如統計學的知識,同時還需要結合具體的研究話題融合其他社會科學的具體知識,綜合不同學科的視角。因此,“數字人文”不僅僅是工具意義上的跨學科,也是知識內涵和研究視角上的跨學科。

(3)“數字人文”的研究以文學理論為基礎,輔以數據分析的方法,不可本末倒置。

正如前文中提到的,如果沒有文學理論作為支撐,再精細的數據分析最終也不能加深我們對文學問題的理解。“數字人文”的研究需要理論。陳冬華等在研究的一開始就通過梳理已有文獻的方法,給出了自己的邏輯體係。在構造的理論框架中,他們提出了自己的學術觀點。通過理論邏輯的推演,他們將理論中的核心觀點轉化成可以用數據去檢驗的假設,最後他們再運用統計學和大數據的方法對他們的核心假說進行檢驗。如果沒有一開始的理論作為支撐,數據分析的結果很難展示出其對文學理論的貢獻。這樣的研究思路是合理的,它強調了“數字人文”研究中理論的重要性。事實上,這樣的研究思路早已被廣泛應用在現代社會科學的各個領域當中。隨著近些年大數據研究方法越來越流行,社會科學家也越來越警惕沒有理論而隻是純粹的“數據挖掘”(data mining)式的數字遊戲。所謂“數據挖掘”,就是指在沒有什麽人文或者社會科學具體理論的指導下,讓計算機算法對已有的數據中的特征進行機械的探索。在“數據挖掘”式的社會科學研究中,研究者往往在處理和分析數據之前並沒有成型的理論,而是通過嚐試多種統計方法和模型,探索多個變量之間各種形式的統計關係,而最後匯報研究結果的時候,隻展示那些統計結果比較好的研究,卻不匯報那些結果不好的研究。這樣的研究流程被現代社會科學家所詬病,當然也不應該成為人文研究遵循的方法。“數據挖掘”的方法來源於計算機領域,適當地應用到人文、社會科學領域固然會有些成效。比如,前文提到的哈佛大學“中國曆代人物傳記資料庫”共收錄從7世紀到19世紀的超過37萬人的傳記資料。如果我們利用這個大數據庫進行一些“數據挖掘”的處理,我們也許可以更清晰地看到同一時期不同作家或者詩人之間的關聯,從而更科學、更清晰地看出不同文學流派的特征和演變。但是包括“數據挖掘”在內的各種技術上的數據搜集和處理方法,不能代替學者的人文思考。沒有思考和理論的“數字人文”研究就好像無源之水無本之木,很難長久、深遠。文學理論和人文學科中思考的主體作用是本書一再強調的。隻有建立在此之上,合理地運用“數字人文”的方法,才能錦上添花。

(4)“數字人文”更有利於直接回答“實證”性的問題,但同時也對“規範”性的問題有間接的啟發。

無論是在本書中,還是在上文中介紹的陳冬華等的研究中,我們的研究問題,從社會科學的視角來看,都是“實證性”(positive)的問題,也就是“是什麽”和“為什麽”的問題。在社會科學中,跟“實證性”的問題相對應的是“規範性”(normative)的問題。“規範性”的問題一般是指“應該怎麽樣”之類的問題。具體來說,本書中的核心問題是文學的發展如何影響社會文化。根據定義,這是一個“實證性”的問題。前幾章一係列的分析就是著眼於文論、文學及其發展與社會文化之間的關係,並且認為應該探索前者對後者施加影響的渠道或者機製是什麽。簡言之,本書並不想直接涉及“文學是不是‘應該’對社會文化產生影響”這樣的問題。和其他的人文和社會科學研究類似,雖然研究的主題是實證的,但不是說研究結果對於我們理解對應的規範問題就沒有啟發。我們有各種邏輯和經驗證據說明文學會對社會發展和社會文化起到積極的促進作用。那麽從規範的意義上來看,我們就需要進一步地發展文論,鼓勵文學在社會中不斷產生更多的影響。當然,“文學是不是‘應該’對社會文化產生影響”,或者說文學是不是應該獨立於社會和文化發展而存在,則是本章沒有直接回答的一個問題,對於這樣的問題,廣義的“數字人文”的方法可能並不一定能提供直接的研究工具。此時隻有文學範疇內的深度思考才能給出這個問題的答案。