重回天人之際:反思新時期古代文論研究方式的轉換

三、數據的搜集和關鍵指標的度量

字體:16+-

在具體檢驗他們的假說之前,學者們還需要對假說中的關鍵“變量”進行合理的度量。陳冬華等的具體假說(hypothesis)是:詩歌造詣能否反映個人的道德情操。這個命題中有兩個關鍵的指標,一個是個人的詩歌造詣,而另一個則是個人的道德情操水平。為了能夠從史書中獲得相關的數據,研究者們將目光放在了唐朝。作者們選擇用唐朝史書的數據進行檢驗,主要是出於數據可得性和變量度量的考慮。“詩歌創作在唐代達到了鼎盛,在史料中保留了豐富的關於詩人行為、道德以及詩歌創作的記錄”。“之所以擇唐而棄宋,原因有三個。一是因為唐代更加注重詩作,詩人燦若辰星,而宋代顯然更加重視詞作,當然,詞也是詩的一種形式,但是詞的意境也是自蘇軾之後才漸至開闊,並且詞始終沒有作為科舉考試的內容。二是宋代經靖康之恥,分為南北兩宋,使得研究的環境因素變得更加複雜。三是因為宋代在王安石主政時,在科舉中取消了詩賦考試。”[11]

在數據搜集和度量的過程中,作者們首先解決了如何度量詩歌造詣的問題。個體在詩歌造詣方麵的度量可能有很多種辦法。陳冬華等首先選取了一個具體的比較客觀的方法。作者們將入選《唐詩三百首》作為詩歌造詣的最高層次。這意味著,在他們的樣本中如果一個人的詩歌入選了《唐詩三百首》,他的造詣就被定義為1,否則就定義為0。“《唐詩三百首》由蘅塘退士孫洙選編於清乾隆二十八年(1763年),是近250年來流傳最廣、影響很大的一部唐詩選本。詩選收錄詩人77名、唐詩313首,詩選中所收錄的詩被認為在文學上具有極高的藝術價值。”[12]

從這樣的度量方法中可以看出,即使是“量化”的方法,也存在很多不可避免的主觀因素。詩歌造詣是一個很難準確度量的因素,有些很出彩的詩歌並不一定會被《唐詩三百首》引用,而被《唐詩三百首》引用的也未必就一定比沒有引用的要好。正如其他“數字人文”的研究中遇到的問題一樣,在運用量化方法的時候,研究者沒有辦法百分百客觀地剔除掉所有主觀的因素。而研究者可以最大限度剔除掉的就是通常所謂的“係統性”誤差。具體來說,在陳冬華等的研究中,他們用《唐詩三百首》的是否收錄來度量詩人的詩歌造詣,是基於下麵這麽一個基本的原理:從統計意義上來說,被收錄進《唐詩三百首》中的詩歌相比於其他的詩歌更受歡迎。在這裏,我們強調的關鍵詞是“統計意義上”。我們都知道,如果任意挑《唐詩三百首》中的一首詩,它未必就一定比沒有入選的詩要寫得更好。但是,我們不妨做一個思想實驗。如果我們有一個機器,能夠隨機地多次從《唐詩三百首》和其他非《唐詩三百首》的詩中各挑選出一首詩進行對比,然後讓學者們對這兩首詩進行評判打分。即使一次打分有可能是非《唐詩三百首》詩歌的勝出,如果這樣的“隨機抽樣”重複很多次之後,我們就有理由相信,《唐詩三百首》中挑出來的詩的分值會更高。或者說平均而言,《唐詩三百首》中挑出來的詩更容易受到好評。因此,“統計意義上”的比較就是指“平均而言”的比較。和現代科學以及現代社會科學中的原理一樣,在進行文學相關的量化研究時,特別是在度量一些關鍵變量的時候,我們不可避免地會出現一些個體的誤差。隻要這些誤差不是“係統性”的,從統計學的角度來看,最後的量化結果就是可信的,至少是統計意義上正確的。