上述一系列的统计学分析的结果都表明,个人的诗歌造诣和历史对其道德品质的评价是高度正相关的。这里需要强调的是,统计学分析的结果告诉我们的是相关性,而不是百分百的因果关系。为什么之前我们用了量化的“回归”模型,最后只能得出一个相关性的结论而不是因果关系的结论呢?这是统计“回归”的分析方法共有的特征。正如前文所说,核心的自变量对应的系数反映的是当这个变量变化之后能带来的被解释因素的变化。在没有其他更多信息的情况下,一般没有办法确定两个因素之间一定是因果关系。它们可能是反向的因果,也可能是有另一个因素在同时影响着这两个因素。比如,蘅塘退士在编选《唐诗三百首》的时候,有可能会通过诗人在历史上的名声来进行诗歌的选择。如果在编选《唐诗三百首》时有这个考量的话,诗歌造诣和道德情操的相关性就可能是在选编过程中人为产生的一个反向因果的关系。虽然不能直接排除这个关系的存在,但是陈冬华等的研究中也提供了一些定性的证据,试图排除“以德选诗”这样的选编标准。“比如,温庭筠曾经‘代人作诗应考、扰乱科场’,道德不端,世人皆知,并被皇帝禁止参加科举考试,但其诗作依然获选。再如,李绅掌权后结党弄权,且生活豪侈,私妓成群,但其早期所作的《悯农》‘锄禾日当午,汗滴禾下土。谁知盘中餐,粒粒皆辛苦’依然入选。即便是《唐诗三百首》各自入选了29首诗作的李白和王维,在品德上也不是白璧无瑕,李白曾经附逆李璘,王维亦曾出仕安氏伪朝。在后文的描述性统计中我们可以发现,《唐诗三百首》中的诗人道德不高的也不乏其人。最后,诗选还收录唐玄宗、杜秋娘、西鄙人、无名氏等作品,其生平及品德或不可考,或未有共识,且每人仅1首,这更能从侧面反映其首在选诗,而非选人。”[18]
这些史实,从各个角度说明《唐诗三百首》在编选的时候不太可能存在“以德选诗”的情况,从而也就不太可能出现我们猜测的反向因果关系。综合上述的统计学分析和定性的史料考察,我们有理由相信一个人诗歌造诣的提升可以显著地提高历史对其道德品质的评价。这样的一个实证发现该如何来解释呢?这背后具体的影响机制是什么呢?
对于数据中发现的经验现象,在很多情况下我们并不一定能从数据分析中找到答案。要探究现象背后的机理,就需要理论的支持,在文学研究领域自然就需要文学理论。没有文学理论或者观点的支撑,统计分析的结果本身对于我们理解像文学在社会文化发展中的作用这样的现实问题而言,就没有太多意义。落实到对前文中经验现象的阐释,就需要回到本书的核心观点:文学可以对社会文化起到积极的影响作用。我们可以认为,在我国古代社会鼓励文学的发展对陶冶个人情操起到了积极作用,通过文学的发展和普及,对公民进行道德上的潜移默化的影响,从而积极地影响了社会文化。那么为文学立法的古代文论对社会文化的形塑作用由此可见一斑。从这个视角来看,陈冬华等的经验发现和本书的核心观点是一致的。当然,若只是基于已经介绍的这些数据分析,还不足以排除其他的阐释。比如,文学造诣高的人有更高的道德情操,有可能是因为道德修养高的人更愿意、也更容易学习诗歌的写作,从而也就有了较高的文学造诣。如果排除这种可能性,那么本书的观点就可以得到更强的支持。当然这也需要以后的更多、更好的“数字人文”经验分析的研究工作。