数据无法测度艺术含量和审美价值高低
问:您在课题里提到,据统计,东汉到隋末近六百年,诗歌总共才五千余首,而到唐代,诗歌第一次超过万首并直接跨越到五万多首。唐诗比之前的八代诗增加了七倍多,诗人由六百余位增加到三千余位,诗人和诗作都达到前所未有的量级。这个数据从何而来,有参考哪些重要的文献资料吗?
答:数据来源于我的老朋友尚永亮教授的两篇论文:《八代诗歌分布情形与发展态势的定量分析》和《唐知名诗人之层级分布与代群发展的定量分析》。
问:白居易的诗数量最多,影响力却在前十名开外,这是如何判定的?
答:用数据衡定的。我们用了多种数据,对唐代诗人影响力进行排名。白居易的影响力,在现当代大于古代。他的综合影响力,远不如李白、杜甫。
问:那您通过大数据判定唐诗宋词质量的依据是什么?
答:目前只能用大数据衡量唐诗宋词影响力的大小——包括对后代词人创作的吸引力,在后代词评家中的美誉度,在普通作者中的知名度等等。目前暂时还不能用数据测度唐诗宋词艺术含量和审美价值的高低。
文学中心在北宋初就完全移到南方
问:用大数据研究唐宋诗词有无遇到一些学术上的困难,又是如何克服的?
答:文学研究从来没有数据意识,困难不仅在于到哪儿去找数据,更在于找什么样的数据。究竟什么样的数据有用有效,既需要理论的支撑,也需要在实践中检验。理论上,我们不断探求,从统计学、计量信息学和计量历史学中去寻找理论和方法的启示;实践上,反复试验,失败了重来。最痛苦的是,数据库建好了,文章也写完了,忽然发现数据来源不全,只好从头补齐数据,写好的论文又推倒重来。
问:您在大数据具体研究中还有哪些新发现呢?
答:数据的意义,既能确证传统的结论,也会修正传统的结论,更能发现新问题,改变传统的认知。比如,中国文化地理有一个著名的结论,中国文化中心,是由北方中原逐步向南方移动,第一次南移是东晋永嘉之乱,第二次南移是唐代安史之乱,第三次南移是宋代靖康之乱。三次战乱推动了文化中心的南移,靖康之乱后,文化中心就彻底移到南方。我们的大数据发现,文学中心在北宋初就完全移到南方,南方作者的数量全面超越北方,无需等到靖康之乱后。而且,战争不是推动文化中心南移的唯一因素。
我们还发现,宋代的文学中心,是逐步向东南沿海移动。按今天的地市级行政区划来统计,宋代福建南平的作者人数最多,名列第一,福州居第二,这很让人惊讶。与此相关的是,宋代进士人数福州第一,南平第二。可见当时南平、福州教育发达,进士多,诗词作者也多。教育与文学是高度正相互的。
此外,我们还发现苏东坡词的创作高峰是在黄州,他三分之一的词是在贬谪黄州期间写的,他的名篇佳作一半是在黄州写的。比如宋词的第一名篇《念奴娇·赤壁怀古》就是在黄州写的。黄州成就了苏轼词作的辉煌。
(来源:北京青年报;文/记者 张恩杰 统筹/刘江华)