您现在的位置: 台海网 >> 生活频道 >> 文化 >> 文化大话堂  >> 正文

大数据研究唐诗宋词 结论很颠覆

www.taihainet.com 来源: 北京青年报 用手持设备访问
二维码

  用大数据分析:唐代诗人白居易作品量第一 但影响力排十名之外 宋词名篇中收录词作最多的不是苏轼、辛弃疾而是周邦彦

  用大数据分析唐宋诗词,结论可能超出你的想象——唐代诗人中作品量居第一的白居易,影响力排在十名之外;宋词名篇中收录词作最多的不是苏轼、辛弃疾而是周邦彦;综合影响指数表明,杜甫高于李白、辛弃疾强于苏轼……

  以上新发现,是国家社科基金重大项目“唐宋文学编年系地信息平台建设”首席专家、四川大学文学与新闻学院讲席教授王兆鹏分析所得。

  唐诗是中国诗歌史上第一座高峰。唐代诗歌五万多首,诗人三千余位,诗人和诗作都达到前所未有的量级。宋代词人近一千五百位,词作超两万一千阕。

  从个体诗人来看,唐诗宋词里谁的作品最多?王兆鹏的大数据显示,白居易名列唐诗作品量的榜首,诗作近三千;杜甫和李白紧随其后,都超过千首大关。宋词中辛弃疾的词作量位居第一,有六百余阕,其次是苏轼、刘辰翁。宋诗的篇数,则由陆游称雄,凡九千多首,其次是刘克庄和杨万里。

  根据综合影响指数排名,唐代诗人影响力第一的是杜甫,其次为李白、王维,而作品量居第一的白居易,影响力排在十名之外。宋代词人作品量和影响力第一的都是辛弃疾,苏轼和周邦彦分别居第二、第三。高居宋诗影响力榜首的是苏轼,作品量雄居榜首的陆游紧随其后。

  提到唐诗宋词的名家,人们习称“李杜”“苏辛”,似乎李优于杜、苏胜于辛。但综合影响指数表明,杜甫高于李白、辛弃疾强于苏轼。更令人意外的是,最受追捧的词人不是苏、辛而是周邦彦。在一百首和三百首宋词名篇中,周邦彦各占十五首和四十首,占有率远高于苏、辛。

  用客观的数据去衡量、分析颇为主观的诗词鉴赏,是否科学、能否可行?在接受北京青年报记者专访时,王兆鹏强调,虽然数据能在一定程度上描述显示文学史的发展面貌和进程,但也有明显的局限性。

  30年前开始研究积累了上百万条数据

  问:《大数据里的唐宋诗词世界》课题的初衷是什么?

  答:我1992年就开始做唐宋诗词的定量分析了。初衷是每人心目中都有自己的唐宋诗词名篇。究竟历史上哪些唐宋诗词被视为名篇,我想用统计数据来分析衡量。

  问:那您是如何利用大数据来衡量唐宋诗词质量的呢?这些数据是如何统计出来的?

  答:唐宋诗词作品的质量,目前还没找到有效数据来评估、衡量。我目前正在努力尝试构建文学作品质量的评价指标体系,以便搜集数据。这需要比较长的过程。此外,个人建立的评价指标体系,需要学界的认同和共识。

  问:关于文学指标体系,学界目前的研究现状怎样?

  答:大数据时代的文学数据,需要分类分层建立起文学史数据的指标体系,以确保数据的信度和效度。但目前用大数据来做唐诗宋词研究的学者不多,为学界共享的唐宋诗词大数据也相当有限。

  从1992年到现在,我虽然积累了一百多万条和唐诗宋词有关的数据,但还不完备、不均衡。有的时段数据多,有的时段数据少;有的这一类数据多,那一类数据少;有的诗人数据多,有的诗人数据少。我们常感慨“书到用时方恨少”,数据更是这样。全方位分析唐诗宋词时,常常觉得数据不够用。

  在我看来,文学评价指标体系应该以作品为中心来建立。作家的影响力是以作品的影响力为前提。而作品评价,可分两个维度,一是相对稳定作品的内在文学价值,二是动态不居作品的外在影响力。其文学价值,可考虑从内容和形式两个层面来评估。

  作品影响力则从创作者、评论者、普通读者三个层面来衡量。一是对创作者的影响,包括引用、化用、仿效、改编、翻译等,体现出作品的典范性和吸引力;二是对评点者的评论和学者的研究,反映出作品在文学批评、学术研究层面的美誉度和关注度;三是在普通读者中的传阅度和知晓率。确定作品的价值、影响的基本要素和结构后,再构建计算模型,然后由计算机在相关资源库、语料库和网络运行,挖掘提取相关数据,最后计算出每篇作品的得分。

上一页 1 2下一页
相关新闻
望亭,唐诗里的风雅

太湖风光   望亭风光一瞥   自古以来,江南的水总是在诗人的笔下开出一朵朵淡雅的花。姑苏城外的古驿望亭,运河与太湖这两道有着浓厚江南诗性的水系将其左右环绕,在流韵的唐诗里留下了千年的风雅。   京杭大运河的第一铲土是在望亭开挖的。   历经千年积淀,京杭运河望亭...

仕与隐:杜甫天宝前后的两次移居

天宝前后,杜甫的两次移居很值得注意:一是约开元二十九年(741)从位于洛阳之南陆浑山的陆浑庄移居到洛阳之东首阳山的土娄庄,二是天宝十三载(754)移居到长安杜曲。两次移居,杜甫的心态颇有不同。移居土娄庄后他曾云:“幸遇圣主,愿发清机。”(《祭外祖祖母文》)实为追求仕进之途的开端。移居杜曲时则云:“故将移住南山边。短衣匹马随李广,看射猛虎终残年。”(《曲...

1200万字《刘学锴文集》发布

10卷本、22册、1200多万字……《刘学锴文集》首发式暨座谈会16日在安徽师范大学举行。   安徽师范大学供图   在当日举行的首发式上,87岁的刘学锴谦称:“自己的书现在还侥幸地活着,我很知足。”他谈人生体验时称,做学术研究不偷懒不拼命,量力量才而行。   刘学锴,1933年...

《夜雨寄北》为寄友的一条内证

晚唐诗人李商隐的名作《夜雨寄北》,一题《夜雨寄内》。今人刘学锴根据对此诗历代版本异文的辨析,以及对李商隐大中年间梓幕行迹、其妻王氏卒于大中五年(851)等考证,判断该诗诗题应为《夜雨寄北》,乃“寄给身居北方(当是长安)的某位亲友”之作,并认为该诗最有可能作于大中七年。刘说当为定谳,但“寄内”即寄怀妻子说一直不乏人从。(如某初中语文教材既录题为...

他经历过悲惨的生活 却交出了最好的人生答卷

“一切幸福都并非没有烦恼,而一切逆境也绝非没有希望。”身处逆境时,不少人都喜欢拿这句话来鼓励自己。   在许多年以前的唐代,也有这么一个人,最初的生活只能用一个“惨”字形容:40岁时还在东奔西走讨生活,50岁时事业看不到任何起色。 制图:倪雯冰   但他一直都没放弃希...