万俊人|科技|人文研究数字化:一场方兴未艾的变革( 二 )


清华大学人文学院副教授李飞跃和中国社会科学院文学研究所助理研究员赵薇介绍 , 几十年来中国人文学科的定量分析成果纷纷涌现 , 用数字手段检验和打破了一些人们习焉不察的定见:
20世纪80年代 , 陈炳藻、李贤平、施健军和陈大康等海内外中国学者分别采用文体测量学的办法 , 利用人工统计或计算机辅助手段 , 对《石头记》前八十回、后四十回作者统一性问题作出判定;2005年 , 哈佛大学包弼德与北京大学等合建“中国历代人物传记资料库”(CBDB);2001年 , 复旦大学和哈佛大学共建“中国历史地理信息系统”(CHGIS)等 , 这些人文学者是数字人文的先行者 。
“长安城图的精准化和数位化应用” , 这是台湾中山大学中文系教授简锦松利用数字化技术进行的一项研究 。 据他介绍 , 过去学界对唐代长安城的了解 , 都是从留存下来的纸质图上看到的 。 现在可以对原始的古图做数字化处理 , 然后放进电子地图里 , 就能看到精准的长安古城面貌了 。
这项研究既有学术价值 , 也很有趣 。 比如 , 有了这张数字化图 , 就可以知道白居易的家住在哪里 , 上朝要走多久;也可以知道韩愈从家里出来拜访张继 , 要经过什么路径;李商隐为悼念亡妻写下了著名的《西亭》:“此夜西亭月正圆 , 疏帘相伴宿风烟 。 梧桐莫更翻清露 , 孤鹤从来不得眠 。 ”从李商隐家到他妻子娘家的居所西亭 , 路程并不遥远 , 只有1.7公里 。
借助中南民族大学文学与新闻传播学院王兆鹏教授构建的“唐宋文学编年地图平台”和“汉魏六朝文学编年地图平台”数据库 , 也可以了解唐宋时期和汉魏六朝时期作家的活动情况 。
“数字人文 , 能够在相当程度上帮助传统的研究工作 , 让学者们有更多时间去做计算机目前还不能做的研究 。 ”清华大学人文学院教授、《数字人文》期刊主编刘石说 。 比如 , 古籍标点、字句校勘、索引编纂、资料汇编 , 过去的学者在这些方面花费了大量心血 , 如今都可以借助计算机去完成 。
万俊人|科技|人文研究数字化:一场方兴未艾的变革
本文图片

建立起知识的关联 , 是数字人文的本事
数字人文兴起的前提 , 是人文资料和文献档案的电子化与数据化 。
刘石认为 , 当今社会 , 数字化的浪潮无所不在 , 也深刻地影响着包括人文和社会科学在内的一切领域 。 数字人文 , 推动了当代文献学的发展 , 使之形成数据驱动、实证为先的新特征 。 “前几年 , 人文学界有一种轻文献考辨、重义理阐发的现象 , 导致学风空疏的倾向 。 现在有了数字人文 , 你想空疏都空疏不了 。 因为 , 数字人文中的大数据 , 不就是拿数据说话的实证研究吗?所以 , 从这个角度讲 , 文献学、古籍整理 , 或者考据学 , 今后不见得会消亡 , 反而会随着数字人文的发展获得新的活力 。 ”
众所周知 , 钱钟书先生博闻强记 , 而他的记忆力与他的学术成就息息相关 。 有人提出疑问:进入数字人文时代 , 学者的记忆能力还重要吗?清华大学计算机科学与技术系主任、《数字人文》期刊主编孙茂松教授认为:“实际上 , 电脑时代并不意味着什么都能搜索到 。 数字人文要做的 , 不是把死的知识存在那里 , 而是要建立起不同知识间的关联 , 有丰富的知识联想 , 让知识活起来 , 进行深入的学术融合 。 ”
“我们现在遇到的一个最大的问题 , 就是有了大量的电子文本之后 , 怎样利用这些数据库进行研究?”美国巴克内尔大学东亚研究系教授陈松说 。
因为 , 人工智能必须由人去做 , 才会智能 , 才有可能做出有价值的研究 。