首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    光明日报 2012年04月17日 星期二

    学习贯彻十七届六中全会精神·专家访谈24

    书寿越千载 古籍入万家

    ——访清华大学中文系主任刘石教授

    《 光明日报 》( 2012年04月17日   03 版)

     数字化改变了少数人垄断古籍资源的局面

        记者:十七届六中全会提出“推进文化典籍资源数字化”,典籍资源数字化对古籍传播和文史研究有何意义?

        刘石:典籍是文化传承的重要载体,但纸质典籍在流传中容易遭受水浸、火烧、虫蛀、战争等因素的破坏。清乾隆年间编纂《四库全书》时列存目书6000多种,前些年在编纂《四库全书存目丛书》时,能搜罗到的书就只有4000多种了。侥幸流传下来的古籍存世数量也是有限的,有些甚至是孤本,有些虽然影印出版,也不是每个藏书机构更不是所有的学者都有能力购买的。一套影印的《文渊阁四库全书》有1500册之多,不要说一般人的书房很难盛放,很多图书馆都没条件购藏。

        通过光盘、U盘、网络等不易损坏的介质,以数字化形式储存,更便于古籍的保存、传播和使用。数字化尤其是网络的介入,使古籍资源迅速而最大程度地改变了只为少数人垄断的局面,古籍资源占有的地区性和地位性差异大大减少。而对文史研究者来说,数字化古籍的多样化检索功能往往使研究事半功倍,这是上世纪九十年代以前想也不敢想的事情。

        记者:古籍数字化发展的现状如何?

        刘石:我国古籍数字化的历史不过20多年,但发展相当快。学术研究的常用书如《四库全书》、《四部丛刊》、《二十四史》等都已经实现数字化。《四库全书》收书3500种左右,《四部丛刊》收书500多种,虽然数量不如前者多,但内容、版本都很重要。除了这些可以全文检索的古籍数据库,像《四库全书存目丛书》、《续修四库全书》、《丛书集成初编》、《丛书集成新编》及《续编》、《三编》等大型丛书都有了图像扫描版,数字化古籍的总量已相当可观。

     古籍数字化的相关法规和行业条例欠缺

        记者:古籍数字化目前面临哪些问题?

        刘石:问题也不少。

        第一是规划问题。我国设有全国古籍整理出版规划领导小组、全国高校古籍整理研究工作委员会负责全国的古籍研究、整理和出版规划工作,但重点是传统的纸本古籍,对数字化古籍这一块重视得还不够。和出版纸本古籍的出版社不同,目前从事古籍数字化产品研发的多为私企,选题随意性大、重复率较高,缺乏统筹和规划。

        第二是质量问题。我国图书包括古籍图书的出版质量管理是有标准的,差错率在万分之一以上万分之五以下的,出版单位必须改正重印;差错率在万分之五以上的,只能全部收回。但这是针对纸质图书的。目前从事古籍数字化产品研发的力量总的来讲还很有限,产品的出版和销售合法性模糊,质量参差不齐。准数字化图书成本与利润的核算与纸本差异也很大,缺乏统一、合理的定价机制。

        第三是版权问题。古籍是古人留下来的文化遗产,影印出版的古籍,其著作权和出版权如何规定;经过整理排印出版的古籍,整理者和出版社的著作权、出版权的边界又如何划定,还是不太明确的问题。将这些新印古籍数字化,就需要界定哪些是公众包括其他出版单位共有的权利、哪些是整理者和出版社专享的权利。古籍数字化是新生事物,相关法规和行业内部的通用条例都还欠缺,由此产生了不少矛盾纠纷,诉诸法律的也时有出现。

        第四是技术问题。数字化产品的研发需要技术支持,其版权保护更需要技术作保障,这是令古籍数字化从业者头疼的问题。一家著名的古籍出版社对本社历年出版的古籍作深度的数字化开发,却迟迟未能推向市场,就是担心技术上无法有效防范盗版。技术是古籍数字化持续发展的基础,技术的发展则依赖资金和人力的进一步投入。

     应发展不封口的超大型集约型数字化产品

        记者:古籍数字化应该如何进一步发展?

        刘石:古籍数字化是朝阳产业,前景广阔,但这有赖于政府尽快地建立健全相关法规条例,并给予政策上的扶持,也依赖更多有实力的机构和个人的参与投入。

        就数字化古籍产品自身而言,应出现超大型集约型数字化产品,这个产品应当是不封口的,研发者可以将不断取得的新成果随时汇入其中。这个集约型产品的文本数量越大,对学术研究的作用就越大。举个简单的例子,拿数字化古籍的全文检索来说,10首七言绝句不过280字,如果仅在其中检索某词是没有意义的,这不仅因为不用检索,仅凭目读便很容易得出结果,更是因为文本数过少,不管得出的是什么结果,它能够提供的研究空间都不大。如果从《全唐诗》、《全宋诗》乃至全部的古代诗歌中去搜索,情形就完全不一样了。傅璇琮先生就举过一例,说有人检索《全唐诗》中的“夕阳”二字,发现在晚唐时段出现的频次最高,这个检索结果,显然能为研究者提供一个饶有意味的学术话题。

        原版扫描和可编辑文本的结合可能是数字化古籍产品比较合理的模式。产品的编校质量应大幅提高,功能更要适应、满足研究者不断增长和变化的需要,不断丰富调整。

        最后想特别强调一点,古籍数字化是双刃剑,善于利用,可以给学习和研究带来极大的便利,不善利用,则适得其反。我在《清华大学学报》(哲社版)兼职,每年都要看不少来稿,相当数量的文章乍看起来材料很丰富,其实都不是读书读来的,不过是弹指一挥间的检索拣来的。既然没有读书的过程,哪来读书的乐趣,又怎么会产生有价值的研究成果,更谈不上学术功力的积攒了。这当然不能怪古籍数字化本身,但身处古籍数字化时代的人如何做学问,确实是另一个值得好好探究的话题。(本报记者 杜 羽)

    光明日报
    中华读书报
    文摘报
    出版社
    考试
    博览群书
    书摘

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有