首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    光明日报 2024年04月19日 星期五

    盘活中华典籍的“数字家底”

    作者: 《光明日报》( 2024年04月19日 07版)

      【一线讲述】

      讲述人:中华书局古联(北京)数字传媒科技有限公司总经理 洪涛

      古籍大数据对中国传统文化领域有着独特的价值和作用。近年来,我们建立了百亿级的古籍大数据中心,可以满足不同类型的用户和研究需求。

      数据作为生产要素,其质量的优劣直接影响着生产结果。因此,我们建立了严格的数据加工流程和审核机制,确保将高质量数据产品投入市场。同时,还将古籍图书的线性文本内容进行结构化处理,使隐藏在古籍文本中的知识更加突显,甚至打通不同学科之间的知识壁垒,建立知识关联,持续发掘、提升数据价值。

      在古籍大数据的开放共享方面,我们积极携手各大研究机构、图书馆和高校,共同推动古籍数字资源的广泛共享与高效利用。我们研制了图像采集、文字整理、知识组织等20多项古籍数字化规范标准,确保数据在不同平台间无缝流通和共享。同时,我们采取先进技术手段,严密保护数据安全与隐私,严防数据泄露与滥用。

      在交易流通方面,我们积极探索市场化运作机制,推动古籍数字资源的商业化利用。我们与20多家出版机构和科研团队合作,制定了公平交易规则和价格体系,通过国家级古籍整理与数字化综合服务平台——籍合网这个统一的线上发布平台,实现了古籍数字资源的流通和传播。在交易过程中,我们注重保护知识产权和原作者的权益,建立完善的版权保护机制,确保每一份数字资源交易合法合规。同时,我们也积极推广数字版权保护技术,提高用户的版权意识,共同维护良好的数据市场秩序。

      近期,我们正尝试利用古籍大数据进行大模型研发,在自动摘要、文白翻译、自动构建古籍知识图谱等具体应用方面进行探索,不断挖掘和强化数据作为生产要素这一属性的重要价值,推动古籍大数据资源发挥更加显著的作用。

      (项目团队:本报记者 方曲韵、杜倩、苏雁、陈雪 本报通讯员 李梦、金永成)

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有