摘书网 - 最好的清爽在线阅读
摘要:理论|当下我国古籍数字出版的发展趋势摘 要摘 要:在数字人文与人工智能技术的双重驱动下,我国古籍数字出版呈现新的演进方向。与此同时,古籍数字出版主体的角色格局也正在发生显著变化:公立图书馆通过强化古籍原始版本的公益化发布占据主导地位,古籍类专业出版社依托古籍整理本的数字化转制实现对传统数据库厂商的超…理论|当下我国古籍数字出版的发展趋势
摘 要
摘 要:在数字人文与人工智能技术的双重驱动下,我国古籍数字出版呈现新的演进方向。与此同时,古籍数字出版主体的角色格局也正在发生显著变化:公立图书馆通过强化古籍原始版本的公益化发布占据主导地位,古籍类专业出版社依托古籍整理本的数字化转制实现对传统数据库厂商的超越,而公益性众包发布平台则将成为重要的补充力量。未来,业界需重点解决数据质量、版权规范与行业协作等问题,遏制灰色产业链不良势头,共同维护古籍数字出版与纸质出版良性互动的健康生态。
关键词:古籍数字化 数字人文 人工智能
文 / 唐 宸
在当下数字人文与人工智能技术加速融合的背景下,我国古籍数字出版正经历从资源数字化向知识智能化的深刻转型。[1]古籍数字出版产品的形态、质量与交互模式发生了结构性变革,数据资源利用的深度开发与知识服务的创新应用成为行业演进的核心动力。与此同时,公立图书馆、公益性众包平台、古籍类专业出版社和传统数据库厂商通过差异化定位重构了出版主体的生态格局,正在推动古籍数字资源利用从封闭式商业化向开放式公益化转变。本文通过系统梳理古籍数字出版在数据形态、质量层次、交互方式与功能支撑等维度的立体化演进路径,剖析出版主体角色转换的现实逻辑,旨在揭示数字人文与人工智能双重技术驱动下我国古籍数字出版的发展趋势。
一、古籍数字出版产品形态的立体演进
古籍数字出版产品从最初单一的古籍影像型数据库,到结构化文本型数据库、关系化本体数据库,再到对话式人工智能应用,其形态的每一次变化都显著提高了学者与公众对古籍的利用度,其主要演变路径可归纳为以下几个方面。
(一)数据形态:从数字化到结构化、图谱化
作为古籍数字出版生态体系中的基础部分,影像型数据库是古籍数据库的传统形式,但它却长期存在数据资源分散、缺乏检索功能等问题。随着爱如生、鼎秀、书同文等重点数据库陆续引入图文对照机制、配置全文检索功能等,有效解决了检索利用不便的矛盾。笔者年研发推出的“全球汉籍影像开放集成系统”利用数据聚合技术,首次实现了全球古籍影像资源的“一站式”利用,初步化解了资源获取不易的难题。然而随着学界对深度结构化数据需求的日益凸显,仅仅具备“全文检索”的文本数据还不够,要想实现更精准、更灵活的检索乃至知识挖掘,还需要在文本中预先进行内容的层级标记与语义注解,即对书名、篇名、段落、注释、批语、题跋、印章等进行标记,对人名、地名、官名、时间、人物关系等进行本体建模与标注。以浙江大学徐永明教授团队年推出的“智慧古籍平台”为例,该平台借鉴知识图谱理念,综合运用计量统计、定位查询、聚类查询、空间分析、数据关联、网络分析、机器标引等技术,实现了古籍文献和研究成果的图谱化。[2]可以说,以“智慧古籍平台”为代表的一批数字人文新式产品的涌现,使得古籍数据库的结构化改造逐渐成为学界乃至整个文化界的广泛共识。年4月,国家图书馆、国家古籍保护中心牵头发布“中华古籍智慧化服务平台”(第一期),不仅预置了篇卷标记和实体标引,还提供图谱可视化检索和知识详情等功能。在未来十数年内,一旦高质量结构化和图谱化的古籍数据积累到一定规模,学者将能够轻易实现“点对点”乃至“点对线”的文献追踪,开展基于数字人文技术的量化分析和深度研究,同时也使得古籍数字出版向高阶智能知识应用转型成为可能。
(二)质量层次:从全文化到标点化、实体化
(三)交互方式:从检索式到问答式、生成式
(四)功能支撑:从工具集到工作流、知识库
二、古籍数字出版主体角色的多维转换
在古籍数字出版产品形态不断演进的同时,其出版主体的角色体系也在发生重大变化,业已形成以公立图书馆为核心,以公益性众包平台为补充的体系,而传统数据库厂商也开始受到古籍类专业出版社的有力挑战,即将迎来行业的普遍调整转型。
(一)公立图书馆和公益性众包平台的关系
(二)古籍出版社与传统数据库厂商的关系
(作者单位系清华大学人文学院)
参考文献
参考文献:
[1]刘石.文献学的数字化转向[J].文学遗产,(6):.
[2]徐永明,王兆鹏,欧阳剑,等.系列笔谈之二:古籍数字化平台的建设[J].数字人文,(2):.
[3]李绅,胡韧奋,诸雨辰.古籍标点与专名的智能识别技术研究[J].数字人文,(3):.
[4]刘石,孙茂松.关于建设“中国古典知识库”的思考[N].人民政协报,(9).
转自:出版参考
来源: 首都新闻出版