跳至正文

古籍识别

方志类古籍地名识别及系统构建

江西地名研究 关注我们,获取更多地名资讯 关注 摘要:以地方志资料汇编《方志物产》(广东分卷)为语料,设计并构建了古籍地名识别系统。采用规则与统计相结合的命名实体识别方法,实现了物产地名的自动识别。分析了命名实体识别技术在中国方志类古籍整理中的应用前景,为方志类古籍进行数字化整理、挖掘物产分布、物产引进和传播等相关研究提供了新的途径。 关键词:地名识别;方志;命名实体;古籍数字化;古籍整理。 作为… 阅读更多 »方志类古籍地名识别及系统构建

古文智能处理系列成果之二 | 中国古代典籍实体自动识别模型和工具

中国古代典籍实体自动识别模型和工具 刘江峰,冯钰童,王东波,胡昊天,张逸勤 【研究背景】 近年来,深度学习技术日益成熟,诸如LSTM、BERT模型及其变体在命名实体识别领域均有很多成功的应用。但由于语法上的独特性且与现代汉语、英语存在较大差异,汉语古文语料的分词、词性标注、命名实体识别难度较大。2018年Google发布基于双向Transformer编码器表征的语言模型(BERT)。在BERT模型… 阅读更多 »古文智能处理系列成果之二 | 中国古代典籍实体自动识别模型和工具