历史学论文范文(3)

2022-10-29 08:58:22   第一文档网     [ 字体: ] [ 阅读: ] [ 文档下载 ]

#第一文档网# 导语】以下是®第一文档网的小编为您整理的《历史学论文范文(3)》,欢迎阅读!
历史学,范文,论文
历史学论文范文(3)

二文献史料的数字化

由于主客观条件的限制,历史文献的记录者不可能完整地记录历史也不可能回避个人立场、观点和感受。录音中的不足和错误是不可避免的。一般来说,历史文献以其丰富、完整、连续、系统的内容而闻名,因此成为最重要的史料来源。 1古籍电子

古籍作为一种重要的历史资源,其录入是历史学家面临的一大难题。由于古籍中使用繁体字的特殊性,对古籍的检索方法提出了更高的要求。

现有电脑的输入方式主要有键盘、扫描仪等与古籍输入相匹配。目前, UNICODE是被广泛应用的字库,它是对国际标准 ISO/ICE 10646进行编码的称谓,包含了33884个字符集,提供了高达21亿多个码位,解决了古籍数字化过程中的码位短缺问题。但键盘输入方式对校验人员的要求较高,需要他们具备一定的古籍整理知识,因此,键盘输入方式并非理想的古籍输入方式。 扫描录入一直是古籍电子化界追求的一种方式,但因其对古籍识别率不高,又没有解决校对问题,故很少采用,北京同文公司制作“文渊阁《四库全书》电子版是,与清华大学合作完善了OCR技术,并开发出与之配套的校对软件“较得



1


准”“较得精”“较得快”,实现图文对照,点击改错,大大降低了对校对者的要求,减轻了劳动强度,错误率大为减少。同文公司的这一尝试意味着利用OCR技术 扫描录入将成为一种重要的古籍录入方[3]

与传统古籍相比,电子古籍最大的优势是古籍的检索功能。古籍那么多,想找自己想要的史料很难,很浪费时间。而且很多有价值的史料也会因为检索不方便而被遗漏。所以,方便检索是电子古籍最基本的要求。

目前大部分电子古籍都实现了对任意字、词、字符串的检索,这些都是字库中找不到的,用词分组构造的,一般是检索不到的,但这只是最基本的;一些较好的实现了条件检索,即按照检索范围、检索单位和组合规则进行检索。台湾省的“中国电子文献”系统优于袁林的“二十五史”全文检索系统,基本实现了这些功能。[4]

2


本文来源:https://www.dy1993.cn/bH7x.html

相关推荐