跳至正文

文献乃天下之公器 ——“历史资料的整理、研究与数字化建设”会议纪要

教育部社会科学委员会历史学学部年度会议进行“历史资料的整理、研究和数字化建设”的研讨分三个时段进行,分别由赵毅教授、桑兵教授和钱乘旦教授主持,有15位学者做了专题发言。

上海交通大学曹树基教授主要就“县级档案与契约文书的搜集、整理与研究”,详细介绍了所在单位近10余年所做的相关工作。主要包括搜集1950年代以来的县级档案,关注的区域从上海郊县扩大到苏南、浙北地区甚至中西部省份,目前共收8省50个县的县级档案大约6万余卷,共600万页。其中的特色档案有四川省江津县土改档案、江西省南昌县土改档案、安徽省无为县县委会记录等。契约文书方面,从最初在浙江省松阳县石仓搜集契约文书开始,由点及面,扩大到浙南、徽州与江西,目前搜集的契约文书共计32万件。在校图书馆建立起大型契约文书整理工作室,聘请三位有经验的装裱师傅主持契约文书的修理工作。以这些资料为基础,陆续出版大型的“上海交通大学藏地方历史文献汇编”系列,并发表相关的系列研究论著。曹教授还就相关的搜集过程、特色档案与契约的价值进行了细致的介绍。

中国社科院近代史研究所金以林研究员首先介绍了本单位的19万件档案文献的收藏情况,其中比较有特色且已完成电子扫描的四类档案分别是晚清督抚档案,约二百个人全宗,其中以张之洞档案最完整,共10万页;二是胡适个人全宗档案(1949年以前部分,约11万页);三是满铁调查局从1918年至1945年的专题剪报(约70万页);四是超过9000种的文革小报。这些档案大部分都进行了整理。本所近年还承担了社科院一项重大创新工程:“近代中国海外珍惜文献的收集整理与研究”,其中数量最大的是台湾中国国民党党史馆档案,超过100万页电子档。

除文字档案之外,本所还陆续开展图像档案(照片)的搜集与整理,目前搜集到的有美国国家档案馆藏的3万多张韩战的照片、台湾的蒋经国的全套照片近4万张、中央日报社的照片等,为学术研究扩充了新的史源。此外,本所还与海外的相关收藏单位洽谈合作,逐步搜集比利时某修道院藏的陆征祥档案、英国北爱尔兰的女王大学藏的赫德档案、美国哥伦比亚大学手稿珍本图书馆收藏的顾维钧档案等。本所已就相关档案的使用,与国内外的机构或学者们进行合作或者交换。其次,就学术资料的建设,金先生还特别谈到了几个问题,1、学术资料的整理需要一个大的机构来协调,以避免盲目的重复建设和资金浪费;2、档案的存储问题,随着资料搜集的越来越多,存储要求的空间量非常大,需要大型的存储设备。3、档案文献的呈现,如何真正做到能让学者方便地阅读、检索和共享?这需要国家的大量资金投入,任何一家研究机构不可能独立做到,希望历史学学部能够从国家战略角度的考虑,来协调和处理这些问题。此外,国内单位重复购买国外的西文的数据库,而忽视了以往所购买的微缩胶卷,只要一套50、60万的设备就能把这些所有的微缩胶卷转换成PDF档,使用起来会很方便,实际上也能节省大量的外汇开支。

南开大学中国社会史研究中心常建华教授,由于参加《中国家谱综合目录》的编辑以及研究宗族的兴趣,从1983年起留意于族谱学,已达30年之久。他指出,在中国传统文献当中,族谱(或称家谱、家乘、宗谱、谱牒,一般意义上可以混称)以记载祖先、世系、宗族制度引人注目,族谱反映出中国社会与文化的祖先崇拜、血缘意识与社会组织结构,传承至今,数量巨大。中国族谱资料的整理工作,在编目、提要、选编、汇编、影印、考释几个方面取得了可观的成绩,但是还不太完善,需要继续努力。如民间族谱、1949年以后新修族谱有待收集编目,族谱提要编出的只是一部分,资料选编还应选择新的专题,汇编影印也需要新的选题。

20世纪20年代以来的90年间,海内外的学者对中国族谱进行了广泛的研究和利用,大致可以分成奠基、复兴与拓新几个阶段,各个阶段都有代表性的研究。近十几年,学术研究更加多元化,受社会史、文化史、生活史的影响,族谱研究具有从地方文献与民间文献视角探讨的特色。我们也应当看到存在的一些问题,比如,研究在时间、空间上分布的不够系统、全面,空白之处不少,需要扎实的工作来弥补。如晚清族谱普及化,民国族谱变化较大,都还没有研究的力作给予揭示。至于当代修谱活动,还需要深入地探讨。族谱的数字化建设已经全面启动,初见成效。中国族谱资料的整理、研究和数字化建设的推进,有赖于专门性的研究。研究机构开展专项研究,为此收集整理族谱进行数字化,应是一项重要工作,可以将学术研究、资料整理、公众服务三位一体,深化对中国族谱的认识与利用。

北京师范大学历史学院瞿林东教授,针对目前过度依赖文献检索而忽视建立扎实系统的历史资料整理的理念与能力的不足的现象,着重阐释了传统的历史资料整理、研究对于提升学术水平的重要性。他认为,历史资料的数字化非常重要,但它似也不能缺乏最基础的研究,如会通思想、实际运用,这对于数字化的编制程序与检索方法是很重要的。因此,既要重视原始性的资料整理、分类与研究,也要重视研究性成果的编年、分类、检索与数字化应用。他认为,前人在历史资料的整理和编纂方面,给我们留下了丰富的遗产。重视这些遗产,对于今天我们在历史资料整理工作上的传承创新,对于学术水平的提升,仍具有重要的参考价值。就学术资料的数字化和信息化,瞿教授认为,目前的技术、检索的手段、乃至国家的资金投入,都不是问题,而主要的问题存在两个方面,第一个是版权,这个是大问题;还有一个就是怎么样共享?我们要充分利用现有的条件,协调促进各个单位之间合理的和有效的合作。

南京大学信息管理学院朱学芳教授认为,信息时代肩负着历史资料的保护和传承的重任,历史资料保护刻不容缓,数字技术为历史资料保护提供了新的技术手段。历史资料的数字化既有利于提高公众的历史资料保护和参与意识,也有利于提高公共文化机构的信息服务效率,还有利于推动我国历史资料数字资源的共建共享。历史资料数字化是利用数字摄影、信息获取、图像处理技术、虚拟现实、计算机辅助设计、多媒体与宽带网络技术等对历史资料进行数字采集、存储、处理、展示、传播的过程。历史资料数字资源是指直接以数字形式产生或根据历史资料原型进行仿真、建模等数字采集后生成的数字资源,可以以多种格式呈现,如文本、音频、视频、图像、三维对象等。朱教授还介绍了我国图博文献数字化发展的概况。经过近二十年的努力,我国政府、IT业、图书情报界在数字图书馆理论研究、资源建设、标准体系、技术研发和数字图书馆服务等方面有了较大的进展,取得了一定成果。其中包括中国国家数字图书馆、全国文化信息资源共享工程、中国高等教育文献保障系统、大学数字图书馆国际合作计划、国家科技图书文献中心、中国科学院国家科学图书馆。其中以中国国家数字图书馆的规模最大且具代表性。而我国大陆地区博物馆数字化建设还处于初级阶段,各地区的博物馆数字化工作还处于分散状态。相比之下,博物馆的数字化工作主体都是博物馆本身,缺乏足够的信息技术的支撑及应用。

北京大学图书馆沈乃文研究馆员认为,今天高校人文学科的学生、教员、研究人员所需的文献资源中,很重要的一部分是原始古籍,即图书馆严格控制借阅的线装书。原始古籍存世稀少,分散于各地,保管严格,阅读不便,年复一年,矛盾日益尖锐,使用者将借书视为畏途,迫切需要找到解决办法。2007年国务院办公厅发布了《关于进一步加强古籍保护工作的意见》(国办发[2007]6号),第五条明确指出“进一步加强古籍的整理、出版和研究利用。制订古籍数字化标准,规范古籍数字化工作,建立古籍数字资源库”。原始古籍的数字化和网上服务,既是保护原始古籍的最好方法,又是学生、教员、研究者可以克服时空障碍获取原始古籍资源的最方便、最快捷的方法,能有力地促进人文学科研究。但是六年过去了,原始古籍数字化的进展仍然很缓慢,没有国家级项目的支撑,只有一些企业开发的数据库,因此,存在着重复购买数字产品、各库设置的技术手段多样化而造成用者不胜其烦、新出版纸质影印本的图像质量较差等许多问题。

沈乃文先生还介绍了海外图书馆的相关情况,美国国会图书馆、哈佛大学哈佛燕京图书馆、普林斯顿大学葛斯德图书馆与台湾“中央研究院”傅斯年图书馆合作的中文善本数位典藏计划,以及日本东京大学东洋文化研究所汉籍善本全文影像资料,这些工作可以作为我们的样板。他认为,持续等待总不是办法,目前需要采取切实步骤,推进原始古籍的数字化建设。可以参考海内外都有的一些公益性古籍资源网站的作法,由几个人建立和维护,数据库由社会共建共享。网友可以免费从网站下载资源,同时也可以自愿把自有的数字资源上传到网站,提供给他人共享。这样几年之间,有的网站已积累古籍资源达数万种之多。沈先生建议教育部社科委历史学学部可以考虑向教育部申请建立原始古籍资源数字化服务项目,每年拨付必要的经费,设立原始古籍资源数字化服务网站,发布图像数据加工标准,组织和发动有关藏书单位(首先是高校)自愿上传自藏的原始古籍数字化数据,只要符合图像数据加工标准,就按照规定给予一定金额的报酬,予以鼓励,不需要太久,必可开创原始古籍数字化建设和服务的全新局面。

中国人民大学图书馆古籍研究所宋平生研究馆员,赞同其他学者提到的在历史文献数字化过程中存在资源浪费很严重的现象。他主要介绍了自己关注的一些比较冷门的、不太被人重视的、数量不成批次的历史文献的收集情况。比如,雕版印刷的文书,大到布告,小到一张戏票、一份契约、一张税单、一个协议等等,包括官方的谕、札等,都和老百姓生活息息相关。但这类文书非常分散,很难留下来,多散落于民间,在古玩市场上偶能遇见。此外,还有“家堂”(即悬挂在墙上的家谱)、民间社会团体印行的义仓谱、建桥谱、义渡谱等通用性不是很广的出版物,也应当加以重视,加强搜集、整理进而将其数字化,以便让更多的学者能够研究利用。

上海图书馆陈先行研究馆员在《版本目录学的思考与实践—上海图书馆善本题跋真迹编后记》一文中,详述该书的编纂旨意、发现的问题及其处理措施等。该书收录1750余种善本的题跋原迹,数据颇丰,虽然仅属编纂之书,但殊匪易事。因为附有原书书影,不仅要定夺题跋之真伪,系原迹抑或过录,更重要的是要能准确著录版本。与以往的文字编目不同,此书是以书影编目,其功用既较单纯的文字目录为宏,其难度当然也更大,客观上是对编纂人员版本目录学水平的一种检验。大家知难而上,态度谨慎,在水平不到之处,或受条件限制而不能一时作出定夺的地方,对某些版本采取存疑式著录。粗步统计,该书纠正《中国古籍善本书目》著录不妥者,占比在一成以上,颇费心血。此书的编纂得到了上海图书馆领导的鼎力支持,让编者们能在宽松的环境下静心工作,这在趋利的当下,实属难能可贵。陈先行先生颇为感概地指出,作为一名图书馆的老古籍编目员,希望能在前辈事业基础上,为版本目录学的发展作些贡献。但是,往往有些项目,甚至是国家项目,政府投入了很大财力,也具有比以往更好的条件,由于急于求成,或明显追求经济目的,而收效不佳。自己在参与这些项目的时候,虽勉力为之,无奈左右不了客观局面,苦不堪言,常有浪费生命之感。只能埋首做点力所能及之事,将编纂此书视为版本目录学的重要实践。

复旦大学历史地理研究中心吴松弟教授介绍了近年来主持的温州通史的编撰情况,提供了一些可以借鉴的经验。该项目是在温州市政府的支持下进行的,经历了大规模的地域调查和地方文献的搜集与整理的过程。在编目的基础上,建立数字化文献资料库,实现设备共享,分层次开放。目前,在温州找到的地方文献中最大量的是家谱,大约3000部左右,此外,还有契约文书、宗教刻印书、唱本、圣旨、碑刻资料、个人日记、书信、诉讼文本、医药书、做生意的路程书等等。这些家谱分布在温州的各个区市县,修谱时间最早的是明代万历年间,也有清代康熙、乾隆年间,此后差不多是年年不减,还有一些新修的家谱。此外,吴教授介绍说,在智库建设方面,打算利用复旦大学历史地理研究中心所掌握的丰富的历史地理资料和相关研究成果,建立“国家政策历史地理咨询平台”,供中央和地方政府领导人在制定相关政策时,方便、迅速地获得直观、生动而又真实的历史依据,因此,希望这一咨询平台能够获得教育部的立项支持。

华东师范大学冷战研究中心沈志华教授介绍了近年所做的冷战时期档案文献工作的情况,他的主要兴趣是搜集国外的档案,以及国内涉及外交方面的档案。他的工作分为三个方面:1、搜集美国的外交文件、俄国档案、日本外务省与中国关系的档案、韩国外交史料馆涉及中国和朝鲜的档案,这些档案均未在网上刊布。2、未来十年,计划搜集相关档案,研究中国周边国家(包括越南、柬埔寨、泰国、巴基斯坦、尼泊尔、吉尔吉斯、哈萨克斯坦等)和中国关系的历史,特别是冷战时期的双边关系。3、搜集东欧档案,主要涉及一个主题,即东欧七国如何进入社会主义体制?又如何脱离社会主义体制?影响这种转变的主要事件是什么?以及他们与苏联的关系等等。沈教授认为,在未来需要解决两个主要问题:1、避免重复建设,减少人力、财力的浪费。建议由教育部成立一个协调机构,建立资源共享平台,各校、各专业人士可以根据自己的研究重点,把所掌握的档案目录在此平台上公布,互相交换,互相交流。2、解决资金不足。档案的搜集过程中需要雄厚的财力,主要花费在购买、攻关、旅费等方面,仅仅一个重大项目的经费无法支持这项工作的持续开展。因此,有必要专门召开一次档案文献搜集整理的会议,形成报告,以引起相关部门的重视。

北京师范大学历史学院郭小凌教授介绍了首都博物馆数字化建设的经验,他认为目前要建立一个档案文献的数字化平台,技术、资金、版权、著作权等问题都可以有解决的途径,主要的问题是,谁出资、谁愿意来牵头、协调搭建这个平台?他呼吁,我们不能坐而论道,要有人去落实,争取能做起来。

复旦大学历史地理研究中心葛剑雄教授担任过多年的图书馆馆长的工作,他的体会是由于目前图书馆或制作数据库的公司只能雇佣文化层次很低的人从事搜集、整理、扫描的工作,他们大多不了解历史学,做出来的东西存在许多局限和欠缺。问题的根源在于,国家社科基金项目、985项目、211项目等纵向项目,都不允许给教师发放劳务费,有兴趣参与这些工作的教师是没有报酬的。既无报酬,成果又是公有的,谁会愿意做呢?所以如何给从事这些工作的专业人员发放劳务费,目前是一个很大的难题。他呼吁财政部要在这个问题上有所改变,才能把钱花到实处,起到多出成果的鼓励效应。

辽宁师范大学历史文化学院赵毅教授谈到了几个问题:1、如何促进历史资料搜集、整理、研究和数字化工作的有序开展,避免重复建设?他建议由历史学学部牵头,教育部社科司组织各学部,联合文化部、国家档案总局、国家文物局、社科院等相关系统,召开专门的协调会议,商议可行性方案,这样才能打破目前的文献资源壁垒,实现资源共享,避免重复建设。2、目前各单位在数字化的过程中,技术标准是否需要统一?他认为有必要建立统一的国家标准,这样有利于在未来能实现资源共享的时候,实现技术上的顺利对接。3、在搜集、整理、数字化的过程中,应有轻重缓急之分,先做最重要而国家又急需的项目。4、资金的支持对大多数学校和研究者个人来说,仍然是很紧缺的,如何获得持续的支持?5、要重视古代中外关系史料的搜集、整理和利用。比如,研究藏学、新疆问题等,仅靠明清的档案、文献依然是片面的。西藏和尼泊尔是什么关系?新疆和阿富汗、土库曼斯坦、乌兹别克斯坦、吉尔吉斯斯坦、俄罗斯等之间的关系是什么?这些问题的研究需要我们从周边国家挖掘历史资料。

中山大学历史系桑兵教授介绍了自己近年来的工作经验,涉及从收集资料到出版、建立数据库等全过程,对其中出现的方方面面的问题都有亲身的体会。他主张建立一个完整的数据库,最终目标包括除档案以外的所有图书、报刊、未刊文献、民间文书、各种谱录等等,使其成为公共资源,免费、长期开放使用。研究者将不再为史料发愁,可以随心所欲地使用,专心读书和研究。如何在史料中有新的发现、新的解读,目前并不容易,研究者只有对新旧材料熟悉掌握之后,才具备解读的能力。桑教授认为,做整理文献的工作要分为三级:1、熟悉各类文献的总目及收藏状况。2、用PDF的扫描版呈现原文,不做编目等深加工,以减少加工过程中出现的错误。3、提供全文检索。这三级工作需要各家单位的共同建设,才能实现资源共享。桑教授还介绍了日本近代亚洲文献中心的做法。

北京大学历史学系李剑鸣教授认为,前面各位学者提到的经费、协调和共享等问题,确实需要引起重视。美国有史料整理的成功经验,比如联邦制宪会议的文件、美国各州批准宪法辩论记录等的整理和出版,在美国早期研究中发挥了重要作用。我们在考虑历史资料的整理和数字化建设时,可否借鉴美国、英国、日本等先行国家的经验,结合中国自己的实际情况,找到合适的机制来解决各方面的问题。除了政府的介入和支持之外,地方性史料的整理似乎还可依托不同的机构,如社团、大学、私人基金会和商业公司等。

在史料的数字化过程中,还会涉及数字化文本和原件之间的关系。如何使数字化史料最大限度地呈现出原始纸本文献的原貌,减少录入和整理过程中的错误,是一个值得重视的问题。另外,还要考虑文献的多样性,比如,利用美国国家安全委员会的档案,也要关注中情局的档案和国务院的档案,还有国会文件。刚才有的学者提到,在族谱的研究中,需要参考其他类型的文献。可见,只有多种资料结合起来,才能更全面地看清问题。对于世界史研究来说,数字化已经把很多一手史料搬上了网络,所以目前的问题主要不是缺乏材料,而是研究者没有足够的知识、资源和能力,包括语言能力、文化背景知识,来很好地解读和运用这些材料。只有真正把材料看懂、看出问题、看出味道,才能做出有价值的成果,促进历史学科的发展。这需要我们考虑如何训练研究生,帮助他们提高能力,掌握方法。可见,史料的整理和数字化是一项整体性的工作上,需要把各方面的问题解决好,才能使史料的数字化建设和引进发挥实效,推动中国史学的发展,产生能与国际史学界对话的成果。

北京大学历史学系马克垚教授总结说,数据库的建设很重要,我国的现状是百花齐放的局面。数据库的建设要逐步推进,形式应是多种多样的。他认为现在大家关心的还有一个问题,就是像桑兵、沈志华等教授已逐步建设的数据库该怎么处理?如何发挥最大的学术与社会效果?相信会逐渐找到推进、解决的办法。不过,要将所有资料放在一个平台上面,建成一个大一统的完整数据库,似乎难以实现。

by 吴士英

原网址

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注