跳至正文

资源分享 | 美国史数据库资源查找与使用



一 门户网站与数据库平台



1.万维网虚拟图书馆-美国史(WWW-VL:HISTORY:UNITED STATES)[2]


该网站最初由堪萨斯大学的林恩·纳尔逊(Lynn Nelson)维护,后改由乔治·劳黑德(George Laughead)维护。网站核心内容分六大板块:“研究工具”(Research Tools)、“研究助手”(Research Aids)、“美国历史学会”(USA History Associations and Societies)、“美国博物馆、历史景点和历史留存”(US Museums,Historic Sites & Historic Preservation )、“美国历史-按主题分类”(United States Historical Topics)、“美国历史-按时间分类”(United States History Chronological Periods)。每一板块下,再细分若干类目,如“美国历史-按主题分类”下,有非裔美国人史、农业史、西部、垮掉的一代及其文献、冷战、人口统计、经济史、环境史、种族研究、族谱资源、生育研究、网络史、劳工史、海洋史、军事史、民粹主义、激进主义和改革、奴隶制、城市史、芝加哥、纽约城、旧西堪萨斯、风力、妇女史、一战史、一战资源中心、二战医护阵线、二战史等约30个主题。


这个网站最主要的作用是提供相关研究信息和资源链接,虽然有一些网址已经失效,但总体仍不失为入门时的参考。比如,研究工具板块下的“地图”(Maps)[3],就有大量的地图信息。[4]


2.美国国会图书馆“数字化收藏”(Digital Collections)[5]


在美国的众多大学和机构中,都有“数字化收藏”项目,但美国国会图书馆的“数字化收藏”,因馆藏美国史资源丰富,尤其值得关注。该收藏共346个子库,每个子库收录6项(Items)[6]到1829500项不等。这些子库中若干个,之前曾经集合在一起,叫作“美国记忆”(American Memory)。原始载体形式包括图书、期刊、手稿、音视频资料(照片、地图、音频、视频等)。这些子库包含222个主题,涉及美国历史上的重大事件,如美国革命、大陆会议和制宪会议、内战、美西战争、一战、二战、越战、“9·11”事件、2003年伊拉克战争、2009年阿富汗战争;涉及美国社会生活的方方面面,如音乐、电影、舞蹈、建筑和景观、城镇、环保、科技、文学、宗教、体育、大众娱乐、语言、广告、奴隶制、民权运动、移民、美洲土著。绝大部分主题为美国的历史与文化,少量关于其他国家,如“中国善本数字收藏”(The Chinese Rare Book Digital Collection),收录了国会图书馆亚洲部近2000本中国图书。


这些数量庞大、主题丰富的数据库,是研究美国史的宝库。如其中的美国总统文件各子库。在美国第39任总统卡特之前,所有的总统都认为总统档案是其个人财产,应由总统及其家属保管与处理。这就不断引发历史研究人员需要查看总统档案与总统及其家属极力封闭资料之间的矛盾,也造成大量文件因管理不善而散失。[7]为了扭转这种情况,从19世纪后期开始,美国国务院、国会图书馆搜集了从华盛顿到柯立芝共计23位总统的文件材料,仅手稿就有200多万件,从而拯救了一大批珍贵档案。其中,从华盛顿到威尔逊17位总统[8]的档案已被数字化。


3.AMD历史与文化珍稀史料数据库集成


AMD历史与文化珍稀史料数据库集成由英国亚当·马修数字公司(Adam Matthew Digital,AMD)推出,共包含60多个数据库,内容涉及世界各国历史、政治、文化与文学等研究范畴,包含档案、手稿等珍稀史料。该集成包含六个研究区域与主题:亚洲与太平洋地区研究,北美与拉美研究,欧洲与非洲殖民研究,文学、戏剧与艺术史,文化、社会生活与商业,移民、迁徙与种族研究,其中,分布在该数据库集成中的美国史数据库主要分布在北美与拉美研究的研究区域与主题,但在其他研究区域与主题中也有一部分,总计18个(见表1)。

表1 AMD历史与文化珍稀史料数据库集成中的美国史数据库


由表1可见,AMD历史与文化珍稀史料数据库集成对研究美国从殖民地到尼克松时期的历史,特别是美国社会生活史、族裔史、中美关系史、西部史等,都是重要文献源。比如,其子库“中国、美国与太平洋”,数据库时间覆盖18世纪与19世纪,资料来源于美国和加拿大的图书馆、博物馆等。所收录的主要内容包括:中国贸易、中国移民、在太平洋西北地区的皮毛贸易(原住民)、美国商业海上航线、中美经贸和文化交流、美国与远东地区之间的外交和政治、重要的太平洋贸易站等。数据库文件类型包括:航海日志(有价值的商品和交易信息记录)、手稿资源(包括航海时代商人、造船者、船长和押运员写给家庭成员的信函手稿和用于商业的信函手稿)、报纸、印刷书籍、图像材料(包括绘画、插图和照片)、历史地图、短时效收藏品(如帆船牌)等。


4.Readex全球研究数字化典藏


Readex成立于1950年,隶属于NewsBank公司,以出版原始资料档案而著称,数据源自各国图书馆、档案馆和纪念馆等权威收藏机构的珍贵馆藏资料。全球研究数字化典藏数据库众多[9],国内可用的与美国史有关数据库见表2。


表2 Readex全球研究数字化典藏中的美国史数据库


由表2可知,Readex全球研究数字化典藏同样有美国史研究的丰富资料。例如,“美国历史印刷品”子库,包括三个系列,收录了1639~1819年,北美/美国出版的图书、手册与文学手稿等印刷品600多万页。其收录的时间是美国早期历史,因此也曾被命名为“美国印刷品”(EAI)。


5.Gale平台


Gale平台上的数据库收录很多原始档案,为用户呈现跨越了全球500多年历史的2.2亿页珍稀原始资源,收录了来自英国国家档案馆、美国国家档案馆、大英图书馆、苏格兰国家图书馆、爱尔兰国家图书馆、美国国会图书馆,以及哈佛大学、耶鲁大学、牛津大学、剑桥大学、哥伦比亚大学、约克大学等的海量档案、图书、报纸和期刊,以及地图、照片等多媒体资源。Gale平台上的数据库涉及丰富的学科主题,包括经济、历史、社会、国际关系、文学、地理、政治、法律等。国内可用的美国史数据库有11个(见表3)。


表3 Gale平台上的美国史数据库


表3中的“萨宾史料,1500~1926”子库,提供了相关时期美洲各方面的第一手资料,包括美洲大陆的发现和探索、奴隶制和欧洲殖民地、原住民、独立战争、宗教和传教工作、社会和政治改革、经济发展、西部扩张、著名人物等。该数据库借鉴了约瑟夫·萨宾的著名书目《美国藏书——从发现美洲大陆至今与美国相关的图书辞典》(Bibliotheca AmericanaA Dictionary of Books Relating to America from Its Discovery to the Present Time )。数据库中的内容来自多家图书馆,包括亨廷顿图书馆、耶鲁大学图书馆、美国古文物学会图书馆和美国国会图书馆。


6.ProQuest平台


ProQuest Information and Learning公司通过ProQuest平台提供60多个文献数据库,包含文摘题录信息和部分全文。这些数据库涉及商业经济、人文社会、医药学、生命科学、水科学与海洋学、环境科学、土木工程、计算机科学、材料科学等广泛领域,有档案、学位论文、期刊、报纸等多种文献类型。国内可用的美国史数据库见表4。


表4 ProQuest平台上的美国史数据库


表4中的“美国期刊全文数据库”是一个多学科全文期刊数据库,包含两部分内容:子库1为American Periodicals Series Online(美国期刊典藏数据库);子库2为American Periodicals from the Center for Research Libraries (美国研究图书馆中心保存的美国期刊数据库)。这两部分收录了包括从殖民时期到20世纪中期出版的美国期刊。


7.HeinOnline平台


HeinOnline数据库是由美国W.S.Hein公司推出的法律专题电子产品,现收录了2300余种法学期刊、美国联邦和各州的法律案例、6000多部精品法学学术专著。该平台包括核心库、国际法库、联合国库、知识产权库、中国法子库等60余个库。这些库有非常丰富的美国史尤其是美国法律史的文献。我们仅以标题来看,就至少有15个数据库(见表5)。


表5 HeinOnline平台上的美国史数据库


表5中的“条约和协定文库”包含美国所有的条约,不论是现行的、废止的还是未经官方正式公布的。这是世界上最大、最全的在线美国条约和协定文库。其中包含一些著名的文集,如正式的“美国条约及其他国际协定”(通常称为“蓝色系列”)。


8.EBSCO平台


EBSCO是一家从事多元化产业经营的跨国公司,总部位于美国,主要产业有文献信息产品和服务、渔具、地产和酒店等。其平台上的美国史数据库包括:AAS Historical Periodicals(美国古文物学会典藏期刊文献,50个子集共有8400余种期刊的回溯文献);European Views of the America 1493 to 1750 (从欧洲看美洲,1493~1750,在欧洲印制的有关美国的文献,包括32000多条记录);American Doctoral Dissertations,1933-1955 (美国博士学位论文档案数据库,1933~1955)。


除了以上门户网站与数据库平台,零散开发的非平台类美国史数据库更是数量众多,例如,康奈尔大学和密歇根大学两校图书馆联合开发的Making of America(美国的缔造,简称MOA),收录了大量19世纪的美国社会史文献,尤其集中于1850年到1877年。康奈尔大学的网站侧重于此阶段的期刊类文献,拥有1815年到1901年的23种期刊,论文总数超过10万篇,另有专著和美国内战文件。[10]密歇根大学的网站侧重于专著的收集,目前共有约1万本专著和5万篇文章。[11]


二 搜集整理专题性数据库:以战后美国外交史为例


对于开展专题研究来说,搜集研究所用的数据库,其基本路径是通过平台的和非平台的信息,尽可能地搜罗相关资源,并对每种资源的内容、重要性等有基本了解,从而分类分表整理专题性的数据库。[12]以战后美国外交史为例,我们可以根据文献来源情况,粗略把相关数据库分为三大类:综合类、单一联邦机构类和其他类。[13]


(一)综合类数据库


这里所谈的“综合类”数据库,指数据来自多家机构的数据库。下面主要介绍来自多个美国联邦机构的数据资源。


查询公开的综合文献,可以参考两个数据库。一是OCLC FirstSearch的U.S.Government Printing Office(美国政府出版物书目数据库)。该数据库由美国政府出版署(U.S.Government Printing Office,GPO)创建,覆盖从1976年以来各种各样的美国政府文件,包括美国国会的报告、听证会文件、辩论记录、司法资料以及由行政部门(国防部、国务院、总统办公室等)颁布的文件,每条记录包含一个书目引文,共有60多万条记录。二是美国国会图书馆或HeinOnline平台的Federal Register(联邦公报)。联邦公报自1936年由国家档案馆出版,公布每日的联邦官方文献,包括总统文件、行政命令、法律规范、各联邦机构通告以及各种听证会、委员会会议、调查等通告。


查询解密档案类文献,有如下电子资源可以利用。

(1)Foreign Relations of the United States,FRUS(美国对外关系文件集)。美国官方出版的外交档案集,是研究美国对外政策史的重要史料。1861年,在林肯总统提议下,经国会批准,FRUS的第1卷于当年诞生。该文件集目前总计出版了500多卷。与其他国家的同类出版物相比,FRUS是持续时间最长、内容最丰富的外交解密档案集,也是美国国务院出版物中最有价值的部分之一。该套文件的电子版可通过三个渠道获得:1861~1960年的卷册可以用威斯康星大学全文影像系统[14],所有卷册均可通过美国国务院历史学家办公室网站[15]、HeinOnline平台查阅。


(2)U.S.Declassified Documents Online,USDDO[16](美国解密档案在线)。Gale平台开发的数据库,包括白宫、国务院、中情局、北约组织、联邦调查局、国家安全委员会、司法部、商业部和国际贸易署等机构的文件,文件类型涉及国家安全委员会文件、内阁会议记录、中情局评估报告、参谋长联席会议文件、往来通信、谈话备忘录、日记等,目前已有11万余份档案,总量超过76万页。收纳的解密文件涵盖了整个冷战时期,包括这一时期发生的几乎所有重要的国际和美国国内事件,如冷战、越战、外交政策演变、民权运动等,是研究冷战时期美国外交的重要参考工具。


(3)Digital National Security Archive,DNSA(数字化国家安全档案)。由国家安全档案馆与ProQuest公司合作开发。到2018年12月,DNSA共有52个子库,每个子库都是一个独立的专题,总量超过12.4万份文件,总页数超过84万页。DNSA收录有多种政策文档,包括总统指令、备忘录、外交急件、会议记录、独立报告、简报、白宫通信录、电子邮件、机密信函和其他机密材料。数据库中还提供关于每个子库的介绍、年鉴、术语表、相关背景信息、参考书等补充参考资料。


(4)ProQuest History Vault,PHV(ProQuest历史库)。PHV是ProQuest开发的系列原始档案数据库的总称。截止到2019年3月底,已有45个模块,总计超过1850万页,其中绝大部分模块为美国史内容。PHV提供的资源异常丰富。以“越南战争和美国外交政策(1960~1975)”模块为例,该模块包括104个子辑,每个子辑收录数量众多的原始档案,有不少档案在国内并无其他形式的收藏。如以“John F.Kennedy National Security Files,1961-1963”(肯尼迪国家安全文件,1961~1963)为题的子辑里面有专题 15个,对应原始文件缩微胶片224卷,其中关于非洲、拉美、中东的7个专题在国内无缩微胶片馆藏。[17]


(5)Archives Unbound,AU(珍稀原始典藏档案)。Gale开发的系列专题数据库合集的统称。AU的设计理念是针对特定研究人员,它的每个子库都有一个特定的专题内容,截止到2018年底,已经有307个专题数据库。AU每个专题收藏的文献页数,从1200余页到26万余页不等。文献生成时间,最早可追溯到13世纪中期,最晚到20世纪末,主体是在19世纪和20世纪。从其专题情况来看,AU对政治学、经济学、历史学等学科的研究都有一定的价值。这些数据库的主要来源是美国政府解密档案。AU超过60%的子库都是美国史内容,已成为美国史研究的最基本史料之一。[18]


(6)Access to Archive Databases,AAD。[19]美国国家档案馆向公众提供的档案数据库之一,总文件量约8500万页,分为六大类,约150个主题。其中,与国际关系史研究相关的“战争/国际关系”(Wars/International Relations)部分又细分为内战、二战、朝鲜战争、越南战争、冷战、外交记录6个子系列。


(二)美国单一联邦机构数据库

1.美国总统

(1)美国各总统图书馆网站。[20]美国自富兰克林·罗斯福时起开始建立总统图书馆。1955年,美国国会通过了《总统图书馆法》,据此法,美国总统卸任后将建立相应的总统图书馆存放自己的文件,由国家档案馆管理。目前,美国已建立了从胡佛到奥巴马总计14位总统的图书馆。查阅从胡佛以来的总统文献,其电子资源可优先考虑各总统图书馆网站。如肯尼迪总统图书馆网站,就提供大量的白宫核心文件、总统办公室文件、国家安全文件等。[21]


(2)The American Presidency Project,APP(美国总统计划数据库)。[22]APP发起于1999年,最初是作为“美国总统”(The American Presidency)课程的资源,现在的目标是成为公认的“权威的、非党派性的在线总统公文资源”。其开发原则是:资源准确(即准确地复制纸本资源,如纸本有错误,则加注说明),分类明确,便于搜索,尽可能全面(即尽可能包含所有的总统公文,相关的历史文件、视频资料,以及研究总统必要的统计数据),同时提供一些分析性的论文。该库以战后的文献为主,战前的文献相对较少。


(3)U.S.Presidential Library(美国总统事务文库),HeinOnline平台。该库收录美国建国以来的各种与总统有关的公文汇编、总统弹劾专辑(安德鲁·约翰逊、尼克松、克林顿)、与总统有关的著作、总统研究相关链接等。


2.美国国务院

数量庞大的美国国务院档案资源,已收录在AU、PHV两个数据库的子库之中。除此之外,还可以利用如下资源。

(1)Foreign Relations of the United States Library(美国外交关系文库),HeinOnline平台。里面除了有上文已提到的FRUS,还有大量的公文汇编、美国外交研究著作,比较著名的包括美国国务院编的《美国外交政策:当前文档》(American Foreign PolicyCurrent Documents )。


(2)Central Foreign Policy Files(外交政策核心文件)。[23]该库包括1973~1979年部分档案(原件有650立方英尺,共4038个胶卷)。该数据库是AAD的一个子库。


(3)美国国务院《信息自由法》电子阅览室(Electronic Reading Room)。[24]这里提供207482份文件(最近的一次更新为2018年11月1日)。


3.中情局

(1)Twentieth-Century Global Perspectives(20世纪全球视角),Readex平台。资料全部来源于中央情报局,为20世纪国际研究提供了全球观点,涵盖全球各个热点区域及地缘政治地区。数据库包括政府出版物、杂志、报纸、转录电视、无线电广播,这些资料都被中情局在1941~1996年搜集、翻译与整理。除了“世界抗议与改革运动”子库,其他国内都有馆藏。“20世纪全球视角”子库见表6。


表6 “20世纪全球视角”子库


(2)Foreign Broadcast Information Service Daily Report(中情局海外情报档案),Readex平台。外国广播信息服务机构(Foreign Broadcast Information Service,FBIS)是中情局科技处下辖的情报部门,其任务是监听、录音、誊写、翻译美国以外国家的广播信息。该库提供1941~1996年的FBIS档案,包括:


FBIS Daily Reports,1941-1974(FBIS全球报告,1941~1974),无地区划分,提供了来自美国以外国家和全球热点地区关于众多历史事件的不同观点,还包含对于很多重要历史人物的看法。


FBIS Daily Reports,1974-1996(FBIS全球报告,1974~1996),提供了7个区域,即中东和北非、撒哈拉以南非洲、亚洲和太平洋地区、拉丁美洲、东欧、苏联和欧亚大陆中部、西欧的情报信息。


(3)Joint Publications Research Service Reports,1957-1994(联合出版研究服务报告,1957~1944),Readex平台。该库收录超过13万份400万页文件。联合出版研究服务(Joint Publications Research Service,JPRS)最初于1957年3月设立,是商务部技术服务办公室(Office of Technical Services)的一部分,后划归中情局。JPRS基本采取“译而不评”的方式,更多是从美国以外国家的专著、报告、期刊、报纸、广播与电视上查阅资料,并将其翻译成英文,以供美国政府及其他机构利用。最初,JPRS的关注范围主要在科技领域,后来扩展到环境、健康、核不扩散等领域。


(4)博睿学术出版社(Brill)美国情报系列数据库,总计4个。U.S.Intelligence on the Middle East,1945-2009(美国中东情报在线,1945~2009),收录档案2733份;U.S.Intelligence on Asia,1945-1991(美国亚洲情报在线,1945~1991)收录档案4294份;U.S.Intelligence on Europe,1945-1994(美国欧洲情报在线,1945~1994)收录档案4023份;Cold War Intelligence(冷战情报),收录对苏情报2360件。[25]国内目前只有“美国中东情报在线”可用。


(5)中情局《信息自由法》电子阅览室。[26]在中情局网站上,根据《信息自由法》设立的电子阅览室,可检索利用大量解密档案,以及符合25年规则的所有档案目录。


4.美国国会


(1)ProQuest Congressional(美国国会文件集)。

ProQuest出版了系列的美国国会文件集数据库,这些数据库汇集了1789年美国联邦政府成立以来的美国政府文献信息资源,包括众多美国国会参众两院文献资料,共计超过380万份文件,逾6700万页内容。这是一个比较完善而又具权威性的综合性美国政府文献信息资源平台,包括8个子库(见表7)。


表7 “美国国会文件集”各子库


(2)America’s Historical Government Publications(美国政府历史出版物),Readex平台。包括4个子库。


U.S.Congressional Serial Set(美国国会文献集)。该库包括15000卷,超过36万种出版物的2000万页内容,并有52000 张地图,以及许多插图与统计图表,其中包括13000张彩色地图。范围涵盖了1789~1994年美国国会文献的全部内容,包括美国参众两院的报告与文件,行政部门的年度报告与文件、有关期刊等。


Senate Executive Journals,1789-1980(美国参议院行政期刊,1789~1980)。该库收录美国参议院行政会议期刊,记录美国历史上影响政局与政治走向的重要时刻,包括总统候选人的确定、条约的批准、军事行动议案、司法任命、外交事务等。它是研究美国近200年(1789~1980)国会史和政治史的重要参考资料。


House and Senate Journals,1789-1817(美国众议院与参议院期刊,1789~1817)。该库完整地收录了记载早期美国国会会议记录等相关内容的期刊出版物。收录的文献内容包含早期美国参议院与众议院采取的行动、政治人物的决策、重要历史事件与重要国事问题记述文献等,讨论涉及的主题有棉花工业、《西北法令》、内阁部门、《格林维尔条约》、司法法案、法国大革命、关税法案、烟草业、《杰伊条约》、《客籍法和惩治叛乱法》、美籍法国人大会、公有土地法案、威廉·布朗特(William Blount)的控告、后革命时代的英美关系等。


Territorial Papers of the United States,1764-1953(美国领土文件集,1764~1953)。该库记录了美国国家领土的变化与不断扩张的历史。内容包含与美国原住民的谈判条文与条约、联邦政府官方往来公文、军事档案、诉讼程序记录、人口数据、财政统计数据、土地记录等。美国联邦政府职能部门和参议院负责地区领土事务的有关部门保存的全部官方文献可在这里查询。


(三)其他类


除了来自美国单一联邦政府机构的文献数据库,源自其他机构或其他国家的电子资源,对研究战后美国外交史也很有帮助。此处略举几例。


(1)Frontline Diplomacy:The Foreign Affairs Oral History Collection of the Association for Diplomatic Studies and Training(外交前线:外交研究与训练协会外事口述史收藏),美国国会图书馆。外交研究与训练协会于1986年成立,是独立的非营利机构。其目的是促进人们对美国外交的理解,支持美国国务院的外交训练。其活动包括口述史、出版书籍、展览、训练实习生。截止到2019年4月17日,在线的口述史资源超过1700份。


(2) Confidential Print:North America,1824-1961(英国外交部机密印刷件:北美,1824~1961),AMD平台。数据库资料来源于英国国家档案馆,其资料种类有报告、急件、政治领导策略报告、每周政治总结、月度经济报告等。内容覆盖美国、加拿大、加勒比地区乃至部分南美地区的资料。该库包含的档案内容如下:CO 880/1~32档案、CO 884/1~38档案、FO 414/1~278档案、FO 461/1~13档案、FO 462/1~10档案。


(3)The Nixon Years,1969-1974(尼克松年代,1969~1974),AMD平台。该数据库既包括英裔美国人的讨论与文章,也有与美国社会、国内改革、贸易、文化和环境等相关的资料。这些文件还涉及尼克松对冷战危机的处理、尼克松执政时期的重大成就,以及在水门事件与总统弹劾中有争议的活动与执行权的运用等。


三 利用进阶:数据库资源分析与来源扩展


李剑鸣教授在一篇文章中指出:“在资料激增的情况下,选取材料的眼光,解读材料的能力,以及运用材料的技巧,在研究和写作中就能起到更加重要的作用……另外,来自大数据资源的材料,因其量大和庞杂,在发掘、整理和运用时,还需要花更大气力来做考证和辨析。”[27]如何选取、考证、辨析、解读和运用数字资源,这是一个庞大的课题。笔者结合美国史数据库资源,谈几点体会。


一是注意数据库资料来源和开发机构。这主要是从数据来源,判断其中文本的权威性。一般而言,政府机构公布的本机构所掌握文献的权威性,高于其他来源;知名的开发商、学术机构开发的专业性数据库,高于一般网络资源。例如,我们要查美国人口数据,当然最优先利用的是美国人口普查局开发的“美国事实发现者”(American FactFinder)[28],它可以提供美国人口、住房、经济和地理数据的来源;而农业人口,则要参阅农业部的“国家农业统计数据”(National Agricultural Statistics Service)[29],它提供自1840年以来美国各州和地区的农业人口普查数据;还可以利用明尼苏达大学明尼苏达人口中心得到美国国家科学基金等资助开发的“美国国家历史地理信息系统”(National Historical Geographic Information System)[30],它提供1790年至今的美国人口普查和其他全国性调查的在线汇总统计和地理信息系统边界文件,包括带有地理空间属性信息的人口、农业、经济等方面的数据。此外,本文所列数据库,其数据权威性还都是比较高的。


二是注重数据形式和原实体之间的关系。有很多文献,本身就是电子化的,如数码照片,以及众多的电子文件。但就多数人文学科的数据库而言,其数据往往来自某种实物,数据库的建立经历了一个从实物载体向数字形式的转变。利用这种数据库中的数据,除了传统利用实物载体要注意的考辨等工作,还要从这个转变过程入手,考察数据形式同原实体之间的关系。如纸质的文献在电子化时,我们可能要关注单一文件或书籍是完整电子化的还是部分电子化的;对于套书或期刊,其电子化是否完整;电子化的文献,是如何排列的,这种排列同原始文献的排列关系何在;等等。


以ProQuest公司开发的PHV为例,在其U.S.State Department Central Files,Asia,1960-1969(美国国务院核心机密文件,亚洲,1960~1969)模块中,有13个子辑。其中一个子辑为China:Foreign Affairs,1960-January 1963。这个子辑是经过两次电子化的结果。子辑的档案来源为美国国家档案馆RG59核心文件,其十进位制代码为表示中美关系的611.93、611.93B、611.93C和表示中国外交事务的693、693B、693C,在1960~1963年核心文件的第1308~1312盒、第1400~1401盒。2000年第一次电子化时,这些档案被完整、按原次序制作成5个缩微胶卷,名为“美国国务院核心机密档案,中国,1960~1963年1月,外交事务”(Confidential U.S.State Department Central Files,China,1960-January 1963,Foreign Affairs)。第二次电子化,就成了现在PHV亚洲模块的子辑,而且其内容和排序也未发生变动。由此我们可以得知:该子辑的数据,因同美国国家档案馆完全相同,权威性高;因为两次电子化并未改变内容和顺序,第一次电子化时专业人员编写的指南,利用时可以参考。[31]

但ProQuest公司开发的DNSA,对文献源的选取和组合却有不同模式。它更多是围绕某一国家安全问题,抽取来自不同机构的档案,并按时间先后组织在新的子辑中。虽然所抽取的档案是完整扫描,但它并不会完整扫描原档案所在卷宗或系列。比如,U.S.Nuclear Non-Proliferation Policy,1945-1991(美国的核不扩散政策,1945~1991),收录了来自美国国务院、美国国防部、参谋长联席会议、白宫办公室、总统行政办公室、国会、原子能委员会、国家安全委员会、原子能控制与裁军署、美国核管制委员会、驻外使馆等机构的档案2651件,近14000页。这些档案,大部分是通过《信息自由法》申请获得的。美国国家安全档案馆人员利用该法申请到档案后,根据文件对理解专题的重要性,加以筛选。开发人员通过不同来源档案的时序排列,为研究者建立起新的联系。但由于数据库是原始档案抽取、重新组合的结果,由某一份档案无法获知其最初的排列方式以及该档案在原始卷宗里的位置、同上下档案的关系。


三是注意数据库来源的扩展。导语中,我们限定本文所讨论的主题为“美国史”数据库,即主要来源为美国,或主要反映美国历史,而这种限定,只是为了对海量数据库进行筛选。而在研究实践中,讨论专题问题,则需要更多的或广博或专门的数据资源,它们未必是我们限定的“美国史”数据库。

根据第一部分对相关平台的介绍,我们可以从如下渠道获得美国报纸资源(见表8)。


表8 各平台“美国史”数据库的报纸资源


从大致内容上看,上述资源覆盖了美国自建国前到20世纪末的报纸,但它们的一个显著缺陷是现报的缺乏,而ProQuest历史报纸数据库除了少量几份报纸由中国社会科学院购买[32]外,国内其他单位均无订购,这就导致要查20世纪60年代中后期之后的美国报纸有一定的困难。部分解决的办法之一是利用一些综合性的报纸数据库。根据国内的馆藏,可资利用的见表9。


表9 部分综合性报纸数据库简介


不仅报纸资源在利用上需要扩展,其他诸如图书、期刊、学位论文、档案等各种类型文献,在实际研究中,也需要超越“美国史”数据库的范畴。唯其如此,才能极大地丰富我们的文献来源,并据此相应地深化我们的研究。

本篇文章来源于微信公众号: 港澳台及海外历史文献

发表评论

您的电子邮箱地址不会被公开。