电子文献学引论
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 电子文献产生的背景及发展过程

人类文明的历史是知识积累的历史,也是作为知识载体的文献发展史。从人文角度讲,作为人类实践的结果和一种物化了的精神财富,文献具有继承性、积累性和扩散性,可以一代一代地流传下去,可以从一个民族向另一个民族、从一个地区向另一个地区传播。文献的形态是不断发展的,而不会永远停留在一个水平上。当人类社会的物质生产和精神生产的发展达到一个新的水平,文献形态也会提高到一个新的高度,发展到一个新的阶段。因而,文献形态的发展在一定程度上可以作为衡量社会发展的一个尺度,反过来说,文献形态也反映出社会发展的背景。

1.3.1 电子文献产生的背景

最早记录知识的载体有甲骨、青铜、竹简、缣帛、羊皮等,由于受当时生产力水平低下和原材料稀缺、成本昂贵等限制,这些载体不可能被大量生产,而它们所能存储的信息量又少得可怜,因而它们传递信息、保存文献的功能差。西汉时期,中国发明了造纸术。(蔡伦被古今中外公认为造纸术的发明人,但出土纸张实物表明,远在蔡伦发明较完善的造纸术之前的西汉时期,造纸术已具雏形。20世纪30年代以来,在新疆、甘肃、陕西等地,曾多次出土西汉纸,如1933年在新疆罗布淖尔汉代烽燧遗址出土的“罗布淖尔麻纸”,以及1957年在西安灞桥汉墓葬区灞桥砖瓦厂工地出土的“灞桥纸”。宋朝苏易简《文房四谱》卷四载:“汉初已有幡纸代简。……蔡伦锉故布及渔网、树皮,而作之弥工,如蒙恬之前已有笔之谓也。”张树东,庞多益,郑如斯.简明中华印刷通史.桂林:广西师范大学出版社,2004,44)纸张比起青铜、竹简来,轻盈细薄,装订成册可以存储大量信息,而且它成本低廉,制造方便,可以大量生产,从而为人类社会传递信息、保存文献提供了一种便捷、价廉、高效的载体。从此,人类知识文化的传播速度大大加快,传播范围大大拓宽,也使浩如烟海的大量史籍典故得以保存,流传后世。可以说,纸张的出现,是文献载体发展史上的一次划时代的变革。所以,纸张很快取代了甲骨、竹简、缣帛等传统非纸质载体的地位,在后来一两千年里,一直是人类传递信息、保存文献的主要手段,至今仍占据统治地位。但是,随着科学技术的发展,又出现了一些非纸质载体,特别是现代科学和高科技的发展,使信息传递的速度和总量有了急剧的增长,以至于人们用信息爆炸来描述它迅猛的势头。与此相适应,文献载体也打破了纸张一统天下的局面,缩微胶片、录音磁带、录像磁带、软盘、光盘等现代非纸质文献载体迅速发展起来,并日益受到世人的青睐。与纸质文献相比,现代非纸质文献不但极大地提高了信息保存的数量,而且,它以富于感染力的音响、生动逼真的活动画面等功能,把人们带进一种感受信息的全新境地。可以说,它不仅保存了历史的文字记录,也保存了历史本身。它对信息保存的真实性与全面性,远非纸质文献可比拟。如果说当年纸的出现还只是从保存信息的量的方面引起变革,那么现在非纸质文献载体则是从量与质两个方面引起更加深刻的变革。电子文献的产生是人类文明发展到一定阶段的产物,具有很强的科学技术发展背景。

1.微电子与计算机技术

微电子技术是微电子元器件和电路的研制、生产,以及用它们实现电子系统功能的技术领域。1946年2月15日,世界上第一台电子数字计算机埃尼阿克(ENIAC)问世,占地150平方米,重达30吨,耗电几百千瓦,其功能只相当于一个袖珍计算器。1958年出现了第一块集成电路,而后发展速度十分惊人,对生产、生活的影响也是深远的。当微电子技术应用到计算机技术领域之后,计算机得到飞速发展,并成为了人类大脑的延伸。20世纪80年代个人计算机(PC)使计算机从庭院深处的计算中心中走出来,使每个人都可以拥有与使用一台计算机。当计算机逐渐渗透到人类生活中的时候,人们又开始研究与开发人工智能(Artificial Intelligence),使计算机成为具有感知、推理的智能机器系统。凌云,王勋,费玉莲.智能技术与信息处理.北京:科学出版社,2003,7~10

2.信息时代的通信技术

在电器时代到来前,还不具备发展远程通信的先决条件,所以通信事业的发展十分缓慢。从19世纪40年代到20世纪30年代,电磁技术广泛应用于通信领域,1844年电报的发明,1876年电话的出现,1903年无线电的发明,标志着近代电信事业的开始。从20世纪30年代到60年代,电子技术广泛用于通信网络,微波传输、电子多路通信网络、大西洋电话电缆相继实现。1957年人造卫星的发射,1960年美国海军首次使用命名为“月亮”的卫星进行远程通信。1962年通信卫星的发射和1970年光纤电缆的开发及航天技术的发展,都有力地促进了遥感技术、信息技术和其他高科技的开发利用。从20世纪60年代到80年代,计算机技术和通信技术的结合,形成了现代的计算机网络,1969年第一个远程分组交换网ARPAnet问世,20世纪70年代中期出现的局部网络在80年代得到了飞速的发展。从20世纪80年代到90年代,计算机网络发展成为社会重要的信息基础设施。胡道元.计算机网络实用技术指南.北京:清华大学出版社,2002人们发现,从工业革命到信息革命,一个根本的变革乃是从劳动密集的社会转入知识密集的社会,在这样的信息社会,谁拥有了信息,谁就拥有知识和财富。孙汉文.现代科学技术概论.北京:中国经济出版社,1999,82~87

3.网络技术

计算机网络是地理上分散的多台独立的计算机遵循约定的通信协议,通过软硬件互联以实现交互通信、资源共享、信息交换、协同工作及在线处理等功能的系统。计算机网络的出现为电子文献的传输、开发、利用提供了一个崭新的平台。

ARPAnet,即美国国防部的计算机网络,是因特网(Internet)的先驱。1960年代古巴导弹危机事件之后,美国著名的智囊团兰德公司向政府提出了将跨越国家的计算机网络离散化的设想,目的是力求当网络的一些部分在遭受核攻击而受到破坏或失效时,整个网络不致全面崩溃。实现这个设想的关键是将网络的控制和管理离散化,网络各结点计算机之间的通信信道必须是多条的。在20世纪60年代末期,兰德公司、麻省理工学院(MIT)和加州大学洛杉矶分校(UCLA)开始实验这种基于离散控制和信息包交换思想的计算机网络。1968年,美国国防部高级研究计划局ARPA(Advanced Research Project Agency)开始资助这个研究项目。1969年秋,具备4个结点的计算机网络ARPAnet诞生了,这4个结点分别位于美国加州大学洛杉矶分校(UCLA)、斯坦福研究所(SRI)、加州大学圣·巴巴拉分校(UCSB)和美国犹他州立大学(University of Utah)。

ARPAnet的成功超出了任何人的想象。1972年在首届国际计算机通信会议(ICCC)上首次公开了ARPAnet的远程分组交换技术。此后,人们开始探讨建立全球计算机网络。1973年,ARPAnet实现了第一个国际连接,连通了英国的伦敦学院大学和挪威的皇家雷达基地。到1976年,加入ARPAnet的计算机结点已发展到57个,连接不同类型的计算机100多台,联网用户2000多个。加入ARPAnet的计算机在相互通信时,最初采用的是“网络控制协议NCP”(Network:Control Protocol)。1974年,美国国家科学基金会NSF(National Science Foundation)的Vint Cerf和Bob Kahn发表了他们有关TCP/IP协议的技术规范。

传输控制协议TCP与NCP协议不同,在于它在信息的发送端对要传输的信息进行分割打包,并在接收端再将收到的信息包重组复原。网际互连协议IP的功能是为打包信息解决按地址传送,特别是能够通过多个结点乃至采用不同通信协议的多个网络。TCP/IP协议在1977年被其他一些与ARPAnet连接的网络所采纳。1983年1月1日,已经接管ARPAnet的美国国防部国防通信局,决定将ARPAnet采用的通信协议由NCP过渡到新一代的通信协议TCP/IP。采用TCP/IP通信协议是日后因特网得以发展的关键。因此,许多人都把这一天认作因特网的诞生之日。

网络技术发展史上的另一个重要事件是美国国家科学基金会(NSF)在1985年资助建立的连接五大超级计算机中心的计算机网络NSFnet。这五大超级计算机中心分别建立在普林斯顿大学、卡内基·梅隆大学、加州大学、伊利诺斯大学和康乃尔大学。20世纪80年代中期美国国家科学基金会(NSF)意识到因特网对科学研究的重要性,决定资助因特网的发展和TCP/TP技术,开始建设使用TCP/TP协议的NSFnet。由于美国国家科学资金的资助和鼓励,很多大学、政府科研机构甚至私营的科研机构都纷纷将自己的局域网并入NSFnet网。NSFnet在1986年建成后取代ARPAnet成为因特网在美国国内的主干网。NSFnet对推广因特网的重大贡献是使因特网对科教界开放,而不像以前那样仅供计算机科学家、政府职员和政府项目承包商使用。因特网进入了以资源共享为中心的实用服务阶段,得到迅速普及。虽然1986年连入因特网的计算机只有2300余台,到l987年就超过了1万台。1989年连接13个地点的Tl级主干网开始运行,Tl级主干网能以1.544Mbps的速度传输数据,连接计算机突破了10万台。1992年达到了72万多台。现在看来NSFnet是非常成功的,它不仅向科研人员提供了可获得无限资源的通信网络,并在不断完善、提高的过程中,构造现代美国因特网网络结构。

1989年3月,“互联网之父”蒂姆·伯纳斯-李(Tim Berners-Lee)向位于瑞士日内瓦的欧洲粒子物理研究所(CERN)递交了一份立项建议书,建议采用超文本技术(Hypertext)把CERN内部的各实验室连接起来,在系统建成后,将可能扩展到全世界。1989年仲夏,蒂姆成功开发出世界上第一个Web服务器和第一个Web客户机。1989年12月,蒂姆为他的发明正式定名为“万维”(World Wide Web,即WWW)。1991年5月WWW在Internet上首次露面,立即引起轰动,获得了极大的成功,并被广泛推广应用。(国际互联网Internet在20世纪60年代就诞生了,为什么没有迅速流传开来呢?其实,很重要的原因是因为联接到Internet需要经过一系列复杂的操作,而且网上内容的表现形式极端单调枯燥。Web通过一种超文本方式,把网络上不同计算机内的信息有机地结合在一起,并且可以通过超文本传输协议(HTTP)从一台Web服务器转到另一台Web服务器上检索信息。此外,Internet的许多其他功能,如E-mail、Telnet、FTP、WAIS 等都有可通过Web实现。的确,WWW技术给Internet赋予了强大的生命力,而Web浏览的方式给了互联网靓丽的青春。因此,1989年是Internet历史上划时代的分水岭。http://baike.baidu.com/view/78210.html?fromTaglist,2010年6月23日)据统计,因特网的发展速度超过了它以前的所有其他技术,无线电广播问世38年后拥有5000万听众,电视诞生13年后拥有同样数量的观众,而因特网从1993年对公众开放到拥有5000万用户只花了4年时间。它是当今世界上最大的信息网络。随着因特网的迅速发展,美国的私人企业开始建立自己的网络,在一定程度上绕开了美国国家科学基金会出资的主干网NSFnet,向用户提供因特网商业的联网服务。1991年这些企业组成了“商用因特网协会”,纷纷宣布自己开发的子网可以用于各种商业用途。商界的介入,进一步发挥了因特网在通信、信息检索、客户服务等方面的巨大潜力,世界各地无数的企业和个人纷纷涌入因特网,给因特网带来了一个新的飞跃。

在计算机技术、通信技术、网络技术发展的背景下,电子文献得到了长足的发展。1990年,美国文献学家T·H·纳尔逊在研究文献发展历史的基础上指出,电子文献的出现把人类带进了文献发展的屏幕显示阶段,而随着它的发展,文献单元间的相互连接将使所有文献形成一个整体系统,这个整体系统的最大特征就是它的和谐共享性。电子文献的出现充分表明,文献不仅载体在变化,记录方式在变化,功能性质也在不断丰富和加强,许多方面都在体现功能、性质交叉和综合的特点。文献记录、储存、检索和传播信息的目的在随着社会需求的更新和加大而更趋完善地接近它的目标,这也同其他事物的发展一样,有着普遍、必然的演化规律。总之,不论你是否接受和认识到,文献形态转向电子化的这种演化和发展是不以人的意志为转移的。

1.3.2 电子文献的发展过程

1.电子文献在国外的发展过程

文献发展的动因是自身形态的变化和运动,一定的文献形态代表着一定历史阶段人类特定的文化信息传播方式。电子计算机的出现,为电子文献这一新的信息载体形态提供了生长的沃土,同时,磁性与光感等材料以及相应电子记录方式的出现,都为电子文献的顺利产生和发展提供了可能。1954年美国海军军械试验站(NOTS)的图书馆利用IBM701电子管计算机建立了世界上第一个情报检索系统,约14000篇海军军械研究报告存储在磁带上形成了世界上第一个数据库。1961年,美国化学文摘服务社用计算机来编制《化学题录》,首次开始了电子出版物的实验。1962年进行了世界上第一次联机检索实验,网络文献开始产生。1964年,美国国家医学图书馆创建的医学文献分析与检索系统MEDLARS问世,它不仅可以进行多种逻辑运算,还可以从多种途径检索文献。这时的文献检索主要是对计算机编辑的文摘期刊的检索,文献是机器可读的书目文档,或多为文献目录型数据库。1965年,系统发展公司SDC在美国高级研究计划局的支持下进行了第一次全美规模的联机检索网的表演,为13个单位提供20万份国外文献的检索。自此,许多联机检索系统相继出现。1969年,美国宇航局(NASA,National Aeronautics and Space Administration)的第一个大规模的联机检索系统RECON全面投入运行。1970年,洛克希德火箭公司的DIALOG系统和系统发展公司的ORBIT系统相继建成。20世纪70年代末,世界上最大的联机情报检索服务系统——DIALOG系统开始装载4个全文数据库向公众提供服务。1982年世界上第一份网络报纸《沃斯堡明星电讯报》诞生于美国得克萨斯州。1985年世界上第一个商品化的光盘文献——CD-ROM数据库——BIBLIOFILE(美国国会图书馆的机读目录MARC)推出。1991年9月,美国科学促进会(AAAS)和俄亥俄大学图书馆中心(OCLC)共同开发了世界上第一份联网期刊《最新临床实践联机杂志》。1994年视频技术被开发,数据压缩技术进一步成熟,出现了融文本、视频、声频、图形、图像为一体的大数据容量的多媒体电子出版物。多媒体电子文献由此产生并得到迅速发展。据美国多媒体年鉴和多媒体与CD-ROM指南报道,到1999年欧美出版的CD-ROM电子出版物已近2万种。进入21世纪之后,文献学领域的形势更发生急剧的变化,电子书需求旺盛,数字媒体强烈冲击传统纸质媒体。2008年以来,美国纸传统报业深陷破产潮,许多报业公司停止平面印刷,涉足数字报纸。(2010年8月2日,美国华盛顿邮报公司对外宣布,美国音响设备制造业大亨悉尼·哈曼以1美元收购了美国号称“国家宝藏”的纸媒《新闻周刊》。于是,有人发出这样的警语:“也许传统大众媒介的昏黄斜阳已经让很多人丧失信心,从金融风暴以来先后如《读者文摘》和《新闻周刊》这样的‘金字招牌’的倒下或者易主,纸质平媒的前途的确来到了一个分叉路口。默多克和ipad的合作也许是新时代媒介生存的一种尝试,‘内容虽然为王’还要‘平台’来帮忙。中国平面媒体也许还未到《新闻周刊》这般疼痛的转型期,然而一叶知秋为智者,莫到满眼萧瑟时才觉秋风冷。”1美元的《新闻周刊》:纸媒的黄昏?.http:// www.legaldaily.com.cn/international/content/2010-08/10/content_2234628.htm?node=21732,2010年8月26日)俄罗斯传统报刊业损失惨重,2009年有20%的传统期刊停止发行,从而转为电子期刊。日本传统期刊业同样面临严峻的形势,2010年6月的调查显示,53.3%的人表示“最近就会感受一下电子图书”,而2009年9月的这一数据只有33.2%。中国迎来数字出版元年.北京:光明日报,2010年8月18日,第9版

2.电子文献在我国的发展过程

我国电子文献起步较晚,但发展很快,然而与欧美等发达国家相比,无论数量还是质量都有较大的差距。在20世纪70年代中后期,我国一些情报中心(所)引进了欧美的一些具有典型参考价值的文献磁带,并经过吸收改装,渐渐地建立了自己的磁盘数据库,拥有了自己的数据库产品。1983年北京文献服务处开始提供联机检索服务。进入20世纪90年代后,随着国家有关部门政策的重视和计算机技术的飞速发展,越来越多的机构进入数据库开发这一行业,出现了以CD-ROM为介质的多媒体电子出版物,1991年中国出版了第一种光盘型电子文献,名为《中国工商名录》(英文版)。同一年,武汉大学出版社在全国推出《国共两党关系通史》全文检索电子版。1992年,我国第一家多媒体光盘电子图书开发研制专业公司——北京金盘电子有限公司在北京成立,完成了我国第一张以CD-ROM为基础的电子《百科全书》。1993年3月18日,我国第一家数据库专业公司——万方数据公司成立,标志着我国专业化数据库企业工作的开始。1993年我国第一张科技文献数据库光盘《中国化学文献数据库》,由上海科文光盘公司和中国科学院上海有机化学所共同研制出版。1994年4月,第一本拥有独立书号和版权的电子图书——《邓小平文选》第三卷问世。1994年北辰集团出版了《人民日报》、《中国计算机报》、《百家报刊精选》等CD-ROM报纸。1994年底中国科学技术信息研究所与INTERNET的B级结点连通工作,开创了我国网络型电子文献的新时代。1995年伊始,我国第一本电子杂志《电子信息与通信网络》在上海问世。1995年《中国日报》率先上网,开始了网络版报纸的先河。1996年,清华光盘国家工程研究中心研制出版了我国第一个资源型电子版全文检索系统《中国大百科全书》、《邮票上的中国》、《中华针灸大成》、《北京的中国菜》等。1996年3月,国家新闻出版署颁布并实施《电子出版物管理暂行规定》,国产电子文献迅速崛起。2002年我国出版发行光盘型电子文献10,428种,内容涉及物理、化学、生物、法律、贸易、农业、传统中医药、军事、旅游、地图、文学、历史、地理、工业标准、专利、百科全书、工具参考书、书目光盘等。例如,北辰实业公司出版了《人大复印资料》光盘系列,万方数据中心出版了《中国科技文献数据库》、《中国科技成果数据库》、《中国学术论文数据库》等数十种光盘,清华大学出版了CD-ROM形式的《中国学术期刊》(光盘版)论文检索数据库。电子出版物在数量上,1993年为30余种;1994年为50余种;1995年为70余种;1997年猛增到1025种,年增长率为200%,几乎是1993—1996年4年产品数量的总和。从此以后数字化电子出版物发展极为迅速,年平均增长率接近50%,“纸质阅读”到“电子阅读”的转型已是大势所趋,有的媒体称2010年是中国数字出版元年。(国家新闻出版署发布报告称,2009年我国数字出版总产值达到了799.4亿元,首度超越传统书报刊出版物的生产总值。见中国迎来数字出版元年.北京:光明日报,2010年8月18日第9版我国数字出版总产值首超传统出版.文汇读书周报,2010年5月14日首版

计算机技术及其高密度大容量存储技术的突破和普及为电子期刊的大发展提供了技术上的保障和可能。我国的电子期刊发展异常迅猛,《非线性科学与数值模拟通信》、《读者》、《神州学人》、《计算机世界》、《中国学术期刊(光盘版)》等数千种期刊以电子出版物的形式出版发行。由清华大学电子出版社出版的《中国学术期刊(光盘版)》是经国家新闻出版署正式批准的,具有电子刊号的我国第一个连续出版的大规模、集成化、多功能的学术期刊全文数据库检索系统。该“光盘版”遴选了国内中、英文核心期刊和专业特色期刊数千种,以理工A、理工B、理工C、农业、医药卫生、经济法律与政治、文史哲、教育与社科综合及电子技术与信息科学9个专辑向全国发行。《中国学术期刊(光盘版)》的成功推出,受到了广大读者尤其是高校科研人员的关注,由最初的少数检索光盘,到如今越来越多的电子期刊和图书文献,以及形形色色的网络数据库,其在人们的学习和生活中也占据了越来越重要的地位,其所起的作用也日益得到重视。

总之,从国内外电子文献发展的历程来看,由于信息处理技术、计算机技术和远程通信技术的迅速发展,电子文献异军突起,呈现出百花争艳的景象。同时,电子文献的出现,将带来一场阅读的革命,因为“数字阅读改变的,并不仅仅是传统纸质阅读的命运,它还改变着阅读本身。”徐升国.数字时代你怎么读书?——从第七次全国国民阅读调查看国民阅读趋势.北京:新华文摘,2010(13),154