- 相關推薦
圖書館與網絡信息資源編目
【內容提要】著重論述了圖書館對網絡信息資源編目的必要性、可行性,以及編目工具——元數據DC、MARC和可擴展標識語言XML,介紹了目前國際圖書館界在這方面取得的進展。【摘 要 題】圖書情報工作論壇
【英文摘要】This paper discusses the importance ……
1.對網絡信息資源編目的必要性
圖書館對網絡信息資源進行編目的意義在于:一是把網絡信息資源及其服務有機地納入到圖書館服務中來,這意味著圖書館利用網絡信息資源補充已有館藏和提高圖書館滿足讀者信息需求的能力;二是運用和移植圖書館學、情報學在組織文獻信息和書目控制文獻的研究成果和實踐經驗,提高網絡信息資源的有序化程度。
1.1隨著數字化革命的深入和Internet的飛速發展,網絡信息資源呈現出幾何級數量增長,據國外最新研究結果表明,因特網上可編索引的網頁已超過10億頁,僅此一項,其增長規模已超越了現有的非網絡資源,信息資源從內容到形式都發生了質的變化。網絡信息資源同非網絡資源相比,具有地理上分散、組織上無序、數據類型多、變幻多端的特點。
無序擴張的網絡信息資源,一方面使網上信息包羅萬象,良莠不齊,信息分布、信息組合錯綜復雜,信息污染嚴重;另一方面,廣大用戶,即信息的需求者,面對如此浩瀚的信息海洋,無法快捷地獲取自己所需的信息,對檢索和獲取信息的低效感到無奈。解決二者之間的矛盾,為用戶提供便利的信息獲取途徑和方法,就圖書館而言,最為有效的方法即是將網絡信息資源納入圖書館的服務當中,對其進行編目管理。
1.2網絡中存在著巨大數字化信息,用戶要想快速準確地檢索到所需信息,就需要一個機構能夠承擔起網絡信息的整序工作。目前,以網絡搜尋為目的的搜索引擎的出現(如國外的Yahoo、infoseek、altavista,國內的網易、搜狐等),雖然在浩如煙海的網絡資源中起到了一定的導航作用,由于其處理方式是通過自動調用程序在網際網絡上選取網頁,然后使用全文檢索的技術,以自動拆字詞作為索引的方式,建立其數據庫作為檢索的基礎,這種方式的不足之處在于其查全率高,但查準率低,以及缺乏一致性的用戶界面。檢索出的篇目太多,有時甚至有成千上萬篇,而其中真正有用的信息并不多。
這種情況下,圖書館應發揮自己的職業優勢,圖書館對非網絡信息資源的編目已有了豐富的經驗,將其應用于網絡信息資源的編目將起到事倍功半的效果,由圖書館對網絡信息資源進行選擇、加工、整理,對網絡上的各種信息進行篩選、過濾、描述、標引,以便于查尋的方式把有價值的信息提供給用戶,這是利用網絡資源最為有效的途徑之一。
2.網絡信息資源編目的可行性
盡管網絡信息資源具有增長迅速、數量巨大、流動性大、穩定性小的特點,它與非網絡信息資源仍具有共性,可以這樣比喻,整個因特網就像一個巨大的圖書館,各個網站就是種類不同的圖書,而每一個網頁就是圖書中的一頁,共性的存在,是對網絡信息資源進行編目的前提條件。
美國OCLC(Online Computer Library Center)對網絡信息資源的編目進行了有益的嘗試,并且取得了重大的進展。OCLC從1991年開始就致力于應用計算機技術對因特網上的資源進行精心篩選和標引。通過試驗,證實了MARC和AACR2可適用于網絡信息資源,同時提出了修改完善MARC建議,在USMARC中新增加了856字段—電子網址和索取字段。由于MARC本身的局限性,如結構復雜、著錄項目過于煩瑣,要求專業性強,要受過專門訓練的編目員來做等等,雖保證了著錄的精確性,但著錄速度慢,工作效率低,無法滿足海量的網絡資源的整序需求。
于是人們開始轉向研究一種新的著錄項目,一種用以描述網絡信息資源的格式和工具。“元數據”這一概念被及時推出,元數據的產生為網絡信息資源的組織提供了重要手段。到目前為止,世界上已開發出并付諸使用的元數據有許多種,如都柏林核心元數據(Dublin Core)、頻道定義格式(CDF)、藝術作品描述目錄(CDWA)、資源描述框架(RDF)等等。
有了高效實用的網絡信息描述工具以后,針對網絡信息資源編目的特殊性,1998年8月OCLC研究署向研究顧問委員會提交了CORC(Cooperative Online Resource Catalog)計劃的構想,這一計劃嘗試將傳統的圖書館編目規則與技術—文獻信息的選擇、描述、標引及利用等運用于網絡信息的存取,OCLC于2000年7月正式推出了CORC產品,并向美國和全世界推廣。CORC與商業的搜索引擎不同之處在于它有人工干預,網絡資源是由圖書館員挑選的,它的目標是將傳統的圖書館編目技術與先進的計算機技術相結合形成一個新系統,能夠明顯優于現有的搜索引擎。
3.編目工具
圖書館員一向以善于組織信息著稱,我們曾經有效地完成了印刷型資料的編目組織工作,當然有能力完成網絡信息資源編目的使命。
目前圖書館界對網絡信息資源編目的工具以MARC和DC為主,對網絡信息資源進行著錄的格式應是基于XML的DC描述。
3.1MARC
MARC格式是美國國會圖書館從1963年開始研究應用計算機對圖書進行編目的工具,1971年,美國國家標準局將USMARC確定為美國國家標準,1977年,國際圖聯(IFLA)發布UNIMARC格式,中國根據UNIMARC的框架體系和內容,結合中國的特點編制了CNMARC。
MARC是用于描述、存儲、交換、控制和檢索的一套機讀書目數據標準,它開始主要是針對印刷型書本的描述,對網絡信息資源進行編目,是通過在MARC中增加856字段,即“電子資源地址與存取”,并采用5XX字段記錄資源格式的方法來進行的。它的數據結構嚴密,能很好地描述電子信息,尤其是在檢索點的選取原則上,能確保其數據元索組成具有統一性,有利于資源交換。此外,這種經過編目人員過濾、篩選過的信息,確保了數據描述的可靠性、完全性和精確性。
856字段主要記錄被著錄的數字對象或與之相關的其它電子資源的存儲地址和存取方式,是可重復、必備字段,包含27個子字段。專業水準的分類和準確的記錄這兩大特色將使其能在Internet中占有一席之地。但用MARC格式編目Internet的成本相當高,由于網絡信息地址時常更改,為了維護856字段鏈接的有效性,需要耗費相當多的財力、人力和時間,編目的速度遠遠跟不上網絡信息資源增長的速度,因此這種高成本的編目方式只適用于編目一些最重要的網絡資源。
3.2DC
目前對因特網上
的信息資源編目用得最多的著錄工具是DC(Dublin Core)——都柏林核心,它是一項描述信息資源的國際標準,1995年3月在俄亥俄州的都柏林核心研討會上,52位來自圖書館、計算機和網絡方面的學者和專家共同探討了基于網絡信息資源的描述問題,創建了都柏林核心集。
DC包含15個元素,依據其所描述內容的類別和范圍可分為三組:a、對資源內容的描述;b.對知識產權的描述;c、對外部屬性的描述。對資源內容描述類包括:Title、Subject、Description、Source、Language、Relation、Coverage。對知識產權的描述包括:Creator、Publisher、Contributor、Rights。對外部屬性的描述包括:Date、Type、Format、Identifier。
DC同MARC相比具有以下優點:
· 格式簡單且易于使用:因它只有15個元素,易于理解,適合各種背景的人群使用。
· 具有通用性:15個元素可自由選用及重復使用,元素的含義不因其是否嵌入所描述的資源而受到影響。它支持任何內容的資源描述,使得跨學科的語義描述有了可操作性。
· 具有兼容性:DC通過RDF框架形成了資源描述的基礎,對基于WEB的元數據提供了靈活的語法基礎,如可內嵌入HTML、XML語言,各種瀏覽器均支持它。
· 具有可擴展性:可根據實際情況,通過使用限定詞能夠實現擴展描述的方法。
第七次都柏林核心研討會后,對DC進行了重大改進,DC與MARC之間映射更加一致,接近一一對應于MARC的許多字段,有利于將DC元數據記錄集成到圖書館原有的基于MARC的OPAC系統。
3.2XML
圖書館在對網絡信息資源編目過程中,采用DC作為網絡信息資源的著錄工具、XML文檔結構作為著錄格式是使網絡信息資源有序化的理想模式。
XML是一種區別于HTML和SGML的可擴展標識語言,它不象SGML那樣復雜,又能象HTML那樣可在WEB上傳送,它已廣泛應用于互聯網上。XML是一種類似于HTML,被設計用來描述數據的語言,XML提供了一種獨立的運行程序的方法來共享數據,它是用于自動描述信息的一種新的標準語言,它能使計算機通信把Internet的功能由信息傳遞擴大到人類其他多種多樣的活動中去。XML由若干規則組成,這些規則可用于創建標識語言,正如HTML為第一個計算機用戶閱讀Internet文檔提供一種顯示方法一樣,XML也創建了一種任何人都能讀出和寫入的世界語。
XML作為新的一代網絡語言,它具有良好的可擴展性,它允許各個不同的行業根據自己獨特的需要制定自己的一套標記;它還具有良好的自描述性,能夠描述信息本身的含義甚至它們之間的關系;它遵循嚴格的語法要求,增加了網頁的文檔的可讀性和可維護性,提高了瀏覽器的時間空間效率;它便于不同系統之間信息的傳輸,XML是一種非常理想的網際語言。
XML文檔最好以一個XML聲明作為開始,一個完整的聲明是這樣的:
附圖
下面是一個基于XML的DC描述的一個例子,
<?XML version="1.0" encoding="GB2312" standalone="no"?>
<論文>
<HEAD>
<Title>Dublin Core形式書目</Title>
……
<BODY>
<dc:Title>Internet環境下電子化圖書館信息管理系統</dc:Title>
<dc:Creator>林雪英</dc:Creator>
<dc:Subject>圖書館信息管理</dc:Subject>
<dc:Description>…</dc:Description>
<dc:Date>2002—5--?</dc:Date>
<dc:Type>學術論文</dc:Type>
<dc:Source>http://www.fjinfo.gov.cn/publicat/qbts/004/18.htm</dc:Source>
<dc:Language>Chi</dc:Language>
<dc:Relation>福建科技</dc:Relation>
<dc:Rights>http://www.fjinfo.gov.cn</dc:Rights>
</BODY>
</論文>
每個著錄項目均為可選項目,可重復標記,數據是可變長的,書目信息與全文版電子資源的鏈接是通過<dc:Source>……</dc:Source>來實現的。
4.圖書館對網絡信息資源進行編目的現狀
網絡資源編目既然是傳統文獻編目在網絡環境下的延伸,而網絡資源又具有數量大、增長快、穩定性小的特點,實行聯機合作編目是理所當然的必由之路。在這方面,美國做出了有益的嘗試。美國的OCLC在積其數十年合作編目豐富經驗的基礎上,順應網絡信息資源發展的趨勢,及時推出“合作聯機資源目錄”——Cooperative Online Resources Catalog,即CORC構想。
4.1CORC的概況。它的目的是在自動化編目工具與圖書館合作有機結合的基礎上,建設共享的網絡資源數據庫。目前它已建立4個數據庫:資源記錄數據庫、規范數據庫、尋路器數據庫、杜威十進分類法數據庫,其中資源記錄數據庫相當于一般的書目數據庫,以Dublin Core或MARC形式提供網絡信息,尋路器數據庫則以網頁形式揭示網絡資源的書目信息及其與資源的超文本鏈接。
4.2 CORC的功能。
· 快速生成書目記錄。圖書館利用CORC編目時,只需根據編目人員提供的URL,系統會自動搜索、獲取相關域名的網頁,為相關網頁及其所有鏈接生成一系列的資源記錄,而且可定向獲取具有EAD與TEI頭標的網頁,并自動生成書目記錄,CORC工具在獲取某一網址后,能自動過濾出關鍵概念與關鍵詞作為索引詞。
· 自動標引分類法類號和主題詞。CORC安裝了豐富的機助編目工具,如杜威十進分類法、美國國會圖書館標題表、美國國家醫學圖書館標題表等,以減輕編目人員的標引工作強度。
· 通過合作與機器協助的方法維護記錄的URL(統一資源定位器)。在CORC系統中,由成員館分擔維護URL,當用戶的記錄包含無效的URL時,CORC的自動鏈接維護工具會通過“狀態屏幕”及時通知用戶,由用戶進行核查、更正,從而保證了URL的正確性。
4.3CORC的啟示。
目前,國內許多有實力的圖書館已經開始對網絡信息資源加以收集、整理加工,開始了對網絡資源編目的有益的探索,但是同時存在著分散、不統一的特點,作為發達國家的美國,合作
聯機編目已走在我們的前面,我們的問題不再是如何對網絡信息資源進行編目,尋找什么樣的工具編目,而是應該直接與國際接軌,充分利用CORC系統這一先進的工具。
5.結束語
網絡信息的極大豐富,給圖書館的工作帶來了新的機遇和挑戰,也給圖書館員帶來了新的工作內涵,它使我們不斷地補充新知識、接受新生事物,采用新的編目工具組織新的信息。在對網絡信息資源進行組織整理方面,圖書館應是大有可為的,圖書館有知識、經驗都很豐富的編目人員,有一套切實可行的工作方法。目前,對網絡信息編目,圖書館界正在進行如火如荼的研究,相信無論是用MARC或是DC,是用XML或是HTML,圖書館這在方面的工作將會做得越來越完善、越來越科學。
【責任編輯】宋雅范
【參考文獻】
1、盧共平.圖書館與網絡信息資源的組織管理.http://www.libnet.sh.cn/magzine/00-06
2、郭瑞華.對網絡信息資源著錄項目和著錄格式的研究.圖書館建設,2002(1),55-57頁
3、吳萬曄.OCLC的CORC系統對我國虛擬圖書館發展的啟示.情報雜志,2002(8),86-89頁
4、王紹平.合作編目—網絡資源書目控制的必由之路.http://www.lib.sjtu.edu.cn/chinese/teaching&research
5、方小容.網絡信息資源編目與CORC系統.現代圖書情報技術,2002(2)65-68頁
6、吳開華等.數字圖書館元數據研究.圖書館學、信息科學、資料工作,2002(8),27-30
7、吳建中.網絡資源的組織與整理.http://www.kingsy.net/library/expert/wjz
8、Internet環境下電子化圖書館信息管理系統.http://www.fjinfo.gov.cn/publicat/qbts/004/18.htm
【圖書館與網絡信息資源編目】相關文章:
論圖書館網絡信息資源的整合08-05
論網絡化圖書館的信息資源建設08-06
網絡型電子期刊編目原則探討08-05
淺談圖書館地方文獻信息資源的開發08-09
網絡信息資源組織研究進展08-05
圖書館地方文獻信息資源的管理模式08-09
數字圖書館信息資源本體論的構建08-05
網絡環境下書目信息資源共享的思考08-05
社會科學信息資源網絡的構建08-05