- 相關推薦
地方文獻數據庫建設初探
吉安地區坐落在贛中南,是一座歷史悠久的地理文化名城,擁有豐富的地方文獻資源。建立吉安地方文獻資源數據庫,為地方經濟建設服務,是圖書館與地方經濟建設相結合的有效途徑。
1 吉安地方文獻數據的采集
地方文獻是指有關當地的一切資料,表現為不同時期各種記載形式的文獻,如:圖書、雜志、報紙、圖片、影片、畫片、拓本、表格、傳單、票據、文告、手稿、簿籍等。因此,地方文獻的數據可以從時間、空間、內容等方面進行采集。
1.1時間順序
吉安是一個歷史悠久的文化名城,有著 500年的歷史。我們收集地方文獻數據時,可以按照時間順序,從古代—近現代—當代的順序進行收集。如我館編撰的《井岡山革命斗爭史研究資料索引》,就是按照時間順序進行的,從井岡山革命根據地的創立(1927.9—1928.2)井岡山革命根據地的鞏固和發展 (1928.2—1929.1)井岡山軍民堅持斗爭(1929.1—1930.2)
1.2空間范圍
地方文獻具有典型的地域性,使得地方文獻的出現始終與一定的地域相聯系。吉安地理位置復雜,從地形、地貌到各區方言,再到各地習俗都有很大的區別。所以,我們可以按照地理空間,一般是按行政區劃來劃分。市下設縣,縣下設鄉鎮,直到村。以地名來收集地方文獻,按地域區分隸屬關系,以地名作為細類和子目,將庫容文獻各歸其類,有利于編制地名歸類文獻檢索子系統,形成一個樹杈式的檢索結構。
1.3 內容范圍
地方文獻是某一地域自然現象、社會現象的知識記錄。天、地、人、事、物,包羅萬象,按內容進行劃分可分為:
1.3.1人文、歷史類數據
(1) 吉安地區研究數據 (歷史、現狀、人文)。對于吉安市近500 年的歷史,按時間空間順序,對期間的歷史、現狀、人文、風俗進行收集,形成該地研究數據庫。我館歷時 3年之久,編撰了《井岡山革命斗爭史研究資料索引》,匯編了全國圖書、報刊文獻當中所載的有關井岡山斗爭資料1300余條,集中反映了井岡山革命斗爭史和井岡山精神。
(2) 本地區名人數據。吉安自古以來就人杰地靈,從“人生自古誰無死,留取丹心照汗青”的文天祥,到一代文豪歐陽修,再到賀子珍、袁文才、王佐等一代革命家,到曾慶紅等新一代國家領導人。以這些歷代名人組成專題數據庫,對于其中的有特殊貢獻的名人,可追加全文數據庫、照片數據,輔之以字畫、印章等必不可少的內容。我館目前正在建立《古代吉安名人研究資料索引》,計劃將陸續出版歐陽修、文天祥、楊萬里、劉過、劉辰翁、周大必等古代名人的研究資料索引,目前已出版 《楊萬里研究資料索引》、《歐陽修研究資料索引》。
(3)古籍數據。包括本地的全部古籍地方文獻的專題數據庫。由于古籍珍貴,甚至有的是孤本,不便于查詢,可通過光電掃描技術,存入計算機。如《楊萬里研究資料索引》中收錄了楊萬里的詩、詞、文;《歐陽修研究資料索引》中收錄了其詩、詞、文賦以及其史學觀、經濟觀、書法等。
(4)地方志數據。包括本地全部史志的專題數據。按照地域范圍,依次逐步采集。
(5)姓氏淵源數據。建立專題數據庫,可根據需要建立全文數據庫。
(6)譜牒多媒體數據。
(5)、(6) 兩種數據在 《楊萬里研究資料索引》和 《歐陽修研究資料索引》當中都有所反映,資料分別介紹了歐陽修、楊萬里的家世、生平、年譜。
1.3.2 商情類數據
(1)行業動態數據。包括吉安地區熱門、重點行業,如政策動態、市場、投資趨勢,形成旅游、電子、生物等行業特色專題數據。
(2) 地方企業名錄數據。吉安有許多企業,如電線電纜總廠、江西電視機廠、八三四廠。建立地方企業名錄數據庫,以公司名稱、業務經營范圍、產品名稱等反映公司行業主題特征的字段作為基本索引字段,以公司地址、電話、員工數字段作為輔助索引字段。
(3)地市名特產數據。吉安地區有許多地方名特產,如:遂川狗牯腦茶葉、泰和武山烏骨雞、安;鹜鹊,以他們的產地、用途、成分等字段來描述,形成專題數據庫。
(4)旅游資料數據。吉安旅游區和待開發旅游區,如:井岡山旅游區、遂川湯湖、吉安青原山道教勝地、八都毛主席故居、君山湖度假村等,按他們的地理位置、主要景點、服務項目、歷史典故等字段形成數據庫。
(5)地區農業科技數據庫。吉安是個以農業為主的地區,開發多種經濟作物,如:茶葉、玉米、煙葉、甘蔗等等,數據庫重點介紹地方特色產品的歷史、種植、栽培、加工等技術。
1.3.3 綜合數據
介紹該地各行業、各個方面的百科全書性綜合數據。
2 吉安地方文獻數據庫的設計
2.1書目型數據庫
書目型文獻數據庫即二次文獻數據庫,儲存原始文獻的題名、著者文獻出處、文摘、主題詞等項目。其價值在于把用戶指引到所需要的原始文獻,如歐陽修研究,把對歐陽修研究的文章進行二次加工,形成書目索引,可設計為書目型數據庫。在對吉安地方文獻進行分類時,可把本地區名人數據,人文、歷史類數據,古籍、地方志數據建成書目型數據庫。目前我館建立的《古代吉安名人數據庫》,就可按照其索引資料建立書目型數據庫。
2.2 源數據庫
源數據庫即一次信息庫,儲存用戶作為檢索目的而要求獲得的數據、事實或文本。其價值在于檢索的結果可以直接滿足用戶的信息要求。按照信息形式不同可分為:
(1)數值型數據庫。如:吉安地方工農業總產值、市場等。
(2)詞典型數據庫。把姓氏淵源數據、地方企業名錄、地市名特產品數據、旅游資源數據、農業科技等建成詞典型數據庫。
(3) 全文本數據庫。名人著作數據庫、古籍數據庫等可建成全文本數據庫。
有些數據還可能是上述 3 種形式的結合。如:本地名人數據庫中歐陽修、楊萬里研究資料,包括了他們的原著及其研究論文、政治思想觀點、家世生平和年譜等等,內容復雜,可建成一些復合式專題數據庫。
2.3 數據庫地址指針在數據庫文檔組織中的使用
利用倒排擋形式,把由基本索引字段構成的基本索引款目和由輔助索引字段構成的輔助索引款目采用倒排的形式,描述其特征標識、存取號、字段位置。在實踐中,為了提高聯機響應的速度,常采用兩級索引的倒排文檔結構,即將倒排文檔分為詞典文檔和存取號文檔,
詞典文檔也稱為索引文檔款目,內容包含特征標識、含有該標識的記錄總數、關聯到存取號文檔的指針。詞典文檔相當于一個索引詞表,其規模由索引詞數量決定,基本不受數據庫文獻或數據記錄增加的影響,可以極大提高系統對檢索終端的響應速度。存取號文檔的款目主要包括與詞典文檔指針關聯的存儲地址、含有該標識的記錄存取號,以及該標識在記錄中所處的字段及其位置。這樣的兩級索引結構不僅包括了原倒排的全部內容,而且使主機聯機響應速度得到極大的提高。這是由于特征標識與含有該標識的存取號及其字段位置的分離。雖然使文檔的結構更為復雜,卻突破了原先倒排文檔的索引款目會因記錄的增加而數百倍增加,進而因文檔的規模擴大而影響檢索速度的限制。在 《歐陽修研究資料索引數據庫》當中,由于數據庫規模大,所以也可使用指針來達到提高聯機響應的速度。如使用輔助索引倒排的兩級結構。
另外,使用鏈接link把書目型數據庫和文摘型數據庫、全文數據庫都可以連接起來,實現根據檢索需求,查找地方文獻的題錄、文摘或全文的目的。
〔出處〕 科技情報開發與經濟2003(9)
【地方文獻數據庫建設初探】相關文章:
職業學校班級學風建設初探08-16
淺談地方道路建設與發展08-12
新時期加強領導干部作風建設初探08-12
評語初探08-17
中學生網絡道德素質測評體系建設初探08-16
網上德育初探08-17
“愉快教學”初探08-19
現階段鄉鎮地方稅源建設研究與思考08-16
現階段鄉鎮地方稅源建設研究與思考08-15