關(guān)于地方文獻數據庫建設的思考
關(guān)于地方文獻的界定,地方文獻工作的前輩杜定友先生認為“地方文獻是指有關(guān)本地方的一切資料,表現于各種記載形式的,如:圖書(shū)、雜志、報紙、圖片、照片、影片、畫(huà)片、拓本、表格、傳單、票據、文告、手稿、印模、簿籍等”。隨著(zhù)社會(huì )的發(fā)展,新型載體形式的不斷涌現,諸如光化學(xué)、磁記錄制品等的面世,增加了地方文獻載體形式的新家族。在如此眾多的文獻類(lèi)型和文獻載體中選取相關(guān)的地方文獻信息進(jìn)行數據庫建設是社會(huì )發(fā)展的必然,也是地方文獻對社會(huì )需求的積極反應。
地方文獻數據庫建設工作是地方文獻全面實(shí)現自動(dòng)化和網(wǎng)絡(luò )化的基礎,是提高地方文獻工作管理水平與質(zhì)量,建立和實(shí)現地方文獻資源共享的前提。本文是筆者對地方文獻數據庫建設過(guò)程中涉及到問(wèn)題的一些思考,供同道師友參考。
1 數據庫建設論證
數據庫建設作為一項系統工程在投資興建前應對其經(jīng)濟效益和社會(huì )效果進(jìn)行多方面的調研、預測和評介,進(jìn)行可行性論證,以回答在限定條件下,數據庫建設的目標能否達到,是否可行,何者為優(yōu)諸多問(wèn)題。論證的主要內容包括需求研究、可行性研究和評價(jià)報告等步驟。
需求研究是對項目的背景,研究工作的依據和范圍,市場(chǎng)需求和擬建規模的調研。
地方文獻是反映一個(gè)地方諸多方面信息的文獻總集成,研究的主題和范圍有著(zhù)嚴格的界定,其信息密度和獨特性是其他文獻無(wú)可替代的。在網(wǎng)絡(luò )環(huán)境下,以數據庫建設為契機對地方文獻中的核心文獻進(jìn)行一次全面深入的發(fā)掘和整理,逐步實(shí)現地方文獻數字化。其意義在于突破了地方文獻信息傳統傳輸的限制,實(shí)現了跨地域、無(wú)時(shí)限的信息獲取方式。將地方文獻推向一個(gè)廣闊的傳播空間,在這個(gè)文獻基礎上建設的數據庫存在著(zhù)廣泛的市場(chǎng)需求和信息開(kāi)發(fā)價(jià)值。地方文獻從整體范圍上說(shuō)分為核心文獻和非核心文獻,數據庫選題應首先選擇地方文獻的核心文獻作為數據庫的建設重點(diǎn)。建立獨具特色的數據庫是地方文獻建庫的原則,在這個(gè)基礎上精心策劃和設計建設符合實(shí)際的地方文獻數據庫,可以包括不同的文獻類(lèi)型和文獻載體,其規模應視實(shí)際情況而定,不能貪大求快作表面文章,要特別重視數據庫的實(shí)用性和社會(huì )效益。
可行性研究是對資金、資源和人員等進(jìn)行分析研究,并提出和考慮幾種方案以便比較,從數據庫使用的角度回答項目的可行與否。
數據庫建設主要是將紙本文獻信息通過(guò)技術(shù)手段加工成為電子文件的過(guò)程,在這個(gè)過(guò)程中涉及到文獻資源、資金和專(zhuān)業(yè)技術(shù)人員等諸多因素,涉及到多部門(mén)之間協(xié)作。數據庫建設工作中的每一個(gè)環(huán)節,都應經(jīng)過(guò)認真研究和分析才能作出決定,而不能簡(jiǎn)單化。行政命令不能解決本應通過(guò)討論和協(xié)商解決的問(wèn)題,應該注意解決的問(wèn)題含糊不得。
數據庫建設資金是非常重要的問(wèn)題。資金籌措和使用管理等應請有關(guān)專(zhuān)家領(lǐng)導研究和論證方可決定。與資金相關(guān)的問(wèn)題是數據生產(chǎn)方式,而采用什么樣的數據生產(chǎn)方式又涉及到數據庫建設人員問(wèn)題。生產(chǎn)方式不外乎本單位生產(chǎn)和社會(huì )化加工兩種。如果自己具備數據生產(chǎn)能力,資金投入從理論上應該低于社會(huì )化加工,通過(guò)實(shí)際工作還可以培養和造就一批專(zhuān)業(yè)人才。如果本館數據加工能力有限,需要社會(huì )化加工,也應考慮資金投入與獲得利益的價(jià)值比。
完成上述工作后,提出周密詳細可靠的評介報告交付決策部門(mén),整個(gè)數據庫建設論證工作才算完成。
2 數據庫建設工作流程
決策部門(mén)下達了數據庫建設任務(wù)后,數據庫建設任務(wù)的承擔部門(mén)應迅速擬定出具體的建設方案及業(yè)務(wù)工作流程,以指導數據庫建設工作有序進(jìn)行。建設方案主要內容應包括:文獻選取、數據庫結構、文獻加工、文獻標引、數據灌裝鏈接等。
①工作流程圖
②文獻選取
文獻選取工作是數據庫建設的重要內容之一,關(guān)系到數據庫的質(zhì)量高低和成功與否。文獻選取應以社會(huì )需求、社會(huì )效果和地方文獻基礎業(yè)務(wù)建設需要為主要參考依據,選取標準應定位在地方文獻核心文獻。
考慮不同時(shí)期文獻的字體形式、紙張問(wèn)題、印刷技術(shù)在文獻數據加工時(shí)的難易和成本費用的高低等。先期選取文獻時(shí)以簡(jiǎn)體橫排文字圖書(shū)為主體,古籍線(xiàn)裝圖書(shū)盡可能使用再版排印本,這樣可以大大降低文獻掃描識別的難度。
③數據庫結構
數據庫結構設計的合理與否關(guān)系到數據庫使用,因此在進(jìn)行數據庫結構設計時(shí),數據庫設計人員和地方文獻業(yè)務(wù)人員應該從使用者的角度,進(jìn)行細致的研究分析,力求操作簡(jiǎn)便快捷。
數據庫結構主要包括以下內容:
題名、題名責任者(可重復字段)、母體文獻名稱(chēng)、母體文獻責任者、出版社、出版日期、頁(yè)數、分類(lèi)號(可重復字段)、主題詞(可重復字段)、索引號、ISBN、摘要。
對象數據:文本(文獻全文)、圖像(文獻全文、封面和插圖)
④文獻加工
文獻加工是通過(guò)數據庫掃描、識別、灌裝、鏈接等工序將紙本文獻加工成為電子文獻,以實(shí)現文獻性質(zhì)的轉換,完成數據庫檢索功能。
文獻加工是項復雜的事情,紙本文獻由于出版年代不同,存在著(zhù)繁體字豎排版、異體字等問(wèn)題,這是數據加工的難點(diǎn)之一。全文數據庫的文獻格式有圖形文件(tif)和文本文件(txt),兩種格式的文件性質(zhì)不同加工價(jià)格也不同。圖形文件在數據庫中僅供瀏覽不能進(jìn)行檢索,當然加工價(jià)格也便宜。文本文件在數據庫中不僅可以瀏覽重要的是可供檢索,自然加工價(jià)格也貴許多。兩種文獻格式的加工費用比例約為1比5。受價(jià)格因素的制約,在文獻加工時(shí)選擇那種文獻格式,要對使用目的和文獻加工價(jià)格綜合考慮。
⑤文獻標引
文獻標引工作是一項復雜的技術(shù)性工作,標引質(zhì)量受各個(gè)工作環(huán)節的制約,因此必須嚴格遵守一定的工作程序。地方文獻標引工作因其文獻的地域性和特殊性,在遵循圖書(shū)館文獻標引工作的原則和方法前提下,應根據地方文獻工作的特點(diǎn)制定出一些符合實(shí)際工作需求的標準和方法,以滿(mǎn)足地方文獻標引工作需要。文獻標引涉及到數據庫檢索質(zhì)量問(wèn)題,檢全率、檢準率是衡量數據庫質(zhì)量的重要標準,因此文獻標引工作應由富有經(jīng)驗的地方文獻專(zhuān)業(yè)人員完成。
⑥數據灌裝鏈接
從事數據灌裝鏈接工作的技術(shù)人員需要很強的責任心,良好的專(zhuān)業(yè)素質(zhì),操作謹慎細致,來(lái)不得一點(diǎn)馬虎。灌裝鏈接中一個(gè)不經(jīng)意的誤差可能導致數據庫檢索失敗,出現誤檢或漏檢,大大降低數據庫的檢全率和檢準率,極大的削弱數據庫使用功能。
數據灌裝鏈接專(zhuān)業(yè)人員要與地方文獻專(zhuān)業(yè)人員進(jìn)行必要的溝通,傾聽(tīng)他們對數據庫的使用要求,最大限度的滿(mǎn)足地方文獻工作
【地方文獻數據庫建設的思考】相關(guān)文章:
建設河池地區地方文獻數據庫的思考03-19
構建地方文獻數據庫的思考03-18
地方數據庫建設實(shí)踐與思考03-18
地方文獻古籍書(shū)目數據庫之建設03-20
高校圖書(shū)館建設地方特色文獻數據庫的再思考03-18
網(wǎng)絡(luò )環(huán)境下地方文獻資源建設的思考03-25
對廣西地方文獻資源網(wǎng)絡(luò )建設的思考12-06