一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看

一種基于人機結合思想的書(shū)本式地方文獻索引編制方法

時(shí)間:2024-08-25 13:22:45 計算機畢業(yè)論文 我要投稿
  • 相關(guān)推薦

一種基于人機結合思想的書(shū)本式地方文獻索引編制方法


  地方文獻以其地名、人名、機構名等專(zhuān)有名詞術(shù)語(yǔ)眾多而一直是索引編制的難點(diǎn)。對于文字數量數百萬(wàn)乃至上千萬(wàn)的地方文獻而言,若要達到滿(mǎn)足讀者檢索要求的標引深度,則索引制作的工作量就會(huì )急劇增加。如果純用手工制作,不僅在信息的處理過(guò)程中容易產(chǎn)生差錯,且費時(shí)費力。為了解決這一矛盾,降低索引編制成本,需要引入計算機信息處理技術(shù)。以下我們以在《杭州市志·索引》編制過(guò)程中開(kāi)發(fā)的計算機輔助索引軟件(CAIC1.0Beta)為例,就詳細說(shuō)明這一基于人機結合思想的地方文獻索引編制方法。

1 現 狀

目前,運用計算機信息處理技術(shù)來(lái)進(jìn)行漢語(yǔ)文獻索引編制的方法一般分為兩大類(lèi):一種為基本以自動(dòng)標引、索引為主的方法,其中漢語(yǔ)自動(dòng)標引法常見(jiàn)的有詞典標引法、切分標引法、語(yǔ)法分析標引法、漢語(yǔ)自動(dòng)標引專(zhuān)家系統、單漢字標引法等;在漢語(yǔ)索引法上則多采用題名關(guān)鍵詞抽詞索引法、主題詞表選詞索引法、職能符號標引索引法等。這些方法都在一定程度上解決了漢語(yǔ)文獻標引和索引的問(wèn)題,但由于漢語(yǔ)語(yǔ)言現象的復雜性,此工作基本都在文獻題名這一層次上展開(kāi),至于針對文獻全文的智能標引和索引尚處于探索階段。而且,這些方法需要具備相當專(zhuān)業(yè)的計算機、語(yǔ)言學(xué)、文獻學(xué)知識,并且相關(guān)的專(zhuān)用軟件獲取成本極高。另一個(gè)常用方法是人機結合、以人為主的方法,主要為采用諸如Foxpro MicrosoftAccess據庫軟件來(lái)編制。這種方法具有技術(shù)要求低、使用方便的特性。但這僅是一個(gè)以人工為主、輔以計算機技術(shù)的方案,并且參照系統即關(guān)鍵詞之間的相互關(guān)系(見(jiàn)、參見(jiàn))不能直接在上述數據庫軟件中得到表達和轉移,因此索引庫的生成無(wú)法直接應用參照系統,編制者將不得不依靠手工來(lái)進(jìn)行,這是一個(gè)非常繁瑣而且極易導致差錯的工作。

2 解決方案的系統設計

方志作為地方文獻的一個(gè)重要門(mén)類(lèi),其數量龐大,包含了一個(gè)區域的自然、政治、經(jīng)濟、文化、社會(huì )、軍事等信息,有地方百科全書(shū)之稱(chēng),具有極高的使用價(jià)值。為此,我們在實(shí)踐中以《杭州市志·索引》作為地方文獻的樣本,對此進(jìn)行索引的編制。其編制目標是一部分析內容的書(shū)本式關(guān)鍵詞索引,其標引范圍為全志中的正文、附錄、圖、表格、照片,標引對象為人物、機構、地名以及其他一切具有檢索價(jià)值的各類(lèi)事物、事件和活動(dòng)。

對于一個(gè)優(yōu)秀的索引而言,確定適合的標引、索引方案和參照系統是至關(guān)重要的,也是本索引編制解決方案首先要解決的問(wèn)題。因此,在系統設計過(guò)程中,我們考慮了地方文獻的特點(diǎn)和客觀(guān)實(shí)際,分析上述方法的利弊,制訂了以下的編制思路!

2.1 標引方案 以實(shí)現的手段劃分,可分為人工標引和自動(dòng)標引。自動(dòng)標引又可分為自動(dòng) 抽詞標引和賦詞標引。自動(dòng)抽詞標引是指直接從原文中抽取詞或短語(yǔ)作為標引詞來(lái)描述文獻的主題內容。如果在自動(dòng)標引過(guò)程中,使用的標引詞來(lái)自于預先編制好的詞表,則稱(chēng)之為自動(dòng)賦詞標引。對于計算機而言,針對漢語(yǔ)的自動(dòng)抽詞主要困難在于自動(dòng)分詞以及選取標引詞的標準,而自動(dòng)抽詞標引的標準很大程度上是建立在詞頻統計的基礎上的。就方志這一類(lèi)地方文獻而言,如果一些人名、地名在文獻中只出現數次乃至一次的話(huà),就很有可能不被標引,這會(huì )導致大量有價(jià)值的信息不能被檢索到。而如果放低詞頻標準,則相關(guān)的標引詞數量會(huì )急劇增多,書(shū)本式索引的篇幅會(huì )相當龐大。而自動(dòng)賦詞標引又依賴(lài)于詞表,由于方志的地域性,這樣一個(gè)包含有大量地方獨特的人名、機構名和地方特色事物的詞表一般都沒(méi)有建立,因此無(wú)從根據詞表來(lái)進(jìn)行自動(dòng)標引。

由于地方文獻的編纂者或研究者對于文獻內容比較熟悉,可以準確地分析主題內容,并抽取相應的關(guān)鍵詞予以標引。因此,采用由他們來(lái)進(jìn)行人工標引的方法,應該是方便和切合實(shí)際操作情況的策略!

2.2 索引方案 索引款目的自動(dòng)生成目前已經(jīng)有很多實(shí)際應用的方案,如鏈式索引法(ChainIndexing)、選擇組合排列索引法SLIC)、掛接主題索引法(ASI)、保留上下文索引法(PRECIS)等,這些基于計算機的索引法無(wú)一例外地運用了輪排或循環(huán)技術(shù),對于計算機來(lái)說(shuō)只要設定好索引法的原則后,工作是相當簡(jiǎn)單的。但是這種方法會(huì )導致索引款目急劇增多的后果,因此這種對于專(zhuān)業(yè)性文獻檢索工具而言是十分適合的方法,運用到地方文獻上時(shí),特別是如方志一類(lèi)篇量較大的文獻上時(shí),就要承擔索引篇幅大幅增加印刷成本提高所帶來(lái)的危險;谶@個(gè)因素,我們認為在方志索引上應該采取對于絕大部分的索引詞不進(jìn)行輪排,只對極個(gè)別的主標目和副標目進(jìn)行輪排的索引方案,以最小的代價(jià)來(lái)實(shí)現相對高的查全率!

2.3 參照系統生成 是否設置參照系統是衡量索引系統質(zhì)量的重要指標之一。而為了提高查全率,也需要我們設置參照系統。參照系統由主標目詞和見(jiàn)參照(seereference)、參見(jiàn)參照(seeaisoreference)組成,從而保證了索引的整體性和系統性。因此,我們認為在沒(méi)有現成詞表的前提下,運用計算機技術(shù)結合人工干預來(lái)生成參照系統應該是軟件追求的目標。

  2.4 編程語(yǔ)言的選擇 由于直接運用Foxpro數據庫技術(shù)在款目地址碼歸并和參照系統生成上的困難,因此采用通用編程語(yǔ)言是理想的選擇。Delphi為一種面向對象的可視應用程序開(kāi)發(fā)工具,與其他語(yǔ)言相比,它提供了一種快速的編譯器,優(yōu)化編譯模式在很大程度上提高了代碼質(zhì)量和運行穩定性,所以這種語(yǔ)言一直受到專(zhuān)業(yè)人士的青睞。同時(shí),Delphi特別對于數據庫的體系結構提供了強大的支撐,Delphi還允許開(kāi)發(fā)者將應用程序作為單一的.exe文件提供給終端用戶(hù),這樣就減少了可執行文件在運行時(shí)對于其他文件或DLL(動(dòng)態(tài)鏈接文件)的依賴(lài)。因此我們以Delphi為系統前臺,以MicrosoftAccess為后臺數據庫存儲原始信息,來(lái)編制索引計算機輔助編制系統。

3 本方案的技術(shù)實(shí)現 

3.1 數據結構 本軟件數據庫包含三個(gè)主要的數據表:a 主表(標引詞庫)。該表用來(lái)儲存從方志文獻中抽取的關(guān)鍵詞和諸如卷號、頁(yè)碼、體裁、參照關(guān)系等屬性,以及一些用于操作管理的信息。其中的記錄需要索引編制者人工輸入。為了方便數據的錄入工作,一般可按照文獻的頁(yè)碼順序依次輸入。b 關(guān)鍵詞表。該表依據主表表達的各標引詞之間的參照關(guān)系,由程序自動(dòng)生成。此表是軟件下一步進(jìn)行索引合成的依據。c 索引正文數據表。該表用來(lái)儲存關(guān)鍵詞及其地址碼(卷號、頁(yè)碼),可用來(lái)最后輸出索引正文格式的文本文件。

  3.2 程序功能(主控界面見(jiàn)圖1)

本軟件具備信息采集;信息處理;信息輸出三大功能。

3.2.1 信息采集功能。主要是由索引編制者將標引詞(

一種基于人機結合思想的書(shū)本式地方文獻索引編制方法

【一種基于人機結合思想的書(shū)本式地方文獻索引編制方法】相關(guān)文章:

淺議地方文獻報刊索引工作03-20

地方文獻書(shū)目的編制及它的社會(huì )價(jià)值03-18

地方文獻目錄初探03-20

地方文獻的搜集與整理03-19

一種基于區域特性選擇與加權平均相結合的遙感圖像融合方法11-22

基于嵌入式思想的小波圖像壓縮研究03-20

地方文獻整序研究12-05

家譜-不可忽視的地方文獻03-18

地方文獻工作芻議03-18

一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看