一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看

淺析漢字識別技術(shù)在檔案管理工作中的應用

時(shí)間:2024-10-14 18:38:47 管理畢業(yè)論文 我要投稿
  • 相關(guān)推薦

淺析漢字識別技術(shù)在檔案管理工作中的應用

漢字識別技術(shù)(簡(jiǎn)稱(chēng)OCR)可以理解為是讓機認字的技術(shù)。它通過(guò)光電信號轉換,即文本數據。

? 一、漢字識別技術(shù)的價(jià)值? 漢字識別技術(shù)的應用價(jià)值主要體現在兩個(gè)方面: ? 一方面,把紙質(zhì)檔案上的固定信息變成可以被檢索利用的活信息,為文本數據管理技術(shù)提供 豐富的數據源。

? 首先,從庫存檔案的情況來(lái)看,近幾十年來(lái)形成的大量印刷漢字檔案記載了我們黨和國家的 重要,對我國化事業(yè)的,對精神文明和物質(zhì)文明的建設都有著(zhù)非常重要的利用 價(jià)值。但這部分檔案的都沒(méi)有文本數據,或者說(shuō)都只是固定在紙質(zhì)載體上的死信息。既 使通過(guò)掃描以圖像方式存儲于計算機中,檢索利用也有不便之處,難于滿(mǎn)足現代對檔案 信息的多種利用需求。其次,從辦公自動(dòng)化的發(fā)展情況來(lái)看,每年接收的檔案中仍然會(huì )有相 當數量的檔案沒(méi)有文本文件,或為外單位來(lái)文,或為丟失損壞等。漢字識別技術(shù)的應用價(jià)值 就是使這兩大部分紙質(zhì)檔案上的固定信息變成可以被檢索利用的活信息,為全文檢索提供數 據,使深層次的開(kāi)發(fā)利用成為可能,更好地為現代化建設事業(yè)服務(wù)。

? 另一方面,提供了一種新的檔 案目錄數據的錄入方式。

? 應用計算機以來(lái),漢字錄入只有一種方式,即健盤(pán)錄入。雖然漢字鍵盤(pán)錄入的有許 多種,而且日趨簡(jiǎn)便快捷,已是年輕人必備的職業(yè)技能,但是它畢竟屬于一種技能,不僅需 要反應靈敏,手指靈活,而且要熟記錄入的原則、方法和要領(lǐng)。這對于在檔案部門(mén)占有相當 比例的中老年同志來(lái)說(shuō),掌握起來(lái)確有難度。因此,鍵盤(pán)錄入方式仍然是一些檔案部門(mén) 建立檔案目錄信息數據庫的因素之一。OCR軟件為我們提供了一條新的途徑。它通過(guò)“拖拉 ”的方式,將屏幕上文件的目錄項如標題、文號、責任者等直接移植到檔案目錄數據庫的相 應字段中去,簡(jiǎn)單易學(xué),一看就會(huì )。遺憾的是手工“拖拉”速度較慢,而且需要即時(shí)掃描或 調用圖像數據,所以單一利用這種方式錄入檔案目錄,速度不及熟練錄入員的鍵入速度。但它畢竟是一種新的錄入方式,為建立檔案目錄信息數據庫提供了一條前所未有的途徑。而且 ,如果利用OCR軟件同時(shí)建立新型的綜合檔案信息數據庫,例如包括檔案的文件目錄、圖像 和文本等,效果就此較理想了。

? 二、漢字識別后生成的文本數據的屬性。

? 原始性是檔案的基本屬性。漢字識別后生成的文本數據是根據檔案的本源信息,即固定在紙 質(zhì)載體上的漢字信息進(jìn)行加工處理:掃描、識別、校對、修改等工序后形成的復制加工品, 因此不具有檔案的原始性。

? 知識性是檔案的又一個(gè)屬性。漢字識別后生成的文本數據如果不計算人工校對后仍然可能存 在的微小誤差,應該說(shuō)具有與檔案原件同等的內容,因此具有檔案的知識性。

? 漢字識別后生成的文本數據是將檔案的內容以特殊的物理方式重新記錄在特殊的載體之上, 比以文字的方式記錄在紙質(zhì)載體之上更具有便于傳遞、接收、存儲、利用以及不磨損、不丟 失等屬性。因此具有更強的信息性。? 漢字識別后生成的文本數據應該說(shuō),它是一種新型的檔案一次信息的復制品或編研開(kāi)發(fā)成果 。但作為一種新型的復制品或編研開(kāi)發(fā)成果,因其生成的目的不同,又具有兩種不同的屬性 :當以提供利用為目的通過(guò)漢字識別建立文本數據庫時(shí),其文本數據具有類(lèi)似于匯編類(lèi)檔案 編研成果的屬性;當以編輯出版紙質(zhì)的檔案編研材料如大事記、組織機構沿革、文件匯編等 為目的進(jìn)行漢字識別時(shí),其文本數據不僅具有類(lèi)似于檔案編研成果的屬性,而且具有檔案原 始性的基本屬性,因為它們是印刷品或出版物的本源信息。

? 由此可見(jiàn),漢字識別后生成的文本數據是一種不同于傳統檔案屬性的新型檔案信息。

? 三、漢字識別技術(shù)的應用方式? (一)利用者閱讀紙質(zhì)檔案的之后,對其所需要的內容進(jìn)行掃描和漢字識別,或打印出統 一格式的利用摘錄,或直接提供文本拷貝。? 這是充分發(fā)揮OCR軟件功能,深層次開(kāi)發(fā)利用檔案信息資源的方式。但工程量較大,人力、資金需求較多,建庫周期較長(cháng)。

? 隨著(zhù)漢字識別技術(shù)水平的提高和應用的普及,可能還會(huì )產(chǎn)生新的應用方式,但無(wú)論使用哪一 種方式,都必須符合本單位檔案管理工作的實(shí)際,統籌考慮檔案狀況、人員配備、經(jīng)費能力、辦公自動(dòng)化水平、檔案化建設規劃等方面的因素,以切實(shí)提高檔案信息資源開(kāi)發(fā)利用能力為目的,這樣才能收到事半功倍的效果。

【淺析漢字識別技術(shù)在檔案管理工作中的應用】相關(guān)文章:

淺析計算機技術(shù)在檔案管理中的應用12-01

淺析數據融合技術(shù)及其在林業(yè)中的應用03-19

人臉信息技術(shù)應用新熱點(diǎn)淺析03-05

簡(jiǎn)易漢字識別系統的設計03-08

淺析多媒體技術(shù)在高校音樂(lè )教學(xué)中的應用03-08

淺析DCEMAP技術(shù)在遼寧業(yè)務(wù)支撐網(wǎng)的應用03-20

淺析3G技術(shù)及其在通信中的應用03-18

淺析納米技術(shù)在建筑材料的應用06-11

淺析化學(xué)工程技術(shù)的應用問(wèn)題12-02

一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看