信息檢索的小論文
信息檢索,是指將信息按一定的方式組織和存儲起來(lái),并根據信息用戶(hù)的需要找出有關(guān)的信息過(guò)程。以下是小編整理的信息檢索的小論文,歡迎閱讀。

信息檢索的小論文1
圖書(shū)情報的信息檢索也就是把信息進(jìn)行整理、排序、歸納以及存儲起來(lái),這樣不僅能夠展現情報的內在特征,還能夠反應情報的外在形式。眾所周知,傳統的圖書(shū)情報搜索模式已不能夠適應現代社會(huì )的發(fā)展,現在人們更加的追求智能化的信息檢索方式,在信息檢索的過(guò)程中,把高科技的技術(shù)以及方法引入到圖書(shū)情報管理工作中,確保圖書(shū)情報更加的真實(shí)科學(xué)。
一、我國信息檢索在圖書(shū)情報應用中存在的問(wèn)題
1.信息檢索技術(shù)不完善
目前,信息檢索在圖書(shū)情報中的應用仍然不是很完善,其中主要包括以下兩個(gè)方面:一方面是知識的獲取和技術(shù)的表達存在一些問(wèn)題。把復雜多樣的專(zhuān)業(yè)知識形成一個(gè)比較系統的、有規律的模式,往往是比較復雜的。另一方面是由于語(yǔ)言處理方面的局限,在進(jìn)行檢索工作的時(shí)候,檢索者的文化素養以及專(zhuān)業(yè)知識往往直接影響著(zhù)檢索所出現的結果。因此若想使計算機能夠準確的把握檢索者輸入的各種語(yǔ)言方式,將大大提高檢索的效率,然而在實(shí)際的檢索過(guò)程中,由于計算機只能夠接收一些簡(jiǎn)單的、規范的語(yǔ)句,大大降低了檢索效率。
2.信息檢索系統本身的障礙
檢索者在進(jìn)行圖書(shū)情報檢索的過(guò)程中,容易出現各種問(wèn)題,其中信息檢索系統本身就存在一定的局限。首先,信息檢索的用戶(hù)往往來(lái)自不同的專(zhuān)業(yè)領(lǐng)域,他們知識水平和專(zhuān)業(yè)素質(zhì)都不相同,這使得計算機很難對其進(jìn)行一個(gè)合理的定位。其次是圖書(shū)情報不僅存在一定的豐富性,還存在一定的復雜性,而將那么多綜合復雜的信息整個(gè)到一個(gè)系統當中,是一件非常困難的事情。最后是圖書(shū)情報檢索專(zhuān)家系統不易建立,一方面是這些專(zhuān)家的經(jīng)驗和技術(shù)不能夠準確的表達,另一方面是不同檢索專(zhuān)家往往具有不同的觀(guān)點(diǎn),這都對圖書(shū)情報檢索專(zhuān)家系統的建立,帶來(lái)一定的困難。
3.我國的情報技術(shù)發(fā)展落后
眾所周知,相對于國外的情報技術(shù)的發(fā)展,我國的情報技術(shù)明顯落后,這嚴重影響了信息檢索在圖書(shū)情報中的應用。同時(shí)我國在對于信息檢索技術(shù)上的人力、財力以及物力的投資也明顯沒(méi)有國外高?偠灾,由于我國對于情報技術(shù)的重視程度不高,在很大程度上影響了信息檢索的發(fā)展。
二、信息檢索在圖書(shū)情報中應用的幾點(diǎn)建議
1.建立理論基礎,打破傳統思維模式
任何一項技術(shù)都有理論依據,信息檢索也不例外,然而目前大多數負責的圖書(shū)情報的管理工作人員不能夠很好的理解信息檢索在圖書(shū)情報中的作用,因此在今后的.發(fā)展過(guò)程中,要對信息檢索建立一定的理論依據,并且打破傳統的思維模式,促進(jìn)信息檢索的發(fā)展。信息檢索就是要確保圖書(shū)情報能夠進(jìn)行有組織的、有規律的分類(lèi)和歸納,同時(shí)也要讓工作人員明白其中的復雜程度,讓他們認真對待信息檢索在圖書(shū)情報中的應用,以提高圖書(shū)情報的發(fā)展。
2.圖書(shū)情報檢索專(zhuān)家化
在圖書(shū)情報中推廣信息檢索,可以嘗試成立專(zhuān)門(mén)的圖書(shū)情報檢索小組,讓信息檢索在圖書(shū)情報中受到重視。眾所周知,我國對于圖書(shū)情報的檢索往往不夠重視,導致了圖書(shū)情報檢索工作停滯不前,因此,在今后的圖書(shū)情報檢索發(fā)展的過(guò)程中,要建立由國家情報信息機構牽頭以及各行各業(yè)的專(zhuān)家組成,確保我國圖書(shū)情報信息檢索工作在今后的發(fā)展過(guò)程中能夠有組織、有計劃,以此來(lái)打破各自為政的發(fā)展方式,確保我國圖書(shū)情報檢索向著(zhù)統一化、系統化、智能化的方向發(fā)展。
3.加強自身知識建設,提高專(zhuān)業(yè)水平
加強圖書(shū)情報教育,要從大學(xué)生教育開(kāi)始。因此在今后的發(fā)展過(guò)程中,要全面的提高學(xué)生的基本素質(zhì),培養大學(xué)生的情報信息素養,確保他們能夠熟練的運用當代的信息檢索技術(shù)進(jìn)行圖書(shū)情報的獲取。在學(xué)習的過(guò)程中,圖書(shū)情報信息的識別、歸納綜合處理信息以及傳遞信息等是基本技能,因此一定要確保大學(xué)生能夠掌握以上技能。而高水平的檢索者能夠對圖書(shū)情報進(jìn)行一定分析和判定,善于利用信息檢索,確保信息檢索在圖書(shū)情報中能夠得到很好的應用,讓我國的信息檢索在圖書(shū)情報中得到更好的發(fā)展。眾所周知,未來(lái)是一個(gè)信息技術(shù)發(fā)達的社會(huì ),誰(shuí)先掌握了技術(shù),誰(shuí)就能夠主宰這個(gè)社會(huì ),因此在今后的發(fā)展過(guò)程中,要不斷的學(xué)習和發(fā)展人工智能技術(shù),確保我國圖書(shū)情報的發(fā)展。
三、圖書(shū)情報人員必須接受的教育
若想確保我國圖書(shū)情報的發(fā)展,就必須對圖書(shū)情報人員進(jìn)行教育和培訓。首先要擴展他們的知識,對圖書(shū)情報工作人員不僅要補充他們的知識,還要確保他們知識結構的合理化。同時(shí)還要培養他們的計算機以及外語(yǔ)水平,確保他們能夠勝任圖書(shū)情報這一工作。其次要對圖書(shū)情報工作人員的知識進(jìn)行更新,現在技術(shù)和知識都發(fā)展很整理快,圖書(shū)情報工作人員為了能夠更好的掌握圖書(shū)情報工作,就要不斷的學(xué)習,不斷的更新自己的知識。最后是培養圖書(shū)情報工作人員的科研能力,圖書(shū)情報工作人員只有敢于探索,敢于鉆研,才能夠推動(dòng)圖書(shū)情報工作的發(fā)展。
總結語(yǔ)
綜上所述,目前在我國信息檢索在圖書(shū)情報的應用仍然不夠完善,其中不僅由于技術(shù)發(fā)展的落后,還由于缺乏專(zhuān)業(yè)的圖書(shū)情報工作人員。因此在今后的圖書(shū)情報的發(fā)展過(guò)程中,相關(guān)部門(mén)要重視圖書(shū)情報工作,不惜投入大量的資金和人力,以促進(jìn)我國圖書(shū)情報的發(fā)展。
信息檢索的小論文2
引言
互聯(lián)網(wǎng)的快速發(fā)展和廣泛應用,為人們提供了一個(gè)廣闊的信息空間,也為信息檢索提供了一個(gè)廣闊的發(fā)展平臺;ヂ(lián)網(wǎng)的開(kāi)放性和自由性使得網(wǎng)絡(luò )信息資源呈現出數量巨大、異構性、分散性和動(dòng)態(tài)性特征。但由于網(wǎng)絡(luò )信息時(shí)效性強以及互聯(lián)網(wǎng)缺乏必要的監督和質(zhì)量控制,使得大量垃圾信息混于高質(zhì)量信息當中,增加了有效信息獲取的難度,影響檢索效率。因此,使用有效的檢索工具才能使得網(wǎng)絡(luò )信息資源為人們所充分利用。
1 網(wǎng)絡(luò )信息資源點(diǎn)與檢索工具
上世紀90年代中期出現的搜索引擎技術(shù)目前已經(jīng)成為檢索各類(lèi)網(wǎng)絡(luò )信息資源最主要的檢索工具。搜索引擎一般工作流程是借助于網(wǎng)絡(luò )自動(dòng)搜索軟件(Robot、Spider等)訪(fǎng)問(wèn)瀏覽網(wǎng)頁(yè)并抓取文件,并通過(guò)已瀏覽的網(wǎng)頁(yè)中的鏈接訪(fǎng)問(wèn)更多網(wǎng)頁(yè)。在抓取網(wǎng)頁(yè)的同時(shí)對頁(yè)面文件進(jìn)行分析分解以及索引,建立索引數據庫。當用戶(hù)在搜索引擎界面輸入搜索詞后,搜索引擎對搜索詞進(jìn)行處理,按照處理后的搜索詞在索引數據庫中找出所有包含相關(guān)內容的網(wǎng)頁(yè),并更具排名算法計算出排名順序然后按照一定的格式返回到搜索頁(yè)面。普通的搜索引擎缺點(diǎn)在于返回的檢索結果數量巨大,無(wú)關(guān)和冗余信息較多,用戶(hù)必須從中進(jìn)行篩選。雖然布爾運算、截詞運算、自然語(yǔ)言檢索等技術(shù)使用大大提高了準確率,但對用戶(hù)檢索素養要求很高。針對以上問(wèn)題,學(xué)者把研究對象放到對詞意的挖掘上,探索實(shí)現基于概念匹配的檢索技術(shù)和方法,基于本體的語(yǔ)義檢索成為研究重點(diǎn)。
2 語(yǔ)義檢索基本要素和原理
隨著(zhù)人工智能以及自然語(yǔ)言處理的發(fā)展,尤其是語(yǔ)義網(wǎng)技術(shù)的興起,自上個(gè)世紀以來(lái)語(yǔ)義檢索研究得到了迅猛的發(fā)展。雖然對于語(yǔ)義檢索在概念上到目前為止沒(méi)有統一的界定,但是不同的研究都有一個(gè)共同之處就是基于對信息資源的語(yǔ)義處理時(shí)限效率更高的檢索。本體是語(yǔ)義檢索的基礎,其主要任務(wù)是對信息資源進(jìn)行語(yǔ)義表達。
本體(Ontology)原本是一個(gè)描述客觀(guān)事物本質(zhì)的哲學(xué)概念,是對客觀(guān)存在的一個(gè)系統的解釋和說(shuō)明。如今,本體是一種能在語(yǔ)義和知識層次上描述概念體系的有效工具,用來(lái)描述概念以及概念之間的關(guān)系,通過(guò)概念之間的管理來(lái)描述概念的語(yǔ)義。本體作為一種最先進(jìn)的知識表示方式能夠充分的描述所以的數據結構,是推理和關(guān)系數據庫的結合。概括的講本體能夠在人們和應用系統之間達成對術(shù)語(yǔ)含義的共享和共同理解,通過(guò)函數(functions)、關(guān)系(relations)、原則(axioms)和實(shí)例(instances)、類(lèi)(classes)這5種元素表達本體中的知識,使其具有邏輯推理和語(yǔ)義識別功能,幫助檢索系統跨越目前基于關(guān)鍵詞的檢索過(guò)程中的上述問(wèn)題以實(shí)現語(yǔ)義檢索。目前實(shí)現網(wǎng)絡(luò )檢索的技術(shù)主要有兩種:第一種,依賴(lài)于編碼處理,以分類(lèi)模式來(lái)描述信息資源以實(shí)現檢索的目的;第二種,是通過(guò)全文檢索查找文本中包含用戶(hù)指定的詞語(yǔ)的信息源。語(yǔ)義檢索的語(yǔ)義信息的提取和處理是基于語(yǔ)義網(wǎng)方法與技術(shù)的查詢(xún)處理與文檔標注及索引;诒倔w的查詢(xún)處理包括:查詢(xún)消歧和查詢(xún)擴展,通過(guò)消岐,明確查詢(xún)的確切所指,準確反映用戶(hù)的信息意圖,繼而通過(guò)加入與其語(yǔ)義相關(guān)的其他概念來(lái)實(shí)施擴展。在對文檔進(jìn)行語(yǔ)義標注與索引的基礎上,先進(jìn)行實(shí)例檢索,再據此返回所有以檢出實(shí)例標注的文檔信息是語(yǔ)義標注文檔檢索的一種普遍思路。相對于傳統的網(wǎng)絡(luò )檢索,基于本體的語(yǔ)義檢索的優(yōu)勢在于體現語(yǔ)義信息,準確表達用戶(hù)的查詢(xún)意圖。
3 常見(jiàn)語(yǔ)義檢索系統介紹
3.1 一體化醫學(xué)語(yǔ)言系統(UMLS) UMLS(Unified Medical Language System)作為計算機化的情報檢索語(yǔ)言集成系統,是美國國立醫學(xué)圖書(shū)館(NLM)主持的一項長(cháng)期開(kāi)發(fā)研究計劃。它不僅是自然語(yǔ)言處理、語(yǔ)言規范化以及語(yǔ)言翻譯的規范化工具,更是實(shí)現實(shí)現跨數據庫檢測的詞匯轉換系統并且還可以幫助用戶(hù)連接情報源,包括書(shū)目數據庫、事實(shí)數據庫、計算機化的病案記錄以及專(zhuān)家系統過(guò)程中對于其他的電子式生物醫學(xué)情報的一體化檢索。UMLS包括情報源圖譜(Information Sources Map)、語(yǔ)義網(wǎng)絡(luò )(Semantic Network)、專(zhuān)家詞典(SPECIALIST Lexicon) )和超級敘詞表(Metathesaurus)四部分。其中超級敘詞表是術(shù)語(yǔ)、生物醫學(xué)概念、等級范疇、詞匯及其涵義的廣泛集成。1997年第8版的超級敘詞表收錄了739439個(gè)詞匯,這些詞匯來(lái)源于30多種生物醫學(xué)詞表和分類(lèi)表的能表達33萬(wàn)多個(gè)概念的,詞匯量達到空前規模。而語(yǔ)義網(wǎng)絡(luò )是為超級敘詞表中的所有概念提供語(yǔ)義類(lèi)型及相互關(guān)系結構的工具,是為建立概念術(shù)語(yǔ)間相互錯綜復雜關(guān)系而設計的。UMLS的語(yǔ)義網(wǎng)絡(luò )不僅運用了常規的語(yǔ)義控制手段,如屬分、相關(guān)關(guān)系控制、語(yǔ)義等級,同時(shí)在語(yǔ)義規范和語(yǔ)義關(guān)系分析、延伸等多方面有許多創(chuàng )新。 3.2 語(yǔ)義網(wǎng)(Semantic Web) 為了能夠在網(wǎng)絡(luò )環(huán)境下也同樣實(shí)現語(yǔ)義檢索的功能進(jìn)而開(kāi)發(fā)研究了語(yǔ)義網(wǎng)的W3C項目。W3C項目是將網(wǎng)絡(luò )上的數據通過(guò)一種方式進(jìn)行連續和定義,通過(guò)這種定義和連續可以根據人的不同需求實(shí)現計算機將數據自動(dòng)進(jìn)行整合以及再利用,從而達到更有利于人機協(xié)作的目的。資源描述框架(Re-source Description Framework,簡(jiǎn)稱(chēng)RDF)是語(yǔ)義網(wǎng)的核心構件。在網(wǎng)絡(luò )中,一般用元數據對資源進(jìn)行描述,而RDF則是處理元數據的一個(gè)基礎。RDF認為一個(gè)具體的元數據是由屬性值(Statements)、屬性(Properties)和資源(Resources)構成的三元關(guān)系模式,實(shí)際上是關(guān)于一個(gè)特定的資源特定屬性的取值聲明。使用RDFS語(yǔ)言,元數據的設計者不僅可以定義所描述資源的類(lèi)別、屬性以及詞匯,還可以定義這些屬性或者對象的關(guān)系以及對象與屬性之間的相互關(guān)系,同時(shí)還可以進(jìn)一步定義這些資源的對象、屬性以及屬性應用類(lèi)別和取值條件等,通過(guò)這些定義從而能以計算機理解的`標準方式對元數據進(jìn)行描述語(yǔ)義內容以及元數據的結構關(guān)系。
3.3 WordNet WordNet是一種基于認知語(yǔ)言學(xué)的英語(yǔ)詞典,它是由普林斯頓大學(xué)的計算機工程師、心理學(xué)家和語(yǔ)言學(xué)家聯(lián)合設計的不僅是把單詞以字母順序排列,并且是按單側的意義組成的一個(gè)“單詞的網(wǎng)絡(luò )”。WordNet將所有的英語(yǔ)詞匯按詞性分為功能詞、形容詞、動(dòng)詞、名詞和副詞五類(lèi)。動(dòng)詞被組成各種推演關(guān)系;名詞在詞匯記憶中被組成主題的層次;而形容詞和副詞被組織在N維超空間中。根據WordNet關(guān)系分析最大的優(yōu)勢是能在他的單詞網(wǎng)里通過(guò)相關(guān)關(guān)系消除歧義,因為WordNet分析主要是關(guān)系分析。WordNet在名詞的語(yǔ)義消歧率可以超過(guò)60%。
4 結語(yǔ)
從以上三個(gè)語(yǔ)義系統來(lái)看,無(wú)論是相對封閉的ULMS系統還是開(kāi)放式的語(yǔ)義網(wǎng)、wordnet系統都具有較強的靈活性和擴展性。相對于常見(jiàn)的關(guān)鍵字信息檢索,語(yǔ)義檢索不需要用戶(hù)使用專(zhuān)業(yè)的檢索策略,也不需要語(yǔ)法嚴謹的檢索式,用戶(hù)可以將自己的信息需求通過(guò)自然語(yǔ)言直接表達出來(lái)。語(yǔ)義檢索在后臺經(jīng)過(guò)大量的計算,分析用戶(hù)的用戶(hù)的語(yǔ)義文檔信息,充分利用各種語(yǔ)義關(guān)系消除歧義將用戶(hù)真正需要的準確的信息資源反饋給用戶(hù),將用戶(hù)的檢索效率提升60—80%。因此,語(yǔ)義檢索無(wú)疑是當前信息爆炸條件下最適合的網(wǎng)絡(luò )信息檢索方式。
【信息檢索的小論文】相關(guān)文章:
信息檢索與利用論文01-01
網(wǎng)絡(luò )信息檢索論文01-20
信息檢索畢業(yè)論文12-08
生物醫學(xué)信息檢索論文03-17
電子信息小論文11-28
數據挖掘技術(shù)在Web信息檢索中的應用研究論文12-01
論文寫(xiě)作中文獻資料檢索01-09
寫(xiě)作中文獻資料的檢索論文01-01
淺談信息素養培養的項目式信息檢索課程的教學(xué)模式02-26
- 相關(guān)推薦