- 相關(guān)推薦
搜索引擎技術(shù)中人工智能的引入研究
在全球經(jīng)濟的不斷發(fā)展下,在搜索引擎中引入人工智能技術(shù),可以有效提高互聯(lián)網(wǎng)中的資源利用率,下面是小編搜集整理的一篇相關(guān)論文范文,歡迎閱讀借鑒。

Internet 網(wǎng)絡(luò )技術(shù)的快速發(fā)展 ,使網(wǎng)絡(luò )已經(jīng)成為了人們日常生活不可或缺的一部分 ,它作為信息發(fā)布、傳播的主要方式 ,Web 擁有幾億頁(yè)面的分布式信息空間 ,目前仍然以 130~200d 翻一番的速度增加。Internet 信息廣泛 ,涵蓋量很大 ,要從中迅速找出自己需要的信息 ,有一定難度。因此 ,人們研究開(kāi)發(fā)了多種檢索工具 ,以便自可以快速方便的找出自己想要的內容。
隨著(zhù)科學(xué)技術(shù)的不斷發(fā)展與成熟 ,網(wǎng)絡(luò )搜索引擎得到了快速發(fā)展 ,它是以一定的策略在互聯(lián)網(wǎng)中搜集、發(fā)現、提取、處理信息的過(guò)程 ,通過(guò)為用戶(hù)提供檢索服務(wù) ,發(fā)揮其信息導航的作用。
1、搜索引擎技術(shù)
1.1 分類(lèi)
、倌夸浭剿阉饕。其特點(diǎn)主要是用人工方式或者半自動(dòng)的方式搜集相關(guān)信息 ,編輯人員通過(guò)訪(fǎng)問(wèn) Web 站點(diǎn) ,等信息摘要形成之后便會(huì )根據站點(diǎn)的內容將其歸類(lèi)在預先設置的分類(lèi)中 ,將站點(diǎn)的描述、URL 置于此類(lèi)別中 ,若用戶(hù)需要查詢(xún)某個(gè)關(guān)鍵詞 ,搜索軟件便會(huì )在預先存儲的描述中搜索。部分目錄也會(huì )接受用戶(hù)提交的描述 ,當編輯人員認可此描述后 ,便會(huì )將其歸類(lèi)在相關(guān)類(lèi)別當中 ,以供其他用戶(hù)查詢(xún)。此搜索引擎的優(yōu)點(diǎn)是導航質(zhì)量可靠 ,準確性高 ,如 Yahoo ;缺點(diǎn)則是人工介入過(guò)多 ,維護量及維修費用大 ,信息無(wú)法及時(shí)更新。
、诨 Robot 的搜索引擎。其特點(diǎn)是由稱(chēng)為 Robot 的機器人程序用某種策略自動(dòng)發(fā)現并搜集互聯(lián)網(wǎng)中的有關(guān)信息 ,通過(guò)索引系統自動(dòng)建立信息索引 ,由查詢(xún)接口按照用戶(hù)輸入信息檢索索引庫 ,然后將查詢(xún)結果反饋給用戶(hù)。其較為顯著(zhù)的一個(gè)特點(diǎn)是需要定期訪(fǎng)問(wèn)曾經(jīng)搜集的網(wǎng)頁(yè),并刷新索引,去除無(wú)用鏈接,網(wǎng)頁(yè)內容的變化也會(huì )出現在用戶(hù)查詢(xún)結果中。其優(yōu)點(diǎn)是更新及時(shí)、不需要人工干預、信息齊全 ,如 Google,缺點(diǎn)則是返回信息較多 ,且無(wú)用信息多 ,用戶(hù)要在搜索結果中仔細篩選。
、跰eta搜索引擎。其特點(diǎn)是自身無(wú)存放網(wǎng)頁(yè)信息的數據庫,用戶(hù)查詢(xún)某個(gè)關(guān)鍵詞時(shí) ,它可以將其查詢(xún)請求轉化為其他搜索引擎可以接受的形式 ,通過(guò)訪(fǎng)問(wèn)多個(gè)搜索引擎查詢(xún)關(guān)鍵詞 ,并對查詢(xún)的相同結果進(jìn)行排除 ,之后返回給用戶(hù)。優(yōu)點(diǎn)是覆蓋面比較大 ,搜索效果好 ,缺點(diǎn)是具有局限性 ,無(wú)法充分發(fā)揮搜索引擎的功能。
1.2 工作原理及相關(guān)技術(shù)
搜索引擎的工作原理是通過(guò)一個(gè) Robot 最大限度的收集 WWW的網(wǎng)頁(yè) ,根據網(wǎng)頁(yè)內容建立反向索引 ,用戶(hù)想查詢(xún)有關(guān)內容時(shí) ,輸入關(guān)鍵字作為查詢(xún)條件 ,搜索引擎根據預先建立的單詞索引或者網(wǎng)頁(yè)庫 ,檢索符合要求的網(wǎng)頁(yè)反饋給用戶(hù)。通常情況下 ,搜索引擎由三部分組織 ,如下圖所示(圖 1)!1】
、傩畔⑺鸭到y。主要以 Robot 自動(dòng)完成 Robot 在互聯(lián)網(wǎng)中漫游時(shí)能夠搜集大量的、多類(lèi)型的新信息;ヂ(lián)網(wǎng)上信息含量大 ,更新速度快。為了確保搜索引擎信息具備一定的時(shí)效性與準確性 ,就要提高 Robot 的搜索效率 ,完善其搜索策略。搜索策略主要有兩個(gè)內容 ,一是從 URL 集合開(kāi)始 ,根據其超鏈接 ,以深度或者寬度優(yōu)先的方法重復搜索互聯(lián)網(wǎng)中的有關(guān)信息 ,URL可以是任何 URL,但經(jīng)常會(huì )包括很多鏈接站點(diǎn) ;二是將 Web 空間根據 IP 地址、域名劃分 ,搜索器需要對每個(gè)子空間進(jìn)行不斷搜索。
、谒饕到y。Robot 完成信息搜集后 ,要用索引系統程序對其收集的網(wǎng)頁(yè)進(jìn)行分析 ,并提取網(wǎng)頁(yè) URL、頁(yè)面內容包含的關(guān)鍵詞等信息 ,采用有關(guān)算法對其進(jìn)行計算 ,然后獲得網(wǎng)頁(yè)針對頁(yè)面文字及關(guān)鍵詞的相關(guān)度 ,用相關(guān)信息建立網(wǎng)頁(yè)索引數據庫。
、鄄樵(xún)接口。用戶(hù)做出查詢(xún)操作時(shí) ,搜索引擎根據查詢(xún)內容迅速檢出相關(guān)文檔 ,并對查詢(xún)和文檔的相關(guān)度進(jìn)行分析 ,根據相關(guān)度大小對輸出結果進(jìn)行排序 ,反饋給用戶(hù)。其目的在于方便用戶(hù)獲得更加及時(shí)、有效的信息。而查詢(xún)接口的設計 ,能夠適應人類(lèi)思維方式。
2、人工智能技術(shù)在搜索引擎中的應用
現有搜索引擎效率較低 ,將人工智能技術(shù)引入搜索引擎中 ,不僅可以支持用戶(hù)的搜索及瀏覽操作 ,還可以提供獨立搜索的功能。
2.1 Robot 的人工智能化
基于 Robot 的搜索引擎使用人工智能技術(shù) ,其目的在于獲得互聯(lián)網(wǎng)中的信息資源 ,利用主頁(yè)的超文本鏈接 Web,然后通過(guò) URL 引用一個(gè) HTML 文檔爬行到另一個(gè)文檔。其算法采用深度優(yōu)先、廣度優(yōu)先的搜索策略 ,廣度優(yōu)先能夠跟蹤頁(yè)面中的任何URL,覆蓋網(wǎng)頁(yè)范圍較廣 ;深度優(yōu)先則是輕松發(fā)現文檔結構 ,并進(jìn)行交叉引用。兩種算法雖然可以檢索出用戶(hù)需要的內容 ,但無(wú)法對檢索出的信息進(jìn)行再分析。為有效提高其搜索效率 ,采用啟發(fā)式學(xué)習采取有效的搜索策略 ,可在互聯(lián)網(wǎng)上自動(dòng)整理信息。
2.2 智能代理技術(shù)的應用
智能代理技術(shù)是人工智能研究的成果 ,可以對用戶(hù)知識進(jìn)行搜集、過(guò)濾 ,根據用戶(hù)需求的變化 ,將用戶(hù)可能感興趣的內容主動(dòng)提交給用戶(hù) ,此外 ,還可以根據用戶(hù)的相關(guān)要求 ,代替用戶(hù)完成某些任務(wù)。其特點(diǎn)是不斷學(xué)習 ,積極、主動(dòng)的適應用戶(hù)興趣的動(dòng)態(tài)變化 ,從而實(shí)現個(gè)性化服務(wù) ,因此 ,其具備智能性、主動(dòng)性、代理性及協(xié)作性等優(yōu)勢。
2.3 查詢(xún)接口的智能化
一是根據關(guān)鍵詞進(jìn)行搜索。用戶(hù)有查詢(xún)需求時(shí) ,搜索技術(shù)可以將其查詢(xún)需求分解為多個(gè)關(guān)鍵詞 ,根據關(guān)鍵詞計算 Web 文檔和用戶(hù)要求是否符合 ,從而選出合適的文檔。二是自然語(yǔ)言查詢(xún)。好的檢索語(yǔ)言可以提高搜索引擎對用戶(hù)查詢(xún)要求的理解 ,自然語(yǔ)言理解計算可以實(shí)現自然語(yǔ)言智能答詢(xún)。它可以將信息檢索從關(guān)鍵詞查詢(xún)提升到知識層面 ,通過(guò)理解、處理有關(guān)知識 ,實(shí)現分詞技術(shù)、翻譯技術(shù)、短語(yǔ)識別等。因此,其服務(wù)更加人性化、智能化。
3、結束語(yǔ)
在全球經(jīng)濟的不斷發(fā)展下 ,互聯(lián)網(wǎng)已經(jīng)發(fā)展成全球最大的信息庫 ,成為傳播信息的主要途徑 ,并且擁有大量分散的信息內容。在搜索引擎中引入人工智能技術(shù) ,可以有效提高互聯(lián)網(wǎng)中的資源利用率 ,實(shí)現資源共享充分發(fā)揮信息資源的作用。
參考文獻
[1]張曉剛,李明樹(shù)。智能搜索引擎技術(shù)的研究與發(fā)展[J].計算機工程與應用,2011(24)。
[2]張明遠;诹S嬎愕闹悄芩阉饕婕夹g(shù)研究[D].武漢理工大學(xué):計算機應用技術(shù),2010.
[3]王挺。智能搜索引擎在企業(yè)人力資源管理決策支持系統中的應用[J].電腦知識與技術(shù),2010(24)。
【搜索引擎技術(shù)中人工智能的引入研究】相關(guān)文章:
TD—LTE關(guān)鍵技術(shù)和引入策略研究06-17
搜索引擎中的網(wǎng)絡(luò )蜘蛛技術(shù)探析09-21
在大學(xué)英語(yǔ)課堂中引入演講的研究與實(shí)踐09-01
搜索引擎技術(shù)及趨勢09-04
英語(yǔ)教學(xué)中的文化引入10-22
條碼技術(shù)在物流中的應用研究10-14
論人工智能的研究與發(fā)展05-24