計算機Web數據挖掘技術(shù)在現代商業(yè)中的應用論文
[摘要] 數據挖掘是近年來(lái)隨著(zhù)數據庫技術(shù)和人工智能技術(shù)的發(fā)展而出現的一種全新的信息技術(shù)。隨著(zhù)internet的普及,使web成為獲取市場(chǎng)信息的最重要的載體。本文介紹了web數據挖掘過(guò)程,以及特點(diǎn),最后重點(diǎn)研究了web數據挖掘技術(shù)現代商業(yè)中的應用。

[關(guān)鍵詞] 數據挖掘 人工智能 載體
一、web數據挖掘概述
web挖掘是從web資源上抽取信息或知識的過(guò)程,它是將傳統的數據挖掘的思想和方法應用于web,從web文檔和web活動(dòng)中抽取感興趣的、潛在的、有用的模式和隱藏信息。web挖掘可在多方面發(fā)揮作用,如搜索引擎結構的挖掘,搜索引擎的開(kāi)發(fā),改進(jìn)和提高搜索引擎的質(zhì)量和效率,確定權威頁(yè)面。web挖掘研究覆蓋了多個(gè)研究領(lǐng)域,包括數據庫技術(shù)、信息獲取技術(shù)、統計學(xué)、人工智能中的機器學(xué)習和神經(jīng)網(wǎng)絡(luò )等。特別是電子商務(wù)領(lǐng)域,通過(guò)對用戶(hù)特征的理解和分析,如對用戶(hù)訪(fǎng)問(wèn)行為、頻度、內容等的分析,提取出用戶(hù)的特征,從而為用戶(hù)定制個(gè)性化的界面,有助于開(kāi)展有針對性的電子商務(wù)活動(dòng)。
二、web挖掘流程以及特點(diǎn)
1.web挖掘的流程
web數據挖掘就是利用數據挖掘技術(shù)從網(wǎng)絡(luò )文檔和服務(wù)中發(fā)現和提取信息。與傳統數據和數據倉庫相比,web上的信息是非結構化或半結構化的、動(dòng)態(tài)的、并且是容易造成混淆的,所以很難直接以web網(wǎng)頁(yè)上的數據進(jìn)行數據挖掘,而必須經(jīng)過(guò)必要的數據處理。web挖掘的有以下幾個(gè)過(guò)程:
(1)資源發(fā)現。任務(wù)是從目標web文檔中得到數據,值得注意的是有時(shí)信息資源不僅限于在線(xiàn)web文檔,還包括電子郵件、電子文檔、新聞組,或者網(wǎng)站的日志數據甚至是通過(guò)web形成的交易數據庫中的數據。wwW.133229.COM
。2)信息選擇和預處理。任務(wù)是從取得的web資源中剔除無(wú)用信息和將信息進(jìn)行必要的例如從web文檔中自動(dòng)去除廣告連接、去除多余格式標記、自動(dòng)識別段落或者字段并將數據組織成規整的邏輯形式甚至是關(guān)系表。
。3)模式發(fā)現。自動(dòng)進(jìn)行模式發(fā)現?梢栽谕粋(gè)站點(diǎn)內部或在多個(gè)站點(diǎn)之間進(jìn)行。
。4)模式分析。驗證、解釋上一步驟產(chǎn)生的模式?梢允菣C器自動(dòng)完成,也可以是與分析人員進(jìn)行交互來(lái)完成。
2.web挖掘的特點(diǎn)
web挖掘技術(shù)具有許多優(yōu)點(diǎn),如不需要用戶(hù)提供主觀(guān)的評價(jià)信息;可以處理大規模的數據量;用戶(hù)訪(fǎng)問(wèn)模式動(dòng)態(tài)獲取,不會(huì )過(guò)時(shí);使用方便等。但是與傳統數據庫和數據倉庫相比,web是一個(gè)巨大、分布廣泛、全球性的信息服務(wù)中心,涉及經(jīng)濟、文化、教育、新聞、廣告、消費、娛樂(lè )、金融、保險、銷(xiāo)售、電子商務(wù)等信息,內容極其豐富,數據最大特點(diǎn)就是半結構化;而傳統的數據庫中的數據結構性很強,即其中的數據為完全結構化的數據。顯然,面向web的數據挖掘比面向單個(gè)數據倉庫的數據挖掘要復雜得多,會(huì )面臨很多具體問(wèn)題,主要有:
(1)半結構化數據。web頁(yè)面以某種格式呈現的半結構化數據,其數據結構不規則或不完整,復雜程度遠遠高于普通的文本文檔,其數據結構隱含、模式信息量大、模式變化快。大量的文檔無(wú)任何排列次序,無(wú)分類(lèi)索引。
(2)web是一個(gè)異質(zhì)、分布、動(dòng)態(tài)的信息源。web及其數據的更新、增長(cháng)速度極快,也無(wú)固定的模式。web上的信息幾乎都是隱藏的、潛在的、未知的,從web上發(fā)現這些未知的信息和有用的模式,僅用傳統的基于關(guān)鍵字的檢索方式很難實(shí)現,現在的搜索引擎尚不具備這些功能。
(3)面對一個(gè)非常廣泛的形形色色的用戶(hù)群體。不同的用戶(hù)訪(fǎng)問(wèn)web的興趣、愛(ài)好和使用目的千差萬(wàn)別,面對一個(gè)非常廣泛的形形色色的用戶(hù)群體,能否使用戶(hù)根據自己的愛(ài)好興趣定制網(wǎng)頁(yè),甚至能否根據發(fā)現的用戶(hù)。自動(dòng)為用戶(hù)定制網(wǎng)頁(yè),從而提供個(gè)性化的信息檢索和查詢(xún)服務(wù)。
3.web挖掘在電子商務(wù)中的應用
目前對于,web挖掘的對象和使用的方法層出不窮,但隨著(zhù)電子商務(wù)網(wǎng)站的興起,電子商務(wù)將是未來(lái)web挖掘的主要發(fā)展方向之一,因此它在各種商業(yè)領(lǐng)域都存在廣泛的使用價(jià)值。在當電子商務(wù)在企業(yè)中得到應用時(shí),企業(yè)信息系統將產(chǎn)生大量數據,這些海量數據使數據挖掘有了豐富的數據基礎,同時(shí)高性能計算機和高傳輸速率網(wǎng)絡(luò )的使用也給數據挖掘技術(shù)提供了堅實(shí)的保障。介紹以下幾個(gè)方面的應用:
(1)分析查找獲得潛在客戶(hù)。隨著(zhù)以客戶(hù)為中心的經(jīng)營(yíng)理念不斷深入人心,分析客戶(hù)、了解客戶(hù)并引導客戶(hù)的需求已成為企業(yè)經(jīng)營(yíng)的重要課題。通過(guò)對電子商務(wù)系統收集的交易數據進(jìn)行分析,可以按各種客戶(hù)指標(如自然屬性、收入貢獻交易額、價(jià)值度等)對客戶(hù)分類(lèi),然后確定不同類(lèi)型客戶(hù)的行為模式,以便采取相應的營(yíng)銷(xiāo)措施,促使企業(yè)利潤的最大化。
比如通過(guò)數據挖掘可以發(fā)現購買(mǎi)某種商品的消費者是男性還是女性,學(xué)歷、收入如何,有什么愛(ài)好,是什么職業(yè)等等。甚至可以發(fā)現不同的人在購買(mǎi)該種商品的相關(guān)商品后多長(cháng)時(shí)間有可能購買(mǎi)該種商品,以及什么樣的人會(huì )購買(mǎi)什么型號的該種商品等等。也許很多因素表面上看起來(lái)和購買(mǎi)該種商品不存在任何聯(lián)系,但數據挖掘的結果卻證明他們之間有聯(lián)系。在采用了數據挖掘后,針對目標客戶(hù)發(fā)送的廣告的有效性和回應率將得到大幅度的提高,推銷(xiāo)的成本將大大降低。
在對web的客戶(hù)訪(fǎng)問(wèn)信息的挖掘中,利用分類(lèi)技術(shù)可以在internet上找到未來(lái)的潛在客戶(hù),獲得這些潛在的客戶(hù)市場(chǎng)。通常的策略是先對己經(jīng)存在的訪(fǎng)問(wèn)者進(jìn)行分類(lèi),一般分為三種:“no customer”、“visitor once”“visitor regular”。對于一個(gè)新的訪(fǎng)問(wèn)者,通過(guò)在web上的分類(lèi)發(fā)現,識別出這個(gè)客戶(hù)與己經(jīng)分類(lèi)的老客戶(hù)的一些公共的描述,從而對這個(gè)新客戶(hù)進(jìn)行正確的分類(lèi)。然后從它的分類(lèi)判斷這個(gè)新客戶(hù)是屬于有利可圖的客戶(hù)群,還是屬于無(wú)利可圖的客戶(hù)群,決定是否要把這個(gè)新客戶(hù)作為潛在的客戶(hù)來(lái)對待?蛻(hù)的類(lèi)型確定后,就可以對客戶(hù)動(dòng)態(tài)地展示web頁(yè)面,頁(yè)面的內容取決于客戶(hù)與銷(xiāo)售商提供的產(chǎn)品和服務(wù)之間的關(guān)聯(lián)。
(2)保留客戶(hù)。數據挖掘可以把你大量的客戶(hù)分成不同的類(lèi),在每個(gè)類(lèi)里的客戶(hù)擁有相似的屬性,而不同類(lèi)里的客戶(hù)的屬性也不同。你完全可以做到給不同類(lèi)的客戶(hù)提供完全不同的服務(wù)來(lái)提高客戶(hù)的滿(mǎn)意度。數據挖掘還可以發(fā)現具有哪些特征的客戶(hù)有可能流失,這樣挽留客戶(hù)的措施將具有針對性,挽留客戶(hù)的費用將下降。對客戶(hù)來(lái)說(shuō),傳統客戶(hù)與銷(xiāo)售商之間的空間距離在電子商務(wù)中己經(jīng)不存在了。在網(wǎng)上,每一個(gè)銷(xiāo)售商對于客戶(hù)來(lái)說(shuō)都是一樣的,那么如何使客戶(hù)在自己的銷(xiāo)售站點(diǎn)上駐留更長(cháng)的時(shí)間,對銷(xiāo)售商來(lái)說(shuō)將是一個(gè)挑戰。為了達到這一目的,就應該了解客戶(hù)的瀏覽行為,知道客戶(hù)的興趣及需求所在,動(dòng)態(tài)地調整web頁(yè)面,以滿(mǎn)足客戶(hù)的需要。通過(guò)對客戶(hù)訪(fǎng)問(wèn)信息的挖掘,就能知道客戶(hù)的瀏覽行為,從而了解客戶(hù)的興趣及需求。在網(wǎng)上的電子商務(wù)中的一個(gè)典型的序列,恰好就代表了一個(gè)購物者以頁(yè)面形式在站點(diǎn)上導航的行為,所以可運用web數據挖掘中的序列模式發(fā)現技術(shù)。
(3)聚類(lèi)客戶(hù)。在電子商務(wù)中客戶(hù)聚類(lèi)是一個(gè)重要的方面。通過(guò)分組具有相似瀏覽行為的客戶(hù),并分析組中客戶(hù)的共同特征,可以幫助電子商務(wù)的組織者更好地了解自己的客戶(hù),向客戶(hù)提供更適合、更面向客戶(hù)的服務(wù)。例如,有一些客戶(hù)都花了一段時(shí)間瀏覽“baby toys”“baby furniture”頁(yè)面,經(jīng)過(guò)分析這些客戶(hù)被聚類(lèi)成為一組。銷(xiāo)售商根據分析出來(lái)的聚類(lèi)信息,就知道這是一組“expecting parents”客戶(hù),對他們所進(jìn)行的業(yè)務(wù)活動(dòng)當然也就不可能同于其他被聚類(lèi)了的客“college students”、“office ladies”。及時(shí)調整頁(yè)面及頁(yè)面內容,使商務(wù)活動(dòng)能夠在一定程度上滿(mǎn)足客戶(hù)的要求,對客戶(hù)和銷(xiāo)售商來(lái)說(shuō)更有意義。
(4)交叉銷(xiāo)售與個(gè)性服務(wù)。交叉銷(xiāo)售的好處在于,對于原有客戶(hù),企業(yè)可以比較容易地得到關(guān)于這個(gè)客戶(hù)的比較豐富的信息,大量的數據對于數據挖掘的準確性來(lái)說(shuō)是有很大幫助的。在企業(yè)所掌握的客戶(hù)信息,尤其是以前購買(mǎi)行為的信息中,可能正包含著(zhù)這個(gè)客戶(hù)決定他下一個(gè)購買(mǎi)行為的關(guān)鍵,甚至是決定因素。這個(gè)時(shí)候數據挖掘的作用就會(huì )體現出來(lái),它可以幫助企業(yè)尋找到這些影響他購買(mǎi)行為的因素。
當客戶(hù)在電子商務(wù)網(wǎng)站注冊時(shí),客戶(hù)將會(huì )看到帶有客戶(hù)姓名的歡迎詞”根據客戶(hù)的訂單紀錄,系統可以向客戶(hù)顯示那些可能引起客戶(hù)特殊興趣的新商品。當客戶(hù)注意到一件特殊的商品時(shí),系統會(huì )建議一些在購買(mǎi)中可以增加的其他商品。普通的產(chǎn)品目錄手冊常常簡(jiǎn)單的按類(lèi)型對商品進(jìn)行分組,以簡(jiǎn)化客戶(hù)挑選商品的步驟。然而對于在線(xiàn)商店,商品分組可能是完全不同的,它常常以針對客戶(hù)的商品補充條目為基礎,不僅考慮客戶(hù)看到的條目,而且還考慮客戶(hù)購物籃中的商品,結果就會(huì )使推薦更加個(gè)性化。
三、結語(yǔ)
隨著(zhù)計算機技術(shù)的迅猛發(fā)展和internet資源的快速增長(cháng),特別是電子商務(wù)的興起,web挖掘成為21世紀的熱門(mén)研究領(lǐng)域之一,其研究具有廣闊的應用前景和巨大的現實(shí)意義。目前國內的web挖掘尚處于學(xué)習、跟蹤和探索階段,web挖掘有許多問(wèn)題有待于進(jìn)一步的研究和深化。
參考文獻:
[1]郝先臣張德干尹國成等:基于電子商務(wù)中的數據挖掘技術(shù)研究.小型微型計算機系統,2001
[2]韓家煒孟小峰王靜等:web挖掘研究.計算機研究與發(fā)展,2001
[3]鄧英李明:web數據挖掘技術(shù)及工具研究.計算機工程與應用,2001
【計算機Web數據挖掘技術(shù)在現代商業(yè)中的應用論文】相關(guān)文章:
數據挖掘技術(shù)在Web信息檢索中的應用研究論文12-01
數據挖掘在現代遠程教育中的應用論文11-22
數據挖掘在電力企業(yè)中的應用論文12-13
數據挖掘技術(shù)的教學(xué)輔助系統應用論文03-16
數據挖掘技術(shù)在就業(yè)指導的應用論文02-27
現代通信技術(shù)中設施農業(yè)的應用論文12-02
數據挖掘技術(shù)在高校學(xué)生成績(jì)分析中的應用研究論文03-15
現代教育技術(shù)在物理教學(xué)中的應用論文06-18
試論多媒體技術(shù)在現代教學(xué)中的應用論文03-22
- 相關(guān)推薦