Web數據挖掘技術(shù)在電子商務(wù)中的應用論文
電子商務(wù)的迅猛發(fā)展產(chǎn)生了海量的Web數據,從電子商務(wù)的大數據中發(fā)現潛在的、有用的知識和信息,是電子商務(wù)健康發(fā)展的需要。在電子商務(wù)中應用Web數據挖掘技術(shù),可實(shí)現從電子商務(wù)的Web文檔和Web活動(dòng)中抽取出隱藏的有用模式。本文通過(guò)介紹Web數據挖掘技術(shù),分析其在電子商務(wù)中的挖掘流程,對其在電子商務(wù)中的具體應用進(jìn)行了探討。

0 引言
我國電子商務(wù)交易量增長(cháng)迅猛,電子商務(wù)平臺和網(wǎng)站越來(lái)越多,數據呈現爆炸式增長(cháng)。面對海量的Web數據,對企業(yè)而言,構建良好的客戶(hù)管理關(guān)系,吸引新客戶(hù)留住老客戶(hù),發(fā)現顧客潛在的購買(mǎi)興趣等都成為了企業(yè)要關(guān)注的問(wèn)題。
對用戶(hù)而言,如何從爆炸式的大數據中發(fā)現與自己相關(guān)的信息存在一定的難度。數據挖掘技術(shù)是一種從大量的、不完全的、有噪聲的、隨機的、模糊的數據中提取隱含在其中的人們事先不知道的,但又具有潛在價(jià)值的信息和知識的技術(shù)[1-2]。在電子商務(wù)中應用數據挖掘技術(shù),從已有的信息數據中挖掘出潛在的有用的信息,已成為人們關(guān)注和研究的熱點(diǎn)。
1 Web數據挖掘
Web數據挖掘是將傳統的數據挖掘思想和技術(shù)應用于Web環(huán)境中,從Web文檔集和Web活動(dòng)中抽取出感興趣、潛在的、有用的模式和知識的過(guò)程。Web數據挖掘根據Web信息不同可以分為Web內容挖掘、Web結構挖掘和Web使用挖掘三個(gè)方面。
Web內容挖掘是從文檔內容或其描述中直接抽取有用信息的過(guò)程,通過(guò)對文本內容的檢索,獲取和提煉知識和信息。
用于Web內容挖掘的數據既有無(wú)結構的自由文本,也有網(wǎng)民留言、帖子、中文微博等半結構化的信息和來(lái)自于數據庫的結構數據。所以Web內容挖掘需要從Web頁(yè)面及后臺數據庫中開(kāi)展挖掘任務(wù),從大量元數據、文本、視頻、音頻等網(wǎng)絡(luò )數據集中找到特定的信息[2]。
Web結構挖掘是從Web組織結構和鏈接中推導知識,對頁(yè)面進(jìn)行分類(lèi)、聚類(lèi),提高檢索效率和找出權威頁(yè)面,目的是發(fā)現頁(yè)面的內部結構和文檔間的結構,利用這些結構蘊含的信息幫助發(fā)現有用的知識和模式。
超鏈接是Web頁(yè)面的基本元素,經(jīng)?梢岳贸溄訉eb結構進(jìn)行挖掘。進(jìn)行Web結構挖掘的常用算法有計算頁(yè)面權威的PageRank算法、基于網(wǎng)頁(yè)分析的HITS算法等。
Web使用挖掘是從服務(wù)器端記錄的用戶(hù)訪(fǎng)問(wèn)日志或用戶(hù)的瀏覽信息中獲取數據,通過(guò)分析這些數據抽取出隱藏在這些數據后面的用戶(hù)模式,進(jìn)行預測性分析。通過(guò)Web使用挖掘,可以發(fā)現隱藏的與用戶(hù)訪(fǎng)問(wèn)行為相關(guān)的規律,如頻繁訪(fǎng)問(wèn)路徑、相似用戶(hù)群和相似的Web頁(yè)面等[3]。
2 面向電子商務(wù)的Web數據挖掘
2.1 Web數據挖掘過(guò)程
在電子商務(wù)環(huán)境下,Web數據挖掘過(guò)程要經(jīng)歷以下幾步,它是不斷反復修正的過(guò)程,直至得到準確的知識,如圖1所示。
、 確定挖掘任務(wù),建立挖掘模型。構建模型的任務(wù)主要是將數據進(jìn)行規格化處理,使用不同的算法、調整參數來(lái)優(yōu)化挖掘任務(wù),數據挖掘技術(shù)本身就是一個(gè)不斷反復、不斷迭代的過(guò)程,通過(guò)多次的循環(huán)構造才能得出更好的評估模型[2]。
、 數據源:電子商務(wù)網(wǎng)站每天都會(huì )產(chǎn)生海量的交易數據和用戶(hù)訪(fǎng)問(wèn)記錄,收集的數據數量和質(zhì)量都會(huì )影響到挖掘的結果。由于Web的結構大體為客戶(hù)端→代理服務(wù)器→Web服務(wù)[4],所以Web的數據源主要有Web服務(wù)器上的Web日志文件、從代理服務(wù)器端收集信息及其從Web頁(yè)面中提取數據等。
、 數據預處理:數據預處理的目的是提高挖掘效率,提供有效的挖掘數據,使得結果更合理。Web文檔的數據很多都是半結構或非結構化的,很難對采集的Web數據直接進(jìn)行處理。采集的Web數據需根據挖掘主題選擇相關(guān)的數據項,經(jīng)過(guò)初步的篩選,縮小數據處理范圍。另外,Web數據具有不完全性、冗余性和模糊性等特性,通過(guò)補全不完全項、去除冗余項、處理模糊項等,去掉無(wú)用、不合理的數據,最后生成標準的數據集。
、 模式發(fā)現:根據挖掘需求選擇合適的Web挖掘算法和工具,實(shí)現從數據集發(fā)現潛在的、有用的知識和模型。常用的Web挖掘算法有:路徑分析用來(lái)發(fā)現Web站點(diǎn)中最經(jīng)常被訪(fǎng)問(wèn)的路徑;關(guān)聯(lián)規則用于關(guān)聯(lián)知識的發(fā)現,了解網(wǎng)頁(yè)之間的關(guān)系;序列模式可以挖掘出交易集之間有時(shí)間序列關(guān)系的模式;運用分類(lèi)和聚類(lèi)算法對數據進(jìn)行分組等Web挖掘。
、 模式分析:對于發(fā)現的模式進(jìn)行驗證、解釋、說(shuō)明,獲取對決策支持有用的信息。根據模式分析的反饋,如果沒(méi)有得到合適的結果,重復上述步驟,重新挖掘知識,直至得到滿(mǎn)意的結果。
、 結果可視化:Web數據挖掘的意義不是獲取龐大的數據信息,而是要將獲取的知識或者模型采取用戶(hù)可理解的方式展現給用戶(hù),這意味著(zhù)要將分析結果可視化。數據可視化主要是借助于圖形化手段,依據數據本身及其內在的模式和關(guān)系,清晰有效地傳達與溝通信息。
2.2 Web數據挖掘在電子商務(wù)中的應用
將Web數據挖掘技術(shù)應用在電子商務(wù)中,從技術(shù)角度,可以提供優(yōu)化網(wǎng)站結構和頁(yè)面的策略;從商家角度,可以增加交叉銷(xiāo)售量,盡可能將瀏覽者變?yōu)橄M者;從用戶(hù)角度,為用戶(hù)提供了個(gè)性化服務(wù)。以下是Web數據挖掘在電子商務(wù)中的具體應用。
、 改進(jìn)站點(diǎn)的訪(fǎng)問(wèn)效率。通過(guò)對Web結構和Web日志的分析,對Web頁(yè)面之間的組織關(guān)系、引用關(guān)系和超鏈接關(guān)系的分析,可以挖掘用戶(hù)網(wǎng)頁(yè)瀏覽行為模式、頁(yè)面瀏覽情況等,對頁(yè)面的重要性進(jìn)行評估,有助于商家重新調整頁(yè)面結構和頁(yè)面布局,改進(jìn)Web站點(diǎn)設計,提升訪(fǎng)問(wèn)效率,吸引更多用戶(hù)。
、 提供個(gè)性化服務(wù)。電子商務(wù)的快速發(fā)展,為用戶(hù)提供了更多的選擇,同時(shí),面對電商網(wǎng)站眾多的商品和越來(lái)越復雜的網(wǎng)站結構,如何能快速查找到自己感興趣的商品是一個(gè)費時(shí)費力的問(wèn)題。個(gè)性化服務(wù)是電子商務(wù)網(wǎng)站爭取更多用戶(hù)、防止用戶(hù)流失以及實(shí)現市場(chǎng)目標的重要手段。協(xié)同過(guò)濾算法是目前使用最多、應用最成熟的一種推薦技術(shù)[5]。在電子商務(wù)中,運用協(xié)同過(guò)濾等推薦算法,構建基于Web電子商務(wù)的個(gè)性化推薦系統,可以制定不同的個(gè)性化營(yíng)銷(xiāo)策略。
、 商品推薦服務(wù)。運用聚類(lèi)、分類(lèi)、關(guān)聯(lián)規則等數據挖掘技術(shù),可以從用戶(hù)的訪(fǎng)問(wèn)數據中發(fā)現商品之間的聯(lián)系,挖掘用戶(hù)感興趣的商品。比如通過(guò)用戶(hù)購買(mǎi)商品A,推導出商品B也是用戶(hù)感興趣的商品。通過(guò)基于Web電子商務(wù)的智能推薦系統,客戶(hù)可以在較短時(shí)間內購買(mǎi)到滿(mǎn)意的商品,同時(shí)增加商家的交叉銷(xiāo)售量。
、 識別電子商務(wù)潛在客戶(hù)。通過(guò)對Web已有的老客戶(hù)數據的公共屬性、類(lèi)別關(guān)鍵屬性及其屬性間的相互關(guān)系進(jìn)行分析,建立分類(lèi)模型。對于一個(gè)新的用戶(hù),根據已建立的分類(lèi)模型,對新用戶(hù)進(jìn)行正確的分類(lèi),根據類(lèi)別判斷用戶(hù)是否潛在客戶(hù)。
、 理解客戶(hù)意圖。通過(guò)分析用戶(hù)的瀏覽路徑等多個(gè)數據源,運用路徑游歷模式等發(fā)現算法,發(fā)現被頻繁訪(fǎng)問(wèn)的路徑,從而發(fā)現用戶(hù)的真實(shí)訪(fǎng)問(wèn)意圖。
3 結束語(yǔ)
Web挖掘能夠在海量的大數據中尋找出潛在的有用的信息和知識,Web挖掘技術(shù)在電子商務(wù)中的應用越來(lái)越廣泛,制作基于Web挖掘的個(gè)性化推薦系統、智能化的電子商務(wù)系統已經(jīng)成為電商網(wǎng)站的發(fā)展趨勢。但同時(shí)電子商務(wù)數據存在異構性、規模大、復雜性等特點(diǎn),使得傳統的Web挖掘技術(shù)遇到挑戰,下一步需要深入研究針對電子商務(wù)數據的Web挖掘算法。
【W(wǎng)eb數據挖掘技術(shù)在電子商務(wù)中的應用論文】相關(guān)文章:
電子商務(wù)應用論文12-24
數據挖掘實(shí)習報告10-05
關(guān)于計算機技術(shù)在檔案管理中的應用的論文10-30
淺論計算機技術(shù)在企業(yè)管理中的應用論文09-22
BIM技術(shù)在建筑工程造價(jià)管理中的應用論文(精選3篇)07-27
計算機應用技術(shù)論文06-08
大數據技術(shù)與應用職業(yè)生涯規劃書(shū)(精選13篇)10-23