數據挖掘電子商務(wù)論文
1數據挖掘技術(shù)和過(guò)程

1.1數據挖掘技術(shù)概述
發(fā)現的是用戶(hù)感興趣的知識;發(fā)現的知識應當能夠被接受、理解和運用。也就是發(fā)現全部相對的知識,是具有特定前提與條件,面向既定領(lǐng)域的,同時(shí)還容易被用戶(hù)接受。數據挖掘屬于一種新型的商業(yè)信息處理技術(shù),其特點(diǎn)為抽取、轉化、分析商業(yè)數據庫中的大規模業(yè)務(wù)數據,從中獲得有價(jià)值的商業(yè)數據。簡(jiǎn)單來(lái)說(shuō),其實(shí)數據挖掘是一種對數據進(jìn)行深入分析的方法。因此,可以描述數據挖掘為:根據企業(yè)設定的工作目標,探索與分析企業(yè)大量數據,充分揭示隱藏的、未知的規律性,并且將其轉變?yōu)榭茖W(xué)的方法。數據挖掘發(fā)現的最常見(jiàn)知識包括:
1.1.1廣義知識體現相同事物共同性質(zhì)的知識,是指類(lèi)別特點(diǎn)的概括描述知識。按照數據的微觀(guān)特點(diǎn)對其表征的、具有普遍性的、極高概念層次的知識積極發(fā)現,是對數據的高度精煉與抽象。發(fā)現廣義知識的方法與技術(shù)有很多,例如數據立方體和歸約等。
1.1.2關(guān)聯(lián)知識體現一個(gè)事件與其他事件之間形成的關(guān)聯(lián)知識。假如兩項或者更多項之間形成關(guān)聯(lián),則其中一項的屬性數值就能夠借助其他屬性數值實(shí)行預測。
1.1.3分類(lèi)知識體現相同事物共同特點(diǎn)的屬性知識與不同事物之間差異特點(diǎn)知識。
1.2數據挖掘過(guò)程
1.2.1明確業(yè)務(wù)對象對業(yè)務(wù)問(wèn)題清楚定義,了解數據挖掘的第一步是數據挖掘目的。挖掘結果是無(wú)法預測的,但是研究的問(wèn)題是可預見(jiàn)的,僅為了數據挖掘而數據挖掘一般會(huì )體現出盲目性,通常也不會(huì )獲得成功;谟脩(hù)特征的電子商務(wù)數據挖掘研究劉芬(惠州商貿旅游高級職業(yè)技術(shù)學(xué)校,廣東惠州516025)摘要:隨著(zhù)互聯(lián)網(wǎng)的出現,全球范圍內電子商務(wù)正在迅速普及與發(fā)展,在這樣的環(huán)境下,電子商務(wù)數據挖掘技術(shù)應運而生。電子商務(wù)數據挖掘技術(shù)是近幾年來(lái)數據挖掘領(lǐng)域中的研究熱點(diǎn),基于用戶(hù)特征的電子商務(wù)數據挖掘技術(shù)研究將會(huì )解決大量現實(shí)問(wèn)題,為企業(yè)確定目標市場(chǎng)、完善決策、獲得最大競爭優(yōu)勢,其應用前景廣闊,促使電子商務(wù)企業(yè)更具有競爭力。主要分析了電子商務(wù)內容、數據挖掘技術(shù)和過(guò)程、用戶(hù)細分理論,以及基于用戶(hù)特征的電子商務(wù)數據挖掘。
1.2.2數據準備第一選擇數據:是按照用戶(hù)的挖掘目標,對全部業(yè)務(wù)內外部數據信息積極搜索,從數據源中獲取和挖掘有關(guān)數據。第二預處理數據:加工選取的數據,具體對數據的完整性和一致性積極檢查,并且處理數據中的噪音,找出計算機丟失的數據,清除重復記錄,轉化數據類(lèi)型等。假如數據倉庫是數據挖掘的對象,則在產(chǎn)生數據庫過(guò)程中已經(jīng)形成了數據預處理。
1.2.3變換數據轉換數據為一個(gè)分析模型。這一分析模型是相對于挖掘算法構建的。構建一個(gè)與挖掘算法適合的分析模型是數據挖掘獲得成功的重點(diǎn)?梢岳猛队皵祿䦷斓南嚓P(guān)操作對數據維度有效降低,進(jìn)一步減少數據挖掘過(guò)程中數據量,提升挖掘算法效率。
1.2.4挖掘數據挖掘獲得的經(jīng)濟轉化的數據。除了對選擇科學(xué)挖掘算法積極完善之外,其余全部工作都自行完成。整體挖掘過(guò)程都是相互的,也就是用戶(hù)對某些挖掘參數能夠積極控制。
1.2.5評價(jià)挖掘結果這個(gè)過(guò)程劃分為兩個(gè)步驟:表達結果和評價(jià)結果。第一表達結果:用戶(hù)能夠理解數據挖掘得到的模式,可以通過(guò)可視化數據促使用戶(hù)對挖掘結果積極理解。第二評價(jià)結果:用戶(hù)與機器對數據挖掘獲得的模式有效評價(jià),對冗余或者無(wú)關(guān)的模式及時(shí)刪除。假如用戶(hù)不滿(mǎn)意挖掘模式,可以重新挑選數據和挖掘算法對挖掘過(guò)程科學(xué)執行,直到獲得用戶(hù)滿(mǎn)意為止。
2用戶(hù)細分理論
用戶(hù)細分是指按照不同用戶(hù)的屬性劃分用戶(hù)集合。目前學(xué)術(shù)界和企業(yè)界一般接受的是基于用戶(hù)價(jià)值的細分理論,其不僅包含了用戶(hù)為企業(yè)貢獻歷史利潤,還包含未來(lái)利潤,也就是在未來(lái)用戶(hù)為企業(yè)可能帶來(lái)的利潤總和;谟脩(hù)價(jià)值的細分理論選擇客戶(hù)當前價(jià)值與客戶(hù)潛在價(jià)值兩個(gè)因素評價(jià)用戶(hù)。用戶(hù)當前價(jià)值是指截止到目前用戶(hù)對企業(yè)貢獻的總體價(jià)值;用戶(hù)潛在價(jià)值是指未來(lái)用戶(hù)可能為企業(yè)創(chuàng )造的價(jià)值總和。每個(gè)因素還能夠劃分為兩個(gè)高低檔次,進(jìn)一步產(chǎn)生一個(gè)二維的矩陣,把用戶(hù)劃分為4組,價(jià)值用戶(hù)、次價(jià)值用戶(hù)、潛在價(jià)值用戶(hù)、低價(jià)值用戶(hù)。企業(yè)在推廣過(guò)程中根據不同用戶(hù)應當形成對應的方法,投入不同的資源。很明顯對于企業(yè)來(lái)說(shuō)價(jià)值用戶(hù)最重要,被認為是企業(yè)的玉質(zhì)用戶(hù);其次是次價(jià)值用戶(hù),被認為是金質(zhì)用戶(hù),雖然數量有限,卻為企業(yè)創(chuàng )造了絕大部分的利潤;其他則是低價(jià)值用戶(hù),對企業(yè)來(lái)說(shuō)價(jià)值最小,成為鉛質(zhì)用戶(hù),另外一類(lèi)則是潛在價(jià)值用戶(hù)。雖然這兩類(lèi)用戶(hù)擁有較多的數量,但是為企業(yè)創(chuàng )造的價(jià)值有限,甚至很小。需要我們注意的是潛在價(jià)值用戶(hù)利用再造用戶(hù)關(guān)系,將來(lái)極有可能變成價(jià)值用戶(hù)。從長(cháng)期分析,潛在價(jià)值用戶(hù)可以是企業(yè)的隱形財富,是企業(yè)獲得利潤的基礎。將采用數據挖掘方法對這4類(lèi)用戶(hù)特點(diǎn)有效挖掘。
3電子商務(wù)數據挖掘分析
3.1設計問(wèn)卷
研究的關(guān)鍵是電子商務(wù)用戶(hù)特征的數據挖掘,具體包含了價(jià)值用戶(hù)特征、次價(jià)值用戶(hù)特征、潛在價(jià)值用戶(hù)特征,對電子商務(wù)用戶(hù)的認知度、用戶(hù)的需求度分析。問(wèn)卷內容包括3部分:其一是為被調查者介紹電子商務(wù)的概念與背景;其二是具體調查被調查對象的個(gè)人信息,包含了性別、年齡、學(xué)歷、感情情況、職業(yè)、工作、生活地點(diǎn)、收入、上網(wǎng)購物經(jīng)歷;其三是問(wèn)卷主要部分,是對用戶(hù)對電子商務(wù)的了解、需求、使用情況的指標設計。
3.2調查方式
本次調查的問(wèn)卷主體是電腦上網(wǎng)的人群,采用隨機抽象的方式進(jìn)行網(wǎng)上訪(fǎng)問(wèn)。一方面采用大眾聊天工具,利用電子郵件和留言的方式發(fā)放問(wèn)卷,另一方面在大眾論壇上邀請其填寫(xiě)問(wèn)卷。
3.3數據挖掘和結果
。1)選擇數據挖掘的算法利用Clementine數據挖掘軟件,采用C5.O算法挖掘預處理之后數據。
。2)用戶(hù)數據分析
1)電子商務(wù)用戶(hù)認知度分析按照調查問(wèn)卷的問(wèn)題“您知道電子商務(wù)嗎?”得到對電子商務(wù)用戶(hù)認知情況的統計,十分了解20.4%,了解30.1%,聽(tīng)過(guò)但不了解具體使用方法40.3%,從未聽(tīng)過(guò)8.9%。很多人僅聽(tīng)過(guò)電子商務(wù),但是并不清楚具體的功能與應用方法,甚至有一小部分人沒(méi)有聽(tīng)過(guò)電子商務(wù)。對調查問(wèn)卷問(wèn)題“您聽(tīng)過(guò)電子商務(wù)的渠道是什么?”,大部分用戶(hù)是利用網(wǎng)了解電子商務(wù)的,占40.2%;僅有76人是利用紙質(zhì)報刊雜志上知道電子商務(wù)的并且對其進(jìn)行應用;這也表明相較于網(wǎng)絡(luò )宣傳紙質(zhì)媒體推廣電子商務(wù)的方法缺乏有效性。
2)電子商務(wù)用戶(hù)需求用戶(hù)希求具體是指使用產(chǎn)品服務(wù)人員對應用產(chǎn)品或服務(wù)形成的需求或者期望。按照問(wèn)題“假如你曾經(jīng)使用電子商務(wù),你覺(jué)得其用途怎樣,假如沒(méi)有使用過(guò),你覺(jué)得其對自己有用嗎?”得到了認為需要和十分需要的數據,覺(jué)得電子商務(wù)有用的用戶(hù)為40.7%,不清楚是否對自己有用的用戶(hù)為56.7%,認為不需要的僅有2.4%。
3)電子商務(wù)用戶(hù)應用意愿應用意愿是指消費者對某一產(chǎn)品服務(wù)進(jìn)行應用或者購買(mǎi)的一種心理欲望。按照問(wèn)題“假如可以滿(mǎn)足你所關(guān)心的因素,未來(lái)你會(huì )繼續應用電子商務(wù)嗎?”獲得的數據可知,在滿(mǎn)足各種因素時(shí),將來(lái)一年之內會(huì )應用電子商務(wù)的用戶(hù)為78.2%,一定不會(huì )應用電子商務(wù)的用戶(hù)為1.4%。表明用戶(hù)形成了較為強烈的應用電子商務(wù)欲望,電子商務(wù)發(fā)展前景很好;谟脩(hù)特征的電子商務(wù)數據研究,電子商務(wù)企業(yè)通過(guò)這一結果能夠更好地實(shí)行營(yíng)銷(xiāo)和推廣,對潛在用戶(hù)積極定位,提高用戶(hù)體驗,積極挖掘用戶(hù)價(jià)值。分析為企業(yè)準確營(yíng)銷(xiāo)和推廣企業(yè)提供了一個(gè)有效的借鑒。
4結語(yǔ)
互聯(lián)網(wǎng)中數據是最寶貴的資源之一,大量數據中包含了很大的潛在價(jià)值,對這些數據深入挖掘對互聯(lián)網(wǎng)商務(wù)、企業(yè)推廣、傳播信息發(fā)揮了巨大的作用。近些年來(lái),數據挖掘技術(shù)獲得了信息產(chǎn)業(yè)的極大重視,具體原因是出現了大量的數據,能夠廣泛應用,并且需要轉化數據成為有價(jià)值的信息知識。通過(guò)基于用戶(hù)特征的電子商務(wù)數據挖掘研究,促使電子商務(wù)獲得巨大發(fā)展機會(huì ),發(fā)現潛在用戶(hù),促使電子商務(wù)企業(yè)精準營(yíng)銷(xiāo)。
【數據挖掘電子商務(wù)論文】相關(guān)文章:
數據挖掘實(shí)習報告10-05
電子商務(wù)的論文05-29
電子商務(wù)論文06-14
電子商務(wù)論文08-30
關(guān)于電子商務(wù)的論文12-18
電子商務(wù)與物流論文11-08
學(xué)習電子商務(wù)論文11-06
電子商務(wù)安全論文05-15
(必備)電子商務(wù)的論文07-24
跨境電子商務(wù)論文08-27