- 相關(guān)推薦
組合營(yíng)銷(xiāo)策略中基于約束的關(guān)聯(lián)規則挖掘方法
畢業(yè)論文摘 要:網(wǎng)絡(luò )銷(xiāo)售是電子商務(wù)的1種重要的形式,而組合營(yíng)銷(xiāo)是提升網(wǎng)絡(luò )銷(xiāo)售業(yè)績(jì)的1種重要手段。針對目前我國網(wǎng)絡(luò )銷(xiāo)售的基本模式,在已發(fā)現的組合營(yíng)銷(xiāo)策略特點(diǎn)的基礎上,提出了1種基于約束的關(guān)聯(lián)規則挖掘新算法。
關(guān)鍵詞:組合營(yíng)銷(xiāo)策略;數據挖掘;關(guān)聯(lián)規則
1 引言
隨著(zhù)全球化浪潮的推進(jìn),電子商務(wù)正不斷發(fā)展壯大。網(wǎng)絡(luò )銷(xiāo)售作為電子商務(wù)的1種重要組成形式為企業(yè)尋求更大的市場(chǎng)空間提供了1種新的有益嘗試。我國目前網(wǎng)絡(luò )銷(xiāo)售的主流模式為:“訂單1物流”模式。即用戶(hù)下訂單后,企業(yè)通過(guò)物流將商品交付給客戶(hù)。由于物流費用1般由客戶(hù)承擔,客戶(hù)為減少購物的物流成本,往往會(huì )在購買(mǎi)主目標商品的同時(shí),搭配幾件價(jià)格不高的次目標商品。這就為企業(yè)實(shí)施商品的組合營(yíng)銷(xiāo)策略提供了機遇。
2 問(wèn)題描述
組合營(yíng)銷(xiāo)是指企業(yè)通過(guò)對不同類(lèi)別、不同價(jià)格的商品的合理組合,向客戶(hù)1次提供多種商品的營(yíng)銷(xiāo)方式。數據挖掘中的關(guān)聯(lián)規則分析方法,通過(guò)挖掘出以往銷(xiāo)售數據中哪些商品頻繁的被顧客同時(shí)購買(mǎi),形成關(guān)于商品間搭配的知識,從而指導今后銷(xiāo)售的商品組合。但經(jīng)典的關(guān)聯(lián)規則挖掘方法由于缺乏用戶(hù)控制,導致產(chǎn)生的規則過(guò)多,且部分規則對用戶(hù)毫無(wú)意義。為了解決該問(wèn)題,人們引入了基于約束的關(guān)聯(lián)規則挖掘方法。R.T.NG等學(xué)者提出了受約束的關(guān)聯(lián)查詢(xún)概念R.Srikant等人研究了項集受約束的關(guān)聯(lián)規則挖掘,挖掘出了包含某布爾表達式的頻繁項集Robert J.Ba-yardo Jr等人研究了稠密數據庫的特點(diǎn),并提出了改進(jìn)度的概念
本文首先介紹了關(guān)聯(lián)規則的基本概念,在指出傳統關(guān)聯(lián)規則挖掘方法缺陷的基礎上,提出了1種受用戶(hù)指定數據約束的關(guān)聯(lián)規則挖掘算法(UD-Apriori)。實(shí)驗分析表明,該算法能在短時(shí)間內找到用戶(hù)感興趣的規則,算法效率有明顯提高。
3 關(guān)聯(lián)規則的基本概念
3.1關(guān)聯(lián)規則的描述
設I={i1i2,im}是項的集合,其中的元素稱(chēng)為項(item)。記D為交易T的集合,這里交易T是項的集合,并且T I。設X是I中項的1個(gè)集合,如果X T.那么稱(chēng)交易T3X。1個(gè)關(guān)聯(lián)規則是形如“X Y的蘊含式,這里X I,Y I,并且X Y= 。
規則“XjY”在事務(wù)數據庫中的支持度(support)是事務(wù)集中包含X和Y的事務(wù)數與所有事務(wù)數之比,記為suppog(X Y),即:
suooort(X Y):l{T,X Y T,T D}|/|D|
對項目集I和事務(wù)數據庫D,T中所有滿(mǎn)足用戶(hù)指定的最小支持度(minsupportl的項目集,稱(chēng)為頻繁項目集。
規則X Y在事務(wù)集中的置信度(confidence)是指包含X和Y的事務(wù)數與包含X的事務(wù)數之比,記為confidence(X Y),即:
Confidence(X Y)=|{T,X Y T,T D,T D}|/|T:X T,T D}|
3.2經(jīng)典關(guān)聯(lián)規則挖掘算法及其缺陷
經(jīng)典的關(guān)聯(lián)規則挖掘算法分兩個(gè)階段:首先,產(chǎn)生達到指定最小支持度的項集(即頻繁項集),然后從每個(gè)頻繁項集中找出能夠達到指定最小置信度的規則。其中,第1步生成滿(mǎn)足最小支持度的項集是關(guān)鍵。1994年Agrawal等人在提出了著(zhù)名的Apfiofi算法此算法使用遞歸方法生成所有的頻繁項集。首先生成頻繁1-項集L1,然后生成頻繁2-項集L2,…,1直到某個(gè)r使得Lr為空,算法結束。當求Lk時(shí),首先通過(guò)Lk-1的自連接生成候選項集Ck;檢驗Ck中的每個(gè)元素,滿(mǎn)足用戶(hù)指定的最小支持度的元素就是Lk中的元素。從以上算法描述可看出由于Lk-1候選集Ck是呈指數增長(cháng)的,例如104個(gè)1-頻繁項集就有可能產(chǎn)生接近107個(gè)元素的2-候選項集。如此大的候選項集對時(shí)間和主存空間是1種巨大的挑戰。另外,由于基于“支持度1置信度”的關(guān)聯(lián)規則挖掘度量框架本身不具有關(guān)聯(lián)規則生成的先決指導性,導致產(chǎn)生的部分規則對最終用戶(hù)毫無(wú)意義,而1些較長(cháng)的規則又難于理解。這些都導致算法效率的低下。
4 受用戶(hù)指定數據約束的關(guān)聯(lián)規則挖掘算法
4.1算法的提出背景
在企業(yè)實(shí)施商品的組合營(yíng)銷(xiāo)策略過(guò)程中,往往以利潤為先導,把關(guān)注焦點(diǎn)集中在那些銷(xiāo)售情況較好而價(jià)格又相對比較高的商品上面。因此,企業(yè)銷(xiāo)售策略可以是:針對具有上述特征的商品,找出和這類(lèi)商品1起被頻繁購買(mǎi)的其它價(jià)格比較低的商品,以便在今后的銷(xiāo)售中對這些商品進(jìn)行捆綁銷(xiāo)售。
4.2受用戶(hù)指定數據約束的關(guān)聯(lián)規則挖掘算法(UD-Apfiofi)的基本思想
基于上述銷(xiāo)售策略,我們提出1種受用戶(hù)指定數據約束的關(guān)聯(lián)規則挖掘算法。其中。用戶(hù)需要提供兩個(gè)約束信息:暢銷(xiāo)商品A以及與A關(guān)聯(lián)的商品價(jià)格總和的最大值(max_sumprice)。
該算法的基本思想是:首先利用用戶(hù)指定商品A為約束條件對事務(wù)數據庫D進(jìn)行掃描,包含A的實(shí)例加入到實(shí)例集Dt中,其余被過(guò)濾掉。然后在經(jīng)典Apfiofi算法的頻繁項集生成過(guò)程中應用受max_sumprice參數約束的剪枝策略,生成符合約束條件的頻繁K-項集,最后由頻繁項集生成受約束的關(guān)聯(lián)規則。
4.3剪枝策略
定義1
約束Ca是反單調的是指對于任意給定的不滿(mǎn)足Ca的項目集S,不存在S的超集能夠滿(mǎn)足Ca。
下面給出了與A相關(guān)聯(lián)商品的反單調性約束表達式:
sum_price(Bl,B2,…,Bn)≤max_sumprice。
其中,sum_price(B1,B2,…,Bn)為在頻繁項集的項(item)中與A相關(guān)聯(lián)的商品價(jià)格的總和。
證明:反證法。假設sum_price(B1,B2,…,Bn)>max_sumprice,且有sum_price(B1,B2,…,BnBn+1)≤max_sumprice,其中Bi>0。則有sum_price(B1,B2,…,Bn)>sum_price(B1,B2,…,BnBn+1),即:Bn+1+l<0,與假設Bi>0矛盾,故sum_price(B1,B2,…,Bn)≤max_sumprice為反單調性約束條件。由定義1可以確定,如果在A(yíng)priofi算法中生成的任何1個(gè)頻繁項集不滿(mǎn)足反單調約束條件,則它的任何超集都不滿(mǎn)足此約束條件。因此,在經(jīng)典的apriori算法產(chǎn)生K-1-頻繁項集后,我們可以直接將不滿(mǎn)足約束的頻繁項集剔除掉。這樣從客觀(guān)上,減少了頻繁項集生成所需要的候選項集的數目,成功地對候選項集進(jìn)行了剪枝。
4.4 UD-Apriori算法描述
輸入:事務(wù)數據庫D,A(用戶(hù)指定的商品),min_sup(最小支持度),min_conf(最小置信度),max_sumprice(頻繁項集的項中與A關(guān)聯(lián)的商品之和的最大值)。
輸出:滿(mǎn)足min_sup,min_conf,A,max_sumprice約束的關(guān)聯(lián)規則。
Begin
If A is unfrequent then
return;
Filter(A);
L1=L1+find_frequent_l-itemsets(D’)//產(chǎn)生頻繁1項集
Delete T where not contain L1;
Gen_rules(1,L1);//產(chǎn)生頻繁1項集規則
For(k=2;Lk-1≠φ;k++)
{Ck:apriori_gen Lk-1,min_sup,max_sumprice);//產(chǎn)生K-項集
Lk=subset (Ck,D’);//產(chǎn)生頻繁K-項集
Gen_rules(K,Lk)://產(chǎn)生頻繁K-項集的規則
end;procedure filter(A)//過(guò)濾事務(wù)數據庫
For all trasactions t D:
Ift contain A then
Write to D′return;
5 試驗結果分析
本試驗采用IBM數據生成器生成記錄型測試數據進(jìn)行算法測試,同時(shí)將每個(gè)項目元素進(jìn)行價(jià)格賦值。實(shí)驗環(huán)境基于winxp平臺,計算機內存256MB,主頻2.8GHZ,測試數據各項參數如表2。
在數據庫291個(gè)項目元素中,元素最高價(jià)格為4995。在頻繁1項集中項集最高價(jià)格為4425。因此,將價(jià)格為4425的項i4425定為指定約束元素;诖耸聞(wù)數據庫對經(jīng)典的Apriori算法及受用戶(hù)指定數據約束算法的對比測試結果如表3。
實(shí)驗結果表明,由于受項i4425的約束,算法的運行時(shí)間和生成的規則數大為減少。且由于指定了約束條件項i4425,使挖掘過(guò)程的指向性得到明顯提高。很好的控制了挖掘的數據規模,從而保證了在生成的關(guān)聯(lián)規則數目減少的同時(shí)更加契合用戶(hù)的意愿。
6 結論
本文根據網(wǎng)絡(luò )電子商務(wù)的特點(diǎn),結合組合營(yíng)銷(xiāo)策略實(shí)施中客戶(hù)的具體購買(mǎi)模式,提出了1種基于約束的關(guān)聯(lián)規則挖掘算法。試驗結果表明,這種算法由于引入了更多的用戶(hù)控制,相比經(jīng)典的關(guān)聯(lián)規則挖掘算法效率更高。挖掘結果表明,挖掘生成的關(guān)聯(lián)規則大為減少,信息指向性也更加明確,為企業(yè)實(shí)施組合營(yíng)銷(xiāo)策略提供了科學(xué)的依據。
【組合營(yíng)銷(xiāo)策略中基于約束的關(guān)聯(lián)規則挖掘方法】相關(guān)文章:
基于聚類(lèi)分析的數據挖掘方法03-08
基于知識營(yíng)銷(xiāo)的4Is營(yíng)銷(xiāo)策略03-23
差異化經(jīng)營(yíng)策略在營(yíng)銷(xiāo)組合中的應用03-21
論差異化經(jīng)營(yíng)策略在營(yíng)銷(xiāo)組合中的應用03-02
基于顧客價(jià)值的需求,流動(dòng)網(wǎng)挖掘策略分析01-11
新款手機上市的營(yíng)銷(xiāo)組合策略03-23
保險產(chǎn)品營(yíng)銷(xiāo)組合與競爭策略研究03-13