數據挖掘的算法及技術(shù)的應用的研究論文
摘要:數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實(shí)際應用數據中發(fā)現隱含的、規律性的、人們事先未知的, 但又是潛在有用的并且最終可被理解的信息和知識的非平凡過(guò)程。任何有數據管理和知識發(fā)現需求的地方都可以借助數據挖掘技術(shù)來(lái)解決問(wèn)題。本文對數據挖掘的算法以及數據挖掘技術(shù)的應用展開(kāi)研究, 論文對數據挖掘技術(shù)的應用做了有益的研究。

關(guān)鍵詞:數據挖掘; 技術(shù); 應用;
引言:數據挖掘技術(shù)是人們長(cháng)期對數據庫技術(shù)進(jìn)行研究和開(kāi)發(fā)的結果。起初各種商業(yè)數據是存儲在計算機的數據庫中的, 然后發(fā)展到可對數據庫進(jìn)行查詢(xún)和訪(fǎng)問(wèn), 進(jìn)而發(fā)展到對數據庫的即時(shí)遍歷。數據挖掘使數據庫技術(shù)進(jìn)入了一個(gè)更高級的階段, 它不僅能對過(guò)去的數據進(jìn)行查詢(xún)和遍歷, 并且能夠找出過(guò)去數據之間的潛在聯(lián)系, 從而促進(jìn)信息的傳遞。
一、數據挖掘概述
數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實(shí)際應用數據中發(fā)現隱含的、規律性的、人們事先未知的, 但又是潛在有用的并且最終可被理解的信息和知識的非平凡過(guò)程。
二、數據挖掘的基本過(guò)程
(1) 數據選擇:選擇與目標相關(guān)的數據進(jìn)行數據挖掘。根據不同的數據挖掘目標, 對數據進(jìn)行處理, 不僅可以排除不必要的數據干擾, 還可以極大地提高數據挖掘的效率。 (2) 數據預處理:主要進(jìn)行數據清理、數據集成和變換、數據歸約、離散化和概念分層生成。 (3) 模式發(fā)現:從數據中發(fā)現用戶(hù)感興趣的模式的過(guò)程.是知識發(fā)現的主要的處理過(guò)程。 (4) 模式評估:通過(guò)某種度量得出真正代表知識的模式。一般來(lái)說(shuō)企業(yè)進(jìn)行數據挖掘主要遵循以下流程——準備數據, 即收集數據并進(jìn)行積累, 此時(shí)企業(yè)就需要知道其所需要的是什么樣的數據, 并通過(guò)分類(lèi)、編輯、清洗、預處理得到客觀(guān)明確的目標數據。數據挖掘這是最為關(guān)鍵的步驟, 主要是針對預處理后的數據進(jìn)行進(jìn)一步的挖掘, 取得更加客觀(guān)準確的數據, 方能引入決策之中, 不同的企業(yè)可能采取的數據挖掘技術(shù)不同, 但在當前來(lái)看暫時(shí)脫離不了上述的挖掘方法。當然隨著(zhù)技術(shù)的進(jìn)步, 大數據必定會(huì )進(jìn)一步成為企業(yè)的立身之本, 在當前已經(jīng)在很多領(lǐng)域得以應用。如市場(chǎng)營(yíng)銷(xiāo), 這是數據挖掘應用最早的領(lǐng)域, 旨在挖掘用戶(hù)消費習慣, 分析用戶(hù)消費特征進(jìn)而進(jìn)行精準營(yíng)銷(xiāo)。就以令人深?lèi)和唇^的彈窗廣告來(lái)說(shuō), 當消費者有網(wǎng)購習慣并在網(wǎng)絡(luò )上搜索喜愛(ài)的產(chǎn)品, 當再一次進(jìn)行搜索時(shí), 就會(huì )彈出很多針對消費者消費習慣的商品。
三、數據挖掘方法
1、聚集發(fā)現。
聚集是把整個(gè)數據庫分成不同的群組。它的目的是要群與群之間差別很明顯.而同一個(gè)群之間的數據盡量相似.聚集在電子商務(wù)上的典型應用是幫助市場(chǎng)分析人員從客戶(hù)基本庫中發(fā)現不同的客戶(hù)群, 并且用購買(mǎi)模式來(lái)刻畫(huà)不同客戶(hù)群的特征。此外聚類(lèi)分析可以作為其它算法 (如特征和分類(lèi)等) 的預處理步驟, 這些算法再在生成的簇上進(jìn)行處理。與分類(lèi)不同, 在開(kāi)始聚集之前你不知道要把數據分成幾組, 也不知道怎么分 (依照哪幾個(gè)變量) .因此在聚集之后要有一個(gè)對業(yè)務(wù)很熟悉的人來(lái)解釋這樣分群的意義。很多情況下一次聚集你得到的分群對你的業(yè)務(wù)來(lái)說(shuō)可能并不好, 這時(shí)你需要刪除或增加變量以影響分群的方式, 經(jīng)過(guò)幾次反復之后才能最終得到一個(gè)理想的結果.聚類(lèi)方法主要有兩類(lèi), 包括統計方法和神經(jīng)網(wǎng)絡(luò )方法.自組織神經(jīng)網(wǎng)絡(luò )方法和K-均值是比較常用的聚集算法。
2、決策樹(shù)。
這在解決歸類(lèi)與預測上能力極強, 通過(guò)一系列的問(wèn)題組成法則并表達出來(lái), 然后經(jīng)過(guò)不斷詢(xún)問(wèn)問(wèn)題導出所需的結果。典型的決策樹(shù)頂端是一個(gè)樹(shù)根, 底部擁有許多樹(shù)葉, 記錄分解成不同的子集, 每個(gè)子集可能包含一個(gè)簡(jiǎn)單法則。
四、數據挖掘的應用領(lǐng)域
4.1市場(chǎng)營(yíng)銷(xiāo)
市場(chǎng)銷(xiāo)售數據采掘在銷(xiāo)售業(yè)上的應用可分為兩類(lèi):數據庫銷(xiāo)售和籃子數據分析。前者的任務(wù)是通過(guò)交互式查詢(xún)、數據分割和模型預測等方法來(lái)選擇潛在的顧客以便向它們推銷(xiāo)產(chǎn)品, 而不是像以前那樣盲目地選擇顧客推銷(xiāo);后者的任務(wù)是分析市場(chǎng)銷(xiāo)售數據以識別顧客的購買(mǎi)行為模式, 從而幫助確定商店貨架的布局排放以促銷(xiāo)某些商品。
4.2金融投資
典型的金融分析領(lǐng)域有投資評估和股票交易市場(chǎng)預測, 分析方法一般采用模型預測法。這方面的系統有Fidelity Stock Selector, LBS Capital Management。前者的任務(wù)是使用神經(jīng)網(wǎng)絡(luò )模型選擇投資, 后者則使用了專(zhuān)家系統、神經(jīng)網(wǎng)絡(luò )和基因算法技術(shù)輔助管理多達6億美元的有價(jià)證券。
結論:數據挖掘是一種新興的智能信息處理技術(shù)。隨著(zhù)相關(guān)信息技術(shù)的迅猛發(fā)展, 數據挖掘的應用領(lǐng)域不斷地拓寬和深入, 特別是在電信、軍事、生物工程和商業(yè)智能等方面的應用將成為新的研究熱點(diǎn)。同時(shí), 數據挖掘應用也面臨著(zhù)許多技術(shù)上的挑戰, 如何對復雜類(lèi)型的數據進(jìn)行挖掘, 數據挖掘與數據庫、數據倉庫和Web技術(shù)等技術(shù)的集成問(wèn)題, 以及數據挖掘的可視化和數據質(zhì)量等問(wèn)題都有待于進(jìn)一步研究和探索。
參考文獻
[1]孟強, 李海晨.Web數據挖掘技術(shù)及應用研究[J].電腦與信息技術(shù), 2017, 25 (1) :59-62.
[2]高海峰.智能交通系統中數據挖掘技術(shù)的應用研究[J].數字技術(shù)與應用, 2016 (5) :108-108.
【數據挖掘的算法及技術(shù)的應用的研究論文】相關(guān)文章:
數據挖掘技術(shù)在Web信息檢索中的應用研究論文12-01
數據挖掘技術(shù)的教學(xué)輔助系統應用論文03-16
數據挖掘技術(shù)在就業(yè)指導的應用論文02-27
數據挖掘技術(shù)在高校學(xué)生成績(jì)分析中的應用研究論文03-15
時(shí)間序列數據挖掘研究論文提綱03-27
數據挖掘在電力企業(yè)中的應用論文12-13
數據挖掘在現代遠程教育中的應用論文11-22
數據挖掘技術(shù)在中等職業(yè)學(xué)校管理實(shí)踐中的應用研究11-19
大數據云計算技術(shù)及應用論文06-11
數據挖掘論文的參考文獻01-07
- 相關(guān)推薦