一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看

數據挖掘技術(shù)在高校學(xué)生成績(jì)分析中的應用研究論文

時(shí)間:2024-10-20 18:32:19 其他類(lèi)論文 我要投稿

數據挖掘技術(shù)在高校學(xué)生成績(jì)分析中的應用研究論文

  摘 要:本文主要討論的是決策樹(shù)挖掘技術(shù)在學(xué)生成績(jì)分析中的應用。通過(guò)確定數據挖掘的對象、數據選擇、數據分類(lèi)挖掘,最后由決策樹(shù)產(chǎn)生分類(lèi)規則,得出挖掘結果和運用這個(gè)結果的指導作用。希望本文的研究能夠為相關(guān)領(lǐng)域提供一些指導和幫助。

數據挖掘技術(shù)在高校學(xué)生成績(jì)分析中的應用研究論文

  關(guān)鍵詞:數據挖掘;高校學(xué)生;成績(jì)分析

  1.確定數據挖掘的對象

  本文數據挖掘的對象主要是以本人所授的《大學(xué)計算機基礎》課程的數據為例,對象是本校學(xué)生,總人數250人,采用授課方法是在機房上課,周學(xué)時(shí)為三節課。根據學(xué)生的基本情況來(lái)分析挖掘出哪些因素對學(xué)生的學(xué)習成績(jì)是有影響的,如性別、基礎程度、每周上機時(shí)間、生源地、出勤情況等等,分析考試成績(jì)?yōu)樵趦?yōu)、良、中、及格、不及格這五個(gè)等級之間分布的學(xué)生人數與上面哪些因素有關(guān)系,并希望用得到的分析結果來(lái)指導今后的教學(xué)工作,提高教學(xué)質(zhì)量、改革教學(xué)方法。

  2.數據選擇

  2.1學(xué)生的基本情況信息

  數據結構包含以下屬性信息:學(xué)號、姓名、性別、專(zhuān)業(yè)、家庭住址、籍貫、聯(lián)系方式、班級、生源地。這些信息可以通過(guò)學(xué)院的“學(xué)生教務(wù)管理信息系統”來(lái)獲取,存入“學(xué)生基本情況數據庫”中,內部的數據結構包含以上九個(gè)屬性。

  2.2需要向學(xué)生調查的數據信息

  需要調查的信息包括:對計算機課程是否感興趣、基礎程度、每周上機時(shí)間等。這些信息是通過(guò)對學(xué)生的調查才能得到。把調查所得到的數據存放到“調查信息數據庫”中!罢{查信息數據庫”的數據結構包含以下屬性信息:學(xué)號、姓名、是否對計算機課程感興趣、基礎程度、每周上機時(shí)間五個(gè)屬性。其中是否對計算機課程感興趣屬性有感興趣、不感興趣兩個(gè)屬性值;基礎程度屬性有好、一般、差三個(gè)屬性值;上機時(shí)間量有0、≤1、1~2、≥2四個(gè)屬性值。

  2.3學(xué)生的考試成績(jì)數據

  學(xué)生的考試成績(jì)是教師在期末考試后統計的,通過(guò)學(xué)院已有的“教務(wù)管理系統”來(lái)完成錄入收集的,其數據結構包含以下內容:學(xué)號、姓名、專(zhuān)業(yè)名稱(chēng)、班級、課程名稱(chēng)、成績(jì)。錄入的學(xué)生成績(jì)保存在“學(xué)生成績(jì)數據庫”中,數據結構包含以下屬性:學(xué)號、姓名、專(zhuān)業(yè)、成績(jì)四個(gè)屬性。

  3.數據分類(lèi)挖掘

  數據分類(lèi)挖掘的主要目的就是要建立學(xué)生成績(jì)分析決策樹(shù)的模型。

  3.1算法的選擇

  本文運用決策樹(shù)技術(shù)的兩個(gè)經(jīng)典算法 ID3算法和C4.5算法,因ID3算法是利用信息增益,作為分類(lèi)評價(jià)函數來(lái)選取最優(yōu)屬性,這種選擇容易傾向于選擇取值較大的屬性,但取值較大的屬性并不一定是最重要的屬性。且ID3算法只能處理離散值的屬性,沒(méi)有考慮數據中的缺值問(wèn)題。C4.5算法能有效處理數值的離散化,考慮了缺值問(wèn)題,因此選用了C4.5算法建立決策樹(shù)進(jìn)行數據挖掘分析。

  3.2建立決策樹(shù)模型

  用于挖掘的學(xué)生成績(jì)表中的屬性很多,本文選取了與成績(jì)屬性相關(guān)性較大的性別、基礎程度、每周上機時(shí)間三個(gè)屬性作為建立成績(jì)分類(lèi)決策樹(shù)模型的依據。建立決策樹(shù)模型的步驟如下:

 。1)對每個(gè)屬性分別計算該屬性的信息增益率。

 。2)選取信息增益比率最大的屬性作為根結點(diǎn),并按其值劃分數據集合,如果該屬性只有一個(gè)值則停止劃分。

 。3)對劃分的每個(gè)子數據集遞歸執行(1)~(2)。

  4.生成分類(lèi)規則

  決策樹(shù)的最大優(yōu)點(diǎn)是能直接提取分類(lèi)規則,可以以IF…THEN形式的分類(lèi)規則表示。IF…THEN規則易于理解,特別是當給定的決策樹(shù)很大時(shí)很實(shí)用。提取IF…THEN規則的主要做法是:對從根到葉節點(diǎn)的每條路徑創(chuàng )建一個(gè)規則,沿著(zhù)給定路徑上的每個(gè)屬性值對形成規則前面部分的一個(gè)合取項。葉節點(diǎn)包含類(lèi)預測,形成規則的后面部分。

  5.決策樹(shù)挖掘結果分析

  通過(guò)應用決策樹(shù)算法對學(xué)生成績(jì)進(jìn)行析,可得如下結論:

 。1)基礎程度好的學(xué)生且每周上機時(shí)間不少于1小時(shí)的學(xué)生,成績(jì)基本上都是優(yōu)秀的。

 。2)基礎程度一般的學(xué)生且每周上機時(shí)間不少于1小時(shí)的學(xué)生,成績(jì)基本上是良好的。

 。3)基礎程度一般的學(xué)生且每周上機時(shí)間小于1小時(shí)的學(xué)生,成績(jì)基本是屬于中等水平。

 。4)基礎程度差的學(xué)生但每周上機時(shí)間不少于1小時(shí)的學(xué)生,成績(jì)大部分集中在及格左右。

 。5)基礎程度差的學(xué)生且每周上機時(shí)間少于1小時(shí)的學(xué)生,成績(jì)基本上都是不及格。

 。6)而從結果來(lái)看性別是不能決定成績(jì)的。

  6.決策樹(shù)方法分析結果的指導作用

  通過(guò)對學(xué)生成績(jì)的決策樹(shù)分析,教師可以了解到哪些因素對學(xué)生成績(jì)有影響,根據這些影響因素,教師可以在今后的教學(xué)過(guò)程當中進(jìn)行課程改革、改善教學(xué)過(guò)程當中的不足之處,可以提高學(xué)生的學(xué)習成績(jì),學(xué)到更多的知識。

  從生成的分類(lèi)規則,可以了解到,學(xué)生基礎程度好且能保證每周有相當的時(shí)間來(lái)學(xué)習,那么這樣的學(xué)生成績(jì)基本上都是優(yōu)秀,而基礎程度差且每周能用來(lái)學(xué)習的時(shí)間比較少的那些學(xué)生,成績(jì)基本上是屬于不及格的。而基礎程度一般且每周用來(lái)上機的時(shí)間相對比較多的學(xué)生,成績(jì)大部分是集中在中、良這兩個(gè)階段;A程度一般且每周用來(lái)上機時(shí)間比較少的那部分學(xué)生,成績(jì)集中在及格與不及格之間。所以可以知道學(xué)生的基礎程度好與差、每周能用來(lái)學(xué)習的上機時(shí)間的多與少,是影響學(xué)生成績(jì)的主要因素。但性別不是影響學(xué)生成績(jì)的主要因素,從決策樹(shù)來(lái)看,無(wú)論從哪個(gè)分支都看不出是男生成績(jì)好還是女生成績(jì)好,所以性別不是能影響學(xué)生成績(jì)的主要因素。

  針對這些主次要因素,教師在教學(xué)過(guò)程當中要進(jìn)行適當的教學(xué)改革。而不能再用傳統的教學(xué)方法,不管基礎程度好與差,一概而論;也不管學(xué)生對知識掌握與否,一堂課都是老師在講,學(xué)生只能聽(tīng)。這樣會(huì )使程度好的學(xué)生因為沒(méi)有新知識可學(xué)而失去對這門(mén)課的興趣,而程度差的學(xué)生因為聽(tīng)不明白、學(xué)不到知識,也對這門(mén)課失去興趣,結果會(huì )使整體的教學(xué)效果不好,學(xué)生的成績(jì)沒(méi)有得到提高,因此教師要改變這樣的傳統教學(xué)模式,才能提高學(xué)生對知識的掌握。改革的重點(diǎn)是要把程度差和程度好的學(xué)生進(jìn)行分開(kāi)教學(xué),對于程度好的學(xué)生可以做一些更深層次的授課,而程度差的學(xué)生在授課的時(shí)候就要有針對性的授課,必須做到提高學(xué)生學(xué)習的積極性,讓他們對這個(gè)課程感興趣。程度好的學(xué)生計算機能力也會(huì )有所提高,而程度差的學(xué)生也可以學(xué)到自己想學(xué)的知識。

  參考文獻:

  [1]陳文偉.決策樹(shù)支持系統與數據挖掘技術(shù)[M].北京:清華大學(xué)出版社,1998.

  [2]陳文偉.數據挖掘技術(shù)[M].北京:北京工業(yè)大學(xué)出版社,2002

【數據挖掘技術(shù)在高校學(xué)生成績(jì)分析中的應用研究論文】相關(guān)文章:

數據挖掘技術(shù)在Web信息檢索中的應用研究論文12-01

數據挖掘技術(shù)在中等職業(yè)學(xué)校管理實(shí)踐中的應用研究11-19

數據挖掘在電力企業(yè)中的應用論文12-13

數據挖掘技術(shù)的教學(xué)輔助系統應用論文03-16

數據挖掘技術(shù)在就業(yè)指導的應用論文02-27

數據挖掘在現代遠程教育中的應用論文11-22

GPSRTK技術(shù)在工程測量中的應用研究論文02-14

數據挖掘論文的參考文獻01-07

數據挖掘與客戶(hù)關(guān)系管理分析02-28

  • 相關(guān)推薦
一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看