一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看

學(xué)前教育師資信息素養的挖掘模型設計論文

時(shí)間:2025-10-17 21:26:07 學(xué)前教育畢業(yè)論文

學(xué)前教育師資信息素養的挖掘模型設計論文

  摘 要:數據挖掘模型的設計,對于整個(gè)挖掘過(guò)程起到了至關(guān)重要的作用,本文針對學(xué)前教育信息素養的調查表,圍繞著(zhù)數據庫設計、數據準備、挖掘方法的選用、模型建立四個(gè)方面進(jìn)行闡述,針對調查表中的若干重要的問(wèn)題進(jìn)行分析、研究,從而建立挖掘模型,為最終的數據挖掘做好準備.

學(xué)前教育師資信息素養的挖掘模型設計論文

  關(guān)鍵詞:學(xué)前教育;信息素養;數據挖掘;模型設計

  前言

  圍繞著(zhù)學(xué)前教育師資信息素養體系,國內各個(gè)機構對其研究較為缺乏,沒(méi)有一個(gè)現成的模式可以借鑒,本人參考《江蘇省東臺市幼兒園的信息素養調查研究報告》為參考,請教學(xué)院的學(xué)前教育領(lǐng)域專(zhuān)家,與一線(xiàn)教師交流,根據自身多年信息技術(shù)教學(xué)的經(jīng)驗,形成了《學(xué)前教育師資信息素養調查表》,從教師基本信息、信息意識與態(tài)度、信息知識與技能、信息整合與創(chuàng )新、信息道德與安全、信息技術(shù)的培訓等六個(gè)方面進(jìn)行研究,對廈、漳、泉、莆田等地公辦、民辦、私立幼兒園的教師展開(kāi)調查,希望通過(guò)數據挖掘技術(shù),發(fā)現幼兒園教師的信息素養現狀及其影響因素.

  1 “學(xué)前教育師資信息素養”數據庫設計

  首先,利用Access的建表功能,先建立“學(xué)前教育師資信息素養”數據庫,根據調查表中設置的六大部分,分別創(chuàng )建6個(gè)表,分別為“教師基本信息”(grxx)、“關(guān)于信息意識和態(tài)度”(ystd)、“關(guān)于信息知識和技能”(zsjn)、“關(guān)于信息整合與應用”(zhyy)、“關(guān)于信息道德與安全”(ddaq)、“信息技術(shù)培訓”( jspx).對各部分中的每個(gè)問(wèn)題設立一字段,以縮寫(xiě)形式為字段名,如“信息技術(shù)自評”的字段名為“Jszp”,“家庭上網(wǎng)條件”的字段名為“Jtswtj”.而每個(gè)問(wèn)題的答案都是以選項形式填寫(xiě),所以每個(gè)字段的數據類(lèi)型均設置為文本.為了便于管理,我們對每個(gè)教師都進(jìn)行了編號,并將編號設為每個(gè)表的關(guān)鍵字.

  2 數據準備

  2. 1 數據收集本文數據的來(lái)源主要通過(guò)兩種渠道:網(wǎng)上問(wèn)卷調查以及網(wǎng)下問(wèn)卷收集,研究對象為廈門(mén)、漳州、泉州、莆田、龍巖等五個(gè)地區的學(xué)前教育一線(xiàn)教師.

  由于泉州兒童發(fā)展職業(yè)學(xué)院多年來(lái)都是面向廈門(mén)、漳州、泉州、莆田、龍巖等五地招生,畢業(yè)生也基本上分布在這五個(gè)地區,因此本文收集的數據有一定的區域特點(diǎn),即調查對象具有較相似的教育教學(xué)背景,這樣給統計、分析提供了很大的方便,使得數據更加精確.

  我們根據事先設置的《學(xué)前教育師資信息素養調查表》的內容,將調查表以網(wǎng)頁(yè)的形式發(fā)布在網(wǎng)上,供教師填寫(xiě);有了網(wǎng)絡(luò )工具,我們能收集到更多的數據,從而使調查結果更加準確.在服務(wù)器端收集的數據,直接以Access數據庫形式保存下來(lái),然后添加到SQL Server數據庫中.

  2. 2 清洗數據

  該過(guò)程用于提高數據質(zhì)量,使數據達到分析所要求的標準.數據清洗過(guò)程包括子數據集的選擇和缺失值的處理.

  因為數據質(zhì)量是決定挖掘成功與否的關(guān)程中對一些重要字段進(jìn)行數據質(zhì)量檢查是十分必要的.

  缺失值是指數據集中無(wú)法知道、沒(méi)有搜集或者錯誤錄入的值.一般來(lái)說(shuō)對于它們所屬的字段這些值是無(wú)效的.對于此類(lèi)問(wèn)題需要觀(guān)察缺失值情況,考慮舍去其后對預測的結果是否有較大的影響.

  本文中,利用問(wèn)卷形式收集來(lái)的數據,在手工錄入的過(guò)程中,發(fā)現了有許多字段存在缺失值問(wèn)題,表現為:有的題目中沒(méi)有“D”選項,但老師的答案中卻出現了“D”的選擇;

  有的題目答案為空;還有的選擇不合邏輯,比如“年齡”選擇為“20 ~ 30”,而“教師職稱(chēng)”卻選擇為“特級”.諸如最后一種選擇,在此我們先不做處理,本文主要針對前兩種缺失情況進(jìn)行研究.

  第一種情形下,以“jjntff”字段(字段含義為“解決教育教學(xué)難題采用方法”)為例,選項中只有A、B、C三個(gè)選項,但結果中出現了7個(gè)D的選項,造成數據錯誤有可能是教師填寫(xiě)錯誤或者是錄入員錄入失誤,在這里我們將這些錯誤值定義稱(chēng)缺失值,然后利用Excel工具,發(fā)現該題目中C出現頻率最高,因此將7個(gè)缺失值修改為C.

  第二種情形,我們對于答案為空的題目先放空,然后在所有數據填寫(xiě)完整后,再采用類(lèi)似第一種情況代替方式,以出現頻率最高的選項填寫(xiě)之.

  2. 3 選擇數據

  利用Business Intelligence Development Studio工具,新建一名為“信息素養挖掘”的Analysis Services項目,導入數據源,然后將數據源轉化成數據源視圖,再進(jìn)行“選擇數據”.

  “選擇數據”是用來(lái)決定用于分析的數據.在整合數據過(guò)程中、構建數據庫之后,有一些字段會(huì )和分析無(wú)關(guān),這里就是要對字段進(jìn)行過(guò)濾.

  選擇數據是指對一些變量的選擇取舍.選擇數據過(guò)程包括字段的選擇和記錄的選擇.我們這里主要針對字段進(jìn)行選擇.在調查表設置初期,由于對目標問(wèn)題理解不夠細致,雖然有幼教專(zhuān)家的指點(diǎn),但在學(xué)前教育師資信息素養領(lǐng)域中,有關(guān)研究還是比較缺乏,因此我們在設置數據表時(shí)考慮也不夠完善,有關(guān)字段設置可能是多余的,這也需要通過(guò)數據挖掘過(guò)程去發(fā)現.由于篇幅限制,本文只針對每部分中的典型項目進(jìn)行挖掘研究.

  3 挖掘方法的選用

  在學(xué)前教育領(lǐng)域中,問(wèn)題調查一般選項式、問(wèn)答式的題目來(lái)實(shí)現,針對選項式的調查,以下我們將對本文涉及的問(wèn)題進(jìn)行研究.

  3. 1 關(guān)聯(lián)規則的選用

  挖掘關(guān)聯(lián)規則的過(guò)程,就是尋找具有內在、隱性聯(lián)系信息的過(guò)程.隨著(zhù)收集和存儲在數據庫中的數據規模越來(lái)越大,人們可以從中挖掘出更可靠、更有價(jià)值的關(guān)聯(lián)規則.參與關(guān)聯(lián)規則挖掘的數據項可以沒(méi)有顯性的關(guān)聯(lián)特征,正是要通過(guò)挖掘,探討它們之間的內在聯(lián)系.

  通過(guò)對調查表的分析,我們發(fā)現各字段之間的關(guān)系可分為兩種情形.其中一種有著(zhù)內在或外在聯(lián)系,如在“教師職稱(chēng)結構與自評”中,教師年齡與教師職稱(chēng)字段之間有著(zhù)隱形的聯(lián)系,即不同年齡的教師具有不同的職稱(chēng),而教師年齡與信息技術(shù)自評、教師職稱(chēng)與信息技術(shù)自評之間的關(guān)系則是用戶(hù)所關(guān)心的問(wèn)題,這個(gè)關(guān)系需要通過(guò)研究得出.根據關(guān)聯(lián)規則的適用范圍及其目的,我們發(fā)現只有關(guān)聯(lián)規則最接近客戶(hù)的要求:通過(guò)挖掘,得出不同年齡、不同職稱(chēng)教師對自我信息技術(shù)的評價(jià),即相互間的制約、相互影響的規律.

  我們這里可以設定教師信息技術(shù)自評為預測字段,將年齡和職稱(chēng)設置成輸入字段,這樣通過(guò)挖掘,便可以得到年齡與信息技術(shù)自評、職稱(chēng)與信息技術(shù)自評的關(guān)聯(lián)規則.

  從上面的例子我們可以發(fā)現,當問(wèn)題相關(guān)的字段是不同范圍的,或者有一項是不同范圍的,則可以使用關(guān)聯(lián).

  3. 2 聚類(lèi)方法的選用

  通過(guò)聚類(lèi),人們能夠自動(dòng)發(fā)現數據集中的數據由于其各自的相似性和相異性被分成不同的類(lèi),這些類(lèi)別具有明顯的特征,進(jìn)而發(fā)現全局數據的分布模式,以及數據之間的有趣的、隱含的相互聯(lián)系[13].

  在調查表中,我們可以發(fā)現字段之間的另一種關(guān)系———各字段之間都是相對獨立,是同一個(gè)范圍的不同方面.這里以“教師多媒體軟件使用情況”問(wèn)題為例.

  該問(wèn)題包含了四個(gè)字段,分別為“使用powerpoint情況”(Ppt)、“使用flash情況”(Flash)、“使用authorware情況”(Aw)、“Photoshop制作”(Psdzz).這四個(gè)方面都是屬于教師使用多媒體軟件能力的調查,每種能力之間都是相對獨立的,而用戶(hù)關(guān)心的是發(fā)現哪些教師能夠使用哪些多媒體軟件,從而對不同教師設定進(jìn)行不同的培訓內容.根據聚類(lèi)方法的適用范圍及其方法特點(diǎn),我們發(fā)現只有聚類(lèi)方法最符合用戶(hù)的需要:通過(guò)挖掘,將教師分成若干類(lèi)別,每個(gè)類(lèi)別都有區別于其他類(lèi)別的顯著(zhù)特征,這樣使得培訓部門(mén)可以有的放矢的進(jìn)行針對性教學(xué).

  在此,我們將問(wèn)題中的每個(gè)字段都設置為輸入和預測字段.

  從上面的例子我們可以發(fā)現,當問(wèn)題相關(guān)的字段是同范圍的不同方面,則可以選擇聚類(lèi)方法進(jìn)行挖掘,得到需要的結果.

  4 數據用法的定義

  在利用SQL Server 2005 Analysis Services進(jìn)行數據挖掘時(shí),需要先指定包含據以生成模型的定型數據的數據源視圖,設置表中的項目,并指定事例表中列的用法.

  4·1 定義數據表的類(lèi)型

  在SQL Server2005 Analysis Services中,數據必須作為包含在事例表中的一系列事例提供給數據挖掘算法.不是所有的事例都可以用一行數據就可以說(shuō)明.例如一個(gè)事例可能派生自?xún)蓚(gè)表,而一個(gè)表也可以派生出兩個(gè)事例,因此Analysis Services提供了數據集的解決方法,可以表示多種數據來(lái)源方式,并提供了嵌套表方式.

  4·2 指定數據列的用法

  指定了事例表后,就可以確定要包括在挖掘結構中的表的每一列使用類(lèi)型.數據挖掘列可以為下列四種類(lèi)型之一:鍵列、輸入列、可預測列或輸入列和可預測列的組合.鍵列包含表中每個(gè)行的唯一標識符.輸入列提供據以進(jìn)行預測的信息,而預測列包含要在挖掘模型中預測的信息.

  5 建立模型

  針對教師信息素養調查表設計,我們將其分為三大部分:個(gè)人信息意識與態(tài)度、個(gè)人信息知識和技能水平、個(gè)人信息素養綜合因素以及學(xué)習目標,對于每個(gè)部分,我們僅提取每部分中的一個(gè)主要問(wèn)題進(jìn)行挖掘模型設計.

  5. 1 個(gè)人信息意識與態(tài)度的挖掘模型設計“教師職稱(chēng)結構與自評情況”挖掘模型設計

  (1)指定“列”的用法根據調查表內容,相關(guān)字段為“教師年齡”(Age)、“教師職稱(chēng)”(Zc)、“信息技術(shù)自評”(Jszp),我們通過(guò)“教師年齡”、“教師職稱(chēng)”這兩個(gè)字段來(lái)預測出教師“信息技術(shù)自評”的情況,從而了解不同層次教師的信息自我評價(jià).

  根據前面所述,在進(jìn)行挖掘時(shí),首先要指定數據源中“教師基本信息”(Grxx)為事例表,然后從中提取出“Age”、“Zc”、“Jszp”三個(gè)“列”(字段)組成挖掘結構,其中“Age”、“Zc”為“Input”屬性,“Jszp”為“Predict”屬性.

  (2)挖掘算法的選擇及其參數設置根據挖掘方法的特點(diǎn),這里采用關(guān)聯(lián)規則挖掘方法,即研究不同年齡、職稱(chēng)的教師對自我信息技術(shù)的評價(jià)情況.

  例如教師年齡=‘20 ~ 30’ 信息技術(shù)自評=‘良好’;

  教師職稱(chēng)=‘二級’ 信息技術(shù)自評=‘良好’.

  其中涉及到關(guān)聯(lián)規則挖掘算法的屬性設置,我們采用默認設置.

  5. 2 個(gè)人信息知識和技能水平的挖掘模型設計“教師多媒體軟件使用情況”挖掘模型設計

  (1)指定“列”的用法根據調查表內容,相關(guān)字段為“使用powerpoint情況”(Ppt)、“使用flash情況”(Flash)、“使用authorware情況”(Aw)、“Photoshop制作”(Psdzz),根據要求,我們指定數據源中“信息知識與技能”(Zsjn)為事例表,提取出“Ppt”、“Flash”、“Aw”、“Psdzz”四個(gè)“列”組成挖掘結構,列屬性均為“Input and Predict”.

  (2)挖掘算法的選擇及其參數設置在此我們利用挖掘,了解教師對于四種多媒體軟件的了解、掌握程度,并自動(dòng)分成具有顯著(zhù)特征的若干個(gè)類(lèi)別,然后找出每個(gè)類(lèi)別中的共性,也就是說(shuō)通過(guò)挖掘,希望能將教師進(jìn)行分類(lèi).根據前面所述,我們認為聚類(lèi)分析挖掘算法最為合適.

  根據聚類(lèi)分析挖掘算法的屬性設置,我們同樣將CLUSTER_COUNT修改為0,為了最準確地確定要生成的分類(lèi)數.

  5. 3 個(gè)人信息素養綜合因素以及學(xué)習目標的挖掘模型設計“信息化教學(xué)意識”挖掘模型設計

  (1)指定“列”的用法根據調查表內容,相關(guān)字段為“信息化教學(xué)設計重點(diǎn)”(Xxhjx)、“信息技術(shù)運用教學(xué)”(Xxjsyy)、“多媒體教學(xué)方法的運用”(Dmtjx)、“多媒體教學(xué)與傳統教學(xué)區別”(Dmtct).

  根據要求,我們指定數據源中“信息整合與應用”(Zhyy)為事例表,表4-4所示,提取出“Xxhjx”、“Xxjsyy”、“Dmtjx”、“Dmtct”四個(gè)“列”組成挖掘結構,列屬性均為“In-put and Predict”.

  (2)挖掘算法的選擇及其參數設置上述四個(gè)字段都是教師對于信息技術(shù)在教學(xué)中應用的理解以及使用情況的不同方面,我們希望通過(guò)挖掘,了解不同類(lèi)別教師的共性.根據前面所述,我們認為,聚類(lèi)分析挖掘算法最為合適.

  根據聚類(lèi)分析挖掘算法的屬性設置,我們同樣將CLUSTER_COUNT修改為0,為了最準確地確定要生成的分類(lèi)數.

  5. 4 綜述

  至此,我們已經(jīng)將整個(gè)數據挖掘模型的結構建立起來(lái),對于其中典型問(wèn)題進(jìn)行了分析,選擇了適用的挖掘方法,為其他問(wèn)題的挖掘方法選擇提供了參考,為最終結論的產(chǎn)生起到了至關(guān)重要的作用。

【學(xué)前教育師資信息素養的挖掘模型設計論文】相關(guān)文章:

素養教育論文04-07

學(xué)前教育論文【經(jīng)典】06-08

學(xué)前教育論文10-27

學(xué)前教育論文05-15

[經(jīng)典]學(xué)前教育論文06-19

學(xué)前教育論文08-07

職業(yè)素養論文(通用5篇)08-18

學(xué)前教育選題論文12-13

學(xué)前教育教育論文11-11

學(xué)前教育論文【實(shí)用】05-15

一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看