一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看

高校財務(wù)樣本數據庫研究論文

時(shí)間:2024-09-19 13:59:36 財務(wù)稅收 我要投稿

高校財務(wù)樣本數據庫研究論文

  摘要:研究了大數據算法在高校財務(wù)數據分析中的應用,提出了基于水庫抽樣算法建立樣本數據庫的方法,結果表明:基于水庫抽樣算法建立樣本數據庫,能夠大幅縮短建立時(shí)間、系統開(kāi)銷(xiāo)小、且建立完成后其內部數據具有良好的均勻特性,可有效解決傳統高校財務(wù)管理中基礎數據樣本生成時(shí)間長(cháng)、開(kāi)銷(xiāo)大、分布不均勻的缺點(diǎn),提高了財務(wù)基礎數據分析質(zhì)量,推動(dòng)了高校財務(wù)管理工作的發(fā)展。

高校財務(wù)樣本數據庫研究論文

  關(guān)鍵詞:大數據;高校財務(wù);數據分析

  大數據對高校財務(wù)管理的影響比較廣泛而深遠,它將有利于高校的資源配置,強化高校全面預算管理,加強成本核算意識,同時(shí)提高資金使用效益,防范財務(wù)風(fēng)險,使高校側重預算編制和結果分析的財務(wù)管理向業(yè)務(wù)全過(guò)程的財務(wù)管理轉變,實(shí)現高校財務(wù)管理新變革。大數據為高校財務(wù)管理帶來(lái)變革的關(guān)鍵特性之一是其預測性作用,傳統財務(wù)利用財務(wù)報表和人為經(jīng)驗為高校財務(wù)管理者提供決策依據,隨著(zhù)海量數據的產(chǎn)生,此種方式已不能在合理的時(shí)間范圍內產(chǎn)生合理性的判斷依據,遠不能達到目前高校財務(wù)管理精細化要求,更偏離信息化時(shí)代所強調的信息支持決策的發(fā)展方向。從目前高校財務(wù)管理實(shí)際來(lái)看,基礎數據的分析是關(guān)鍵,而數據更新及時(shí)、均勻特性好的樣本數據庫是進(jìn)行分析的前提條件。但由于受到高校財務(wù)數據多等因素限制,傳統財務(wù)的線(xiàn)性?huà)呙杼幚矸椒o(wú)法對基礎數據進(jìn)行快速均勻的抽取處理,導致了高校財務(wù)數據分析工作上的困難,不利于高校財務(wù)管理工作的開(kāi)展。應用大數據對數據進(jìn)行全面分析,遵循的是每件事情都有跡可循,找到事物變化的規律,能夠更好地對高校資源籌劃、資本運營(yíng)、資產(chǎn)管理以及當前辦學(xué)和長(cháng)期的規劃進(jìn)行預測,把握高校發(fā)展方向,使教育產(chǎn)出能更好地適應市場(chǎng)需求,合理配置資源,提高經(jīng)濟與社會(huì )效益,實(shí)現高?缭绞娇沙掷m發(fā)展。大數據技術(shù)的出現,為高校財務(wù)數據分析工作提供了新的技術(shù)手段,文中將大數據算法與高校財務(wù)數據分析進(jìn)行結合與應用,在保證速度的前提下,建立具有良好均勻特性的樣本數據庫。

  1樣本數據庫

 。保睌祿䦷鞓嫾

  數據挖掘與分析是大數據在教育領(lǐng)域中的應用之一,其主要作用是進(jìn)行預測分析、行為分析、學(xué)業(yè)分析等的應用和研究。其中財務(wù)數據分析能夠為學(xué)生心理健康、獎優(yōu)助評、貧困生關(guān)懷、個(gè)性化就業(yè)等領(lǐng)域提供數據參考。為了實(shí)現數據的有效收集,應建立財務(wù)基礎數據樣本數據庫,為下一步數據分析提供有力支持,其總體架構為:傳統財務(wù)通常利用線(xiàn)性?huà)呙枧c隨機選取的方法進(jìn)行樣本數據抽取,抽取過(guò)程中需要將所有數據加載進(jìn)內存或緩存,同時(shí)在索引遞增的同時(shí)利用隨機函數生成索引用于確定抽取元素。數據加載和隨機索引生成帶來(lái)了大量的系統開(kāi)銷(xiāo),同時(shí)如果隨機算法的選擇并不優(yōu)秀,還會(huì )導致樣本的重復概率增加。為解決上述問(wèn)題,文中利用水庫抽樣算法作為樣本數據抽取的基礎算法,該算法打破了傳統財務(wù)線(xiàn)性的時(shí)間處理局限,在未損失精度的前提下,提供傳統財務(wù)所不能提供的海量數據樣本生成能力。樣本數據庫除了數據抽取功能之外,還要求具有數據的統計分類(lèi)和序列化功能。對樣本數據進(jìn)行統計分類(lèi)可以實(shí)現按類(lèi)別和權重的樣本抽取,從而豐富大數據分析的手段。同時(shí)通過(guò)對樣本數據進(jìn)行統計分類(lèi),還能解決基礎數據的序列化問(wèn)題。序列化通過(guò)為分類(lèi)數據添加指定索引,可以大大提升數據的檢索速度和準確性。所以,做好樣本數據的統計分類(lèi),并按照財務(wù)管理信息類(lèi)別對基礎數據進(jìn)行合理的序列化對數據處理是十分必要的。對樣本數據進(jìn)行分類(lèi)和序列化之后,可對每一類(lèi)數據進(jìn)行必要的統計,總結樣本數據特點(diǎn),把握樣本數據處理原則,提高樣本數據的處理質(zhì)量。

 。保矓祿䦷鞌祿䴓颖咎幚砹鞒

  2數據庫抽樣算法及其改進(jìn)

 。玻睌祿䦷炀(xiàn)性抽樣算法

  在盡可能快的時(shí)間內,對基礎數據庫中的學(xué)生進(jìn)行盡力均勻抽取,形成樣本用于數據分析。盡力均勻抽取意味著(zhù)盡力保證每個(gè)學(xué)生被抽為樣本的概率是相同的。輸入:基礎數據庫中的學(xué)生數據。輸出:這組數據的k個(gè)均勻取樣。

 。玻菜畮斐闃铀惴ǘx

  針對應用情景,可以利用水庫抽樣算法進(jìn)行樣本抽取,該算法的特征為:1)抽取時(shí)限要求較高,且數據只掃描一次。2)利用計算機資源有限,只為用戶(hù)想要獲取的k個(gè)取樣分配內存空間用于計算。3)掃描前n個(gè)數據時(shí),已保存的k個(gè)取樣是均勻抽取的,隨著(zhù)n的增長(cháng),k個(gè)取樣的隨機性一直不變。算法定義為:1)申請一個(gè)長(cháng)度為k的數組A保存抽樣。2)保存首先接收到的k個(gè)元素。3)當接收到第i個(gè)新元素t時(shí),以k/i的概率隨機替換A中元素。

 。玻掣倪M(jìn)算法均勻性證明

  該算法的取樣是均勻的,在任何時(shí)候接收到大于k的n個(gè)數時(shí),選出的k個(gè)數一定是已掃描數據中的均勻抽。寒斀邮盏降冢椋眰(gè)數時(shí),第i個(gè)數能保存在數組中的概率為1-1i+()1,因為在接收到第i+1個(gè)數的時(shí)候要以ki+()1的概率隨機替換。而第i個(gè)數被選中的概率是1k,他們相乘為1i+1,1i+1就是第i個(gè)數被換出數組的概率。所以1-1i+()1就是在接收i+1個(gè)元素時(shí),第i個(gè)數在數組中的概率。同理在接收第i+2個(gè)數時(shí),第i個(gè)數仍然保存在數組中的概率為1-1i+()2,以此類(lèi)推,接收第n個(gè)數時(shí),第i個(gè)元素仍保存在數組中的概率為1-1()n,如果上述事件都發(fā)生,那么在接收第n個(gè)數時(shí),第i個(gè)數才能保存在數組中,因此它保留在抽樣數組中的概率是這些時(shí)間發(fā)生概率的積,就是k()i×1-1i+()1×1-1i+()2×…×1-1()n=kn。

 。玻此惴▽(shí)現

  算法實(shí)現的偽代碼為:初始化:A[k]←;處理j:foreachi≠EOFdoifi<kthenA[i]←value(i)elsej=random(1,i)ifj≤kA[j]←value(i)i←i+1

  3實(shí)證結果分析

  財務(wù)流程中,對于業(yè)務(wù)數據的時(shí)效性有較高要求,處理算法的優(yōu)劣直接影響執行算法主機的系統開(kāi)銷(xiāo),從而影響整個(gè)財務(wù)流程的運轉速度。為對比傳統線(xiàn)性?huà)呙杷惴ê退畮斐闃铀惴ǖ南到y開(kāi)銷(xiāo),對兩種算法進(jìn)行了程序實(shí)現,設定樣本規模為3000并進(jìn)行了樣本抽取,2種抽取算法帶來(lái)的系統開(kāi)銷(xiāo)對比如圖(3)所示,可見(jiàn)傳統線(xiàn)性?huà)呙桦S數據量級的上升系統開(kāi)銷(xiāo)不斷增大,而水庫抽樣則穩定在樣本規模時(shí)的臨界值。傳統的利用隨機數確定抽樣元素,隨機函數利用時(shí)間等作為種子產(chǎn)生隨機數,雖保證了隨機性,但不能保證樣本抽取的均勻特性,而水庫抽樣彌補了傳統方法的這個(gè)缺陷,圖(4)展示了部分抽樣結果。

  4結語(yǔ)

  大數據環(huán)境中,高校財務(wù)數據的數量級不斷提升,因此基礎數據的分析成為難點(diǎn)。而樣本數據庫作為基礎數據分析的必要支撐,其建立生成尤為重要。通過(guò)本文的分析可知,大數據技術(shù)的出現,給了均勻、快速的樣本生成以新的手段支持,為在允許的時(shí)間與精度范圍內的分析提供了依據。本文提供了基礎數據樣本數據庫的建立思路,在樣本數據庫的基礎上利用水庫抽樣算法進(jìn)行抽樣,作者對上述思路進(jìn)行了程序實(shí)現并提供了試驗結果。該應用手段解決了高校財務(wù)管理中基礎數據樣本來(lái)源困難,提高了財務(wù)基礎數據分析質(zhì)量,豐富了高校財務(wù)分析工作手段。

  參考文獻:

 。郏保蓓n丹丹。大數據時(shí)代下高校財務(wù)管理如何做好基礎數據的分析[J]。財務(wù)管理,2015(18):82。

 。郏玻堇柩;诟咝X攧(wù)管理問(wèn)題的調查與對策研究[D]。長(cháng)春:吉林大學(xué),2014:10-20。

 。郏常菅Τ幍;跊Q策樹(shù)算法的高校財務(wù)管理與決策分析研究[D]。銀川:寧夏大學(xué),2015:4-11。

 。郏矗萃鹾曛。大數據算法[M]。北京:機械工業(yè)出版社,2015:29-57。

 。郏担萃踉,靳小龍,程學(xué)旗。網(wǎng)絡(luò )大數據:現狀與展望[J]。計算機學(xué)報,2013(6):1126-1138。

 。郏叮輰O大為,張廣艷,鄭緯民。大數據流式計算:關(guān)鍵技術(shù)及系統實(shí)例[J]。軟件學(xué)報,2014,25(4):839-862。

 。郏罚輻铎o,張楠男,李建,等。決策樹(shù)算法的研究與應用[J]。計算機技術(shù)與發(fā)展,2010(20):115。

 。郏福蓐悥|。淺談高校財務(wù)決策支持系統及其構建[J]。財會(huì )通訊:綜合(上),2011(6):126-127。

 。郏梗荩牛蹋危桑耍牛裕伲,ELSAYEDT,RAMADANHE。iHadoop:asynchronousiterationsforMapReduce[C]//CloudComputingTechnologyandScience(CloudCom),2011IEEEThirdInternationalConferenceon。IEEE,2011:81-90。

 。郏保埃菝蠞。數據挖掘在高校財務(wù)中的應用[J]。軟件導刊,2008(7):14-15。

 。郏保保莨t,劉經(jīng)南,方媛,等。位置大數據的價(jià)值提取與協(xié)同挖掘方法[J]。軟件學(xué)報,2014,25(4):713-730。

 。郏保玻萃跎,王會(huì )舉,覃雄派。架構大數據:挑戰、現狀與展望[J]。計算機學(xué)報,2011,34(10):1741-1752。

 。郏保常菝闲》,慈祥。大數據管理:概念、技術(shù)與挑戰[J]。計算機研究與發(fā)展,2013,50(1):146-169。

【高校財務(wù)樣本數據庫研究論文】相關(guān)文章:

高校體育教育研究論文3篇03-15

高校體育能力本位教育研究論文02-20

高校英語(yǔ)項目教學(xué)法研究論文03-13

高校公共體育教學(xué)質(zhì)量研究論文02-17

淺談高校教育教學(xué)改革的研究論文03-25

論文致謝樣本12-05

高校聲樂(lè )教育課程體系研究論文12-01

高校體育文化課程體系研究論文03-15

高校教學(xué)管理工作研究的論文12-07

  • 相關(guān)推薦
一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看