大數據與統計學(xué)分析方法比較論文
現如今,大家總免不了要接觸或使用論文吧,論文是對某些學(xué)術(shù)問(wèn)題進(jìn)行研究的手段。那么你知道一篇好的論文該怎么寫(xiě)嗎?下面是小編收集整理的大數據與統計學(xué)分析方法比較論文,歡迎大家分享。

基于理念分析和比較研究方法,對大數據的分析方法和傳統統計學(xué)分析方法的關(guān)聯(lián)性和差異進(jìn)行了對比分析,從方法的基本思想、量化形式、數據來(lái)源、分析范式、分析方法、分析視角等角度揭示了兩種社會(huì )科學(xué)分析方法存在的聯(lián)系與差異。
隨著(zhù)信息技術(shù)的日益發(fā)展與普及,信息以及數據在社會(huì )經(jīng)濟發(fā)展過(guò)程中發(fā)揮的作用越來(lái)越重要,F如今,“大數據”時(shí)代已經(jīng)來(lái)臨,于是如何更有效地利用數據快速做出科學(xué)決策也已成為眾多企業(yè)甚至是國家所共同關(guān)注的焦點(diǎn)問(wèn)題。在數據處理和分析方法方面,《統計學(xué)》以及在其基礎上發(fā)展而來(lái)的實(shí)證統計方法是當前的主流,這些方法可以幫助數據持有者從大量的數據中挖掘有價(jià)值的信息,并為其相關(guān)決策提供理論支撐和方法支持。然而,傳統的實(shí)證統計方法在最新出現的大數據情境下,卻呈現出了諸多缺陷,例如傳統數據收集方法無(wú)法實(shí)現大規模(甚至是總體)數據的收集,傳統統計方法和分析軟件無(wú)法處理大規模數據,等等。于是,在將傳統統計學(xué)方法應用于最新的大數據情境和問(wèn)題之前,需要首先明確大數據所要求的處理方法與傳統的統計學(xué)處理方法存在哪些關(guān)聯(lián)和區別,然后才能夠決定是否可以應用既有統計學(xué)理論和方法來(lái)處理某些大數據問(wèn)題。
1、大數據的界定
根據一位美國學(xué)者的研究,大數據可以被定義為:it means data that’s too big, too fast, or too hard for existing tools to process。也就是說(shuō),該學(xué)者認為:在關(guān)于大數據的所有定義中,他傾向于將之定義為那類(lèi)“太大”、“太快”,或現存工具“太難”處理的數據。一般而言,大數據的特征可以概括為四個(gè)V:一是量大(Volume);二是流動(dòng)性大(Velocity),典型的如微博;三是種類(lèi)多(Variety),多樣性,有結構化數據,也有半結構化和非結構化數據;四是價(jià)值大(Value),這些大規模數據可以為持有企業(yè)或者組織創(chuàng )造出巨大的商業(yè)或社會(huì )價(jià)值。
Victor在其最新著(zhù)作《大數據時(shí)代——生活、工作與思維的大變革》中指出,大數據時(shí)代,思維方式要發(fā)生3個(gè)變革:第一,要分析與事物相關(guān)的所有數據,而不是依靠分析少量數據樣本;要總體,不要樣本。第二,要樂(lè )于接受數據的紛繁復雜,而不再追求精確性。第三,不再探求難以捉摸的因果關(guān)系,應該更加注重相關(guān)關(guān)系。這些變革反映出了大數據處理方式與傳統統計學(xué)分析方法的很多關(guān)聯(lián)以及主要不同。因此,下面我們分別針對兩者的聯(lián)系和區別進(jìn)行討論。
2、大數據與統計學(xué)分析方法的聯(lián)系
從18世紀中葉至今,統計學(xué)已經(jīng)經(jīng)歷了兩百多年的發(fā)展歷程,不論是基礎理論還是社會(huì )應用都極其堅實(shí)而豐富。大數據作為一種新興的事物規律認知和挖掘思維,也將會(huì )對人類(lèi)的價(jià)值體系、知識體系和生活方式產(chǎn)生重要影響,甚至引發(fā)重大改變。作為兩種認知世界和事物規律的基本方法,它們在以下兩個(gè)方面存在緊密關(guān)聯(lián)。
。1)挖掘事物規律的基本思想一致。統計學(xué)(statistics)探索事物規律的基本方法是:通過(guò)利用概率論建立數學(xué)模型,收集所觀(guān)察系統的數據,進(jìn)行量化分析和總結,做出推斷和預測,為相關(guān)決策提供依據和參考。對于大數據,維克托指出,大數據思維的來(lái)臨使人類(lèi)第一次有機會(huì )和條件,在非常多的領(lǐng)域和非常深入的層次獲得和使用全面數據、完整數據和系統數據,深入探索現實(shí)世界的規律,獲取過(guò)去不可能獲取的知識。通過(guò)這兩個(gè)定義可以看出,不論是傳統的統計學(xué)方法還是新興的大數據分析方法,都是以數據為基礎來(lái)揭示事物特征以及發(fā)展趨勢的。
。2)均采用量化分析方式。大數據分析的基礎是數據化,也就是一種把各種各樣現象轉變?yōu)榭芍票矸治龅牧炕问降倪^(guò)程。不論是傳統統計學(xué)中所應用的數據(定性和定量數據),還是大數據時(shí)代即將被轉化和采用其他形式數據(如文字、圖像等),最終都是通過(guò)量化分析方法來(lái)揭示數據中所蘊含的事物特征與發(fā)展趨勢。
3、大數據與統計學(xué)分析方法的區別
。1)基礎數據不同。在大數據時(shí)代,我們可以獲得和分析更多的數據,有時(shí)候甚至可以處理和某個(gè)特別現象相關(guān)的所有數據,而不再依賴(lài)于隨機抽樣。這意味著(zhù),與傳統統計學(xué)數據相比,大數據不僅規模大,變化速度快,而且數據來(lái)源、類(lèi)型、收集方法都有根本性變化。
、僭跀祿䜩(lái)源方面,在大數據背景下,我們需要的紛繁多樣的數據可以分布于全球多個(gè)服務(wù)器上,因此我們可以獲得體量巨大的數據,甚至是關(guān)于總體的所有數據。而統計學(xué)中的數據多是經(jīng)由抽樣調查而獲得的局部數據,因此我們能夠掌握的事“小數據量”。這種情況下,因為需要分析的數據很少,所以必須盡可能精確的量化我們的數據。綜上,大數據情況下,分析人員可以擁有大量數據,因而不需要對一個(gè)現象刨根問(wèn)底,只需要掌握事物大體的發(fā)展方向即可;然而傳統的小數據情況下則需要十分注意所獲得數據的精確度。
、谠跀祿(lèi)型與收集方面,在既往模式下,數據的收集是耗時(shí)且耗力的,大數據時(shí)代所提出的“數據化”方式,將使得對所需數據的收集變得更加容易和高效。除了傳統的數字化數據,就連圖像、方位、文本的字、詞、句、段落等等,世間萬(wàn)物都可以成為大數據范疇下的數據。屆時(shí),一切自然或者社會(huì )現象的事件都可以被轉化為數據,我們會(huì )意識到本質(zhì)上整個(gè)世界都是由信息構成的。
。2)分析范式不同。在小數據時(shí)代,我們往往是假想世界是如何運行的,然后通過(guò)收集和分析數據來(lái)驗證這種假想。也就是說(shuō),傳統統計實(shí)證分析的基本范式為:(基于文獻)提出理論假設—收集相關(guān)數據并進(jìn)行統計分析—驗證理論假設的真偽。然而,在不久的將來(lái),我們將會(huì )在大數據背景下探索世界,不再受限制于傳統的思維模式和特定領(lǐng)域里隱含的固有偏見(jiàn),我們對事物的研究始于數據,并可以發(fā)現以前不曾發(fā)現的聯(lián)系。換言之,大數據背景下,探索事物規律的范式可以概括為:數據觀(guān)察與收集——數據分析——描述事物特征/關(guān)系。
。3)數據分析方法不同。傳統統計學(xué)主要是基于樣本的“推斷分析”,而大數據情境下則是基于總體數據的“實(shí)際分析”,即直接得出總體特征,并可以分析出這些特征出現的概率。
。4)分析視角不同。傳統的實(shí)證統計意在弄清事物之間的內在聯(lián)系和作用機制,但大數據思維模式認為因果關(guān)系是沒(méi)有辦法驗證的,因此需要關(guān)注的是事物之間的相關(guān)關(guān)系。大數據并沒(méi)有改變因果關(guān)系,但使因果關(guān)系變得意義不大,因而大數據的思維是告訴我們“是什么”而不是“為什么”。換言之,大數據思維認為相關(guān)關(guān)系盡管不能準確地告知我們某事件為何會(huì )發(fā)生,但是它會(huì )提醒我們這件事情正在發(fā)生,因此相關(guān)關(guān)系的發(fā)現就可以產(chǎn)生經(jīng)濟和社會(huì )價(jià)值了。
4、結語(yǔ)
綜上,相對于傳統而言,大數據思維主要包括三個(gè)重大轉變。首先,要分析與某事物相關(guān)的所有數據,而不是依靠分析捎來(lái)能夠的數據樣本;其次,研究人員應樂(lè )于接受數據的紛繁復雜,而不再追求精確性;最后,認知世界的思想發(fā)生了轉變,不再探求難以捉摸的因果關(guān)系,轉而關(guān)注事物的相關(guān)關(guān)系。以上三個(gè)轉變構成了大數據思維的核心。在統計學(xué)的進(jìn)一步應用和發(fā)展完善過(guò)程中,需要結合以上轉變所產(chǎn)生的挑戰,思考有效的統計學(xué)發(fā)展對策。
【大數據與統計學(xué)分析方法比較論文】相關(guān)文章:
數據分析報告07-15
數據分析報告03-26
數據分析報告通用12-15
數據分析個(gè)人報告12-20
個(gè)人的數據分析報告10-27
銷(xiāo)售數據分析報告07-10
數據分析報告優(yōu)秀09-10
關(guān)于店鋪數據分析報告01-03
數據分析工作總結10-10
數據分析報告(通用21篇)12-22