一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看

隱私保護的經(jīng)濟統計信息發(fā)布經(jīng)濟論文

時(shí)間:2025-09-14 08:03:03 經(jīng)濟畢業(yè)論文

隱私保護的經(jīng)濟統計信息發(fā)布經(jīng)濟論文

  1引言

隱私保護的經(jīng)濟統計信息發(fā)布經(jīng)濟論文

  21世紀以來(lái),隨著(zhù)信息技術(shù)的進(jìn)步和互聯(lián)網(wǎng)的廣泛應用,信息共享已成為人們日常工作、生活和學(xué)習中的普遍行為。政府部門(mén)、社會(huì )團體和個(gè)人的統計信息大量涌現,信息數據收集的種類(lèi)和數量呈指數級增長(cháng)。與此同時(shí),國家和有關(guān)部門(mén)制定了有關(guān)信息安全的法規及相關(guān)制度,輿論媒體對統計數據的關(guān)注度和要求也越來(lái)越高,但有關(guān)國民經(jīng)濟的各種統計數據因存在虛假和泄露隱私受到質(zhì)疑的情況卻時(shí)有發(fā)生。大量的隱私數據發(fā)布和共享已經(jīng)對隱私和信息安全構成威脅,隱私數據的泄露已成為急待解決的問(wèn)題[1]。如何保證隱私數據在發(fā)布或使用時(shí)不被對應到特定人和特定部門(mén)已成為一個(gè)研究熱點(diǎn)。

  統計信息通過(guò)分析統計數據得到,統計數據按屬性可分為4類(lèi):① 能直接識別個(gè)體身份信息的顯式標志符(EiD),如身份證號、姓名、社會(huì )保險代碼等;② 有助識別個(gè)體信息身份的準標志符(QID),如一些組合屬性;③ 敏感屬性(SA),即隱私信息;④ 非敏感屬性(NSA),即非上述3類(lèi)的其他屬性。本文所述的隱私保護主要是指對統計數據中個(gè)人敏感信息的安全保護,是防止不法分子對個(gè)人敏感信息非法竊取的私有信息保護[2]。隱私攻擊者除了能訪(fǎng)問(wèn)發(fā)布的統計數據表外,還可能通過(guò)文獻資料、技術(shù)文檔等獲得發(fā)布的統計數據表中所采用的隱私模型和實(shí)現算法等。我們假定攻擊者可能獲得的數據信息統稱(chēng)為背景知識。通常攻擊者都是從背景知識中獲得目標對象的QID屬性(如出生日期、性別、出生地、郵政編碼等)。

  用戶(hù)對經(jīng)濟統計數據的第一要求是查詢(xún)結果必須準確。從這個(gè)前提出發(fā),本文提出一種基于交互的序列表發(fā)布模型,它能保證敏感信息不泄露,同時(shí)又能最大程度地減少統計數據的信息損失,提高統計數據的效用。實(shí)驗結果表明,該模型對于大數據集的隱私能很好地進(jìn)行保護,而且丟失的重要信息少,能夠滿(mǎn)足統計數據發(fā)布的需要。

  2隱私保護模型

  為了解決隱私保護問(wèn)題,國內外研究者提出了很多方法,這些方法主要有:① 匿名保護。為了保護個(gè)人信息,在數據發(fā)布時(shí),對能夠直接標識個(gè)人身份的標識符進(jìn)行刪除或加密。② 擾亂、隨機化數據技術(shù)。通過(guò)對數據的隨機化處理,增加數據“噪聲”,使得數據不再反映真實(shí)的世界,從而無(wú)法被濫用而侵犯個(gè)人隱私。當然,關(guān)鍵的技術(shù)是要從處理后的數據中獲得有效的分析結果。③ 分布式的隱私保護技術(shù)。雙方或多方進(jìn)行數據分析挖掘時(shí),由于某種原因,參與者不愿將數據與他人共享而只愿共享數據分析挖掘結果。這需要運用密碼學(xué)技術(shù)來(lái)解決實(shí)際的隱私問(wèn)題。如安全兩方或多方計算問(wèn)題等。④ k-匿名技術(shù)。它要求在公布后的數據中保留一定數量的個(gè)體特征,從而防止匿名處理后的數據被鏈接攻擊,造成個(gè)人隱私泄露。

  研究者們根據隱私保護方法建立了很多隱私信息保護發(fā)布模型,如k-匿名模型[3]、L-多樣性模型[4]、t-closness框架[5]和個(gè)性化匿名模型[6]等。這些隱私保護模型都是針對可能存在隱私泄露建立的。

  3基于統計應用的交互序列發(fā)布模型及算法

  3.1序列發(fā)布模型

  隱私保護模型實(shí)際是利用好的數據發(fā)布方法來(lái)保護隱私,使用最多的算法是泛化或有損連接(降低QID和SA兩者之間的聯(lián)系)[7]。在一些統計分析中,需要進(jìn)行聯(lián)合查詢(xún),用戶(hù)對統計數據進(jìn)行查詢(xún)最重要的要求是查詢(xún)結果準確,這樣發(fā)布的數據才有較高的應用價(jià)值。而匿名化技術(shù)將發(fā)布的數據表中涉及個(gè)體的標志屬性刪除了,因此降低了QID屬性和SA之間的聯(lián)系,無(wú)法得到用戶(hù)關(guān)心的準確查詢(xún)結果。在對應用查詢(xún)的實(shí)際需求和大量實(shí)際數據集的QID屬性的統計中發(fā)現,應用查詢(xún)中所涉及的QID屬性數目一般只有3個(gè)左右,而原始數據集中一般都存在大量滿(mǎn)足匿名要求的數據記錄,且所占比例跟QID的數目存在密切的關(guān)系。例如一個(gè)人口統計的實(shí)際數據集共有14 種屬性,記錄約4萬(wàn)條,其中QID的全部組合數目為9。在k-匿名模型中,當k = 20,QID數目為3時(shí),其平均滿(mǎn)足k-匿名的記錄比例可高達85%,而QID數目為全部組合時(shí)滿(mǎn)足k-匿名的記錄比例只有5%左右;當k = 2,QID數目為全部組合時(shí),滿(mǎn)足k-匿名的記錄比例只有40%左右。由此可見(jiàn),如果將所有的QID屬性捆綁在一起進(jìn)行匿名,必然會(huì )導致大量記錄的QID屬性和SA被割斷。

  本文提出一種基于用戶(hù)應用查詢(xún)的序列發(fā)布模型,將滿(mǎn)足k-匿名的記錄按照QID數目由高到低分成一組序列表進(jìn)行發(fā)布。首先發(fā)布屬性包含了全部QID組合和SA的記錄,然后將QID數減少一個(gè),發(fā)布屬性包含QID組合和SA的剩余記錄。如此類(lèi)推,直到最后QID的數目減少為3,再將這些剩余記錄按照屬性為3個(gè)QID和SA泛化發(fā)布,從而提高泛化表的查準率。

【隱私保護的經(jīng)濟統計信息發(fā)布經(jīng)濟論文】相關(guān)文章:

經(jīng)濟論文06-07

經(jīng)濟論文經(jīng)典[12篇]09-08

農村經(jīng)濟論文04-07

保護隱私安全小知識04-15

經(jīng)濟論文合集15篇06-08

經(jīng)濟論文范例15篇06-10

淺談循環(huán)經(jīng)濟論文2篇10-06

關(guān)于新時(shí)期水管單位的經(jīng)濟論文04-07

寵物經(jīng)濟論文范文兩篇09-06

論隱私權的法律保護民法論文06-25

一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看