宮頸癌多階段多途徑演進(jìn)的樹(shù)模型構建論文
目的 基于宮頸癌比較基因組雜交資料構建宮頸癌的樹(shù)模型,探討宮頸癌發(fā)展演進(jìn)的多途徑模式。 方法 根據收集的58例宮頸癌完整比較基因組雜交資料,利用Desper等建立的腫瘤樹(shù)模型軟件平臺,構建宮頸癌的樹(shù)模型。 結果 宮頸癌樹(shù)模型提示,有6個(gè)非隨機的染色體擴增或者缺失事件發(fā)生在宮頸癌變過(guò)程中:+1q,+3q,+5p,+17q,+20q和+20p,其中+3q和+1q可能是宮頸癌癌變中的重要早期事件;+3q要先于+17q發(fā)生,并且兩者之間可能存在先后依存關(guān)系;而且,+1q可能是一個(gè)相對獨立發(fā)生的事件;這些擴增染色體上可能存在與宮頸癌發(fā)生、發(fā)展演進(jìn)密切相關(guān)的瘤基因。結論 基于比較基因組雜交資料構建的宮頸癌樹(shù)模型,提示宮頸癌多階段、多途徑的發(fā)展演進(jìn)模式,也為后續宮頸癌相關(guān)基因的探索指明了方向。Abstract:Objective Based on CGH(comparative genomic hybridization, CGH) data, to construct tree model of cervical carcinoma and to explore multipathway model of cervical carcinoma progression. Methods Using the software which Desper et al developed, tree models of cervical carcinoma were constructed according to the CGH data of 58 cervical carcinoma patients. Results Tree models for cervical carcinoma suggested that there were +1q,+3q,+5p,+17q,+20q and +20p six nonrandom genetic events, and +1q and +3q might be important early events in cervical carcinogenesis, indicating that there might be cancer?related genes in these chromosomal arms. As changes of +3q occurred prior to those of +17q, there might be some cause?effect relationship. The changes of +1q might be a independent genetic event. Conclusion Tree models based on CGH data of cervical carcinoma imply its’ multistep and multipathway progression and direct how to searching for cervical cancer?related genes.
Key words:cervical carcinoma; comparative genomic hybridization;tree model
腫瘤的發(fā)生發(fā)展是基因改變不斷發(fā)生、不斷累積的結果。那么,在腫瘤發(fā)生發(fā)展過(guò)程中,基因改變的模式如何呢?1988年,Vogelstein等[1]首次提出了結直腸癌演進(jìn)的經(jīng)典模型,即結直腸癌的演進(jìn)由4個(gè)遺傳事件以鏈式模式發(fā)展的,即路徑模型:染色體5q上APC基因的缺失或突變;12p上K?ras基因的突變;18q上DCC基因的缺失;17p上p53基因的缺失或突變。第一個(gè)事件的發(fā)生能增加第二個(gè)事件發(fā)生的概率,第二個(gè)事件的發(fā)生能增加第三個(gè)事件發(fā)生的概率,依次類(lèi)推。這些基因改變一旦發(fā)生,就是一個(gè)不可逆的發(fā)展演進(jìn)過(guò)程。腫瘤演進(jìn)的經(jīng)典路徑模型對于確定腫瘤早期診斷或治療的相關(guān)基因位點(diǎn)具有重要價(jià)值。于是,人們試圖在其他腫瘤的演進(jìn)過(guò)程中找到與結直腸癌類(lèi)似的路徑模型,但是,都沒(méi)有成功[2]。事實(shí)上,在腫瘤的發(fā)展演進(jìn)過(guò)程中,遺傳物質(zhì)的改變不會(huì )總是按照一定的順序、沿著(zhù)一條路徑發(fā)生,而且,即使在臨床上或者病理學(xué)上認為同質(zhì)的腫瘤,其本身存在異質(zhì)性[3]。因此,探索不依賴(lài)于單純線(xiàn)性演進(jìn)的腫瘤發(fā)展模型是很有必要的。Desper等[4,5]提出了反應腫瘤異質(zhì)性的腫瘤發(fā)生發(fā)展的兩種進(jìn)化樹(shù)模型,即分枝樹(shù)和距離樹(shù)。為此,本研究利用Desper等基于比較基因組雜交(comparative genomic hybridization,CGH)資料建立的樹(shù)模型軟件并加以改進(jìn),對58例宮頸癌患者(其中包括4種宮頸癌細胞株)的CGH資料進(jìn)行了分析,構建了宮頸癌發(fā)展演進(jìn)的樹(shù)模型。
1 材料與方法
1.1 材料
收集了58例宮頸癌完整CGH檢測資料,其中FIGO分期Ⅰ期21例,Ⅱ期14例,Ⅲ期16例,Ⅳ期3例,還有4種宮頸癌細胞株的CGH資料[6-9]。
1.2 事件的選擇
CGH檢測的結果是一個(gè)關(guān)于染色體拷貝數量改變(copy number aberrations,CNAs)的遺傳事件集。本文利用最常用的Brodeur法[10]選擇一組非隨機事件,Brodeur法假設擴增和丟失的機會(huì )均等,并與染色體臂長(cháng)成正比[11]。構建樹(shù)模型的數據是一系列的染色體擴增和丟失,一例病人對應一行數據,記錄的是染色體臂水平擴增和丟失。人類(lèi)有22對常染色體和X、Y兩條性染色體,所有染色體都有長(cháng)臂q,而13、14、15、21、22號染色體短臂p很短,本文排除了這5個(gè)染色體短臂,還忽略了1p、16p、19p、19q和22q這5個(gè)染色體臂,因為這些區域富含胞嘧啶和鳥(niǎo)嘌呤,易出現假陽(yáng)性;另外,還忽略了Y染色體,因為其短且很少改變。這樣就剩下36條染色體臂需要分析,而每條染色體臂都有可能擴增或丟失,因此,總共有72個(gè)可能事件。
1.3 樹(shù)模型
1.3.1 分枝樹(shù)(branching trees)
Desper等人[4]利用基于計算機技術(shù)的最大權重分枝方法提出的一種重構腫瘤發(fā)生發(fā)展的樹(shù)模型方法,并稱(chēng)這種樹(shù)模型為分枝樹(shù)。該模型把一個(gè)節點(diǎn)作為根(root),而其他的每個(gè)節點(diǎn)都代表一個(gè)遺傳事件。在一個(gè)樹(shù)枝上,i>j表示一種假說(shuō)的因果關(guān)系,即事件i的出現使得事件j的發(fā)生更為可能。分枝樹(shù)實(shí)際上是Vogelstein路徑模型的泛化,也就是將腫瘤發(fā)生的一條路徑模型轉化為多條路徑模型(multiple pathways),一個(gè)樹(shù)干即為一條路徑,更直觀(guān)地體現了腫瘤的異質(zhì)性。分枝樹(shù)提示:(1)靠近樹(shù)根的事件可能是早期事件,也可能是因為與其他事件的發(fā)生相關(guān)性不大而置于近根部;(2)在一個(gè)樹(shù)枝(edge)上按順序走向的事件有可能存在因果關(guān)系;(3)集聚在樹(shù)的分枝(subtree)下的事件可以作為腫瘤亞型(subclass)的標志。
1.3.2 距離樹(shù)(distance?based trees)
Desper等人[5]利用現有的系統發(fā)育算法建立另一種樹(shù)模型。該模型把所有的事件都作為葉子,同時(shí)把隱含的、未命名的事件作為內在節點(diǎn)。該模型的另一個(gè)不同點(diǎn)是,樹(shù)中的每一個(gè)樹(shù)枝都有長(cháng)度,因此,基于這種方法建立的樹(shù)模型被稱(chēng)作距離樹(shù)。從根到其他事件i的距離為?log (pi), 其中pi是事件i的觀(guān)察概率,可見(jiàn),事件i的觀(guān)察概率越大,它離樹(shù)根的距離越近,即越早發(fā)生。距離樹(shù)提示:(1)靠近根的事件是早期事件;(2)集聚在樹(shù)的分枝(subtree)下的事件可以作為腫瘤的亞型(subclass)標志。
1.4 統計學(xué)分析
用SPSS10.0 for windows統計軟件包進(jìn)行χ2檢驗, 當n<40 或頻數<1 時(shí),用確切概率法。
2 結 果
2.1 宮頸癌發(fā)展演進(jìn)樹(shù)模型的構建
宮頸癌樹(shù)模型見(jiàn)圖1。從分枝樹(shù)模型可以看出,+1q和+3q可能是宮頸癌癌變較早期事件,+1q是相對較獨立的事件,+3q的出現可能導致+17q的發(fā)生,而+17q的發(fā)生又將促進(jìn)+20q的發(fā)生,+20q的發(fā)生必將增加+5p、+20p出現的概率。從距離樹(shù)可以清楚地得出+3q是宮頸癌發(fā)生發(fā)展過(guò)程中較重要的早期事件。
2.2 宮頸癌中非隨機染色體事件的統計分析
58例宮頸癌(其中4個(gè)細胞株)樣本中,+1q,+3q,+5p,+17q,+20q和+20p分布見(jiàn)表2,各染色體臂改變的頻率如下:+1q為36.2%;+3q為70.7%;+5p為20.0%;+17q為24.1%;+20q為15.5%;+20p為15.5%。表1 宮頸癌6個(gè)非隨機染色體事件分布情況(略)
2.3 根據宮頸癌樹(shù)模型可以看出,宮頸癌可能存在2種亞型:一種以+3q、+5p、+17q、+20p和+20q為標記,一種以+1q為標記;宮頸癌染色體改變以擴增為主。
3 討 論
自從1988年Vogelstein 等[1]提出結直腸癌發(fā)生、發(fā)展、演進(jìn)的經(jīng)典路徑模型,科學(xué)研究者們希望其他腫瘤的發(fā)展演進(jìn)也有與結直腸癌相似的經(jīng)典路徑模式,但是都沒(méi)有取得理想的結果。原因是腫瘤是一個(gè)多因素參與、多基因改變、多步驟發(fā)展的復雜過(guò)程,腫瘤具有異質(zhì)性。
比較基因組雜交技術(shù)可以在染色體或染色體亞區水平上對DNA序列拷貝數進(jìn)行檢測、定位。它最大的優(yōu)點(diǎn)是一次雜交就可以全面檢測出腫瘤基因組復雜的遺傳改變,包括染色體區段拷貝數的增加或減少。為了深入挖掘從大量標本獲得的海量CGH資料中蘊含的關(guān)于腫瘤發(fā)生、發(fā)展、演進(jìn)的規律,Desper等根據數學(xué)原理結合計算機技術(shù)開(kāi)發(fā)出了一種CGH資料數據分析軟件,即根據CGH資料數據構建腫瘤發(fā)生、發(fā)展、演進(jìn)的2種樹(shù)模型:分枝樹(shù)和距離數。他們利用CGH資料數據分析軟件分析了116例腎透明細胞癌的CGH資料,并構建了腎透明細胞癌的2種樹(shù)模型,結果分析與以前細胞遺傳學(xué)研究的結果相吻合,如3p丟失是腎透明細胞癌發(fā)生的早期事件,根據樹(shù)模型還提出了腎透明細胞癌發(fā)生發(fā)展過(guò)程中有意義的新假說(shuō)[12]。這有力地說(shuō)明構建基于CGH資料的腫瘤樹(shù)模型對于研究腫瘤發(fā)生發(fā)展及其演進(jìn)規律是非常有意義的。
尹志華[13]等利用CGH資料數據分析軟件分析了收集到的127例結直腸癌的CGH資料,構建了結直腸癌發(fā)生發(fā)展的樹(shù)模型,結果顯示,樹(shù)模型與Vogelstein的經(jīng)典路徑模型有一定的吻合度,如-18q先于-17p發(fā)生,而且使后者的發(fā)生可能性更大。兩者差別也是明顯的,與經(jīng)典路徑模型相比,樹(shù)模型更體現了腫瘤的異質(zhì)性及腫瘤發(fā)生發(fā)展的多途徑模式,更符合現代關(guān)于腫瘤發(fā)生發(fā)展演進(jìn)的理論,經(jīng)典路徑模型顯得過(guò)于簡(jiǎn)單。
本研究利用CGH資料數據分析軟件分析了58例宮頸癌CGH資料,構建了宮頸癌發(fā)生發(fā)展的樹(shù)模型,模型各染色體臂改變的頻率如下:+1q為36.2%;+3q為70.7%;+5p為20.0%;+17q為24.1%;+20q為15.5%;+20p為15.5%。Lazo等[14]研究發(fā)現,90%的浸潤宮頸癌中發(fā)現有3q的擴增。Wilting等[15]研究發(fā)現,在宮頸鱗狀細胞癌和宮頸腺癌中常見(jiàn)20q拷貝數的擴增。樹(shù)模型提示,+1q和+3q可能是宮頸癌癌變較早期事件,統計分析結果也證明了這一點(diǎn),+1q 、+3q和+17q在宮頸癌的發(fā)展演進(jìn)過(guò)程的各個(gè)階段中差異沒(méi)有顯著(zhù)性(P>0.05)。
Andersson等[16]研究發(fā)現,宮頸腺癌中,3q26上人端粒酶基因TERC常見(jiàn)擴增,并可作為宮頸腺癌的診斷指標。+5p和+20p在宮頸癌早期和進(jìn)展期中,差異有顯著(zhù)性(P<0.05),進(jìn)展期高于早期,說(shuō)明+5p和+20p 是宮頸癌發(fā)展演進(jìn)的晚期事件,+20q 在宮頸癌發(fā)展演進(jìn)中的確切作用有待擴大樣本進(jìn)一步確定。根據樹(shù)模型可以推測,宮頸癌可能存在2種亞型:一種以+3q、+5p、+17q、+20p和+20q為標記,一種以+1q為標記;宮頸癌染色體改變以擴增為主。
總之,利用CGH資料數據分析軟件構建基于CGH資料的腫瘤發(fā)生發(fā)展的樹(shù)模型,對于挖掘蘊含在海量數據中的腫瘤發(fā)生發(fā)展演進(jìn)規律具有重要意義。本研究提示+1q 、+3q、 +5p、+17q、+20p和+20q是宮頸癌發(fā)生發(fā)展演進(jìn)過(guò)程中的非隨機事件,提示在這些染色體臂上可能存在與宮頸癌發(fā)生發(fā)展密切相關(guān)的腫瘤基因,為后續相關(guān)研究指明了方向。
由于CGH技術(shù)存在敏感性低的缺點(diǎn),小于10 Mb的染色體改變檢測不出[17] ,一些染色體缺失11q23,2p, 3p, 18q21.3 和11p15.5等未出現在樹(shù)模型中[18,19]。 但是,一次實(shí)驗就能給出了一個(gè)腫瘤全基因組水平的遺傳改變的全貌;贑GH資料和數學(xué)模擬建立的腫瘤發(fā)生發(fā)展的進(jìn)化樹(shù)模型,科學(xué)地闡明了腫瘤發(fā)生發(fā)展的多基因、多步驟的演進(jìn)過(guò)程,體現了腫瘤內在的異質(zhì)性。深入分析宮頸癌進(jìn)化樹(shù)模型中的6個(gè)非隨機染色體事件,對于發(fā)現與宮頸癌發(fā)生發(fā)展密切相關(guān)的腫瘤相關(guān)基因,闡明宮頸癌發(fā)病的分子機制等具有重要指導意義。
致謝:衷心感謝美國國立健康研究所(NIH)的Desper R和Schaffer A為本分析CGH資料所提供的熱情幫助。
【宮頸癌多階段多途徑演進(jìn)的樹(shù)模型構建論文】相關(guān)文章:
旅行社與導游的構建與分析的論文08-29
控制建筑工程造價(jià)的途徑論文09-02
做模型作文08-30
恐龍模型作文11-22
拼裝模型作文09-30
模型母雞作文12-26
關(guān)于物流企業(yè)人力資源管理的構建論文08-25
橋梁模型制作教案09-19