基于組合分類(lèi)器的生物命名實(shí)體識別
論文摘要: 生物命名實(shí)體識別是一項非常重要和基礎的生物醫學(xué)文本挖掘技(略)鍵的一個(gè)步驟,只有正確地識別出生物命名實(shí)體,才能有效地完成基因標準化、生物事件抽取以及蛋白質(zhì)-蛋白質(zhì)交互關(guān)系抽取等更加復雜的工作.生物醫學(xué)命名實(shí)體包括(略)、DNA、RNA等,通常有著(zhù)復雜的結構,對于這些實(shí)體的鑒別和分類(lèi)是非常富有挑戰性的.機器學(xué)習方法例如CRF、MEMM和SVM已經(jīng)廣泛的應用于從已標注的語(yǔ)料中學(xué)習識別出生物醫學(xué)命名實(shí)體.然而,生物命名實(shí)體識別系統的性能仍然沒(méi)有普通命名實(shí)體識別系統的好.(略)高生物命名實(shí)體識別的性能,研究者提出了合并多個(gè)分類(lèi)器結果的多分類(lèi)器方法. 本文主要研究基于組合分類(lèi)器的生物命名實(shí)體識別方法,實(shí)驗是在BioCreAtIvE 2GM的訓練語(yǔ)料和測試語(yǔ)料上進(jìn)行的.本文主(略)下兩點(diǎn): ⒈構建單一分類(lèi)器模型 本文利用不同的分類(lèi)模型、不同的分類(lèi)方法和特征集構建了六個(gè)不同的機器學(xué)習模型,并對每種模型采用的特征集,特征抽取方法,以及訓練過(guò)程進(jìn)行了詳細介紹. (略)提高最大熵方法的識別性能,本文采用TBL方法對最大熵的標注結果進(jìn)行了糾錯處理.實(shí)驗結果顯示糾錯處理在很大程...
Biomedical Named Entity Recognition (Bio-NER) is (omitted)ly important and fundamental task of biomedical text mining, and is also a critical step for biomedical text mining, only when(omitted)ies are correctly i(omitted)could other more complex tasks, such as, gene normalization, biomedical eve(omitted)tion and protein-protein interaction extraction, be performed effectively. Biomedical named entities include mentions of proteins, genes, DNA, RNA, etc which oft(omitted)omplex structures, but it is cha...
目錄:
摘要 第4-5頁(yè)
Abstract 第5-6頁(yè)
1 緒論 第9-16頁(yè)
·研究背景與意義 第9-10頁(yè)
·研究現狀 第10-14頁(yè)
·本文主要研究?jì)热?第14頁(yè)
·本文組織結構 第14-16頁(yè)
2 機器學(xué)習模型 第16-25頁(yè)
·支持向量機模型 第16-18頁(yè)
·最優(yōu)分類(lèi)超平面 第16頁(yè)
·核函數 第16-17頁(yè)
·SVM多分類(lèi)問(wèn)題擴展方法 第17-18頁(yè)
·最大熵模型 第18-20頁(yè)
·條件隨機場(chǎng)模型 第20-24頁(yè)
·CRF的無(wú)向圖結構 第21-22頁(yè)
·CRF與勢函數 第22-23頁(yè)
·CRF的參數估計 第23-24頁(yè)
·本章小結 第24-25頁(yè)
3 單一分類(lèi)器的構建 第25-40頁(yè)
·實(shí)驗語(yǔ)料及語(yǔ)料的預處理方法 第25-26頁(yè)
·有效的特征信息 第26-28頁(yè)
·不同單一分類(lèi)器的構建 第28-38頁(yè)
·基于條件隨機場(chǎng)的生物命名實(shí)體識別 第29-32頁(yè)
·基于支持向量機的生物命名實(shí)體識別 第32-34頁(yè)
·最大熵方法的生物命名實(shí)體識別 第34-38頁(yè)
·本章小結 第38-40頁(yè)
4 基于組合分類(lèi)器的生物命名實(shí)體識別方法 第40-46頁(yè)
·組合分類(lèi)器方法 第40-43頁(yè)
·后處理 第43-45頁(yè)
·本章小結 第45-46頁(yè)
5 實(shí)驗與結果分析 第46-54頁(yè)
·單個(gè)分類(lèi)器實(shí)驗結果 第46-47頁(yè)
·組合分類(lèi)器方法的識別結果 第47-52頁(yè)
·集合并/交操作方法實(shí)驗結果 第47-49頁(yè)
·投票方法實(shí)驗結果 第49-50頁(yè)
·疊加方法實(shí)驗結果 第50-51頁(yè)
·結果比較與分析 第51-52頁(yè)
·錯誤分析與總結 第52頁(yè)
·本章小結 第52-54頁(yè)
結論 第54-55頁(yè)
參考文獻 第55-58頁(yè)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況 第58-59頁(yè)
致謝 第59-61頁(yè)
【基于組合分類(lèi)器的生物命名實(shí)體識別】相關(guān)文章:
基于圖像識別技術(shù)的豆科牧草分類(lèi)研究論文提綱11-24
基于SVM的P2P流量的識別系統12-07
基于簇的無(wú)線(xiàn)傳感器網(wǎng)絡(luò )能量平衡策略11-16
組合化學(xué)在生物醫學(xué)中的應用分析11-14
基于傳輸半徑倍數的無(wú)線(xiàn)傳感器網(wǎng)絡(luò )交替路由11-16
一種基于組件的無(wú)線(xiàn)傳感器網(wǎng)絡(luò )網(wǎng)關(guān)的建設策略03-28
- 相關(guān)推薦