亞洲健康互聯
優化產業的推手,生醫商機的GPS!

首頁最新消息產業觀測站基於集成學習的乳腺癌分類研究

基於集成學習的乳腺癌分類研究

來源 : 中國醫療設備雜誌2020年第12期
update : 2021/03/02
引言
集成學習(多分類器系統)通過將多個弱學習器結合 [1-2],獲得比單一學習器的泛化能力更加顯著的強分類器。目前集成學習根據個體學習器間的關係可以分為兩大類 [3-4] :一種是學習器之間不存在依賴關係,可以同時生成並行化的方法,例如隨機森林 [5-6] ;另一種則是個體學習器之間存在很強的依賴關係,必須串列生成的序列化方法,例如Xgboost[7-8]。所以論文應用集成學習中典型的兩類演算法模型,研究集成學習在醫療診斷領域的應用方法與實際效果。
 
目前集成學習於醫療領域的應用尚處於研究階段,貴州大學醫學院的張玉璽等 [9] 人研究了集成學習在糖尿病預測中的應用,主要應用了集成學習中的隨機森林模型,並與傳統機器學習的演算法做了對比,表明了集成學習演算法明顯由於傳統機器學習演算法。濟南市中醫醫院的任雪等 [10] 人提出了基於主動集成學習的中醫智慧診斷模型及構建方法,將多個不同的機器學習模型進行集成訓練,獲得更為準確的中醫知識學習模型,試驗結果表明,集成學習是一種新型有效的中醫診斷模型。廣東工業大學的曾安等 [11] 人提出了基於卷積神經網路和集成學習的阿爾茨海默症早期診斷,實驗採用 MRI 三個維度上的多個二維切片進行集成訓練,從而更加充分地利用 MRI 包含的有效資訊。所以將集成學習應用於醫療診斷領域的研究需要進一步探索,加快實現中國大陸智慧醫療服務,提高醫療診斷水準。

1 專案模型
本專案首先建立了一個傳統的決策樹模型,方便與集成學習模型進行對比驗證,再利用交叉驗證和網格搜索等方法建立了隨機森林模型和 Xgboost 模型,提高了模型的分類能力和 AUC 指標...完整