以大腸直腸癌預測為例進行缺失值處理方式的探討與實驗
機器學習和精準醫療是目前醫學界的熱門話題。機器學習在醫療領域的應用越來越普及,可幫助臨床更快速及精準診斷疾病,並提供個人化治療方案。例如,通過訓練大量醫學影像數據,建立深度學習模型,可用於腫瘤的自動辨識與分類。通過醫療資料大數據分析,可以為臨床提供及時的疾病預測和預防建議。然而,如何讓臨床資料結合機器學習建立模型預測,是很重要的議題。本研究使用臺北醫學大學數據處蒐集衛生福利部雙和醫院的大腸直腸癌與大腸炎病患三年的臨床資料,結合機器學習進行模型的建立與預測。經處理數據的缺失值、特徵的排序與選取及向前特徵選取法來訓練與驗證模型,找出分辨大腸直腸癌和大腸炎的最佳檢驗項目組合及效能,以預測大腸直腸癌。