本專案為中山醫學大學「研究方法與生醫資料分析」課程之期末研究成果。我們實踐了針對 COVID-19、Viral Pneumonia (病毒性肺炎)、Lung Opacity (肺部混濁) 與 Normal (正常) 胸部 X 光影像的自動化分類模型。本研究參考了文獻 Oltu et al. (2025) 的研究思路,並進行在地化實作與優化。
自 2019 年底 COVID-19 疫情爆發以來,全球醫療體系面臨巨大挑戰。胸部 X 光(CXR)影像因其成本效益高且易於獲得,成為診斷肺部疾病的重要工具。然而,傳統判讀高度依賴醫師專業經驗,且存在主觀性與效率問題。本研究旨在透過深度學習技術,建立輔助診斷模型,提升影像判讀的效率並減少誤差。
- 資料預處理 (Preprocessing):實作 CLAHE (對比度受限自適應長條圖均衡化) 演算法,有效增強 X 光片中肺部組織的邊緣與特徵細節,提升模型辨識度。
- 支援中文路徑:針對 Windows 環境進行優化,利用
cv2.imdecode技術修正了原始 OpenCV 無法讀取中文字元路徑的技術限制。 - 深度學習模型:構建多層卷積神經網絡 (CNN),並結合卷積層、最大池化層及 Dropout 策略以防止模型過擬合。
- 全面評估指標:除了 Accuracy,更導入混淆矩陣 (Confusion Matrix) 與 F1-Score (Precision/Recall) 進行生醫領域所需的嚴謹效能分析。
code/: 核心訓練與實作程式碼chest_xray_train.ipynb。data/: 資料存放區 (資料集請由下方連結下載,本儲存庫依規範不包含原始影像檔)。docs/: 包含完整期末報告 PDF、參考論文資訊及相關文獻。results/: 存放訓練完成之模型 (.h5) 與所有實驗結果圖表(學習曲線、混淆矩陣等)。
本研究使用之資料集為:COVID-19 Radiography Database
- 來源:Kaggle (由卡達大學、杜哈大學及其他學術機構合作收集)。
- 類別組成統計:
- COVID-19: 3,616 張
- Normal: 10,192 張
- Lung Opacity: 6,012 張
- Viral Pneumonia: 1,345 張
由於模型檔案較大,請至此 下載連結 取得 chest_xray_model.h5,並將其放入 results/ 資料夾。
說明:展示模型在訓練集與驗證集上的收斂情況。*
說明:具體呈現各類肺部疾病被預測的準確分布。
說明:顯示模型在不同類別下的細節效能指標。
- 環境配置:安裝必要的 Python 套件。
pip install -r requirements.txt
- 準備資料:請至上述 Kaggle 連結下載資料集,解壓並放置於專案根目錄下的
data/資料夾中(確保結構包含COVID-19_Radiography_Dataset及其子資料夾)。 - 啟動訓練:開啟
code/chest_xray_train.ipynb並依序執行所有單元格進行模型重現。
- Oltu, B., Güney, S., Yuksel, S. E., & Dengiz, B. (2025). Automated classification of chest X-rays: a deep learning approach with attention mechanisms. BMC Medical Imaging.
- Bradley, S. H., et al. (2021). Chest X-ray sensitivity and lung cancer outcomes: A retrospective observational study. BJGP.
- Bressem, K. K., et al. (2020). Comparing different deep learning architectures for the classification of chest radiographs. Scientific Reports.
- 程式碼:採用 MIT License 授權。
- 研究文獻:本專案僅供學術交流參考,原始論文著作權歸屬於原出版社與作者。
- 影像資料集:影像資產之使用需遵循 Kaggle 原始提供者之規範與 CC BY 4.0 授權。
- 江永閎 與其研究團隊
- 中山醫學大學 醫學資訊學系 (CSMU MI)


