胸部 X 光影像自動化分類：基於卷積神經網路之研究與實踐

本專案為中山醫學大學「研究方法與生醫資料分析」課程之期末研究成果。我們實踐了針對 COVID-19、Viral Pneumonia (病毒性肺炎)、Lung Opacity (肺部混濁) 與 Normal (正常) 胸部 X 光影像的自動化分類模型。本研究參考了文獻 Oltu et al. (2025) 的研究思路，並進行在地化實作與優化。

研究動機與背景

自 2019 年底 COVID-19 疫情爆發以來，全球醫療體系面臨巨大挑戰。胸部 X 光（CXR）影像因其成本效益高且易於獲得，成為診斷肺部疾病的重要工具。然而，傳統判讀高度依賴醫師專業經驗，且存在主觀性與效率問題。本研究旨在透過深度學習技術，建立輔助診斷模型，提升影像判讀的效率並減少誤差。

技術特點

資料預處理 (Preprocessing)：實作 CLAHE (對比度受限自適應長條圖均衡化) 演算法，有效增強 X 光片中肺部組織的邊緣與特徵細節，提升模型辨識度。
支援中文路徑：針對 Windows 環境進行優化，利用 cv2.imdecode 技術修正了原始 OpenCV 無法讀取中文字元路徑的技術限制。
深度學習模型：構建多層卷積神經網絡 (CNN)，並結合卷積層、最大池化層及 Dropout 策略以防止模型過擬合。
全面評估指標：除了 Accuracy，更導入混淆矩陣 (Confusion Matrix) 與 F1-Score (Precision/Recall) 進行生醫領域所需的嚴謹效能分析。

檔案結構

code/: 核心訓練與實作程式碼 chest_xray_train.ipynb。
data/: 資料存放區 (資料集請由下方連結下載，本儲存庫依規範不包含原始影像檔)。
docs/: 包含完整期末報告 PDF、參考論文資訊及相關文獻。
results/: 存放訓練完成之模型 (.h5) 與所有實驗結果圖表（學習曲線、混淆矩陣等）。

資料集來源 (Dataset)

本研究使用之資料集為：COVID-19 Radiography Database

來源：Kaggle (由卡達大學、杜哈大學及其他學術機構合作收集)。
類別組成統計：
- COVID-19: 3,616 張
- Normal: 10,192 張
- Lung Opacity: 6,012 張
- Viral Pneumonia: 1,345 張

實驗結果展示

權重下載 (Pre-trained Model)

由於模型檔案較大，請至此下載連結取得 chest_xray_model.h5，並將其放入 results/ 資料夾。

1. 訓練曲線 (Accuracy & Loss)

說明：展示模型在訓練集與驗證集上的收斂情況。*

2. 混淆矩陣 (Confusion Matrix)

說明：具體呈現各類肺部疾病被預測的準確分布。

3. 分類指標分析 (Precision, Recall, F1-Score)

說明：顯示模型在不同類別下的細節效能指標。

如何執行

環境配置：安裝必要的 Python 套件。
```
pip install -r requirements.txt
```
準備資料：請至上述 Kaggle 連結下載資料集，解壓並放置於專案根目錄下的 data/ 資料夾中（確保結構包含 COVID-19_Radiography_Dataset 及其子資料夾）。
啟動訓練：開啟 code/chest_xray_train.ipynb 並依序執行所有單元格進行模型重現。

參考文獻

Oltu, B., Güney, S., Yuksel, S. E., & Dengiz, B. (2025). Automated classification of chest X-rays: a deep learning approach with attention mechanisms. BMC Medical Imaging.
Bradley, S. H., et al. (2021). Chest X-ray sensitivity and lung cancer outcomes: A retrospective observational study. BJGP.
Bressem, K. K., et al. (2020). Comparing different deep learning architectures for the classification of chest radiographs. Scientific Reports.

著作權聲明與授權

程式碼：採用 MIT License 授權。
研究文獻：本專案僅供學術交流參考，原始論文著作權歸屬於原出版社與作者。
影像資料集：影像資產之使用需遵循 Kaggle 原始提供者之規範與 CC BY 4.0 授權。

作者

江永閎 與其研究團隊
中山醫學大學醫學資訊學系 (CSMU MI)

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
code		code
docs/final_report		docs/final_report
results		results
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

胸部 X 光影像自動化分類：基於卷積神經網路之研究與實踐

研究動機與背景

技術特點

檔案結構

資料集來源 (Dataset)