24 มิ.ย. เวลา 06:48 • วิทยาศาสตร์ & เทคโนโลยี
มหาวิทยาลัยมหิดล

บทความที่น่าสนใจวันนี้ เรื่อง การประเมินภาวะหัวใจโตจากภาพเอกซเรย์ทรวงอก ด้วย Deep Learning AI

Assessment of Cardiomegaly from Chest X-Ray Using Deep Learning Artificial Intelligence
👨‍💻Mr.Jiraphat Thongyoo, Dr.Suradej Intagorn, Dr.Punyanuch Borwarnginn, Prof.Dr.Thanongchai Siriapisith.MD., Assoc.Prof.Dr.Worapan Kusakunniran
Published in: 2026 18th International Conference on Knowledge and Smart Technology (KST)
Abstract:
Chest radiography is essential in assessing heart size and shape, contributing to the screening of lung and heart diseases. The cardiothoracic ratio (CTR), defined as the ratio of the heart's largest transverse dimension to the chest's largest transverse dimension, serves as a crucial indicator of cardiac abnormalities. Traditional CTR measurement relies on segmentation-based approaches, which are prone to inaccuracies due to anatomical variations and inconsistencies in image quality.
This study introduces a novel regression-based deep learning approach for automated CTR prediction, leveraging ProGAN-generated synthetic chest X-ray data. The proposed method eliminates the dependency on segmentation while enhancing accuracy and efficiency. A CNN model is developed and trained on ProGAN-generated images. The effectiveness of the regression approach is compared with conventional segmentationbased techniques, with accuracy assessments and Grad-CAM visualizations.
The findings demonstrate improved performance and robustness in CTR prediction, offering a potential screening tool to assist medical professionals in assessing cardiomegaly.
📰 อ่านฉบับเต็มได้ที่ https://doi.org/10.1109/KST67832.2026.11432387
Abstract (บทคัดย่อ) งานวิจัยนี้ต้องการแก้ปัญหาการตรวจหาภาวะหัวใจโตจากภาพเอกซเรย์ทรวงอก ซึ่งปกติแพทย์จะดูจากค่าสัดส่วนขนาดหัวใจต่อทรวงอก (CTR) แต่เดิมมักใช้โมเดลแบ่งส่วนภาพ (Segmentation) ที่มักทำงานพลาดถ้าเจอภาพไม่ชัด
ผู้แต่งจึงเสนอแนวคิดใหม่โดยเปลี่ยนมาใช้ Regression-based CNN เพื่อคำนวณค่า CTR ออกมาเป็นตัวเลขตรงๆ โดยไม่ต้องเสียเวลาตัดแบ่งภาพก่อน พร้อมทั้งใช้เทคนิค ProGAN เพื่อสร้างภาพเอกซเรย์จำลองขึ้นมาช่วยแก้ปัญหาขาดแคลนข้อมูล ทำให้ได้โมเดลที่แม่นยำ เสถียร และพร้อมนำไปพัฒนาเป็นเครื่องมือช่วยแพทย์คัดกรองผู้ป่วยได้จริง
Related Work (งานวิจัยที่เกี่ยวข้อง) จากการทบทวนวรรณกรรมพบว่า งานวิจัยส่วนใหญ่ในอดีตมักจะพึ่งพาโมเดลตระกูล U-Net, DenseNet หรือ ResNet เพื่อทำหน้าที่ตัดแบ่งส่วนภาพ (Segmentation) หรือตรวจจับตำแหน่งของหัวใจและปอดก่อน แล้วค่อยเอาพื้นที่เหล่านั้นมาคำนวณหาค่า CTR ซึ่งแม้ว่าจะได้ความแม่นยำที่สูงในชุดข้อมูลของตัวเอง แต่ก็ยังมีข้อจำกัดเรื่องความเปราะบางหากภาพมีคุณภาพต่ำ ขอบอวัยวะเบลอ หรือผู้ป่วยมีสรีระที่ผิดแปลกไป
การศึกษาก่อนหน้านี้จึงยังขาดการนำแนวคิดแบบทำนายค่าต่อเนื่อง (Regression) มารวบรวมเข้ากับการสร้างข้อมูลสังเคราะห์เพื่อแก้ปัญหาแบบเบ็ดเสร็จอย่างที่งานวิจัยนี้กำลังทำ
Methodology (ระเบียบวิธีวิจัย) ในส่วนของการทดลอง ทีมวิจัยได้ใช้ ProGAN สร้างภาพเอกซเรย์จำลองขึ้นมา 30,000 ภาพเพื่อแก้ปัญหาข้อมูลไม่สมดุล (Data Imbalance) จากนั้นใช้โมเดล Object Detection ช่วยตรวจจับและแปะป้ายกำกับค่า CTR เริ่มต้นให้ ก่อนจะคัดเฉพาะภาพคุณภาพสูงมาแบ่งสัดส่วนข้อมูลสำหรับเทรนและทดสอบ
ไฮไลต์สำคัญคือการออกแบบสถาปัตยกรรม CNN รูปแบบ Regression ที่มีเลเยอร์ Convolution 3 ชั้น เชื่อมต่อเข้ากับ Fully Connected เพื่อทำนายค่า CTR ออกมาเป็นตัวเลขทศนิยมตรงๆ และตบท้ายด้วยการใช้ Grad-CAM ซึ่งเป็นเครื่องมืออธิบาย AI (Explainable AI) เพื่อส่องดูว่าโมเดลไฮไลต์ความสนใจไปที่ขอบหัวใจและซี่โครงตรงตามหลักการแพทย์จริงหรือไม่
Results (ผลการทดลอง)ผลการทดลองพบว่าหลังจากคัดกรองภาพสังเคราะห์ที่สมบูรณ์แล้ว เหลือภาพที่ใช้ได้จริง 14,724 ภาพ ซึ่งตอนแรกที่เทรนแบบปกติโมเดลมีปัญหา Overfitting (ทำนายข้อมูลที่ไม่เคยเห็นได้ไม่ดี)
แต่เมื่อผู้สร้างปรับมาใช้เทคนิค Cross-Validation โมเดลกลับทำผลงานได้ดีเยี่ยมและเสถียรมาก โดยมีค่าความคลาดเคลื่อน (RMSE) ต่ำเพียงประมาณ 0.015 และค่า RxR สูงถึง 0.93-0.95 ในทุกชุดข้อมูล นอกจากนี้ ภาพความร้อนจาก Grad-CAM ยังพิสูจน์ให้เห็นว่า โมเดลสามารถมองเห็นและโฟกัสขอบเขตของหัวใจและซี่โครงได้อย่างแม่นยำใกล้เคียงกับที่มนุษย์มอง
Conclusion (สรุปผล)
สรุปได้ว่าการเปลี่ยนรูปแบบปัญหา (Problem Formulation) มาเป็นโมเดลแบบ Regression สามารถลบจุดบอดของวิธีตรวจจับอวัยวะ (Detection) แบบเดิมๆ ที่มักจะค้างหรือทำงานล้มเหลวหากเจอภาพที่เห็นปอดและหัวใจไม่ชัดเจน โดยโมเดลนี้จะยังคงคำนวณค่า CTR ออกมาเป็นตัวเลขได้อย่างต่อเนื่อง งานวิจัยนี้จึงพิสูจน์ให้เห็นว่า โมเดลมีความทนทานต่อสัญญาณรบกวน (Robustness) สูง เรียนรู้รูปแบบทั่วไปของภาพได้ดี (Generalization) และมีศักยภาพสูงมากในการนำไปประยุกต์ใช้เป็นซอฟต์แวร์ใช้งานจริงในทางคลินิก

ดูเพิ่มเติมในซีรีส์

โฆษณา