논문명 | 적은 자원의 흉부 X-ray 분류 성능 향상을 위한 데이터 증강과 결합한 약지도 학습 |
---|---|
게재일 | 20210923 |
학술지명 | Journal of KIISE (정보과학회 논문지) |
책임교수 | |
논문종류 | 비SCI |
제1저자 | 박민규 |
교신저자 | 김준태 |
공동저자 | 김준태 |
Impact Factor | N/A |
Keyword | |
딥러닝 기반의 의료영상 분석기술은 방사선 전문의의 판독 능력을 능가하는 정확도를 보일 정도로 발전하였다. 하지만, 의료영상 학습에 사용하기 위한 샘플 데이터를 만드는 것(labeling)은 전문가가 필요한 영역이고 큰 비용과 시간이 소요된다. 또한, 많은 경우에 의료영상의 훈련용 데이터는 질환별로 불균형한 분포를 가진다. 예를 들어, 흉부 X-ray 분류 학습을 위한 ChestX-ray14 데이터셋의 경우, 침윤(infiltration)과 탈장(hernia)의 데이터 분포의 차이는 87배에 이른다. 본 연구에서는 불균형한 흉부 X-ray 분류의 성능 향상을 위하여 데이터 증강(data augmentation) 알고리즘인 Mixup과 약지도 학습(weakly supervised learning)을 결합하는 방법을 제안한다. 제안하는 방법은 데이터 불균형 완화를 위하여 적은 수의 레이블이 있는 데이터와 다수의 레이블이 없는 데이터에 복합적으로 Mixup 알고리즘을 적용하고, 교사 모델(teacher model)과 학생 모델(student model)을 순환하면서 레이블이 없는 데이터를 효과적으로 활용하는 커리큘럼 학습(curriculum learning)을 수행하는 것이다. 의료 현장에서 생각할 수 있는 적은 수의 레이블이 있는 데이터(labeled data)와 레이블이 없는 데이터(unlabeled data)가 존재하는 환경을 구성하여 실험을 수행한 결과 데이터 증강과 약지도 학습을 결합함으로써 분류 성능이 향상됨을 보였으며, 순환적인 커리큘럼 학습이 효과가 있음을 확인하였다
|