논문명 | 어족 기반 지식 증류 기법을 적용한 다국어 신경망 기계 번역 |
---|---|
개최일 | 2021.06.24 |
학술회의명 | 2021 한국컴퓨터종합학술대회 |
책임교수 | |
구분 | 구두발표 |
제1저자 | 도희진 |
교신저자 | 이근배 |
공동저자 | 이근배 |
국내/국외 | 국내 |
개최국가 | KR |
주관기관 | |
다국어 신경망 기계 번역(Multilingual NMT)은 여러 언어 간 번역을 단일 모델을 이용하여 수행한다. 효율성과 통합화의 이점으로 주목받으며 급속히 발전해왔지만, 다국어 번역모델에서 다루는 언어들이 이질적인 언어 계열에 속할 경우 번역 성능이 저하되는 문제가 있다. 이에 본 논문에서는 다국어 기계 번역에서 언어 다양성이 초래하는 성능 저하 문제를 해결하고자, 어족 기반 지식 증류 기법을 제안한다. 구체적으로 언어 다양성이 높아 성능이 낮은 학생 모델의 훈련 과정에서, 처리되는 언어가 속한 유사 어족 교사 모델을 대상(target)으로 지정함으로써 지식을 증류 받는다. TED Talk 데이터를 사용한 실험을 통해 제안 방법으로 다국어 기계 번역 성능을 개선할 수 있음을 검증하였다. |