논문명 | R3: 테이블의 구조 정보를 활용한 오픈 도메인 질의응답 시스템 |
---|---|
개최일 | 2022.10.18 |
학술회의명 | 제34회 한글 및 한국어 정보처리 학술대회 |
책임교수 | |
구분 | 구두발표 |
제1저자 | 강덕형 |
교신저자 | 이근배 |
공동저자 | 이근배 |
국내/국외 | 국내 |
개최국가 | KR |
주관기관 | |
오픈 도메인 질의 응답에서 질의에 대한 답변은 질의에 대한 관련 문서를 검색한 다음 질의에 대한 답변을 포함할 수 있는 검색된 문서를 분석함으로써 얻어진다. 문서내의 테이블이 질의와 관련이 있을 수 있음에도 불구하고, 기존의 연구는 주로 문서의 텍스트 부분만을 검색하는 데 초점을 맞추고 있었다. 이에 테이블과 텍스트를 모두 고려하는 질의 응답과 관련된 연구가 진행되었으나 테이블의 구조적 정보가 손실되는 등의 한계가 있었다. 본 연구에서는 테이블의 구조적 정보를 모델의 추가적인 임베딩을 통해 활용한 오픈 도메인 질의응답 시스템인 R3를 제안한다. R3는 오픈 도메인 질의 응답 데이터셋인 NQ에 기반한 새로운 데이터셋인 NQ-Open-Multi를 이용해 학습 및 평가하였으며, 테이블의 구조적 정보를 활용하지 않은 시스템에 비해 더 좋은 성능을 보임을 확인할 수 있었다. |