논문명 | k-평균 군집분석에서의 주요 변수 탐색 방법 |
---|---|
개최일 | 2022.08.26 |
학술회의명 | 한국데이터마이닝학회 2022 하계 학술대회 |
책임교수 | |
구분 | 구두발표 |
제1저자 | 김동희 |
교신저자 | 이영섭 |
공동저자 | 김희경, 이영섭 |
국내/국외 | 국내 |
개최국가 | KR |
주관기관 | |
k-평균 군집분석은 데이터의 각 관측치를 유사한 특징을 갖도록 k개의 군집을 형성하는 방법으로, 군집 내부 관측치의 변동을 줄이며 동시에 서로 다른 군집 간 차이를 크게 하는 방식으로 작동한다. 하지만 k-평균 군집분석은 군집 형성 시 데이터의 모든 변수를 복잡하게 이용하여, 군집 분석 결과의 설명과 군집 형성 시 중요하게 작용하는 변수를 알기 어렵다는 문제점이 있다. 이런 문제를 해결하고자 지도학습 방법 중, 작은 크기의 의사결정나무를 이용하여 k-평균 군집분석의 결과를 설명하거나 주요 변수를 선택하는 연구가 진행되고 있다. 하지만 변수중요도를 계산하는 명확한 방법론은 제시하지 않고 있다. 본 연구에서는 지도학습을 이용한 k-평균 군집분석의 변수중요도 계산에 대한 방법론을 제안한다. 다양한 데이터를 이용하여 실험을 진행한 후, 평가 지표를 통해 비교한다. |