00. 실루엣 분석(silhouette analysis)
- 군집 품질을 평가하는 또다른 방법 중 하나
- k-평균 이외의 다른 군집 알고리즘에도 적용 가능
01. 실루엣 그래프로 군집 품질 정량화
- 단계
- 샘플과 동일한 클러스터 내 모든 포인트 사이의 거리를 평균하여 클러스터 응집력(cluster cohesion)을 계산
- 샘플과 가장 가까운 클러스터의 모든 샘플 간 평균 거리로 최근접 클러스터의 클러스터 분리도(cluster seoaration)을 계산
- 클러스터 응집력과 분리도 사이의 차이를 둘 중 큰 값으로 나누어 실루엣 결과값 출력
- 응집력: 다른 클러스터와 얼마나 다른지 나타냄
- 분리도: 클러스터 내 다른 샘플과 얼마나 비슷한지 나타냄
- 실루엣 점수가 1.0과 가까울 수록 좋은 군집을 띔
- 실루엣 점수표
0.7 ~ 1.0 |
군집이 아주 잘 분리돼 있음 (거의 이상적) |
0.5 ~ 0.7 |
군집이 꽤 잘 되어 있음, 실용적으로 충분히 괜찮음 |
0.3 ~ 0.5 |
군집이 애매함. 어느 정도 패턴은 있는데 뚜렷하진 않음 |
0.0 ~ 0.3 |
군집이 잘 안 됨. 군집끼리 겹치거나 엉켜 있을 확률 큼 |
< 0.0 |
완전 망함. 군집이 아예 잘못 나눠짐 (거의 무조건 데이터 문제) |