머신러닝 & 딥러닝

[머신러닝 & 딥러닝] 비지도 학습에서의 성능 평가 (2) - 실루엣 그래프

beginner-in-coding 2025. 4. 17. 17:10

00. 실루엣 분석(silhouette analysis)

  • 군집 품질을 평가하는 또다른 방법 중 하나
  • k-평균 이외의 다른 군집 알고리즘에도 적용 가능

01. 실루엣 그래프로 군집 품질 정량화

  • 단계
    1. 샘플과 동일한 클러스터 내 모든 포인트 사이의 거리를 평균하여 클러스터 응집력(cluster cohesion)을 계산
    2. 샘플과 가장 가까운 클러스터의 모든 샘플 간 평균 거리로 최근접 클러스터의 클러스터 분리도(cluster seoaration)을 계산
    3. 클러스터 응집력과 분리도 사이의 차이를 둘 중 큰 값으로 나누어 실루엣 결과값 출력
  • 응집력: 다른 클러스터와 얼마나 다른지 나타냄
  • 분리도: 클러스터 내 다른 샘플과 얼마나 비슷한지 나타냄
  • 실루엣 점수가 1.0과 가까울 수록 좋은 군집을 띔
  • 실루엣 점수표
0.7 ~ 1.0 군집이 아주 잘 분리돼 있음 (거의 이상적)
0.5 ~ 0.7 군집이 꽤 잘 되어 있음, 실용적으로 충분히 괜찮음
0.3 ~ 0.5 군집이 애매함. 어느 정도 패턴은 있는데 뚜렷하진 않음
0.0 ~ 0.3 군집이 잘 안 됨. 군집끼리 겹치거나 엉켜 있을 확률 큼
< 0.0 완전 망함. 군집이 아예 잘못 나눠짐 (거의 무조건 데이터 문제)