머신러닝 & 딥러닝

[머신러닝 & 딥러닝] 퍼지 C-평균(Fuzzy C-Means, FCM)

beginner-in-coding 2025. 4. 17. 11:20

01. 퍼지 C-평균(Fuzzy C-Means, FCM) 

  • 동의어: 간접 k-평균(soft k-means) 또는 퍼지 k-평균(fuzzy k-means)
  • FCM의 처리 단계는 k-평균과 유사
    • 차이점: 포인트가 직접적으로 클러스터에 할당되는 것을 각 클러스터에 속할 확률로 바뀜
  • 단계
    1. 센트로이드 개수 k를 지정하고 랜덤하게 각 포인트에 대해 클러스터 확률을 할당
    2. 클러스터 센트로이드를 계산
    3. 각 샘플에 대해 클러스터 소속 확률을 업데이트
    4. 클러스터 확률이 변하지 않거나 사용자가 지정한 허용 오차나 최대 반복 횟수에 도달할 때까지 단계 2와 3을 반복
  • 퍼지 계수(fuzziness coefficient, == 퍼지 지수(fuzzofoer)): 지수 m, 1보다 크거가 같으며(일반적으로 m=2) 퍼지의 정도를 제어
    • m이 클수록 소속 확률이 작어져 더 복잡한 클러스터를 만듬
  • 클러스터의 중심: 샘플의 소속 확률을 가중치로 주어 클러스터에 속한 모든 샘플의 평균으로 계산

02. 퍼지 C-평균의 특징

  • FCM의 각 반복 > k-평균 반복
  • FCM의 수렴 도달 횟수 < k-평균 수렴 도달 횟수
  • FCM은 사이킷런에 구현되어 있지 않음, k-평균 알고리즘은 구현되어 있음
  • k-평균과 FCM이 비슷한 군집 결과를 만듬