Cluster의 개수나 구조에 관한 특별한 사전 가정 없이 개체들 사이의 유사성 / 거리에 근거해 cluster를 찾고 다음 단계의 분석을 하게 하는 기법 유사한 개체들을 cluster로 그룹화하여 각 집단의 성격을 파악 Clustering 장점 – 데이터에 대해 탐색적 기법으로, 데이터 내부구조 등이 주어지지 않아도 자료구조를 탐색 – 추가적인 분석을 위해 사용할 수 있음. – 유사성, 비유사성 만 계산할 수 있다면 여러 형태 데이터 적용이 가능. Clustering 단점 – 자료 유형이 혼합된 경우, 거리정의 등이 어려울 수 있음 – 초기 군집 수 설정이 중요 – 결과 해석에 주의 1) 계층적 군집분석 (단일결합법, 완전결합법, 평균결합법, 중심결합기준법, Ward법 # 군집분석(Clustering)..