밀도기반 클러스터링(DBSCAN)

데이터분석/데이터분석

밀도기반 클러스터링(DBSCAN)

이규승 2022. 5. 19. 00:35

728x90

밀도기반 클러스터링 이론

https://needjarvis.tistory.com/720

DBSCAN clustering 이해하기(밀도기반 알고리즘)

DBSCAN의 개념 DBSCAN은 Density-Based Spatial Clustering of Applications with Noise의 약자로, 한국말로 풀이하면 노이즈를 적용한 밀도 기반 공간 클러스터링이라고 해석할 수 있다. 한마디로 Density-Based..

needjarvis.tistory.com

# 밀도기반 클러스터링(DBSCAN) : K-Mean 로 군집화하기 힘든 데이터 분포인 경우(비선형)에 적당
import matplotlib.pyplot as plt
from matplotlib import style
import numpy as np
from sklearn.datasets import make_moons
from sklearn.cluster import KMeans, DBSCAN

x, y = make_moons(n_samples = 200, noise = 0.07, random_state = 1)
print(x)
print('실제 군집 id:', y[:10])

# plt.scatter(x[:,0], x[:,1])
# plt.show()

# KMeans로 군집화
km = KMeans(n_clusters = 2, random_state = 0)
pred1 = km.fit_predict(x)
print('예측 군집 id:', pred1[:10])

def plot_func(x, pr):
    plt.scatter(x[pr==0,0],x[pr==0,1], c='blue', marker='o', s=40, label = 'cluster1')
    plt.scatter(x[pr==1,0],x[pr==1,1], c='red', marker='s', s=40, label = 'cluster2')
    plt.scatter(km.cluster_centers_[:,0], km.cluster_centers_[:,1], s=50, c='black', marker='+', label='centroid')
    plt.legend()
    plt.title('result')
    plt.show()
    
plot_func(x, pred1)

print()
# Kmeans로 원하는 군집을 얻지 못한 경우 DBSCAN을 수행한다.
dm = DBSCAN(eps=0.2, min_samples=5, metric='euclidean')
pred2 = dm.fit_predict(x)
print('예측 군집 id:', pred2[:10])

plot_func(x,pred2)

728x90

저작자표시 (새창열림)

'데이터분석 > 데이터분석' 카테고리의 다른 글

단어의 빈도수를 이용해 문서의 특징 추출 (0)	2022.05.26
자연어 처리 (0)	2022.05.26
지도학습(K-NN) 과 비지도학습(K-Means) 비교 (0)	2022.05.16
군집 분석(Clustering) (0)	2022.05.16
인공신경망 (ANN) (0)	2022.05.16

현재글밀도기반 클러스터링(DBSCAN)

혼자 공부하는 방

lstm, Logistic Regression, countvectorizer, 텐서플로, Keras, 선형회귀모델, Ensemble, 분류모델, 앙상블, TensorFlow, 프로그래머스, SVM, konlpy, 빅데이터분석기사 실기, sklearn, DBSCAN, 배깅, rnn, TfidfVectorizer, sqld,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

혼자 공부하는 방

밀도기반 클러스터링(DBSCAN)

'데이터분석 > 데이터분석' 카테고리의 다른 글

'데이터분석/데이터분석'의 다른글

티스토리툴바

밀도기반 클러스터링(DBSCAN)

'데이터분석 > 데이터분석' 카테고리의 다른 글

'데이터분석/데이터분석'의 다른글

관련글

티스토리툴바