728x90
반응형
# sklearn 모듈의 분류 모델의 상당수는 출력결과가 연속형인 예측 처리도 가능
import numpy as np
import pandas as pd
# boston 자료
from sklearn.datasets import load_boston
boston = load_boston()
dfx = pd.DataFrame(boston.data, columns = boston.feature_names)
dfy = pd.DataFrame(boston.target, columns = ['MEDV'])
df = pd.concat([dfx, dfy], axis = 1)
cols = ['MEDV', 'RM', 'LSTAT']
x = df[['LSTAT']]
y = df['MEDV']
# 실습 1 : DecisionTreeRegressor
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import r2_score
model = DecisionTreeRegressor (criterion = 'mse').fit(x,y)
print('predict:',model.predict(x)[:5])
print('real:', np.array(y[:5]))
print('결정계수(R2):',r2_score(y, model.predict(x)))
print('---------------------')
# 실습 2 : RandomForestRegressor
from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor(n_estimators = 1000, criterion = 'mse', random_state = 123).fit(x,y)
print('predict:',model.predict(x)[:5])
print('real:', np.array(y[:5]))
print('결정계수(R2):',r2_score(y, model.predict(x)))
분류트리는 질적 반응변수일 때 사용
회귀트리는 양적 반응변수일 때 사용
728x90
'데이터분석 > 데이터분석' 카테고리의 다른 글
서포터 벡터 머신 (SVM) (0) | 2022.05.14 |
---|---|
XGboost (0) | 2022.05.12 |
앙상블 (Esemble Learning) (0) | 2022.05.11 |
sklearn을 이용한 과적합 방지 (0) | 2022.05.11 |
분류모델 : 의사결정나무(DecisionTree) (0) | 2022.05.11 |