본문 바로가기
데이터분석/데이터분석

Regressor

by 이규승 2022. 5. 11.
728x90
반응형
# sklearn 모듈의 분류 모델의 상당수는 출력결과가 연속형인 예측 처리도 가능
import numpy as np
import pandas as pd

# boston 자료
from sklearn.datasets import load_boston
boston = load_boston()
dfx = pd.DataFrame(boston.data, columns = boston.feature_names)
dfy = pd.DataFrame(boston.target, columns = ['MEDV'])
df = pd.concat([dfx, dfy], axis = 1)

cols = ['MEDV', 'RM', 'LSTAT']

x = df[['LSTAT']]
y = df['MEDV']

# 실습 1 : DecisionTreeRegressor
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import r2_score

model = DecisionTreeRegressor (criterion = 'mse').fit(x,y)
print('predict:',model.predict(x)[:5])
print('real:', np.array(y[:5]))
print('결정계수(R2):',r2_score(y, model.predict(x)))

print('---------------------')
# 실습 2 : RandomForestRegressor
from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor(n_estimators = 1000, criterion = 'mse', random_state = 123).fit(x,y)
print('predict:',model.predict(x)[:5])
print('real:', np.array(y[:5]))
print('결정계수(R2):',r2_score(y, model.predict(x)))

분류트리는 질적 반응변수일 때 사용

회귀트리는 양적 반응변수일 때 사용

 

728x90

'데이터분석 > 데이터분석' 카테고리의 다른 글

서포터 벡터 머신 (SVM)  (0) 2022.05.14
XGboost  (0) 2022.05.12
앙상블 (Esemble Learning)  (0) 2022.05.11
sklearn을 이용한 과적합 방지  (0) 2022.05.11
분류모델 : 의사결정나무(DecisionTree)  (0) 2022.05.11