상관 관계는 회귀분석에서 변수들 간의 인과관계를 분석하기 전에 각 변수들 간에 관련성을 분석하는 선행자료로 이용된다. 공분산은 두 개 이상의 확률 변수에 대한 관계를 보여 주는 값이다. 공분산을 표준화 시킨 것이 상관계수이다. # 상관관계 분석 # 두 개 이상의 확률변수(연속형) 간에 어떤 관계가 있는지 분석하는 것 # 공분산을 표준화 한 것을 상관계수(r)라고 한다. import pandas as pd import numpy as np import matplotlib.pyplot as plt plt.rc('font', family='malgun gothic') df = pd.DataFrame({'id1':(1, 2, 3, 4, 5), 'id2':(2, 3, -1, 7, 9)}) print(df) pri..