상관관계
5.1 피어슨 상관계수
1) 피어슨 상관계수란 무엇일까?
피어슨 상관계수
- 두 연속형 변수 간의 선형 관계를 측정하는 지표
- 피어슨 상관계수 그래프에서 x와 y의 선형 관계를 보여준다.
- -1에서 1 사이의 값을 가지며
- 1은 완전한 양의 선형 관계
- -1은 완전한 음의 선형 관계
- 0은 선형 관계가 없음을 의미
더보기
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import pearsonr
# 예시 데이터 생성
np.random.seed(0)
study_hours = np.random.rand(100) * 10
exam_scores = 3 * study_hours + np.random.randn(100) * 5
# 데이터프레임 생성
df = pd.DataFrame({'Study Hours': study_hours, 'Exam Scores': exam_scores})
# 피어슨 상관계수 계산
pearson_corr, _ = pearsonr(df['Study Hours'], df['Exam Scores'])
print(f"피어슨 상관계수: {pearson_corr}")
# 상관관계 히트맵 시각화
sns.heatmap(df.corr(), annot=True, cmap='coolwarm', vmin=-1, vmax=1)
plt.title('pearson coefficient heatmap')
plt.show()
'내배캠_Data_3기 > TIL' 카테고리의 다른 글
240826_데이터 분석가란? (1) | 2024.08.27 |
---|---|
240812_머신러닝 기초 1. 머신러닝의 기초 (0) | 2024.08.12 |
240808_통계학 기초 4주차 (0) | 2024.08.08 |
240807_통계학 기초 3주차 (0) | 2024.08.07 |
240806_통계학 기초 2주차 데이터의 분포 (0) | 2024.08.06 |