train_test_split(): 훈련 데이터와 테스트 데이터로 분류
# 모듈 불러오기
from sklearn.model_selection import train_test_split
# 7:3으로 분리
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=1)
상관관계 확인
# 상관관계 확인
data.corr(numeric_only=True).style.background_gradient()
선형 회귀 모델
# 1단계: 불러오기
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error
# 2단계: 선언하기
model = LinearRegression()
# 3단계: 학습하기
model.fit(x_train, y_train)
# 4단계: 예측하기
y_pred = model.predict(x_test)
# 5단계: 평가하기
mean_absolute_error(y_test, y_pred)
KNN 분류
# 1단계: 불러오기
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
# 2단계: 선언하기
model = KNeighborsClassifier()
# 3단계: 학습하기
model.fit(x_train, y_train)
# 4단계: 예측하기
y_pred = model.predict(x_test)
# 5단계: 평가하기
accuracy_score(y_test, y_pred)
의사결정나무
# 1단계: 불러오기
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
# 2단계: 선언하기
model = DecisionTreeClassifier()
# 3단계: 학습하기
model.fit(x_train, y_train)
# 4단계: 예측하기
y_pred = model.predict(x_test)
# 5단계 평가하기
accuracy_score(y_test, y_pred)
평가지표
SSE: 오차 제곱 합
MSE: 오차 제곱 평균
RMSE: 오차 제곱 평균 제곱근
MAE: 오차 절대값 평균
MAPE: 오차 절대값 평균의 비율 / (MAE/n)
SST, SSR, SSE
SST: 평균과 실제값의 차이
SSR: 평균과 예측값의 차이
SSE: 예측값과 실제값의 차이
# 오차의 비 혹은 설명력
# 전체 오차 중에서 회귀식이 잡아낸 오차 비율
# 높을 수록 좋다
R제곱(결정계수): SSR/SST = 1 - SSE/SST'[KT AIVLE SCHOOL]' 카테고리의 다른 글
| 머신러닝(3) (1) | 2024.10.16 |
|---|---|
| 머신러닝(2) (1) | 2024.10.15 |
| 데이터 시각화(2) (0) | 2024.10.14 |
| 데이터 시각화(1) (1) | 2024.10.10 |
| 데이터 수집(2) (1) | 2024.10.06 |