[KT AIVLE SCHOOL]

머신러닝(1)

조진목_스터디 2024. 10. 14. 20:41

train_test_split(): 훈련 데이터와 테스트 데이터로 분류

# 모듈 불러오기
from sklearn.model_selection import train_test_split
 
# 7:3으로 분리
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=1)

 

 

상관관계 확인

# 상관관계 확인
data.corr(numeric_only=True).style.background_gradient()

 

 

선형 회귀 모델

# 1단계: 불러오기
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error

# 2단계: 선언하기
model = LinearRegression()

# 3단계: 학습하기
model.fit(x_train, y_train)

# 4단계: 예측하기
y_pred = model.predict(x_test)

# 5단계: 평가하기
mean_absolute_error(y_test, y_pred)

 

 

KNN 분류

# 1단계: 불러오기
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# 2단계: 선언하기
model = KNeighborsClassifier()

# 3단계: 학습하기
model.fit(x_train, y_train)

# 4단계: 예측하기
y_pred = model.predict(x_test)

# 5단계: 평가하기
accuracy_score(y_test, y_pred)

 

 

의사결정나무

# 1단계: 불러오기
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

# 2단계: 선언하기
model = DecisionTreeClassifier()

# 3단계: 학습하기
model.fit(x_train, y_train)

# 4단계: 예측하기
y_pred = model.predict(x_test)

# 5단계 평가하기
accuracy_score(y_test, y_pred)

 

 

평가지표

SSE: 오차 제곱 합

MSE: 오차 제곱 평균

RMSE: 오차 제곱 평균 제곱근 

MAE: 오차 절대값 평균

MAPE: 오차 절대값 평균의 비율 / (MAE/n)

 

 

SST,  SSR, SSE

SST: 평균과 실제값의 차이

SSR: 평균과 예측값의 차이

SSE: 예측값과 실제값의 차이

# 오차의 비 혹은 설명력
# 전체 오차 중에서 회귀식이 잡아낸 오차 비율
# 높을 수록 좋다
R제곱(결정계수): SSR/SST = 1 - SSE/SST

'[KT AIVLE SCHOOL]' 카테고리의 다른 글

머신러닝(3)  (1) 2024.10.16
머신러닝(2)  (1) 2024.10.15
데이터 시각화(2)  (0) 2024.10.14
데이터 시각화(1)  (1) 2024.10.10
데이터 수집(2)  (1) 2024.10.06