머신러닝 & 딥러닝

데이터 불균형 처리(undersampling, oversampling, smote)

에멜라 2024. 2. 5. 20:18

 

 

 

https://casa-de-feel.tistory.com/15

 

불균형 데이터 (imbalanced data) 처리를 위한 샘플링 기법

*해당 포스팅은 고려대학교 산업경영공학부 김성범 교수님의 Youtube 채널의 "[핵심 머신러닝] 불균형 데이터 분석을 위한 샘플링 기법" 자료를 보고 공부하며 작성한 글입니다. 그림들의 출처도

casa-de-feel.tistory.com

https://abluesnake.tistory.com/116

 

imblearn 모듈을 이용한 불균형 데이터 다루기

머신러닝에서 분류 문제를 다룰 때 가장 먼저 데이터의 분포를 확인하죠. 타겟이 두가지 범주를 갖는지(-> binary classification), 세 개 이상의 범주를 갖는지(-> multi-class classification), 하나의 데이터

abluesnake.tistory.com