Machine Learning2 [ML] SMOTE 를 알아보자 현실 세계의 데이터는 생각보다 이상적이지 않다. 데이터에서 각 클래스의 개수가 현저하게 차이가 난 상태로 모델을 학습하면, 다수의 범주로 패턴 분류를 많이하게 되는 문제가 생기고 이는 곧 모델의 성능에 영향을 끼치게 된다. 이번에는 불균형 데이터 (imbalanced data) 의 문제를 해결할 수 있는 SMOTE(Synthetic Minority Oversampling TEchnique)에 대해서 설명해보고자 한다. 0. Undersampling vs. Oversampling SMOTE는 대표적인 오버 샘플링 기법 중 하나이므로 먼저 오버 샘플링과 언더 샘플링의 개념을 알아보고자 한다. 언더 샘플링과 오버 샘플링은 클래스 불균형을 해결하기 위한 기법 중 하나이다. 언더 샘플링(Undersamplin.. 2024. 7. 8. [sklearn] KNNImputer https://scikit-learn.org/stable/modules/generated/sklearn.impute.KNNImputer.html KNNImputerGallery examples: Release Highlights for scikit-learn 0.22 Imputing missing values before building an estimatorscikit-learn.orghttps://github.com/scikit-learn/scikit-learn/blob/2621573e6/sklearn/impute/_knn.py#L20 scikit-learn/sklearn/impute/_knn.py at 2621573e60c295a435c62137c65ae787bf438e61 · scikit-lear.. 2024. 6. 23. 이전 1 다음