728x90 머신러닝데이터1 [Algorithms] 머신러닝에서 SMOTE 라이브러리를 통해 데이터 불균형 해소하기: 데이터 수 증가 및 감소 포스트 난이도: HOO_Middle# 데이터 수가 중요한 거지 데이터의 균형이 왜 중요한가요?Machine learning (ML)를 돌리다 보면 충분한 수의 데이터가 마련되지 않는 경우가 있다. 특히 산출하려는 결과가 하나가 아닌 여러 기준을 둔 채 나눠서 산출하려고 한다면 각 기준에 맞는 데이터 수가 필요하다. 예를 들어서 우리가 예측 모델을 만든다고 한다면, 예측하는 값의 기준을 대, 중, 소로 나눈다거나 아니면 카테고리를 가지고 분류를 한다고 했을 때 각 기준에 맞는 충분한 데이터 수가 필요하다. "데이터 수만 많으면 되는 건가요?"라고 오해할 수도 있지만 여기서 한가지 더 중요한 점은 "균형 있는 데이터 수"가 필요하다. 균형 있는 데이터 수라는 건 산출하려는 기준에 비슷한 숫자의 학습 데이터 .. 2025. 3. 31. 이전 1 다음 728x90