728x90 ML4 [Machine Learning] Batch Size, Iteration Batch Size, Iteration 포스트 난이도: HOO_Senior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Gradient Descent # Batch Size Data science 프로젝트에서 사용되는 데이터셋은 한 종류가 아니라 여러 종류의 데이터셋을 종합적으로 분석하여 사용한다. 여기서 말하는 하나의 데이터셋은 빅데이터에 해당하는 데이터셋인 경우가 있는데 결국 여러 종류의 빅데이터를 ML(Machine learning)에 사용되는 셈이다. 이 경우, .. 2022. 7. 29. [Machine Learning] Training Dataset vs Testing Dataset Training Dataset vs Testing Dataset 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Dataset Machine learning을 돌리기 위해서는 학습할 데이터가 필요하다. 이러한 데이터들을 모아놓은 하나의 그룹을 우리는 데이터셋(Dataset)이라고 부른다. Machine learning에서 사용되는 데이터셋은 학습하는 데이터의 종류에 따라 이미지가 될 수도 있고 텍스트 파일이 될 수도 있다. Machine .. 2022. 7. 17. [Q&A] epochs의 기준을 몇으로 잡아야 하나요? epochs의 기준을 몇으로 잡아야 하나요? # epochs 기준 ML을 돌리는 데 있어서 batch size와 epochs를 몇으로 잡아야 하는지 고민이 되는 경우가 종종 있다. 거두절미하고 epochs에 대한 일관된 하나의 답변은 존재하지 않는다. 한마디로 프로젝트 상황에 따라서 적합한 epochs 수가 다르다는 것이다. 그렇기에 optimal한 결과를 산출하기 위해서 underfit과 overfit 결과를 모두 겪기도 한다. 물론 바로 원하는 결과가 산출되었으면 좋겠지만 원하는 결과가 바로 산출되지 않는 것이 데이터 사이언스 프로젝트이다. 또한 원하는 optimal 값이 산출되더라도 다른 epochs 수를 통해 비교 분석을 해보는 것이 좋기 때문에 결과적으로 여러 번 ML 학습을 돌릴 수밖에 없다는.. 2022. 7. 8. [Data Science] Reinforcement Learning(강화학습) Q: 머신러닝 강화 학습이 뭔가요? "머신러닝의 종류"라는 포스트에서 Supervised와 Unsupervised에 차이점에 대해서 살펴보았다. Reinforcement Learning이란? Reinforcement Learning을 직역한 것이 바로 강화 학습이다. 참고로 Reinforcement Learning은 RL이라고 줄여서 표현된다는 점을 알고 있으면 좋다. (Machine Learning은 ML이다.) 필자도 Reinforcement Learning를 RL이라고 포스트에서 줄여서 작성할 것이다. RL의 한국어 직역 표현인 강화 학습이라는 표현이 다소 생소할 수도 있는데, 응용학습이라고 이해하면 보다 더 쉽게 머릿속에 남을 것이다. RL은 머신러닝을 통해 컴퓨터를 학습시키는 방법 중에 하나로써.. 2021. 2. 1. 이전 1 다음 728x90