Machine Learning
머신러닝이란 기계가 배운다는 의미를 가지고 있듯이
머신러닝은 한 가지 방식만 의미하지는 않습니다.
현재까지 머신러닝 알고리즘은 크게 세 가지고 나뉘어서 사용되고 있습니다.
Supervised, Unsupervised, Reinforcement Learning이죠.
여기서 파생된 새로운 방식 중에 Semi-supervised도 있지만
대표적인 세가지세 가지 머신러닝 알고리즘이라고 하면 저 세 가지를 의미합니다.
머신러닝 알고리즘에 따라 방식이 다르며
방식이 다르다는 건 상황에 따라 맞는 알고리즘을 사용하면 된다는 것입니다.
따라서 머신러닝이라고 할지라도 어떤 목적을 가지고 사용하느냐에 따라
각기 다른 머신러닝 알고리즘이 사용됩니다.
supervised
supervised란 "감독하다"라는 의미를 가진 단어입니다.
단어에 뜻에서도 알 수 있듯이 컴퓨터의 학습을 감독하는 역할을 수행하는 알고리즘입니다.
컴퓨터가 머신러닝 알고리즘을 통해 초기값을 어떤 걸 입력하면 어떤 결괏값이 산출되는지를 개발자가 알고리즘을 통해 알려줍니다.
그러고 난 뒤에 컴퓨터는 개발자가 알려준 방법대로 반복하면서 스스로 학습하는 것이 바로 supervised 알고리즘입니다.
예를 들어, 선생님이 수학 문제를 먼저 풀어봐주고 나서 학생은 비슷한 유형의 문제를 풀어보는 것도 supervised 알고리즘에 해당합니다.
따라서 컴퓨터에게 supervised 머신러닝 알고리즘과 방법을 알려주고 나면 스스로 결과를 산출해내기 때문에 분류하는 작업에 supervised 알고리즘을 활용하기도 한답니다.
unsupervised
unsupervised는 un+supervised로 구성된 단어로써 감독을 하지 않는다는 의미를 내포하고 있기에 "자율학습"이라는 뜻을 가지고 있습니다.
한마디로 머신러닝 알고리즘에서 unsupervised는 컴퓨터에게 개발자가 무엇을 찾고 있는지를 따로 알려주지 않는 것이죠.
컴퓨터는 데이터를 통해 어떤 결과값을 찾아야 하는지는 모르지만, 반복 학습을 통해서 스스로가 데이터에 대한 연결고리를 찾게 됩니다.
연결된 데이터끼리 그룹화(clustering)을 하게 되는 것이죠.
예를 들어, 고양이와 멍멍이 사진을 컴퓨터에게 줍니다.
우리는 고양이 사진을 보고 고양이라고 이야기하고 멍멍이 사진을 보면 멍멍이라고 말할 수 있습니다.
하지만 컴퓨터는 고양이라는 고유명사를 모르고 고양이에 대한 개념이 없기 때문에 고양이 사진을 보고 고양이라고 이해하지 못합니다.
컴퓨터는 다양한 데이터 속에서 고양이와 멍멍이를 정의할 수 없지만 사진 속 생김새가 비슷한 사진끼리 그룹화를 할 수 있습니다.
결국 컴퓨터는 고양이가 무엇인지는 모르지만 결과적으로 고양이 그룹에는 고양이 사진만, 멍멍이 그룹에는 멍멍이 사진만 나눌 수 있습니다.
이것이 바로 unsupervised 알고리즘을 사용한 예에 해당됩니다.
'AI & Data' 카테고리의 다른 글
데이터 경제 시대란? (0) | 2020.12.10 |
---|---|
[Data Science] AI, 머신러닝 개발 환경이란? (0) | 2020.05.21 |
[Data Science] 딥러닝(Deep Learning)이란? (0) | 2020.05.13 |
[Data Science] 머신러닝(Machine Learning) vs 딥러닝(Deep Learning) (0) | 2020.05.13 |
[Data Science] 캐글(Kaggle)이란? (0) | 2020.02.03 |
댓글