본문 바로가기
AI & Data

[Data Science] 데이터 사이언스란?

by Henry Cho 2022. 11. 16.
728x90

데이터 사이언스란?

포스트 난이도: HOO_Junior


# Data science

 

데이터 사이언스(Data science)는 데이터를 기반으로 하여 결과를 도출해내거나 산출된 결괏값을 기반으로 미래의 대한 결과를 사전에 예측하는 것을 의미한다. 한마디로 데이터 분석을 통해서 현재의 결과를 도출해낼 뿐만 아니라 최종적으로 앞으로의 미래를 예측하는 역할도 수행하기에 우리는 데이터 사이언스 또는 한국말로는 데이터 과학이라고 부른다.

 

데이터 사이언스는 머신러닝을 통해서 정보(Information)을 산출해내고 이러한 정보는 사용자에게 전달하거나 또 다른 인공지능 프로그램의 학습 소재로 사용이 되어 인공지능 프로그램의 최적화를 만들어주기도 한다. 따라서 우리는 인간을 위한 데이터 사이언스와 기계를 위한 데이터 사이언스로 분류하기도 한다.


# 데이터 기반 인공지능과 함께한 데이터 사이언스

 

4차 산업 시대와 함께 데이터 기반 인공지능 기술이 발달하였고 다양한 분야에서 적용되어 사용하고 있다. 그렇다 보니 4차 산업 시대를 다른 말로 데이터 경제시대라고도 부르며 데이터의 중요성이 대두되고 있다. 이제는 무형의 가치인 데이터 자체도 유형의 가치가 있는 것과 동일하게 대우를 받는 시대인 셈이다.


# 데이터 사이언스와 통계

 

데이터 사이언스만이 데이터를 다뤄온 것은 아니다. 사실상 우리는 통계를 통해서 데이터를 다뤄왔었다. 통계를 통해서 현재의 결과를 도출해내고 미래를 예측하는데 데이터를 활용하였다. 통계와 데이터 사이언스와의 차이점은 인공지능에 있다. 통계는 사람이 직접 데이터를 분석하고 판단하거나 프로그램을 사용하여 데이터를 비교 분석을 하게 된다. 결과적으로 프로그램을 사용하더라도 사람이 직접 결정하고 판단하는데 주요한 역할을 담당한다.

 

반면에 인공지능을 활용할 경우, 개발자가 개입한다는 점에서 사람이 주요한 역할을 담당한다고 볼 수도 있지만 실질적으로 결과를 도출해내고 예측하는 과정 자체는 인공지능 프로그램이 담당하게 된다. 개발자가 하는 역할은 인공지능이 어떤 방향성을 가지고 데이터를 인지하고 결과를 도출해낼 수 있을지 알려주는 역할만 수행하는 것이다. 또는 가이드라인 자체를 제공하지 않고 데이터만 주고 인공지능이 스스로 판단할 수 있게끔 환경을 만들어줄 수도 있다. 심지어 인공지능 자체가 학습을 통해 데이터를 분석하고 추론해내도록 설정할 수도 있다.

 

결국 데이터 사이언스는 인간이 데이터를 처리하는데 관리자 정도로만 참여할 뿐 실질적으로 분석하는 과정을 수행하지는 않는다. 결국 데이터 사이언스는 인간이 그동안 하지 못했던 대량의 데이터를 분석하고 각 데이터가 가진 특징 및 연관성을 찾아낼 수 있다. 


 

728x90

댓글