본문 바로가기
AI & Data

[Data Science] Data Science vs Data Analyst vs Data Engineering

by Henry Cho 2022. 7. 18.
728x90

Data Science vs Data Analyst vs Data Engineering


포스트 난이도: HOO_Middle

 

[Notice] 포스트 난이도에 대한 설명

안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다

whoishoo.tistory.com


# DS, DA, DE

데이터 기반 인공지능이 대중화되어 사용되고 있는 만큼 데이터를 다룰 줄 아는 인재들을 많은 기업과 기관에서 찾고 있다.

몇 년 전까지만 해도 Data science라는 분야 하나로 통일되어 왔던 데이터를 다루는 직종이 이제는 Data science, Data analyst, Data engineering 등으로 나누어졌다.

Data science라는 분야가 세분화되고 전문화가 된다는 것은 그만큼 수요가 증가하고 대중적으로 많이 사용되는 기술이 되었다는 것을 보여준다.

이번 포스트에서는 세분화된 각 분야에 대한 특징과 차이를 알아보도록 하자.


# Data analyst

데이터 분석가 또는 Data analyst는 목적에 따라 데이터를 분석하는 일을 수행한다.

데이터를 수집하고 분석하고 사용자에 맞게끔 데이터를 시각화 또는 구성하는 역할을 수행한다.

데이터 분석가의 역할은 아래와 같다.

  • 데이터 수집
  • 데이터 분석
  • 데이터 시각화

이 점에서 보았을 때, 데이터 사이언스 또는 Data science와 비슷하게 보일 순 있다.

왜냐하면 Data scientist도 실제 프로젝트를 하는 데 있어서 데이터를 수집하고 분석하여 시각화하는 작업을 수행하기 때문이다.

하지만 Data science 분야와 Data analyst의 차이점은 Data analyst는 위에서 말한 역할을 수행하는데에서 끝이 난다는 점이다.

데이터 분석가는 데이터를 분석하는 작업을 하지만 데이터를 분석하는 구조 자체에는 관여하지 않는다.

한마디로 기존에 있는 구조 방식, 즉 프로그램을 통해서 데이터를 원하는 대로 가공하는 역할을 담당할 뿐이다.

물론 프로그래밍 부분을 전혀 몰라서는 안되지만, 그렇다고 데이터 사이언스(Data science)나 데이터 엔지니어링(Data engineering)처럼 데이터를 수집하고 분석하는 과정 자체의 구조를 파악할 필요는 없다는 것이다.

최근에는 데이터 분석가라는 직업을 비즈니스 또는 통계학과 계열의 학생들이 많이 담당하고 있다.

데이터 분석가는 프로그래밍에 대한 지식도 필요하지만 무엇보다도 목적성에 맞는 타깃 분석이 필요하다.

목적성에 맞는 타겟 분석이란 특정 비즈니스에 맞는 분석이 필요하다는 걸 의미한다.

결국 데이터 분석가는 데이터 사이언스와 데이터 엔지니어링처럼 프로그래밍에 대한 전문적인 지식이 상대적으로 필요하지는 않지만 반대로 비즈니스에 대한 지식을 겸비하고 있어야 한다.

그렇다 보니 미국의 경우에서는 CS전공 학부 졸업생뿐만 아니라 비즈니스 계열의 학생들이 석사학위로 데이터 분석 분야로 공부를 하고 취업을 하는 편이다.

CS 전공자일 경우에는 충분한 데이터 분석 경력 및 기술을 가지고 있다면 학부생으로도 취업이 가능하며, 비즈니스 계열의 학생일 경우에는 데이터 분석 분야 석사 공부로 데이터 분석가로 취업이 가능하다.

또한 CS 비전공자인 비즈니스 계열의 학생들도 데이터 분석 석사 공부를 통해 노력한다면 충분히 데이터 분석가로서 필요한 CS 지식과 기술을 습득할 수 있다.

왜냐하면 앞서 이야기했듯이 미국에서는 비즈니스 계열의 학생들이 많이 도전하는 분야이다 보니, 석사 과정에서도 이 점을 고려하여 기초 머신러닝 알고리즘부터 수업을 진행하는 학교들이 많기 때문이다.


# Data engineering

데이터 엔지니어링부터는 사실상 CS 비전공자가 접근하기는 어려운 분야이다.

엄청난 독학과 적성을 가지고 능력이 있다한들 CS 전공자가 아니라면 한국뿐만 아니라 미국에서도 해당 분야로 취업이 어렵다.

데이터 엔지니어링(Data engineering)은 데이터를 분석하기에 앞서서 데이터를 수집하는 과정 자체의 구조부터 다루는 분야이다.

현재의 데이터 기반 인공지능은 컴퓨터가 인간처럼 자유롭게 판단하지는 못한다.

결국 데이터를 수집하는 과정 자체나 데이터를 분석하는 방법 자체를 컴퓨터에게 알려주어야 한다.

이 말인 즉슨, 데이터를 수집 및 가공하는 과정에 대한 프로그래밍과 구조 및 알고리즘을 구현해야 한다는 것이다.

이 점에 있어서 데이터 사이언스와 비슷해 보일 수 있다.

하지만 데이터 엔지니어링이 데이터 사이언스와 다른 점에 데이터 자체에 대한 목적성을 고려하지 않는다는 것이다.

데이터 엔지니어링은 데이터 수집 및 가공에 필요한 APIs들을 만들고 ML Algorithms을 다루며 Data pipeline을 만든다.

그렇다 보니, 기본적으로 Data science에 필요한 프로그래밍에 대한 전문 기술과 경력을 가지고 있어야 하기에 CS 전공자이면서 석사학위까지 취득한 개발자가 취업할 수 있는 분야이다.

CS 학부 졸업생이 해당 분야로 바로 취업할 수 없는 이유는 석사가 아니라서가 아니라 실제로 학부 때 배우는 수업만으로는 데이터 엔지니어로 일을 하기가 어렵기 때문이다.

석사 학위를 가지고 있더라도 데이터 엔지니어링에 필요한 기술이 부족하다면 취업이 안될 수도 있다.


# Data science

거두절미하고 데이터 사이언스는 데이터 분석과 데이터 엔지니어링을 모두 합친 분야에 해당한다.

물론 데이터 사이언스라는 분야가 가진 Predicitive algorithm이나 Develop operational models와 같은 고유 작업 및 기술들이 있지만 기본적으로 데이터 분석과 데이터 엔지니어링에서 다루는 기술과 원리를 모두 알고 있어야 한다.

데이터 사이언스는 데이터를 분석하고 데이터를 수집 및 가공하는데 필요한 알고리즘을 구성할 뿐만 아니라 이후의 데이터를 관리하고 고도화된 데이터 분석 및 예측까지 하는 작업을 수행한다.

그렇다 보니, 데이터 사이언스라는 분야는 CS 비전공자가 접근하기 어려우며, CS 전공자 중에서도 Data science 분야로 박사까지 취득한 개발자만이 취업이 가능한 분야이다.

물론 가끔씩 학부생들도 Data science라고 취업을 하기도 하지만 실질적으로 보면 Data scientist로 취업을 하는 것이 아니라 데이터 분석가로서 우선적으로 취업을 한다.

한마디로 Data science라고 하지만 엄밀히 따져보면 데이터 분석가인 셈이다.

박사 학위까지 공부를 하지 않더라도 Data scientist가 될 수는 있지만 박사를 취득해야 할 정도로 많은 지식과 경험, 기술 등을 겸비해야 한다는 걸 의미한다.


 

728x90

댓글