본문 바로가기
AI & Data

[Data Science] 캐글(Kaggle)이란?

by Henry Cho 2020. 2. 3.
728x90

캐글(Kaggle)이란?




 

 

Good morning yall, HOO입니다.

오랜만에 AI 분야에 있는 삼국지 형이랑 카톡을 하게 되었다가 캐글이라는 걸 언급하더군요. 처음에 캐글이라는 말을 듣고 도대체 캐글이 뭔데 싶었습니다. 아무리 컴퓨터를 써왔다고는 하지만 그래도 군대는 군대인지라 캐글이 뭔지도 모르고 있었네요.

삼국지 형도 제가 돈을 좋아하는 걸 알고 있고, 프로그래밍을 어느정도 한다는 걸 알다보니 캐글을 추천해주셨습니다. 캐글을 통해서 돈도 벌고 AI 쪽으로 스펙도 쌓고 공부도 할 수 있으니 일석삼조였습니다.

 

Kaggle: Your Machine Learning and Data Science Community

Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.

www.kaggle.com

캐글에 대해서 찾아보면, 무엇인지에 대해서 쉽게 찾아볼 수 있습니다. 캐글은 AI이다, 데이터 분석 사이언스 경진대회이다, 예측모델 분석 대회이다, 한국사람들이 떠드는게 캐글이다(Korean + gaggle = Kaggle) 등 다양한 설명이 나와있습니다.

 

 

쉽게 말해서 깃허브의 다른 형태에 프로그래밍 커뮤니티 사이트입니다.


여기서 특징적인 요소는 바로 Competition이라는 대회인데, 기업에서 개발하고자 하는 프로그램이나 개선하고자 하는 프로그래밍 부분을 올리고 우승자를 뽑아서 상금을 줍니다. 캐글에 올라오는 프로그래밍은 데이터를 분석하고 컴퓨터가 어떻게 반응하게 만들 것인지에 해당합니다.

한마디로 데이터를 분석하고 원하는 조건을 맞춰서 결과 값을 도출하기 위해서 데이터 분석에 대한 코딩을 해야되고, 그러다보면 머신러닝과 딥러닝에 대해서 전반적인 지식과 활용할 수 있는 능력이 있어야하고, 결과적으로는 완벽한 AI는 아니지만 현재 AI라고 불리는 수준의 프로그램을 만드는 것입니다. 일부 사람들은 사실상 머신러닝이나 딥러닝 보다는 그냥 특정 부분의 코드로 원하는 결과를 효율적으로 도출해낼 수 있는 아이디어가 중요하다고는 하지만 그래도 해당 개념을 가지고 있어야지 코딩이 가능하겠다라는걸 보면서 느꼈습니다.

 

 

깃허브랑 완전 다른데??


캐글에서 Competiton만 있었다면 Hot해질 수 없었을 것입니다. 캐글이 핫한 이유는 바로 다른 사람과 코드를 공유할 수 있으며, 다른 사람의 코드를 수정하고 변형해서 보다 더 효율적인 코드를 만들 수 있습니다. 그러다보니 자신이 가지고 있던 지식의 범위를 넓힐 수 있는 아주 좋은 웹사이트이더군요! 물론 제 궁극적 목적은 돈이지만요.

 

 

캐글 사용시 유의사항


데이터 분석 분야에 어느정도 지식을 가지고 있다면, 캐글을 사용하는 것을 권하지만, 꿈과 희망에 찬 열정 넘치는 초보 프로그래머가 캐글을 본다면 몇 개월 내로 프로그래머의 꿈을 접을 수도 있다고 생각합니다. 깃허브와 캐글의 차이점을 살펴보았을때 제일 크게 와닿았던 것은 전문성입니다. 깃허브는 다양한 프로그래밍을 배울 수도 있지만, 초보부터 전문가까지 다양한 사람이 이용하기 괜찮다고 생각합니다. 하지만 캐글의 경우 해당 분야에 어느정도 전문가가 아니라면 접근하기가 여간 쉽지 않습니다. 물론 캐글에서도 beginner위한 코드를 올려주시는 분들도 있지만, 말만 beginner이지 제가 처음 프로그래밍을 공부하던 시절에 이것을 본다면, 다시 의학 쪽으로 돌아갔을 겁니다.

 

 

결론


AI, 또는 데이터 분석 쪽으로 공부를 하고 있고 대학원생 이상이라면

캐글은 정말 좋은 수입원 아니 좋은 사이트이다.

728x90

댓글