VAST Challenge 2022
포스트 난이도: HOO_Senior
# VAST 2022
https://vast-challenge.github.io/2022/
VAST Project 또는 VAST Challenge는 매년 IEEE에서 주최하는 Visual analytics science and technology 챌린지이다.
데이터 분석과 데이터 시각화 분야의 발전을 위해서 다양한 Data science 분야의 개발자들이 프로젝트에 참여하면서 새로운 방식이나 생각지 못한 방식의 데이터 분석 및 시각화 작업을 수행한다.
VAST 챌린지는 데이터 분석 및 시각화에 대한 기술 발전뿐만 아니라 새롭게 해당 분야에서 공부하거나 경험을 쌓고 싶어 하는 개발자들을 위한 데이터 시각화 프로젝트의 기회를 제공해주는 셈이다.
# 챌린지 주제
VAST 챌린지에서는 매년 데이터 분석을 통한 긍정적인 결과를 산출해내야 하는 문제들을 제시해주며, 이에 필요한 데이터셋도 제공해준다.
이번 VAST 2022에서 미국 오하이오주 인게이지먼트 시에 대한 데이터 분석 및 시각화 작업이 주요 문제이다.
해당 도시의 급격한 성장으로 인해 발생되는 문제점들을 데이터 분석과 특정 기준으로 구성된 시각화 자료를 통해 해결방법을 모색하고 효율적인 도시 운영에 도움을 주는 것이다.
한마디로 도시 계획 팀의 데이터 분석가 멤버 중 하나로 프로젝트를 수행한다고 보면 된다.
# 챌린지 참가 인원
VAST 챌린지는 팀으로 참여가 가능하며, 시각적 분석을 통한 문제 해결을 도출해내길 원한다.
필자의 경우에는 개인 연구 프로젝트로 개인 참여를 하여 작업을 수행하는데, 데이터 분석과 시각화 작업에 대한 경험이 있거나 지식이 어느 정도 있다면 충분히 시간을 가지고 혼자서 사이드 프로젝트로 작업이 가능하다고 보인다.
# 챌린지 마감일
VAST Challenge는 매년 6월쯤 시작되어 7월에 마감되는 프로젝트이기 때문에 이번 2022 프로젝트는 7월 13일에 프로젝트 제출이 마감된다.
참고로 이번 VAST 2022 마감 기간 기준은 AOE time이다.
VAST 2022 Deadline: 07/13/2022
# 유의사항 - 데이터셋 오류
필자는 사이드 프로젝트로 VAST 2022 프로젝트를 참여 중이다.
이번 프로젝트를 수행하는 데 있어서 문제점이 있다.
이번 프로젝트에는 데이터셋 오류가 있기 때문에 이 점을 유의해서 데이터셋을 다운로드하여야 한다.
데이터셋은 압축파일로 제공이 되며, 챌린지 참여에 동의한 이메일 계정으로만 데이터셋 다운로드가 가능하다.
하지만 일부 데이터셋이 깨져 있기 때문에 로컬 컴퓨터에서 압축 파일이 열리지 않을 수도 있다.
이 점을 유의해서 Cloud storage를 활용하여 압축 파일을 푸는 것을 추천한다.
물론 이 경우에는 이미 오류가 난 데이터셋은 확인할 수 없지만 문제가 없는 데이터셋은 개별적으로 다운로드가 가능하다.
이 점에 대해서 지속적으로 해당 VAST 2022 프로젝트 담당자 및 위원회와 연락을 주고받고 있지만 최종적인 문제 해결점에 대한 답변을 듣지 못하였다.
하지만 개별적 데이터셋 다운로드 후에 프로젝트를 수행하는 데에는 가능하기 때문에 VAST 2022 프로젝트를 참가하거나 필자처럼 데이터셋 문제가 있는 경우에는 Cloud storage를 활용하길 바란다.
# 챌린지에 대한 설명을 마치며
혹시라도 내년 VAST 챌린지에 관심이 있거나 필자의 도움이 필요하다면 언제든지 환영이다.
이 외에도 Data science 프로젝트에 대한 궁금증도 멘토링이나 댓글을 통해서 물어볼 수 있다.
https://vast-challenge.github.io/2022/
'AI & Data' 카테고리의 다른 글
[Data Science] 데이터 사이언스 프로젝트 코드 작성 요령 (0) | 2022.07.06 |
---|---|
[Data Science] Side Project: Paddy Doctor (0) | 2022.07.03 |
[데이터 사이언스] 캐글 프로젝트(Kaggle Project): Foursquare - Location Matching (0) | 2022.06.11 |
[Data Science] Audio data를 ML하는 2가지 방법 (0) | 2022.04.17 |
[Kaggle] Data Visualization: pd.read_csv, filepath (0) | 2022.02.09 |
댓글