Side Project: HuBMAP + HPA
포스트 난이도: HOO_Lead
# HuBMAP + HPA 기한
- Started date: 6/22/2022
- Rules Acceptance Deadline: 9/15/2022
- Finished date: 9/22/2022
# Project Explanation: Functional tissue units
HuBMAP + HPA 프로젝트는 kaggle에서 진행되는 Competitions 프로젝트이다.
Functional tissue units에 대한 Data science 프로젝트에 해당하며, 여기서 말하는 Functional tissue units은 FTU 또는 기능적 조직 단위라고 부른다.
FTU는 특정 장기에 존재하는 Tissue units을 일컬어 말하는 것이 아니라 여러 장기에 존재하는
Functional tissue units을 통틀어 의미한다.
따라서 각기 다른 장기에는 그에 맞는 FTU가 존재하며
우리는 이것을 3차원 블록 형태로 시각화하여 구분하기도 한다.
이번 프로젝트에서는 이러한 FTU에 대한 데이터 분석과 분류를 보다 더 효율적으로 하고자 한다.
물론 기존에 FTU를 나누는 기준이나 방법이 존재하지만 ML을 통해서 보다 더 높은 작업의 효율성을 올리고자 한다.
또한 이번 프로젝트를 통해 FTU 특정 알고리즘으로 FTU에 대한 분류와 분석을 인간의 몸 여러 장기에 도입하여 사용이 가능할 것으로 보인다.
FTU에 대한 한 가지 예를 들어보자면, Kaggle에서는 신장 FTU에 대한 예를 살펴볼 수 있었다.
신장의 경우에는 100만 개 이상의 FTU 블록이 존재하며, 결과적으로 각기 다른 장기에도
이와 같은 또는 더 많은 FTU 블록인 존재한다는 것이다.
따라서 이러한 수많은 FTU를 분류와 분석하는 작업을 이번 프로젝트를 통해서 이루고자 한다.
# 프로젝트 주최자
이번 프로젝트는 스웨덴 연구 프로그램인 Human protein atlas와 연관성을 가지고 있다.
또한 National institutes of health가 후원하는 HuBMAP과도 연관성을 가지고 있는 프로젝트이다.
마지막으로 Indiana University의 CNS에서 다른 세계 기관과 협력하고 있다.
당연히 Google도 이번 주최자 및 후원자에 포함이 되어 있는 프로젝트이다.
# 보상
이번 프로젝트는 Kaggle에서도 큰 프로젝트에 해당하기 때문에 상금뿐만 아니라
랭킹 포인트도 추가적으로 제공한다.
또한 등급에도 영향을 주는 프로젝트에 해당한다.
# ML 평가 기준
제출되는 프로젝트의 ML 평가 기준은 Dice coefficient를 따른다.
또한 프로젝트가 다소 복잡하다보니 제출되는 파일 크기를 고려하여
픽셀 값 실행 길이 인코딩을 사용하고 있다.
한마디로 시작위치와 실행 길이가 포함된 쌍 값만 제출하면 된다는 것이다.
공백으로 구분된 쌍 목록으로 작성해야 한다.
또한 mask에 있어서는 binary로 이루어지며, 파일의 별도 헤더 파일 또한 포함해야 한다.
# Link
https://www.kaggle.com/competitions/hubmap-organ-segmentation/overview/supervised-ml-evaluation
'AI & Data' 카테고리의 다른 글
[Machine Learning] Training Dataset vs Testing Dataset (0) | 2022.07.17 |
---|---|
[Machine Learning] Learning Rate(학습률) (0) | 2022.07.15 |
[Data Science] 데이터 사이언스 코드 작성 요령: 디렉토리, 파일명 선언하기 (0) | 2022.07.08 |
[Data Science] Excel CSV 파일에서 한글 깨짐 현상 해결 방법: 메모장 활용하기 (0) | 2022.07.07 |
[Data Science] 데이터 사이언스 프로젝트 코드 작성 요령 (0) | 2022.07.06 |
댓글