[AI / Computer Vision] YOLOv8 (욜로v8)
YOLOv8 (욜로v8)
포스트 난이도: HOO_Senior
# 2023년 1월에 공식적으로 공개된 YOLOv8
이번에 글쓴이가 학회를 다녀오면서 가장 크게 느낀 점이 Computer vision (컴퓨터 비전)에 대한 연구 및 개발이 정말 놀라울 정도로 많이 차지하고 있었다는 것이다. 글쓴이가 처음 computer vision을 했던 시기는 (라떼는 말이야) open cv나 YOLO 완전 초창기 버전이 막 나와서 대박이라고 외쳤었는데 어느샌가 많은 개발자 브로들이 computer vision을 다루고 있어서 새삼스럽게 눈물이 살짝 고였다.
물론 분야나 학회마다 특성이 달라서 그럴 수도 있지만 인공지능 분야에 있어서도 컴퓨터 비전에 대한 활용이 매우 많아졌다. 심지어 최근에는 NLP(Natural Language Processing)가 트랜드로써 열심히 활동 중인데도 반해 컴퓨터 비젼에 대한 활용도가 높아서 놀라웠다. 그도 그럴 것이 Object detection쟁이들이 환장하는 YOLO가 새로운 버전을 출시하였고 기존의 버전과 상당히 꽤 많은 부분을 바꾸어서 공개했기 때문이다. 실제로 YOLOv8이 나온 지 불과 6개월 정도밖에 안되었음에도 불구하고 학회에서 이미 v8을 사용한 연구 사례들을 발표하는 걸 보고 놀라웠다. 그만큼 YOLOv8이 가진 특징이 상대적으로 다른 버전과 차이가 있기 때문이 아닐까라고 생각했고 실제로 발표하는 연구원이나 교수님들도 같은 이유를 언급했다.
# 버전 업데이트 수준이 아닌 완전 풀 체인지
YOLO를 사용해 오던 브로들은 알 테지만 YOLO는 완벽하지 않기 때문에 매번 업데이트로 정확도를 높여주고 loss 되는 값을 줄여주고 있다. 그렇기에 매 업데이트되는 새로운 YOLO가 효율성 측면에서 조금이라도 낫기 때문에 우리는 최근 버전을 사용하는 편이었다. 하지만 이번 버전은 아키텍처 자체를 바꾼 새로운 방식의 업데이트로써 무엇보다도 Anchor로부터 자유로워졌다는 것이다.
이미지 디텍팅을 하면서 loss가 많이 발생되는 원인 중에 하나가 Anchor box로부터 발생한다. 사실상 Anchor box를 사용하여 Image를 detecting 하는 방식이기에 YOLO 뿐만 아니라 다른 모델의 경우에도 loss가 발생할 수밖에 없었다. 하지만 이번에는 예측하고자 하는 이미지 자체를 우선적으로 예측을 하여 Anchor free detection system 도입이 가능해졌다. 이로써 효율성이 증대되었다는 건 당연한 이야기고 무엇보다 글쓴이가 기대되는 점은 다음 버전에 있어서 효율성이 상대적으로 얼마나 더 증가할 수 있을지였다. Anchor 방식 자체의 변하는 앞으로 YOLO가 업데이트되는 데 있어서 효율성을 더 높일 수 있는 새로운 잠재적 가능성을 보여준다고 보기 때문이다. 이외에 다른 자잘한 업데이트도 있지만 글쓴이가 크게 와닿았던 부분이 바로 이 부분이었다.
# Conclusion
너무도 큰일이 난 게 지금 당장 해야 할 페이퍼 작업과 블록체인 모델 개발이 있는데 YOLOv8을 해보고 싶은 마음에 손이 저절로 사이드 프로젝트로 향하고 있다. 한편으로는 모든 개발자 및 연구원들이 YOLO를 사용하는 것을 보고 어쩔 수 없다고 생각하면서도 조금 걱정이 되기도 했다. 그걸 아는 사람이 YOLO의 새로운 버전을 해보러 가고 있다.
https://github.com/ultralytics/ultralytics