YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
2022/07/06
1. abstract
YOLOv7은 GPU V100에서 30FPS 이상의 속도를 가지는 현재 알려진 모든 real time object detector의 성능을 속도측면에서 5FPS ~ 160FPS까지 뛰어넘었고, 최고 정확도 56.8%AP를 달성했다.
YOLOv7-E6 object detector(56FPS V100, 55.9%AP)는 transformer 기반의 SWIN-L, Cascade-Mask R-CNN을 509% 속도차이와, 2% 정확도 차이로 뛰어넘었고,
convolutional 기반의 detector인 ConvNeXt-XL과 Cascade-Mask R-CNN을 551% 속도차이와 0.7%AP 정확도 차이로 뛰어넘었다.
YOLOv7은 YOLOR, YOLOX, scaled-YOLOv4, YOLOv5, DETR, Deformable DETR, DINO-5scale-R50, ViT-Adapter-B, 많은 다른 object detector들을 속도와 정확도 측면에서 뛰어넘었다.
게다가 우리는 YOLOv7을 오직 MS COCO데이터셋으로만 어떤 다른 데이터셋이나 pretrained weight없이 처음부터 training 시켰다.
이게 진짜 대세인가?? BEiT-3도 공공데이터셋으로만 training 시켰다던데
https://paperswithcode.com/paper/yolov7-trainable-bag-of-freebies-sets-new