Faster RCNN
RPN + Fast RCNN
selective Search를 Neural network 구조로 대체
-gpu 사용으로 빠른 학습/inference가 가능해짐
-End to End Network학습
Anchor Box
Object가 있는지 없는지의 후보 Box
Object의 형태가 다르므로 총 9개의 Anchor box, 3개의 서로 다른 크기, 3개의 서로 다른 ratio로 구성
anchor box는 featuremap에 매핑된다.
800600을 1/16으로 downsampling하여 5038=1900크기로 변경
800600 크기의 이미지를 1/16으로 downsampling 하여 5038 = 1900의 크기로 변경
총 anchor box의 개수 = 1900 * 9 = 17100개
기존의 고정된 크기의 bounding box를 사용할 때보다 9배 많은 bounding box를 생성하며 더 다양한 크기의 객체를 포착하는 것이 가능해진다.
RPN(Region Proposal Network)
객체가 있을 법한 영역을 미리 찾는 형식인 Selective search를 대체