Faster RCNN

RPN + Fast RCNN

selective Search를 Neural network 구조로 대체

-gpu 사용으로 빠른 학습/inference가 가능해짐

-End to End Network학습

Anchor Box

Object가 있는지 없는지의 후보 Box

Object의 형태가 다르므로 총 9개의 Anchor box, 3개의 서로 다른 크기, 3개의 서로 다른 ratio로 구성

anchor box는 featuremap에 매핑된다.

800600을 1/16으로 downsampling하여 5038=1900크기로 변경

800600 크기의 이미지를 1/16으로 downsampling 하여 5038 = 1900의 크기로 변경

총 anchor box의 개수 = 1900 * 9 = 17100개

기존의 고정된 크기의 bounding box를 사용할 때보다 9배 많은 bounding box를 생성하며 더 다양한 크기의 객체를 포착하는 것이 가능해진다.

RPN(Region Proposal Network)

객체가 있을 법한 영역을 미리 찾는 형식인 Selective search를 대체