Giter Site home page Giter Site logo

object-detection's Introduction

Object-Detection

여러 물체에 대해 어떤 물체인지 분류하는 Classification 문제와 그 물체의 위치를 박스를 통해 나타내는 Localization 문제를 해내는 분야이다.
자율주행자동차, CCTV, 스포츠 경기 등에 쓰이며 위 코드는 2019년 하계 현장실습 CCTV 사람 탐지 프로젝트에서 구현한 코드이다.

R-CNN(Regions with CNN features)의 등장

CNN은 바로 object Detection 분야에 적용되지 못하고 있다가 R-CNN의 등장으로 적용되었다. R-CNN을 수정, 보완하여 관련 계열의 논문들(Fast, Mask etc)이 등장하였다.
사진첨부
데이터와 레이블 투입 -> 영역 제안 -> 제안된 영역(CNNs) -> 분류 및 Bounding Box 조정 순으로 이루어진다.
영역 제안은 선택적 탐색 방법으로 이루어진다. 특정 기준에 따라 탐색을 실시하는 방법으로, 작은 크기의 초기 영역을 설정한 후 작은 영역을 큰 영역으로 병합하여 이를 바탕으로 영역을 제안하게 된다. SVM을 통한 분류와 Box 제안은 동시에 이루어진다. 모든 제안된 Box마다 CNN을 돌려야 하고 분류를 위한 SVM, Regression까지 모두 이루어져야 하기 때문에 어렵고 시간이 오래 걸린다는 문제가 있다.

Faster R-CNN

새로운 방식인 Region Proposal Network(RPN)을 통해 속도를 올리고 실시간으로 인식이 가능할 수 있게 만든 모델이다.

Mask R-CNN

농촌진흥청 - 꽃 개수 카운팅 프로젝트에서 사용한 코드이다. 학습 이미지 4장 정도를 이용하여 다른 이미지 속 꽃의 위치와 개수 예측의 타탕도를 확인하고, 수학적 연구방법과 실행속도, 정분류, 오분류 정도를 비교한다.
Mask R-CNN은 물체 분류와 위치를 모두 나타내는데, Box형식이 아닌 mask 한다. Instance Segmentation까지 다루는 특징이 있다.
Classification, BBox Regression, Mask를 동시에 얻으며 Fast R-CNN에 mask를 추가한 모델이다.

github 링크 : https://github.com/matterport/Mask_RCNN

2D pose estimation

사람의 관절을 찾아 움직임을 관찰하는 기술로, 피트니스 분야에서 자주 사용된다. 해당 논문은 동작을 인식하고 그 자세를 측정하는 모델로 2019년 하계 현장실습에서 논문 세미나, 구현을 해본 모델이다.

  • 제목 : Realtime Multi-Person 2D Pose Estimation using Part Affinity
  • 저자 : Zhe Cao, Tomas Simon, Shih-En Wei, Yaser Sheikh(2016.11.24)

Pose Estimation이란 컴퓨터 비전에서 객체의 위치와 방향을 탐지하는 일반적인 문제로 사람의 신체관절인 point가 어떻게 구성되어있는지 위치를 측정하고 추정하는 것이다. Part Arrinity Fields는 찾은 관절(point)끼리의 연결해주는 역할을 한다.
실시간으로 들어오는 영상을 이미지로 캡쳐하여 이미지의 크기에 맞는 input shape을 갖고, 19개의 layer를 가진 cnn 모델 VGG19 layer 중 10개의 layer만 통과하여 특징맵을 추출한다. 추출된 맵은 two-branch multi-stage CNN에 들어간다.(큰 모델) branch1에서는 confidence map을 branch2 에서는 part affinity fields를 얻는다. feature map을 branch1,2 에서 1x1 줄인 후 다시 채널을 늘리는 형태로 진행하는데, 이때 구체적인 패턴을 잘 인식하게 해준다.

참고자료 : https://www.mimul.com/blog/realtime-multi-person-pose-estimation/
github 링크 : https://github.com/ZheC/Realtime_Multi-Person_Pose_Estimation

object-detection's People

Contributors

eeun-ju avatar

Stargazers

 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.