Giter Site home page Giter Site logo

level2-cv-datacentric-cv-12's Introduction

OCR 글자 검출 프로젝트

image

  • 2024.01.24 ~ 2024.02.01
  • 네이버 커넥트 재단 및 Upstage에서 주관하는 비공개 대회

Members

공통 : EDA, Annotation 가이드 제작, 리라벨링, 모델 학습

김세진: 학습데이터 피클화를 통한 모델 학습시간 경량화

박혜나: 추론 결과 분석, Noise Data Augmentation

이동우: Valid set, DetEval 연구 및 코드 제작

진민주: CVAT 세팅, 외부 데이터셋 학습 진행

허재영: Pepper noise Augmentation, Noise Reduction

문제 정의(대회소개) & Project Overview

image

스마트폰으로 카드를 결제하거나, 카메라로 카드를 인식할 경우 자동으로 카드 번호가 입력되는 경우가 있습니다. 또 주차장에 들어가면 차량 번호가 자동으로 인식되는 경우도 흔히 있습니다. 이처럼 OCR (Optimal Character Recognition) 기술은 사람이 직접 쓰거나 이미지 속에 있는 문자를 얻은 다음 이를 컴퓨터가 인식할 수 있도록 하는 기술로, 컴퓨터 비전 분야에서 현재 널리 쓰이는 대표적인 기술 중 하나입니다.

이번 프로젝트에서는 OCR을 이용해 의료 영수증의 글자 영역을 Detecting하는 것이 목표입니다.

대회 결과

Public 5등 | Private 2등

image

image

Dataset

  • 전체 이미지 개수 : Train set 100장, Test set 100장
  • 이미지 종류 : 진료비 영수증
  • 이미지 크기 : Various

Metric

  • F1 score

image

Model

  • EAST

Tools

  • Github
  • Notion
  • Slack
  • Wandb

Project Outline

image

Data Augmentations

  • CIE Ich Noise
  • Median Blur
  • 명도 확산
  • Pepper Noise

level2-cv-datacentric-cv-12's People

Contributors

revabo avatar dong-uri avatar heynapark avatar github-classroom[bot] avatar jae-heo avatar freenozero avatar

level2-cv-datacentric-cv-12's Issues

[Feature] dataset spit 코드 추가

📌 Description

train set, valid set을 split하는 코드를 utils에 추가합니다.

✅ CheckList

  • 관련 문서를 확인했습니다.
  • 관련 이슈를 검토했습니다.

[Feature] json 관련 utils를 추가합니다.

📌 Description

  1. AI hub 추가 데이터셋을 COCO format으로 변경(points 순서 변경)
  2. COCO format을 UFO format으로 변경
  3. UFO format을 COCO format으로 변경
  4. COCO json을 병합
  5. COCO json을 이미지별로 subset

✅ CheckList

  • 관련 문서를 확인했습니다.
  • 관련 이슈를 검토했습니다.

📁 Reference

[관련 자료, 스크린샷, 또는 기타 파일이 있으면 첨부해주세요.]

📎 ETC

[이외에 필요한 것이 있으면 적어주세요.]

[Feature] README 파일이 필요합니다.

📌 Description

�이번 프로젝트를 멋있게 완료했기 때문에 README 파일을 작성해주시면 감사드리겠습니다.

✅ CheckList

  • 관련 문서를 확인했습니다.
  • 관련 이슈를 검토했습니다.

📁 Reference

[관련 자료, 스크린샷, 또는 기타 파일이 있으면 첨부해주세요.]

📎 ETC

[이외에 필요한 것이 있으면 적어주세요.]

[Feature] 결과를 시각화 하는 기능을 추가합니다.

📌 Description

제출파일을 시각화 하여 결과를 확인하는 코드가 필요합니다.
이미지를 저장하는 형식인데 속도가 빠릅니다.

✅ CheckList

  • 관련 문서를 확인했습니다.
  • 관련 이슈를 검토했습니다.

📁 Reference

[관련 자료, 스크린샷, 또는 기타 파일이 있으면 첨부해주세요.]

📎 ETC

[이외에 필요한 것이 있으면 적어주세요.]

[Feature] 쉘 스크립트 파일을 통해 학습, 추론을 편하게 세팅할 수 있게 합니다.

📌 Description

학습, 추론 파일을 실행할 때 터미널에 인자를 설정해 주어야 하는데 이 과정을 편리하게 하기 위해 쉘 스크립트를 만들었습니다.

✅ CheckList

  • 관련 문서를 확인했습니다.
  • 관련 이슈를 검토했습니다.

📁 Reference

[관련 자료, 스크린샷, 또는 기타 파일이 있으면 첨부해주세요.]

📎 ETC

[이외에 필요한 것이 있으면 적어주세요.]

[Feature] Fax Noise와 비슷한 곰팡이 노이즈 추가 작업

📌 Description

�테스트 데이터셋에 있는 노이즈와 비슷한 곰팡이 노이즈를 만드는 작업을 하려고 합니다.
CV를 이용해서 작업하려고 합니다.

✅ CheckList

  • 관련 문서를 확인했습니다.
  • 관련 이슈를 검토했습니다.

📁 Reference

[관련 자료, 스크린샷, 또는 기타 파일이 있으면 첨부해주세요.]

📎 ETC

[이외에 필요한 것이 있으면 적어주세요.]

[Problem] 디렉터리 구조 개편이 필요합니다.

📌 Description

code 디렉터리 구조가 이상해서 개편이 필요합니다.
또한 code 폴더 이름을 text-detector로 변경하면 좋겠습니다.

✅ CheckList

  • 관련 문서를 확인했습니다.
  • 관련 이슈를 검토했습니다.

📁 Reference

[관련 자료, 스크린샷, 또는 기타 파일이 있으면 첨부해주세요.]

📎 ETC

[이외에 필요한 것이 있으면 적어주세요.]

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.