3대 기획사 아이돌 가수들의 얼굴을 분류하는 프로젝트입니다.
- 주제: 3대 기획사(SM, JYP, YG) 소속 아이돌 가수의 얼굴 분류하고 주어진 얼굴에 가까운 기획사를 예측하기
- target: SM, JYP, YG 3개 class
- data: 3대 기획사 소속 아이돌 가수의 얼굴 사진
- 수집방법: 3사 소속 아이돌 멤버의 구글 이미지 검색 결과를 크롤링
- google_images_download 패키지를 이용하여 아이돌 가수의 사진을 100개씩 크롤링
- 활동명이 보통 명사인 경우(비, 바다, 태양, 수영, 마크, 탑, 페이 등), 동명이인인 경우(김태우, 이승훈, 정찬우 등)은 그룹이름이나 '얼굴' 등을 검색어에 추가하여 다시 크롤링
- 혼자 있지 않은 사진, 옆얼굴 사진, 선글라스나 안경 등으로 얼굴이 가려진 사진 등을 필터링함
- 크롤링한 사진에서 얼굴 부분을 자르기
- openCV를 기반으로 만들어진 autocrop 패키지를 이용하여 얼굴을 중심으로 정사각형 이미지로 잘라내고 96*96으로 이미지 사이즈 조정
- 정면 얼굴이라도 기울어진 경우 얼굴 인식이 잘 되지 않아 이미지의 각도를 보정해준 후 다시 cropping함
- image augmentation
- cropping까징 완료한 여자 아이돌 사진은 1953장으로, 신경망 모델에 사용하기엔 데이터 수가 부족하다고 생각되어 image augmentation을 통해 이미지를 30배로 늘린 data set 생성
- CNN with keras
- 모델링 초기 단계인 현재 accuracy 기준 모델 성능은 50% 근처에 머무르고 있으며, image augmentation 후 생성한 모델도 성능에 큰 차이를 보이고 있지 않음