: 많은 사람들은 신용 기록이 불충분하거나 존재하지 않아 대출을 받기 위해 애를 씁니다. 주택 신용 기관(Home Credit)은 안전한 차용을 제공하고자 고객의 상환 능력을 미리 예측할 필요가 있고, 이를 위해 전화 및 거래 정보를 포함한 다양한 데이터를 사용하고 있습니다. 여러분들은 지금까지 배운 다양한 통계 분석 기법과 머신러닝 모델을 활용하여 고객의 부채 상환 능력에 대해 예측을 진행하게 됩니다.
프로젝트를 진행할 때, 유념해야할 것들입니다.
필요한 데이터를 파일로부터 로드하여 데이터프레임으로 변환할 수 있는가 데이터 구성도를 보고 다른 파일 간 데이터 연관성을 지을 수 있는가 데이터 프레임에 대한 병합을 실현할 수 있는가 분류형 데이터를 수치형으로 인코딩 할 수 있는가
병합된 데이터 프레임에 대하여 시각화 (차트)할 수 있는가 카테고리형(분류형) 데이터의 불균형도를 시각화 할 수 있는가
피처 (컬럼) 간 연산 및 피처공학을 통해 유의미한 새로운 컬럼을 만들 수 있는가 학습과 검증용 데이터로 분할 할 수 있는가
적절한 앙상블 모델을 정의하고 학습하며, 어떤 피쳐가 중요한지 판별해 낼 수 있는가 모델의 성능에 대하여 객관적인 지표로 검증해낼 수 있는가