- 데이터와 알고리즘을 기반으로 추론하는 프로그램
- 문제 정의
- 프로젝트의 목표를 정의하고 계획을 세우는 단계
- 대락적으로 어떤 데이터를 수집해서 어떤 머신러닝 알고리즘으로 문제를 해결할지 결정
- 데이터 획득
- 머신러닝 모델 학습에 필요한 데이터를 수집하는 단계
- 성공적인 머신러닝 프로젝트는 얼마나 충분히 데이터를 획득 했냐에 따라 결정되기에 절대 소홀히 해서는 안됨
- 획득된 데이터는 학습, 검증, 테스트 데이터로 구분되어 사용
- 모델 구현
- 학습 데이터를 기반으로 한 개 이상의 머신러닝 모델을 구현
- 검증
- 검증 데이터를 사용해 구현된 머신러닝 모델들의 성능을 검증
- 검증 결과를 바탕으로 모델을 튜닝하여 최적화된 모델을 만들 수 있음
- 테스트
- 검증 결과를 통해 선택된 모델의 성능을 테스트 데이터로 측정
- 결과에 따라 프로젝트를 마무리 할지, 모델을 개선할지 결정