- 주제 확정
- 데이터 준비(학습용+테스트용)
- Output Image
- 분석 방향
- 특징 탐색
- 분석 모델링 - Model Building
- 분석 모델링 - Model Evaluation
- 최종 모델 선택
- 리포트 완료
- 발표 리허설
- 스토리와 호소력이 있는 장표 + 발표력
- 모델의 실세계 해석력
- [신선함, 독창성, 발전성, 유용성] 중 적어도 하나
- 공헌
- 마무리가 없다
- 모델로 끝나고 해석은 없다
- 논리적 비약이 보인다
- 우리회사에 적용할 만한 가치를 이끌어 냈다!
- 구멍이 있는 부분을 채웠다!
- [공공, 기업, 자영업 등]에 이런 정보가 제공되어야 한다
- 주가, 날씨, 물가, 경제전망 - 슈퍼컴퓨터도 못 풀고 있는 주제들
- 사회적 이슈가 큰 주제 - 결과를 제시해도 갑론을박이 심하다
- 데이터 확보의 용이성
- [기존 주장, 기존 서비스, 응용]의 개선포인트 제시
- 작지만 새로운 방향 제시
- 주제
- 데이터 수집과 Fact Finding
- 결과와 공헌
- 모델
- 응용의 과정
- 응용의 결과와 공헌
- Results and Next Step
- Target은 2~3개의 Class
- 가격, 수량과 같은 양적 Target 대상의 예측 모델링은 가급적 피한다
- Regression Model은 정확도를 개선하는데 수개월이 걸릴 수도 있다
- 주제범위가 명확한 경우 다중회귀모델의 접근은 대부분의 feature 변수들의 상관관계가 높은 경향이 있어 다중공선성을 피하기 어렵기 때문에 결과를 제시하더라도 공격을 받기 쉽다
- 모델의 결과로 원인을 제시하는 RCA모델은 현실적으로는 Decision Tree와 Random Forest이다
- 원인의 제시 보다 예측을 더 중시한다면 Random Forest, SVM, Deep Learning으로 접근한다
- 주저말고 연락하시길 ^^
- 멘토가 연락이 온시점에 강사가 Business-Off일 때 - 즉답 Q&A
- 멘토가 연락이 온시점에 강사가 Business-On인 경우 - 시간 협의
- 짧은 Q&A는 Online - Anytime SNS(카톡, 밴드)
- 심도있는 미팅이 필요한 경우 Conference Call(카톡 등)
- 밤 늦게도 상관없슴 ^^