Giter Site home page Giter Site logo

kdata-mentoring-201910's Introduction

kdata-mentoring-201910

[프로젝트 멘토링 Plan]

1차 : 2019-10-12

  • 주제 확정
  • 데이터 준비(학습용+테스트용)
  • Output Image
  • 분석 방향

2차 : 2019-10-19

  • 특징 탐색
  • 분석 모델링 - Model Building

3차 : 2019-10-26

  • 분석 모델링 - Model Evaluation
  • 최종 모델 선택

4차 : 2019-11-02

  • 리포트 완료
  • 발표 리허설

Team Project 제언¶

성공

  • 스토리와 호소력이 있는 장표 + 발표력
  • 모델의 실세계 해석력
  • [신선함, 독창성, 발전성, 유용성] 중 적어도 하나
  • 공헌

실패

  • 마무리가 없다
  • 모델로 끝나고 해석은 없다
  • 논리적 비약이 보인다

이런 접근은 매력적

  • 우리회사에 적용할 만한 가치를 이끌어 냈다!
  • 구멍이 있는 부분을 채웠다!
  • [공공, 기업, 자영업 등]에 이런 정보가 제공되어야 한다

결과를 도출할 특별한 확신이 없다면 지양

  • 주가, 날씨, 물가, 경제전망 - 슈퍼컴퓨터도 못 풀고 있는 주제들
  • 사회적 이슈가 큰 주제 - 결과를 제시해도 갑론을박이 심하다

주제선정

  • 데이터 확보의 용이성
  • [기존 주장, 기존 서비스, 응용]의 개선포인트 제시
  • 작지만 새로운 방향 제시

리포트 구성

  • 주제
  • 데이터 수집과 Fact Finding
  • 결과와 공헌
  • 모델
  • 응용의 과정
  • 응용의 결과와 공헌
  • Results and Next Step

기간이 짧은 프로젝트의 모델링 전개 방향

  • Target은 2~3개의 Class
  • 가격, 수량과 같은 양적 Target 대상의 예측 모델링은 가급적 피한다
  • Regression Model은 정확도를 개선하는데 수개월이 걸릴 수도 있다
  • 주제범위가 명확한 경우 다중회귀모델의 접근은 대부분의 feature 변수들의 상관관계가 높은 경향이 있어 다중공선성을 피하기 어렵기 때문에 결과를 제시하더라도 공격을 받기 쉽다
  • 모델의 결과로 원인을 제시하는 RCA모델은 현실적으로는 Decision Tree와 Random Forest이다
  • 원인의 제시 보다 예측을 더 중시한다면 Random Forest, SVM, Deep Learning으로 접근한다

멘토와의 시간외 소통

  • 주저말고 연락하시길 ^^
    • 멘토가 연락이 온시점에 강사가 Business-Off일 때 - 즉답 Q&A
    • 멘토가 연락이 온시점에 강사가 Business-On인 경우 - 시간 협의
  • 짧은 Q&A는 Online - Anytime SNS(카톡, 밴드)
  • 심도있는 미팅이 필요한 경우 Conference Call(카톡 등)
    • 밤 늦게도 상관없슴 ^^

kdata-mentoring-201910's People

Contributors

mlstack avatar

Stargazers

 avatar pio_moon avatar

Watchers

James Cloos avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.