Giter Site home page Giter Site logo

jeju_bus_bigdata's Introduction

퇴근시간 버스 승차인원 예측대회

https://dacon.io/cpt13/228543

rank

총 264팀 중 6등을 하였으며, 3명의 팀원으로 구성되어 대회에 참가하였습니다.

대회 요약

1. 배경

외국인과 관광객까지 고려하면 전체 상주인구는 90만명을 넘을 것으로 추정됩니다.

제주도민 증가와 외국인의 증가로 현재 제주도의 교통체증이 심각한 문제로 떠오르고 있습니다.

따라서, 제주테크노파크는 교통난 심화를 해결하기 위해 데이터 분석 대회를 개최합니다.

2. 주최/주관

  • 주최 : (재)제주테크노파크
  • 주관 : DACON

3. 데이터

4. 일정 (UTC+ 9 (한국) 기준)

  • 제출 : 2019년 11월 11일 09:00 ~ 2019년 12월 06일 23:59

  • 평가 및 수상자 발표 : 2019년 12월 07일 ~ 12월 16일

  • 시상 : 2019년 12월 20일 (장소 미정 - 제주시)

5. 상금 / 수여 팀

  • 1등 : 400만원
  • 2등 : 200만원
  • 3등 : 100만원

Change log

2019-11-17

  • date processing : 월~일을 의미하는 더미변수에서 주말, 평일만 구분하도록함
  • bus_route_id, station_code, station_name scoring : 종속변수에 따라 점수화하여 재정의

2019-11-20

  • id, code, name 3개 변수 점수화 rank함수 활용, 그리고 변수 자체를 바꾸는 것이 아닌 score칼럼을 추가하는 방식으로 바꿈
  • total_ride와 total_takeoff 칼럼 추가
  • Averge Model을 validation하는 함수 추가

2019-11-24

  • 종속변수만 log1p한 후 테스트, 독립변수 종속변수중 왜도 첨도 조정해야하는 것들만 선택해서 테스트 : 성능개선이 되지 않아 기각

2019-11-27

  • 거리를 harvesine 계산식으로 바꿈
  • 6-8시간이 상관관계가 낮아서 8-12시간으로 통합함
  • 0의 값을 가진 데이터중 반정도를 임의로 삭제 (성능이 너무 안좋아져서 기각)
  • 모델을 3개를 평균내어 xgb 0.45, lgb 0.45, rf 0.1의 가중평균
  • prediction값을 반올림 (기각 성능이 조금 떨어짐)
  • lightgbm을 튜닝함

2019-11-28

  • bus_bts 데이터를 train과 test 일자에 맞게 나눔
  • 노선별 탑승고객유행 변수 추가, 수치화 or 0과 1 (성능을 더 낮춤 기각)
  • 월-목 , 금-일로 weekend 변수 수정 (기각)
  • 서귀포시, 제주시 구분 (기각)
  • station_code로 고객유형 변수 추가 (기각)

2019-12-03

  • 한 station에서 최대 265의 값을 가지지만 평균을 내면 1까지 떨어지고, 평균중에 제일 큰값은 10임
  • 요일별 시각화 그래프 그림
  • 루트랑 코드 합쳐서 scoring하니 0.1 상승
  • 요일별 낮 하루 총 유동인구 (8~12) 변수 추가 0.1 상승

2019-12-05

  • 금토일 1, 그외 0
  • latitude, logitude 학습시 제외
  • bus_route_socre, station_code_score 학습 시 포함
  • 위도, 경도 동서남북 기준으로 새로 할당
  • 할당한 대로 가까운 곳에 맞게 dist_name 변수 추가 후 더미화
  • 지금 보니 학습할때 code_sum_pop 넣었는데 빼야 될듯...
  • randomforest 튜닝 (튜닝 내용 모델링부분 참고)
  • xgboost 튜닝을 빼니 validation 성능이 더 좋았음 (그러나 averaging 할때 뺀게 0.005 개선되어서 뺐음)

2019-12-06

  • lgb, xgb rmse 반복 개선 학습 후 lgb, xgb, rf averging model (옵피팅)
  • lgb train함수사용하여 반복 개선, date_sum_pop 변수 시간별로 나눔
  • code_takeoff_sum_pop 변수 추가

jeju_bus_bigdata's People

Contributors

predictorssh avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.