Решение соревнования Happy Data Year
от Росбанка (платформа Boosters.pro).
Решение заняло 48 место на Public LeaderBoard и 21 место на приватной доске.
Автор: Липко Иван
E-mail: [email protected]
Happy Data Year - новогодний чемпионат по анализу данных от Росбанка.
Вам предстоит предсказать индекс популярности геолокации для размещения устройства банкоматной сети.
В обучающей выборке находятся данные о геопозиции шести тысяч банкоматов Росбанка и его партнеров, а также целевая переменная — индекс популярности банкомата. В тестовой выборке еще две с половиной тысячи банкоматов, разделенных поровну на публичную и приватную часть.
Папка с решением состоит из:
Основное решение.ipynb
- файл с основным решением, где есть парсинг данных, создание признаков, анализ и чистка, обучение лучшего оценщика
myutils.py
- функции парсинга, исправления названий городов
Другие регрессоры.ipynb
- примеры реализации разных оценщиков. Чтобы было видно что сравнение было с другими моделями, но они не дали результата
Полезные заметки.ipynb
- заметки, которые я делал в течении и в завершении соревнования
data
- папка с данными/словарями/промежуточные и почищенные датафреймы
chromedriver
- драйвер для selenium
Сабмиты:
submit.csv
- отпарвляемый сабмит
submit_0.0426033.csv
- мой сабмит с приватным рейтингом 0.0426033
submit_0.0429679.csv
- мой сабмит с приватным рейтингом 0.0429679
сравнение с лучшим submit.ods
- визуальное сравнение получаемого сабмита с лучшим мною полученным