Giter Site home page Giter Site logo

Мое резюме:

Резюме

Сертификаты:

  • Яндекс.Практикум: Специалист по Data Science RUS/EN

Хакатоны:

Курсы:

Название курса Форма обучения Статус
Яндекс.Практикум: Специалист по Data Science Дистанционная Завершен

Самостоятельные проекты:

Kaggle:

Название проекта Источник проекта Описание Статус проекта
Titanic - Machine Learning from Disaster(1 try) Kaggle Найти взаимосвзяь между данными, ответить для себя какие факторы влияют на целевой признак. Построить модель предсказания и дать небольшую визуализацию. accuracy = 0.801

Пробные задания

Название проекта Источник проекта Описание Статус проекта
Banks EDA (NLP) Сбербанк Необходимо провести EDA анализ банков, ответить на поставленные вопросы бизнеса, сделать соответствующие выводы. Завершен

Учебные проекты:

Курсовые работы:

Список проектов по теме
Название проекта Источник проекта Описание Статус проекта
Предсказание температуры стали Яндекс Практикум, Jupyter Notebook Чтобы оптимизировать производственные расходы, металлургический комбинат ООО «Так закаляем сталь» решил уменьшить потребление электроэнергии на этапе обработки стали. Вам предстоит построить модель, которая предскажет температуру стали Завершен

Аналитика:

Список проектов по теме
Название проекта Источник проекта Описание Статус проекта
Анализ рейтинга и успешности игровых жанров Яндекс.Практикум Вам нужно выявить определяющие успешность игры закономерности. Это позволит сделать ставку на потенциально популярный продукт и спланировать рекламные кампании Завершен
Яндекс.Музыка Яндекс.Практикум На данных Яндекс.Музыки вы сравните поведение пользователей двух столиц Завершен
Исследование надёжности заёмщиков Яндекс.Практикум Нужно разобраться, влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок Завершен
Определение перспективного тарифа для телеком-компании Яндекс.Практикум Вам предстоит сделать предварительный анализ тарифов на небольшой выборке клиентов Завершен
Исследование объявлений о продаже квартир Яндекс.Практикум Нужно научиться определять рыночную стоимость объектов недвижимости Завершен

Задачи регрессии:

Список проектов по теме
Название проекта Источник проекта Описание Статус проекта
Прогнозирование заказов таксти Яндекс.Практикум Компания «Чётенькое такси» собрала исторические данные о заказах такси в аэропортах. Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час. Постройте модель для такого предсказания. Завершен
Выбор локации для скважины Яндекс.Практикум Нужно решить, где бурить новую нефтяную скважину для получения наибольшей прибыли Завершен
Восстановление золота из руды Яндекс.Практикум Подготовьте прототип модели машинного обучения для «Цифры». Компания разрабатывает решения для эффективной работы промышленных предприятий. Модель должна предсказать коэффициент восстановления золота из золотосодержащей руды. Используйте данные с параметрами добычи и очистки. Завершен
Защита персональных данных клиентов Яндекс.Практикум Вам нужно защитить данные клиентов страховой компании «Хоть потоп». Разработайте такой метод преобразования данных, чтобы по ним было сложно восстановить персональную информацию. Обоснуйте корректность его работы. Завершен

Классификация:

Список проектов по теме
Название проекта Источник проекта Описание Статус проекта
Прогнозирование оттока клиентов Яндекс.Практикум Из «Бета-Банка» стали уходить клиенты. Каждый месяц. Немного, но заметно. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых.Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Вам предоставлены исторические данные о поведении клиентов и расторжении договоров с банком. Завершен
Рекомендация тарифов Яндекс.Практикум Определить влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок Завершен
Определение возраста покупателей Яндекс.Практикум Определить влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок Завершен
Фильтрация токсичных комментериев Яндекс.Практикум Интернет-магазин «Викишоп» запускает новый сервис. Теперь пользователи могут редактировать и дополнять описания товаров, как в вики-сообществах. То есть клиенты предлагают свои правки и комментируют изменения других. Магазину нужен инструмент, который будет искать токсичные комментарии и отправлять их на модерацию.Обучите модель классифицировать комментарии на позитивные и негативные. Завершен

Mikhail Khasanov's Projects

age_prediction icon age_prediction

Сетевой супермаркет «Хлеб-Соль» внедряет систему компьютерного зрения для обработки фотографий покупателей. Фотофиксация в прикассовой зоне поможет определять возраст клиентов, чтобы: Анализировать покупки и предлагать товары, которые могут заинтересовать покупателей этой возрастной группы; Контролировать добросовестность кассиров при продаже алкоголя. Постройте модель, которая по фотографии определит приблизительный возраст человека. В вашем распоряжении набор фотографий людей с указанием возраста.

apatrments-for-sell icon apatrments-for-sell

В вашем распоряжении данные сервиса Яндекс.Недвижимость — архив объявлений о продаже квартир в Санкт-Петербурге и соседних населённых пунктах за несколько лет. Нужно научиться определять рыночную стоимость объектов недвижимости. Ваша задача — установить параметры. Это позволит построить автоматизированную систему: она отследит аномалии и мошенническую деятельность. По каждой квартире на продажу доступны два вида данных. Первые вписаны пользователем, вторые получены автоматически на основе картографических данных. Например, расстояние до центра, аэропорта, ближайшего парка и водоёма.

banks_eda-nlp- icon banks_eda-nlp-

Необходимо провести EDA анализ банков, ответить на поставленные вопросы бизнеса, сделать соответствующие выводы

customer-churn icon customer-churn

Из «Бета-Банка» стали уходить клиенты. Каждый месяц. Немного, но заметно. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых. Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Вам предоставлены исторические данные о поведении клиентов и расторжении договоров с банком. Постройте модель с предельно большим значением F1-меры. Чтобы сдать проект успешно, нужно довести метрику до 0.59. Проверьте F1-меру на тестовой выборке самостоятельно. Дополнительно измеряйте AUC-ROC, сравнивайте её значение с F1-мерой.

definition-of-tarrif icon definition-of-tarrif

Вы аналитик компании «Мегалайн» — федерального оператора сотовой связи. Клиентам предлагают два тарифных плана: Смарт и Ультра. Чтобы скорректировать рекламный бюджет, коммерческий департамент хочет понять, какой тариф приносит больше денег. Вам предстоит сделать предварительный анализ тарифов на небольшой выборке клиентов. В вашем распоряжении данные 500 пользователей «Мегалайна»: кто они, откуда, каким тарифом пользуются, сколько звонков и сообщений каждый отправил за 2018 год. Нужно проанализировать поведение клиентов и сделать вывод — какой тариф лучше. **Описание тарифов** **Тариф Смарт:** - Ежемесячная плата: 550 рублей - Включено 500 минут разговора, 50 сообщений и 15 Гб интернет-трафика - Стоимость услуг сверх тарифного пакета: - минута разговора: 3 рубля - сообщение: 3 рубля - 1 Гб интернет-трафика: 200 рублей **Тариф Ультра:** - Ежемесячная плата: 1950 рублей - Включено 3000 минут разговора, 1000 сообщений и 30 Гб интернет-трафика - Стоимость услуг сверх тарифного пакета: - минута разговора: 1 рубль - сообщение: 1 рубль - 1 Гб интернет-трафика: 150 рублей *Обратите внимание: «Мегалайн» всегда округляет секунды до минут, а мегабайты — до гигабайт. Каждый звонок округляется отдельно: даже если он длился всего 1 секунду, будет засчитан как 1 минута. Для веб-трафика отдельные сессии не считаются. Вместо этого общая сумма за месяц округляется в бо́льшую сторону. Если абонент использует 1025 мегабайт в этом месяце, с него возьмут плату за 2 гигабайта.* ### Описание данных **Таблица users (информация о пользователях):** - user_id — уникальный идентификатор пользователя - first_name — имя пользователя - last_name — фамилия пользователя - age — возраст пользователя (годы) - reg_date — дата подключения тарифа (день, месяц, год) - churn_date — дата прекращения пользования тарифом (если значение пропущено, то тариф ещё действовал на момент выгрузки данных) - city — город проживания пользователя - tariff — название тарифного плана **Таблица calls (информация о звонках):** - id — уникальный номер звонка - call_date — дата звонка - duration — длительность звонка в минутах - user_id — идентификатор пользователя, сделавшего звонок **Таблица messages (информация о сообщениях):** - id — уникальный номер сообщения - message_date — дата сообщения - user_id — идентификатор пользователя, отправившего сообщение **Таблица internet (информация об интернет-сессиях):** - id — уникальный номер сессии - mb_used — объём потраченного за сессию интернет-трафика (в мегабайтах) - session_date — дата интернет-сессии - user_id — идентификатор пользователя **Таблица tariffs (информация о тарифах):** - tariff_name — название тарифа - rub_monthly_fee — ежемесячная абонентская плата в рублях - minutes_included — количество минут разговора в месяц, включённых в абонентскую плату - messages_included — количество сообщений в месяц, включённых в абонентскую плату - mb_per_month_included — объём интернет-трафика, включённого в абонентскую плату (в мегабайтах) - rub_per_minute — стоимость минуты разговора сверх тарифного пакета (например, если в тарифе 100 минут разговора в месяц, то - со 101 минуты будет взиматься плата) - rub_per_message — стоимость отправки сообщения сверх тарифного пакета - rub_per_gb — стоимость дополнительного гигабайта интернет-трафика сверх тарифного пакета (1 гигабайт = 1024 мегабайта)

determining-cars-value icon determining-cars-value

Сервис по продаже автомобилей с пробегом «Не бит, не крашен» разрабатывает приложение для привлечения новых клиентов. В нём можно быстро узнать рыночную стоимость своего автомобиля. В вашем распоряжении исторические данные: технические характеристики, комплектации и цены автомобилей. Вам нужно построить модель для определения стоимости.

games-rating icon games-rating

Вы работаете в интернет-магазине «Стримчик», который продаёт по всему миру компьютерные игры. Из открытых источников доступны исторические данные о продажах игр, оценки пользователей и экспертов, жанры и платформы (например, Xbox или PlayStation). Вам нужно выявить определяющие успешность игры закономерности. Это позволит сделать ставку на потенциально популярный продукт и спланировать рекламные кампании. Перед вами данные до 2016 года. Представим, что сейчас декабрь 2016 г., и вы планируете кампанию на 2017-й. Нужно отработать принцип работы с данными. Неважно, прогнозируете ли вы продажи на 2017 год по данным 2016-го или же 2027-й — по данным 2026 года. В наборе данных попадается аббревиатура ESRB (Entertainment Software Rating Board) — это ассоциация, определяющая возрастной рейтинг компьютерных игр. ESRB оценивает игровой контент и присваивает ему подходящую возрастную категорию, например, «Для взрослых», «Для детей младшего возраста» или «Для подростков».

gold-recovery icon gold-recovery

Подготовьте прототип модели машинного обучения для «Цифры». Компания разрабатывает решения для эффективной работы промышленных предприятий. Модель должна предсказать коэффициент восстановления золота из золотосодержащей руды. Используйте данные с параметрами добычи и очистки. Модель поможет оптимизировать производство, чтобы не запускать предприятие с убыточными характеристиками.

oil-well-selection icon oil-well-selection

Вам предоставлены пробы нефти в трёх регионах: в каждом 10 000 месторождений, где измерили качество нефти и объём её запасов. Постройте модель машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль. Проанализируйте возможную прибыль и риски техникой Bootstrap.

recomend-system-for-tarrifs icon recomend-system-for-tarrifs

В вашем распоряжении данные о поведении клиентов, которые уже перешли на эти тарифы (из проекта курса «Статистический анализ данных»). Нужно построить модель для задачи классификации, которая выберет подходящий тариф. Предобработка данных не понадобится — вы её уже сделали.

reliability-of-the-borrower-credit-score- icon reliability-of-the-borrower-credit-score-

Заказчик — кредитный отдел банка. Нужно разобраться, влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок. Входные данные от банка — статистика о платёжеспособности клиентов

steel-temperature-prediction icon steel-temperature-prediction

Чтобы оптимизировать производственные расходы, металлургический комбинат ООО «Так закаляем сталь» решил уменьшить потребление электроэнергии на этапе обработки стали. Вам предстоит построить модель, которая предскажет температуру стали.

taxi-orders-forecast icon taxi-orders-forecast

Компания «Чётенькое такси» собрала исторические данные о заказах такси в аэропортах. Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час. Постройте модель для такого предсказания. Значение метрики RMSE на тестовой выборке должно быть не больше 48.

text-analysis-toxic-comments- icon text-analysis-toxic-comments-

Интернет-магазин «Викишоп» запускает новый сервис. Теперь пользователи могут редактировать и дополнять описания товаров, как в вики-сообществах. То есть клиенты предлагают свои правки и комментируют изменения других. Магазину нужен инструмент, который будет искать токсичные комментарии и отправлять их на модерацию. Обучите модель классифицировать комментарии на позитивные и негативные. В вашем распоряжении набор данных с разметкой о токсичности правок. Постройте модель со значением метрики качества F1 не меньше 0.75.

transform-personal-data icon transform-personal-data

Вам нужно защитить данные клиентов страховой компании «Хоть потоп». Разработайте такой метод преобразования данных, чтобы по ним было сложно восстановить персональную информацию.

yandex-music icon yandex-music

Сравнение Москвы и Петербурга окружено мифами. Например: * Москва — мегаполис, подчинённый жёсткому ритму рабочей недели; * Петербург — культурная столица, со своими вкусами. На данных Яндекс.Музыки вы сравните поведение пользователей двух столиц.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.