Giter Site home page Giter Site logo

Привет) 👋

РЕЗЮМЕ


ПРОФЕССИОНАЛЬНАЯ ПЕРЕПОДГОТОВКА


КУРСЫ


"Курсы, пройденные на портале STEPIK"


НАВЫКИ

Linux Python 3 Git Jupiter Notebook PostgreSQL
MySQL SQLite DataLens DBeaver Redash
Pandas Numpy SciPy Scikit-learn Catboost
LightGBM XGBoost Matplotlib Seaborn A/B-тесты

ВЫПОЛНЕННЫЕ ПРОЕКТЫ

Название Цель Библиотеки Технологии
1 «Оценка результатов эксперимента на этапе планирования A/B-теста» на этапе планирования A/B-теста провести анализ соответствия плановых значений метрик теста и расчитанного размера выборки Pandas, Numpy, Matplotlib, Statsmodels, Tqdm Monte Carlo Method, A/B Test Calculator by Gleb Mikhaylov, Evan Miller Sample Size Calculator, LaTeX
2 «Сравнение точности двух тестов с бинарным ответом на примере тестов на беременность на основе анализа значений sensitivity и specificity тестов» на основе анализа метрик двух тестов определить, какой из тестов является более точным Pandas, Matplotlib, Sklearn Monte Carlo Method, LaTeX
3 «SQLite & PostgreSQL. Анализ данных в Google Colab» провести анализ данных с помощью SQLite и PostgreSQL в Google Colab Sqlite3, SQLAlchemy, Pandas, Missingno, Matplotlib SQLite, PostgreSQL, ElephantSQL, оконные функции, Google Colab, Google Drive
4 «Прогнозирование исхода лечения цирроза печени – Prediction of Cirrhosis Outcomes» (Kaggle) предсказание вероятности исхода лечения пациентов с циррозом печени (задача мультиклассификации) Pandas, Numpy, Matplotlib, Seaborn, Missingno, Dataprep, Phik, Category_encoders, Sklearn, Imblearn, Catboost, XGBoost IQR (Interquartile Range), PCA (Principal component analysis), LDA (Linear Discriminant Analysis), t-SNE (T-distributed Stochastic Neighbor Embedding), Feature Engineering, Polynomial Features, Pipeline, VarianceThreshold, SMOTETomek
5 «Турникеты» (Open Data Science) на основе накопленных данных идентифицировать посетителя в зависимости от характерного времени его прохода на территорию организации, исключив вероятность передачи пропуска одним сотрудником другому (задача мультиклассификации) Pandas, Numpy, Random, Matplotlib, Seaborn, Datetime, Sklearn, Imblearn, CatBoost Feature Engineering, Polynomial Features, SelektKBest, GridSearchCV, RandomizedSearchCV, Pipeline, OneVsRestClassifier, confusion_matrix
6 «Разработка модели машинного обучения для предсказания температуры стали для оптимизации производственных расходов металлургического комбината „Так закаляем сталь‟» (Яндекс.Практикум) разработка модели машинного обучения, предсказывающей температуру стали, выплавляемой на металлургическом комбинате «Так закаляем сталь» (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, DateTime, Phik, Sklearn, Imblearn, Feature_Engine, Catboost, Xgboost, Lightgbm Pipeline, Feature Engineering, RandomizedSearchCV, PolynomialFeatures, MinMaxScaler, DropCorrelatedFeatures, SelektKBest, VotingRegressor, background_gradient
7 «Разработка модели машинного обучения для прогнозирования оттока клиентов оператора связи „Ниединогоразрыва.ком‟» (Яндекс.Практикум) разработка модели машинного обучения, прогнозирующей возможный отток клиентов (задача классификации) Pandas, Numpy, Matplotlib, Seaborn, Skimpy, Datetime, ydata-profiling, Psutil, Phik, Sklearn, Imblearn, Catboost, Xgboost, LightGBM Pipeline, Feature Engineering, RandomizedSearchCV, MinMaxScaler, mutual_info_regression, Mutual Information, OneHotEncoder, OrdinalEncoder, MinMaxScaler, SelectKBest, chi2, VotingClassifier, confusion_matrix, background_gradient
8 «Определение возраста покупателей» (Яндекс.Практикум) построение модели, которая по фотографии определит приблизительный возраст человека (задача регрессии для Computer Vision) Pandas, Numpy, Matplotlib, Seaborn, PIL, Tensorflow, Keras Yandex Compute Cloud
9 «Выявление токсичных комментариев в отзывах покупателей интернет-магазина „Викишоп‟» (Яндекс.Практикум) построение модели классификации комментариев пользователей на позитивные и негативные (задача классификации для Natural Language Processing / NLP) Pandas, Numpy, Matplotlib, Seaborn, Autocorrect, Contractions, Gc, Collections, Re, NLTK, Sklearn, Catboost Pipeline, RandomizedSearchCV, TfidfVectorizer, CountVectorizer, ngram_range
10 Задача «Классификация тональности текста» (Яндекс.Практикум) обучение логистической регрессии для определения тональности текста (задача классификации для Natural Language Processing / NLP) Pandas, NLTK, Sklearn Google Drive
11 «Прогнозирование количества заказов такси на следующий час для компании „Чётенькое такси‟» (Яндекс.Практикум) построение модели, предсказывающей количество заказов такси на следующий час (задача регрессии для Time Series) Pandas, Numpy, Matplotlib, Seaborn, Statsmodels, Sklearn, Catboost, LightGBM seasonal_decompose, TimeSeriesSplit, RandomizedSearchCV
12 «Определение рыночной стоимости автомобилей» (Яндекс.Практикум) разработка модели машинного обучения, предсказывающей рыночную стоимость автомобиля (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, Joypy, Skimpy, Datetime, Sklearn, Feature-engine, Catboost, LightGBM KNNImputer, SimpleImputer, OneHotEncoder, OrdinalEncoder, MinMaxScaler, DropCorrelatedFeatures, SelectKBest, mutual_info_regression, make_scorer, RandomizedSearchCV
13 «Защита персональных данных клиентов страховой компании „Хоть потоп‟» (Яндекс.Практикум) разработка метода преобразования данных, гарантирующего одновременно невозможность восстановления персональной информации и высокое качество моделей машинного обучения, использующих обезличенные персональные данные Pandas, Numpy, Matplotlib, Seaborn, Phik, Sklearn
14 «Разработка модели, предсказывающей коэффициент восстановления золота из золотодобывающей руды для группы компаний „Цифра‟» (Яндекс.Практикум) подготовка прототипа модели машинного обучения, предсказывающей коэффициент восстановления золота из золотосодержащей руды (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, Torchmetrics, Joypy, Sklearn Symmetric Mean Absolute Percentage Error, make_scorer, RandomizedSearchCV
15 «Поиск локации для скважины для ПАО „ГлавРосГосНефть‟» (Яндекс.Практикум) определение региона, где добыча нефти принесёт наибольшую прибыль (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, Phik, Sklearn Анализ возможной прибыли и рисков с помощью техники Bootstrap
16 «Предсказание оттока клиентов из банка» (Яндекс.Практикум) построение модели машинного обучения, предсказывающей отток клиентов из банка (задача классификации) Pandas, Numpy, Random, Matplotlib, Seaborn, Skimpy, Imbalanced-learn, Phik, Collections, Tqdm, Sklearn SMOTE, ADASYN, RandomUnderSampling, SMOTETomek, OneHotEncoder, OrdinalEncoder, StandardScaler, mutual_info_regression, SelectKBest, GridSearchCV
17 «Рекомендация тарифов» (Яндекс.Практикум) на основе данных о поведении клиентов оператора мобильной связи 'Мегалайн', уже перешедших на новые тарифы 'Smart' и 'Ultra', построить модель для классификации пользователей в зависимости от используемого ими тарифа (задача классификации) Pandas, Numpy, Matplotlib, Seaborn, Tqdm, Sklearn GridSearchCV
18 «Интернет-магазин „Стримчик‟» (Яндекс.Практикум) на основе исследования информации из открытых источников выявить факторы и закономерности, определяющие успех выпуска компьютерной игры при планировании вывода на рынок новой компьютерной игры и оптимизации бюджета рекламной компании Pandas, Numpy, Random, Matplotlib, Seaborn, Scipy
19 «Исследование объявлений о продаже квартир в Санкт-Петербурге и Ленинградской области» (Яндекс.Практикум) проведение исследовательского анализа данных датасета с объявлениями о продаже квартир Pandas, Numpy, Random, Matplotlib, Seaborn

Егор Юмаев's Projects

2022-gold-recovery-prediction icon 2022-gold-recovery-prediction

Предсказание коэффициента восстановления золота из золотодобывающей руды

2022-realty-spb icon 2022-realty-spb

Исследование объявлений о продаже недвижимости

2022-telekom-tarif-recomendation icon 2022-telekom-tarif-recomendation

Классификация пользователей в зависимости от используемого тарифа телеком-оператора

2023-cirrhosis-outcomes icon 2023-cirrhosis-outcomes

Прогнозирование исхода лечения пациентов с циррозом печени

2023-cost-of-the-car icon 2023-cost-of-the-car

Разработка модели машинного обучения, предсказывающей рыночную стоимость автомобиля

2023-determining-customers-age icon 2023-determining-customers-age

Построение модели, которая по фотографии определяет приблизительный возраст человека

2023-ods-turnstiles icon 2023-ods-turnstiles

Идентификация посетителя в зависимости от характерного времени его прохода на территорию организации

2023-steel-energy icon 2023-steel-energy

Предсказание температуры стали, выплавляемой на металлургическом комбинате

2023-taxi-orders icon 2023-taxi-orders

Прогнозирование количества заказов такси на следующий час

2023-text-tonality icon 2023-text-tonality

Классификация тональности текста комментариев пользователей

2023-toxic-comments icon 2023-toxic-comments

Выявление токсичных комментариев в отзывах покупателей интернет-магазина

2024-ab-tests-metrics icon 2024-ab-tests-metrics

Анализ соответствия размера выборки и плановых значений метрик A/B-теста

2024-test-comparison icon 2024-test-comparison

Анализ метрик двух тестов и выбор наиболее точного

matstat-ab icon matstat-ab

Курс по матстату для онлайна :) Data Science Data Analytics

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.