-
"Linux: внедрение и расширенное администрирование ИТ-решений на базе отечественных операционных систем в государственных и коммерческих организациях" (Томский государственный университет систем управления и радиоэлектроники (ТУСУР), Томск, Россия). Диплом о проф. переподготовке. 2024
-
"Специалист по Data Science" (Яндекс.Практикум, Москва, Россия). Диплом о проф. переподготовке: RU / ENG. 2022-2023
-
"Математика для анализа данных" (Яндекс.Практикум, Москва, Россия). Свидетельство: RU / ENG. 2023-2024
-
"Python: des fondamentaux aux concepts avancés du langage" (Université Côte d'Azur, Ницца, Франция). Open badge: FR. 2023
-
"Machine learning in Python with scikit-learn" (French National Research Institute for Digital Science and Technology (INRIA), Париж, Франция). Open badge: ENG. 2023
-
"Data Science с Глебом Михайловым" (STEPIK). Сертификат: RU. 2023
-
"Введение в Data Science и машинное обучение" (STEPIK). Сертификат: RU. 2023
"Курсы, пройденные на портале STEPIK"
Python 3 | SQL | MS Excel | Power Query | Power Pivot |
VBA | MS Power BI | Pandas | Numpy | Jupiter Notebook |
classical ML | Matplotlib | Seaborn | DataLens | Scikit-learn |
Catboost | LightGBM | XGBoost | А/В-тесты | pgAdmin |
DBeaver | Redash | SciPy | Linux | Astra Linux |
Bash | Docker | RegEx | Git |
№ | Название | Цель | Библиотеки | Технологии |
---|---|---|---|---|
1 | «Расчет среднего времени ответа менеджеров службы поддержки» | рассчитать среднее время ответа для каждого менеджера службы поддержки на запросы клиентов | Psycopg2, Pandas | SQL (PostgresSQL), оконные функции, CTE (Common Table Expressions), LaTex |
2 | «Список из пяти последних совершенных (выполненных) операций клиента» | сформировать список пяти последних операций клиента по заданному шаблону | Pandas | |
3 | «Создание Docker-образа на основе актуальной версии Docker-образа Ubuntu и собственного Dockerfile с загрузкой в репозиторий на Docker Hub» | создать собственный Docker-образ с последующей загрузкой в облачный репозиторий на Docker Hub | Linux (Astra Linux, Ubuntu), Bash, Vim, Docker, Docker Image, Dockerfile, Docker Hub | |
4 | «Настройка сервера SSH для многопользовательского доступа» | настроить сервер SSH для многопользовательского доступа в локальной компьютерной сети | Linux (Astra Linux), Bash, Vim, SSH, SSH-сервер, SSH-клиент, NAT Network, Inrental Network | |
5 | «Настройка NFS и Samba в компьютерной сети» | реализовать настройку NFS и Samba в компьютерной сети | Linux (Astra Linux), Bash, Vim, SSH, SOCKS, SQUID, NFS, Samba | |
6 | «Сбор информации об операционной системе удаленного сервера» | с помощью протокола SSH подключиться к удаленному серверу и собрать информацию об операционной системе | Linux (Astra Linux), Bash, SSH, SCP | |
7 | «Оценка результатов эксперимента на этапе планирования A/B-теста» | на этапе планирования A/B-теста провести анализ соответствия плановых значений метрик теста и расчитанного размера выборки | Pandas, Numpy, Matplotlib, Statsmodels, Tqdm | Monte Carlo Method, A/B Test Calculator by Gleb Mikhaylov, Evan Miller Sample Size Calculator, LaTeX |
8 | «Сравнение точности двух тестов с бинарным ответом на примере тестов на беременность на основе анализа значений sensitivity и specificity тестов» | на основе анализа метрик двух тестов определить, какой из тестов является более точным | Pandas, Matplotlib, Sklearn | Monte Carlo Method, LaTeX |
9 | «SQLite & PostgreSQL. Анализ данных в Google Colab» | провести анализ данных с помощью SQLite и PostgreSQL в Google Colab | Sqlite3, SQLAlchemy, Pandas, Missingno, Matplotlib | SQLite, PostgreSQL, ElephantSQL, оконные функции, Google Colab, Google Drive |
10 | «Прогнозирование исхода лечения цирроза печени – Prediction of Cirrhosis Outcomes» (Kaggle) | предсказание вероятности исхода лечения пациентов с циррозом печени (задача мультиклассификации) | Pandas, Numpy, Matplotlib, Seaborn, Missingno, Dataprep, Phik, Category_encoders, Sklearn, Imblearn, Catboost, XGBoost | IQR (Interquartile Range), PCA (Principal component analysis), LDA (Linear Discriminant Analysis), t-SNE (T-distributed Stochastic Neighbor Embedding), Feature Engineering, Polynomial Features, Pipeline, VarianceThreshold, SMOTETomek |
11 | «Турникеты» (Open Data Science) | на основе накопленных данных идентифицировать посетителя в зависимости от характерного времени его прохода на территорию организации, исключив вероятность передачи пропуска одним сотрудником другому (задача мультиклассификации) | Pandas, Numpy, Random, Matplotlib, Seaborn, Datetime, Sklearn, Imblearn, CatBoost | Feature Engineering, Polynomial Features, SelektKBest, GridSearchCV, RandomizedSearchCV, Pipeline, OneVsRestClassifier, confusion_matrix |
12 | «Разработка модели машинного обучения для предсказания температуры стали для оптимизации производственных расходов металлургического комбината „Так закаляем сталь‟» (Яндекс.Практикум) | разработка модели машинного обучения, предсказывающей температуру стали, выплавляемой на металлургическом комбинате «Так закаляем сталь» (задача регрессии) | Pandas, Numpy, Matplotlib, Seaborn, DateTime, Phik, Sklearn, Imblearn, Feature_Engine, Catboost, Xgboost, Lightgbm | Pipeline, Feature Engineering, RandomizedSearchCV, PolynomialFeatures, MinMaxScaler, DropCorrelatedFeatures, SelektKBest, VotingRegressor, background_gradient |
13 | «Разработка модели машинного обучения для прогнозирования оттока клиентов оператора связи „Ниединогоразрыва.ком‟» (Яндекс.Практикум) | разработка модели машинного обучения, прогнозирующей возможный отток клиентов (задача классификации) | Pandas, Numpy, Matplotlib, Seaborn, Skimpy, Datetime, ydata-profiling, Psutil, Phik, Sklearn, Imblearn, Catboost, Xgboost, LightGBM | Pipeline, Feature Engineering, RandomizedSearchCV, MinMaxScaler, mutual_info_regression, Mutual Information, OneHotEncoder, OrdinalEncoder, MinMaxScaler, SelectKBest, chi2, VotingClassifier, confusion_matrix, background_gradient |
14 | «Определение возраста покупателей» (Яндекс.Практикум) | построение модели, которая по фотографии определит приблизительный возраст человека (задача регрессии для Computer Vision) | Pandas, Numpy, Matplotlib, Seaborn, PIL, Tensorflow, Keras | Yandex Compute Cloud |
15 | «Выявление токсичных комментариев в отзывах покупателей интернет-магазина „Викишоп‟» (Яндекс.Практикум) | построение модели классификации комментариев пользователей на позитивные и негативные (задача классификации для Natural Language Processing / NLP) | Pandas, Numpy, Matplotlib, Seaborn, Autocorrect, Contractions, Gc, Collections, Re, NLTK, Sklearn, Catboost | Pipeline, RandomizedSearchCV, TfidfVectorizer, CountVectorizer, ngram_range |
16 | Задача «Классификация тональности текста» (Яндекс.Практикум) | обучение логистической регрессии для определения тональности текста (задача классификации для Natural Language Processing / NLP) | Pandas, NLTK, Sklearn | Google Drive |
17 | «Прогнозирование количества заказов такси на следующий час для компании „Чётенькое такси‟» (Яндекс.Практикум) | построение модели, предсказывающей количество заказов такси на следующий час (задача регрессии для Time Series) | Pandas, Numpy, Matplotlib, Seaborn, Statsmodels, Sklearn, Catboost, LightGBM | seasonal_decompose, TimeSeriesSplit, RandomizedSearchCV |
18 | «Определение рыночной стоимости автомобилей» (Яндекс.Практикум) | разработка модели машинного обучения, предсказывающей рыночную стоимость автомобиля (задача регрессии) | Pandas, Numpy, Matplotlib, Seaborn, Joypy, Skimpy, Datetime, Sklearn, Feature-engine, Catboost, LightGBM | KNNImputer, SimpleImputer, OneHotEncoder, OrdinalEncoder, MinMaxScaler, DropCorrelatedFeatures, SelectKBest, mutual_info_regression, make_scorer, RandomizedSearchCV |
19 | «Защита персональных данных клиентов страховой компании „Хоть потоп‟» (Яндекс.Практикум) | разработка метода преобразования данных, гарантирующего одновременно невозможность восстановления персональной информации и высокое качество моделей машинного обучения, использующих обезличенные персональные данные | Pandas, Numpy, Matplotlib, Seaborn, Phik, Sklearn | |
20 | «Разработка модели, предсказывающей коэффициент восстановления золота из золотодобывающей руды для группы компаний „Цифра‟» (Яндекс.Практикум) | подготовка прототипа модели машинного обучения, предсказывающей коэффициент восстановления золота из золотосодержащей руды (задача регрессии) | Pandas, Numpy, Matplotlib, Seaborn, Torchmetrics, Joypy, Sklearn | Symmetric Mean Absolute Percentage Error, make_scorer, RandomizedSearchCV |
21 | «Поиск локации для скважины для ПАО „ГлавРосГосНефть‟» (Яндекс.Практикум) | определение региона, где добыча нефти принесёт наибольшую прибыль (задача регрессии) | Pandas, Numpy, Matplotlib, Seaborn, Phik, Sklearn | Анализ возможной прибыли и рисков с помощью техники Bootstrap |
22 | «Предсказание оттока клиентов из банка» (Яндекс.Практикум) | построение модели машинного обучения, предсказывающей отток клиентов из банка (задача классификации) | Pandas, Numpy, Random, Matplotlib, Seaborn, Skimpy, Imbalanced-learn, Phik, Collections, Tqdm, Sklearn | SMOTE, ADASYN, RandomUnderSampling, SMOTETomek, OneHotEncoder, OrdinalEncoder, StandardScaler, mutual_info_regression, SelectKBest, GridSearchCV |
23 | «Рекомендация тарифов» (Яндекс.Практикум) | на основе данных о поведении клиентов оператора мобильной связи 'Мегалайн', уже перешедших на новые тарифы 'Smart' и 'Ultra', построить модель для классификации пользователей в зависимости от используемого ими тарифа (задача классификации) | Pandas, Numpy, Matplotlib, Seaborn, Tqdm, Sklearn | GridSearchCV |
24 | «Интернет-магазин „Стримчик‟» (Яндекс.Практикум) | на основе исследования информации из открытых источников выявить факторы и закономерности, определяющие успех выпуска компьютерной игры при планировании вывода на рынок новой компьютерной игры и оптимизации бюджета рекламной компании | Pandas, Numpy, Random, Matplotlib, Seaborn, Scipy | |
25 | «Исследование объявлений о продаже квартир в Санкт-Петербурге и Ленинградской области» (Яндекс.Практикум) | проведение исследовательского анализа данных датасета с объявлениями о продаже квартир | Pandas, Numpy, Random, Matplotlib, Seaborn |