Каждый, кто начинает свой путь в Data Science, стремится когда-нибудь дорасти до уровня Senior. Но требования к специалистам такого уровня, особенно в крупных компаниях, очень высоки. Большинство соискателей не могут пройти собеседование.
Чтобы уверенно решать не типовые задачи и создавать собственные архитектуры, мало владеть основными методами машинного обучения и нейронных сетей: важно понимать законы математики и статистики у них "под капотом".
Мы объединили 2 важных курса: вы сможете изучить сначала математику, а затем научитесь строить модели машинного обучения, или проходить два курса параллельно и освоить новую профессию всего за 3 месяца.
Программа курса по математике
Часть 1. Линейная алгебра
- Изучаем вектора и виды матриц
- Учимся проводить операции над матрицами
- Определяем линейную зависимость с помощью матриц
- Изучаем обратные, вырожденные и невырожденные матрицы
- Изучаем системы линейных уравнений, собственные и комплексные числа
- Осваиваем матричное и сингулярное разложение
- Решаем задачи линейной зависимости с помощью матриц
- Оптимизируем с помощью метода главных компонент
- Закрепляем математические основы линейной регрессии
Часть 2. Основы матанализа
- Изучаем функции одной и многих переменных и производные
- Осваиваем понятие градиента и градиентного спуска
- Тренируемся в задачах оптимизации
- Изучаем метод множителей Лагранжа, метод Ньютона и имитацию отжига
- Решаем задачи предсказания и поиска выигрышной стратегии с помощью производных и численных методов оптимизации
- Закрепляем математические основы градиентного спуска и имитации отжига
Часть 3. Основы теории вероятности и статистики
- Изучаем общие понятия описательной и математической статистики
- Осваиваем комбинаторику
- Изучаем основные типы распределений и корреляции
- Разбираемся в теореме Байеса
- Изучаем наивный байесовский классификатор
- Решаем задачи комбинаторики, валидности и прогнозирования методами статистики и теорвера
- Закрепляем математические основы классификации и логистической регрессии
Часть 4. Временные ряды и прочие математические методы
- Знакомимся с анализом временных рядов
- Осваиваем более сложные типы регрессий
- Прогнозируем бюджет с помощью временных рядов
- Закрепляем математические основы классических моделей машинного обучения
Краткая программа курса по Machine Learning
Модуль 1. Введение в машинное обучение
- Знакомимся с основными задачами и методами machine learning , изучаем практические кейсы и применяем базовый алгоритм работы над ml-проектом
Решаем 50+ задач на закрепление темы
Модуль 2. Методы предобработки данных
- Изучаем типы данных, учимся очищать и обогащать данные, используем визуализацию для предобработки и осваиваем feature engineering
- Решаем 60+ задач на закрепление темы
Модуль 3. Регрессия
- Осваиваем линейную и логистическую регрессию, изучаем границы применимости, аналитический вывод и регуляризацию. Обучаем модели регрессии
- Решаем 40+ задач на закрепление темы
Модуль 4. Кластеризация
- Осваиваем обучение без учителя, практикуемся в его различных методах, работаем с текстами средствами ML
- Решаем 50+ задач на закрепление темы
Модуль 5 Tree-based алгоритмы: введение в деревья
- Знакомимся с решающими деревьями и их свойствами, осваиваем деревья из библиотеки sklearn и используем деревья для решения задачи регрессии
- Решаем 40+ задач на закрепление темы
Модуль 6. Tree-based алгоритмы: ансамбли
- Изучаем особенности ансамблей деревьев, практикуемся в бустинге, используем ансамбль для построения логистической регрессии
- Решаем 40+ задач на закрепление темы
- Участвуем в соревновании на kaggle по обучению tree-based модели
Модуль 7. Оценка качества алгоритмов
- Изучаем принципы разбиения выборки, недо- и переобучение, оцениваем модели по различным метрикам качества, учимся визуализировать процесс обучения
- Оцениваем качество нескольких моделей ML
- Решаем 40+ задач на закрепление темы
Модуль 8. Временные ряды в машинном обучении
- Знакомимся с анализом временных рядов в ML, осваиваем линейные модели и XGBoost, изучаем принципы кросс-валидации и подбора параметров
- Решаем 50+ задач на закрепление темы
Модуль 9. Рекомендательные системы
- Изучаем методы построения рекомендательных систем, осваиваем SVD-алгоритм, оцениваем качество рекомендаций обученной модели
- Решаем 50+ задач на закрепление темы
Модуль 10. Финальный хакатон
- Применяем все изученные методы для получения максимальной точности предсказаний модели на kaggle
Антон Киселев
Head of R&D, компания EORA
Аяна Шелике
Преподаватель статистики и линейной алгебры МИЭФ ВШЭ, выпускница мехмата МГУ
Сергей Веренцов
CTO, компания EORA
Эмиль Магеррамов
COO Data Lab, компания EORA