❗ Новая сессия стартовала 6 сентября 2017 г. Тут подробное описание активностей в течение курса. А вот и календарь дедлайнов ❗
Статья про курс на Хабре. Youtube-канал c онлайн-трансляциями и записями лекций. Курс обсуждается в Slack OpenDataScience в канале mlcourse_open. Заявка на вступление.
В статьях курса даются теоретические основы машинного обучения. Навыки практического анализа данных и построения прогнозных моделей можно получить через выполнение домашних заданий и индивидуального проекта, а также за счет участия в 2 соревнованиях по анализу данных. Требуются начальные навыки программирования на Python и знание математики (математический анализ, линейная алгебра, теория вероятностей, математическая статистика) на уровне 2 курса технического ВУЗа.
- Первичный анализ данных с Pandas
- Визуальный анализ данных с Python
- Классификация, деревья решений и метод ближайших соседей
- Линейные модели классификации и регрессии
- Композиции: бэггинг, случайный лес
- Построение и отбор признаков
- Обучение без учителя: PCA и кластеризация
- Обучаемся на гигабайтах с Vowpal Wabbit
- Анализ временных рядов с помощью Python
- Градиентный бустинг. Часть 1
- Градиентный бустинг. Часть 2. Скоро...
- Первичный анализ данных с Pandas
- Визуальный анализ данных с Seaborn и Matplotlib
- Классификация. Деревья решений
- Логистическая регрессия + обсуждение соревнования Kaggle
- Случайный лес
- Регрессия, регуляризация
- Обучение без учителя
- Признаки, SGD, Vowpal Wabbit
- Временные ряды
- Градиентный бустинг
- Анализ данных по сердечно-сосудистым заболеваниям (ML Boot Camp V). ipynb
- Визуальный анализ данных по сердечно-сосудистым заболеваниям (ML Boot Camp V). ipynb
- Деревья решений для классификации и регрессии, ipynb. Реализация дерева решений (опционально, не в зачет рейтинга). ipynb
- Логистическая регрессия в задаче тегирования вопросов StackOverflow. ipynb
- Случайный лес и логистическая регрессия в задачах кредитного скоринга и классификации отзывов к фильмам. ipynb
- Исследование признаков на примере поездок такси в Чикаго. ipynb
- Обучение без учителя. ipynb
- Vowpal Wabbit в задаче прогнозирования популярности статьи на Хабре. ipynb
- Временные ряды. ipynb
- Прогнозирование задержек вылетов. Дедлайн: 14 ноября 23:59 UTC +3. ipynb
- Идентификация пользователя по последовательности посещенных сайтов ("Элис"). Kaggle Inclass
- Прогноз популярности статьи на портале Medium.com. Arktur.io. Первые шаги: ipynb
- Идентификация пользователей по последовательности посещенных сайтов ("Элис"). Описание. Тетрадки.
- Индивидуальные проекты. Описаны на Wiki.
На рейтинг участников влияют домашки, соревнования, проекты, тьюториалы и мини-конкурсы по визуализации данных. Подробно все описано на Wiki.
- Все активности по втором запуске курса. Домашки, соревнования, проекты, тьюториалы и мини-конкурсы и все, за что еще можно получить баллы и, главное, опыт.
- Prerequisites: Python, математика, DevOps. О том, как лучше подготовиться к прохождению курса, если навыков программирования или знаний математики не хватает.
- Домашние задания 1-ой сессии курса. На текущий рейтинг не влияют.
- План совместного прохождения курса cs231n c 15.11.2017
- Авторы статей и лекторы. Вкратце представляем всех, кто поработал над курсом.
- ПО для прохождения курса и Docker – как настроить все ПО для прохождения курса. В частности, описывается, как запустить у себя Docker-контейнер, в котором уже все установлено.
- Топ-100 1-ой сессии курса. 1 сессия курса прошла с 28 февраля по 10 июня 2017 года – с домашними заданими, соревнованиями, тьюториалами, конкурсами по визуализации и общим рейтингом. Более 500 участников, было весело 😀. Увековечим имена тех, кто попал в топ-100 финального рейтинга.
- Тьюториалы. Одним из заданий в курсе было написать тьюториал на одну из тем вокруг машинного обучения и анализа данных.