Examples of code for educational purposes and some small demo projects:
- Финальный проект на факультете "Аналитик Big Data"
- Введение в обработку естественного языка
- Урок 3. Embedding word2vec fasttext
- Урок 4. Тематическое моделирование. EM-алгоритм
- Урок 5. Part-of-Speech разметка, NER, извлечение отношений
- Урок 6. Классификация текста. Анализ тональности текста
- Урок 7. Сверточные нейронные сети для анализа текста
- Урок 8. Рекуррентные нейронные сети RNN LSTM GRU
- Урок 9. Языковое моделирование
- Урок 10. Машинный перевод. Модель seq2seq и механизм внимания
- Урок 11. Модель Transformer-1
- Урок 12. Модель Transformer-2
- Урок 13. Модель BERT и GPT
- Урок 14. Transfer learning
- Курсовая работа
- Фреймворк PyTorch для разработки искусственных нейронных сетей
- Урок 1. Основные понятия и структуры PyTorch
- Урок 2. Feed-forward neural network
- Урок 3. Dataset, Dataloader, BatchNorm, Dropout, Оптимизация
- Урок 4. CNN Свертки
- Урок 5. Сегментация изображений
- Урок 6. Нейросети в обработке текста
- Урок 7. Рекурентные сети для обработки последовательностей
- Урок 8. Generative Adversarial Networks
- Курсовая работа
- Введение в нейронные сети
- Рекомендательные системы
- Библиотеки Python для Data Science: продолжение
- Микросервисная архитектура и контейнеризация
- Машинное обучение в бизнесе
- Урок 1. Data-driven-подход на примере задачи маршрутизации заявок в helpdesk
- Урок 2. Профилирование пользователей. Сегментация: unsupervised learning (clustering, LDA/ARTM), supervised (multi/binary classification)
- Урок 3. Связь бизнес-показателей и DS-метрик
- Урок 4. Uplift-моделирование
- Урок 5. Задача оттока: варианты постановки, возможные способы решения
- Урок 6. Задача lookalike (Positive Unlabeled Learning)
- Урок 7. Интерпретация прогнозов модели (SHAP) - объясняем поведение модели на отдельных наблюдениях)
- Урок 8. Проверяем работу модели на практике: A/B-тестирование
- Урок 9. Интеграция. Итоговый проект
- Потоковая обработка данных для выполнения ДЗ был сделан контейнер
- Урок 1. Spark Streaming. Тестовые стримы, чтение файлов в реальном времени
- Урок 2. Kafka. Архитектура
- Урок 3. Spark Streaming. Чтение Kafka
- Урок 4. Spark Streaming. Sinks
- Урок 5. Spark Streaming. Stateful streams
- Урок 6. Lambda архитектура. Spark Streaming + Cassandra
- Урок 7. Spark ML. Аналитика признаков в пакетном режиме. Подготовка, обучение ML-модели
- Урок 8. Spark Streaming + Spark ML + Cassandra. Применение ML-модели в режиме реального времени
- Алгоритмы анализа данных
- Урок 1. Алгоритм линейной регрессии. Градиентный спуск
- Урок 2. Масштабирование признаков. L1- и L2-регуляризация. Стохастический градиентный спуск
- Урок 3. Логистическая регрессия. Log Loss
- Урок 4. Деревья решений
- Урок 5. Случайный лес
- Урок 6. Градиентный бустинг (AdaBoost)
- Урок 7. Классификация с помощью KNN. Кластеризация K-means
- Урок 8. Снижение размерности данных
- Базы данных для аналитиков
- Настройка потоков данных. Apache Airflow
- Линейная алгебра
- BigData. Фреймворк Apache Spark
- Java
- BigData. Введение в экосистему Hadoop
- Теория вероятностей и математическая статистика
- Урок 1. Случайные события. Условная вероятность. Формула Байеса. Независимые испытания
- Урок 2. Дискретные случайные величины. Закон распределения вероятностей. Биномиальный закон распределения. Распределение Пуассона
- Урок 3. Описательная статистика. Качественные и количественные характеристики популяции. Графическое представление данных
- Урок 4. Непрерывные случайные величины. Функция распределения и плотность распределения вероятностей. Центральная предельная теорема
- Урок 5. Проверка статистических гипотез. P-значения. Доверительные интервалы. AB-тестирование
- Урок 6. Взаимосвязь величин. Параметрические и непараметрические показатели корреляции. Корреляционный анализ
- Урок 7. Многомерный статистический анализ. Линейная регрессия
- Урок 8. Дисперсионный анализ. Логистическая регрессия
- C
- Урок 1. Введение. Зачем нужен С и как им пользоваться
- Урок 2. Базовые понятия. Как всё устроено, и что с этим делать
- Урок 5. Циклы. Как придать уникальности простым вещам
- Урок 6. Функции. Пишем универсальные фрагменты кода
- Урок 10. Массивы. Почти безграничные возможности организации данных
- Урок 14. Динамическое выделение памяти
- Введение в noSQL баз данных. Redis, MongoDB, Tarantool
- Data Science tools: Numpy, Matplotlib, Scikit-learn
- Многомерный анализ данных: OLAP и BI
- ETL
- Kaggle
- Методы сбора и обработки данных
- Урок 1. Основы клиент-серверного взаимодействия. Работа с API
- Урок 2. Парсинг HTML. Библиотека Beautiful soup
- Урок 3. Система управления базами данных MongoDB в Python
- Урок 4. Парсинг HTML. XPath
- Урок 5. Selenium в Python
- Урок 6. Фреймворк Scrapy. Знакомство
- Урок 7. Фреймворк Scrapy. Скачивание файлов и фото
- Урок 8. Фреймворк Scrapy. Реализация механизмов клиент-серверного взаимодействия
- Flask
- Математика
- Python (алгоритмы)
- Урок 1. Введение в Алгоритмизацию и простые алгоритмы на Python
- Урок 2. Циклы, рекурсия, функции
- Урок 3. Массивы
- Урок 4. Эмпирическая оценка алгоритмов
- Урок 5. Коллекции. Модуль Collections
- Урок 6. Работа с динамической памятью
- Урок 7. Алгоритмы сортировки
- Урок 8. Графы
- Урок 9. Алгоритмы и структуры данных на Python
- Python (другой курс)
- Урок 1. Знакомство с Python
- Урок 2. Встроенные типы и операции с ними
- Урок 3. Функции. Словари
- Урок 4. Работа с модулями и пакетами
- Урок 5. Генераторы и comprehensions. Множества
- Урок 6. Работа с файлами
- Урок 7. Работа с файловой системой. Исключения в Python
- Урок 8. Регулярные выражения и декораторы в Python
- Урок 9. Объектно-ориентированное программирование
- Урок 10. ООП. Продвинутый уровень
- Урок 11. ООП. Полезные дополнения
- Python
- SQL
- Урок 2. Управление БД. Язык запросов SQL
- Урок 3. Введение в проектирование БД
- Урок 4. CRUD-операции
- Урок 5. Операторы, фильтрация, сортировка и ограничение. Агрегация данных
- Урок 6. Операторы, фильтрация, сортировка и ограничение. Агрегация данных
- Урок 7. Сложные запросы
- Урок 8. Сложные запросы
- Урок 9. Транзакции, переменные, представления. Администрирование. Хранимые процедуры и функции, триггеры
- Урок 10. Транзакции, переменные, представления. Администрирование. Хранимые процедуры и функции, триггеры
- Урок 11. Оптимизация запросов. NoSQL
- HTML/CSS
- Урок 2. Основы языка разметки документов HTML
- Урок 3. Основы языка оформления стилей документа CSS
- Урок 4. Псевдоклассы и псевдоэлементы, табличная верстка
- Урок 5. Формирование блочной модели, блочная верстка
- Урок 6. Работа с макетом дизайна в формате PSD
- Урок 7. Разметка сайта и знакомство с Bootstrap
- Урок 8. Стандарты web и вспомогательные инструменты