Добрый день!
Памятка участника

Координаторы курса:

Ольга Стукалова: +7-964-703-04-04

Злата Полева: +7-914-673-64-27

По срочным вопросам звоните или пишите в Telegram/Watsapp


  • Учебные дни: 26-27 октября, 2-3 ноября, 16-17 ноября (сб-вс)
  • 17 ноября состоится итоговое тестирование по пройденному материалу
  • Занятия начинается с 10.00 (мск) и заканчиваются в 18.00 (мск)
  • Каждый день предусмотрен перерыв на обед – ориентировочное время с 14.00 до 15.00 (мск) и два небольших перерыва по 20 мин.
  • Все дни с Вами будет работать Teaching assistant и Техническая поддержка - они помогут настроить ПО, ответят на все ваши вопросы в ходе обучения.
Программа курса:
26 октября (суббота). Язык Python
Лекция (2 часа):
  • Переменные: типы, массивы, словари
  • Циклы
  • Функции
  • Системные библиотеки
  • Работа с файлами
  • Примеры из биологии
Python Toolkit: инструменты разработчика
  • Командная строка. Conda
  • Jupyter Lab
  • Colab
Лайв-кодинг (2 часа)
Самостоятельные задания (2 часа)
  • Разбор самостоятельного задания (1 час)

27 октября (воскресенье). Основные обработки данных и визуализации в Python
Лекция (2 часа):
Что такое ML?
  • Примеры из биологии
NumPy: массивы и простейшие операции
  • indexing
  • арифметические операции с массивами
Pandas: Исследование и очистка данных
  • Операции чтения и записи табличных данных
  • Операции с DataFrame
  • Обзорный анализ данных
Визуализация данных
  • Введение в Matplotlib и Seaborn
  • Основные типы графиков (гистограммы, scatterplot, boxplot)
Лайв-кодинг (2 часа):
  1. Работа с массивами NumPy: создание, индексация, операции
  2. Введение в Pandas: создание Series и DataFrame, базовые операции
  3. Примеры загрузки и очистки данных
  4. Создание основных графиков с использованием Matplotlib и Seaborn
Самостоятельные задания (2 часа):
  1. Решение задач на базовые операции с NumPy
  2. Работа с DataFrame в Pandas: чтение данных, базовые манипуляции (фильтрация, группировка)
  3. Загрузка, очистка и предварительная обработка данных
  4. Визуализация данных: создание различных графиков для анализа данных
Разбор самостоятельного задания (1 час)

2 ноября (суббота). Введение в машинное обучение
Лекция (2 часа):
Основные концепции машинного обучения
  • Обучением с учителем
  • Метрики оценки моделей
Введение в Scikit-learn
  • Подготовка данных
  • Простые модели (линейная регрессия, KNN classificator)
Лайв-кодинг (2 часа)
  • Подготовка данных для модели машинного обучения
  • Использование моделей из Scikit-learn
  • Визуализация результатов и разбор метрик на примере обученных моделей
  • KNN при разных K.
Самостоятельные задания (2 часа):
  • Подготовка собственного набора данных
  • Построение и оценка моделей
Разбор самостоятельного задания

3 ноября (воскресенье). Продвинутые модели
Лекция (2 часа):
  • SVM (без глубокого разбора kernel trick)
  • Деревья решений и случайные леса
  • Методы ансамблирования (Bagging, Boosting)
Лайв-кодинг (2 часа):
  • Реализация деревьев решений и случайных лесов
  • Реализация наивного байесовского классификатора
  • Примеры использования методов ансамблирования
Самостоятельные задания (2 часа):
  • Реализация моделей дерева решений и случайных лесов для собственного набора данных
  • Реализация K-ближайших соседей и наивного байесовского классификатора
  • Использование методов ансамблирования для улучшения моделей
Разбор самостоятельного задания (1 час)

16 ноября (суббота). Проектирование и оценка моделей
Лекция (2 часа):
  • Кросс-валидация.
  • Оценка и выбор моделей.
  • HPO моделей.
Лайв-кодинг (2 часа):
  • Примеры использования кросс-валидации
  • Оценка моделей и их улучшение
  • Примеры гиперпараметрической настройки моделей
Самостоятельные задания (2 часа):
  • Оценка моделей с использованием кросс-валидации
  • Улучшение моделей на основе результатов оценки
  • Настройка гиперпараметров для улучшения моделей
Разбор самостоятельного задания (1 час)

17 ноября (воскресенье). За пределами табличных знаний
Лекция (2 часа):
  • Работа с последовательностями. Bag-of-Words, K-mers
  • Использование предобученных моделей
  • ProtBERT-like модели
  • Кратко об AlphaFold
  • Кратко о ProteinMPNN
Демонстрация (2 часа).
Самостоятельные задания (2 часа):
  • ColabFold
  • ProteinMPNN
  • Предсказания на готовых эмбеддингах

Каждый участник может проконсультироваться после курса с лектором по вопросу анализа собственных данных: задать вопросы, получить поддержку.
Общая информация:
Что необходимо сделать к началу занятий:
  • Добавьтесь в Telegram-чат
  • Просим установить отдельным приложением Telegram на ноутбук/компьютер, все вопросы Вы будете задавать в этом чате, а мы делиться с Вами презентациями и полезными ссылками.
Внимание! Операционная система на ноутбуке/компьютере может быть любой,
  • Проверить, что работают Ваш аккаунт на gmail.com:
Внимание! Для обучающихся у кого нет аккаунта на gmail.com будет выделен аккаунт от школы
Запись курса:
Весь курс мы предоставим Вам в записи. После каждого дня обучения будем присылать ссылку на запись. Также в чат ТГ мы дублируем все важные презентации и дополнительно их выложим на диск после курса.
Подключение для участников:
  • Обучение будет проходить на платформе mts-link.ru. Ссылки на подключения будут опубликована в чате курса.