Silen
Администратор
- Регистрация
- 3 Дек 2015
- Сообщения
- 179.220
- Реакции
- 755.675
Складчина: Современное компьютерное зрение [stepik] [AI Education] [Елена Кантонистова,Марк Блуменау]
Курс посвящен основам глубинного обучения в области Computer Vision (CV). В курсе мы начнем с азов компьютерного зрения, а затем затронем актуальные задачи CV и посмотрим на устройство популярных решений.
Программа курса
О курсе
Классические методы Computer Vision
Основы обработки изображений: фильтры и сверткиДемо-доступ
Операторы градиента: Лаплас, Собель, КанниДемо-доступ
Бинаризация и трешхолдинг (Otsu, адаптивный порог)Демо-доступ
Методы выделения признаков: SIFT и другие
HOG: гистограммы направленных градиентов
Поиск и сопоставление ключевых точек
Преобразование Хафа и обнаружение геометрических фигур
Пространственные преобразования: аффинные и перспективные
CNN и первые архитектуры
Основы сверточных нейронных сетей: ядра, фильтры, пуллинги
Архитектура LeNet: первые шаги в CV с использованием CNN
AlexNet: особенности и влияние на развитие глубокого обучения
VGG: глубокие сети с фиксированными свертками
ResNet: идея резидуальных связей для решения проблемы исчезающих
Домашнее задание
Современные архитектуры CV
ViT (Vision Transformer): альтернатива CNN
MobileNet: легковесные модели для мобильных устройств
EfficientNet и EfficientNetV2: масштабируемость и оптимизация
Практика: аугментации и MBConv
Домашнее задание
Детекция
Основы задачи детекции и Non-Maximum Suppression
RCNN: архитектура и эволюция (Fast RCNN, Faster RCNN)
YOLOv1
Современные подходы к детекции: YOLO11 и более новые версии
Детекция на практике
Домашнее задание
Сегментация
Задача сегментации
U-Net: идея и применение в медицинских изображениях
Deeplab и его разновидности: адаптация к различным уровням разре
Mask R-CNN: объединение детекции и сегментации
Segment Anything Model (SAM): универсальная модель сегментации
Практика по сегментации
Домашнее задание (тестирование)
Трекинг и работа с видеопотоками
Задача трекинга и оценивание качества трекинга
Алгоритм трекинга
Работа с видеопотоками. FFMpeg: чтение, запись, сжатие видео
Gstreamer: организация сложных видео- и аудиопайплайнов
Практика: захват видео с камер в реальном времени
Тест по последнему занятию
Итоговый проект курса
Итоговый проект курса
Дополнительно: библиотека OpenCV
Установка библиотеки. Загрузка и вывод изображений
Дополнительно: фреймворк FastAPI
Аннотации типов в Python
Практика с FastAPI
Библиотека Pydantic
СКАЧАТЬ СЛИВ КУРСА
Курс посвящен основам глубинного обучения в области Computer Vision (CV). В курсе мы начнем с азов компьютерного зрения, а затем затронем актуальные задачи CV и посмотрим на устройство популярных решений.
Программа курса
О курсе
Классические методы Computer Vision
Основы обработки изображений: фильтры и сверткиДемо-доступ
Операторы градиента: Лаплас, Собель, КанниДемо-доступ
Бинаризация и трешхолдинг (Otsu, адаптивный порог)Демо-доступ
Методы выделения признаков: SIFT и другие
HOG: гистограммы направленных градиентов
Поиск и сопоставление ключевых точек
Преобразование Хафа и обнаружение геометрических фигур
Пространственные преобразования: аффинные и перспективные
CNN и первые архитектуры
Основы сверточных нейронных сетей: ядра, фильтры, пуллинги
Архитектура LeNet: первые шаги в CV с использованием CNN
AlexNet: особенности и влияние на развитие глубокого обучения
VGG: глубокие сети с фиксированными свертками
ResNet: идея резидуальных связей для решения проблемы исчезающих
Домашнее задание
Современные архитектуры CV
ViT (Vision Transformer): альтернатива CNN
MobileNet: легковесные модели для мобильных устройств
EfficientNet и EfficientNetV2: масштабируемость и оптимизация
Практика: аугментации и MBConv
Домашнее задание
Детекция
Основы задачи детекции и Non-Maximum Suppression
RCNN: архитектура и эволюция (Fast RCNN, Faster RCNN)
YOLOv1
Современные подходы к детекции: YOLO11 и более новые версии
Детекция на практике
Домашнее задание
Сегментация
Задача сегментации
U-Net: идея и применение в медицинских изображениях
Deeplab и его разновидности: адаптация к различным уровням разре
Mask R-CNN: объединение детекции и сегментации
Segment Anything Model (SAM): универсальная модель сегментации
Практика по сегментации
Домашнее задание (тестирование)
Трекинг и работа с видеопотоками
Задача трекинга и оценивание качества трекинга
Алгоритм трекинга
Работа с видеопотоками. FFMpeg: чтение, запись, сжатие видео
Gstreamer: организация сложных видео- и аудиопайплайнов
Практика: захват видео с камер в реальном времени
Тест по последнему занятию
Итоговый проект курса
Итоговый проект курса
Дополнительно: библиотека OpenCV
Установка библиотеки. Загрузка и вывод изображений
Дополнительно: фреймворк FastAPI
Аннотации типов в Python
Практика с FastAPI
Библиотека Pydantic
СКАЧАТЬ СЛИВ КУРСА
Для просмотра скрытого содержимого вы должны зарегистрироваться
Возможно, Вас ещё заинтересует:
- Пробиотические напитки [Анна Fermenterra]
- UX-исследования [bangbangeducation] [Алина Ермакова]
- Минеральный баланс (июнь, июль, август 2025) [Анастасия Семко]
- Лето с друзьями [Татьяна Зубова]
- Генерирует диаграммы, инфографику и слайды из текста [№1 на 1 месяц] [napkin.ai]
- Экспресс Ленты [Анастасия Видрук]