КОМПЬЮТЕРНОЕ ЗРЕНИЕ
Компьютерное зрение: от пикселей до production
Изучите весь цикл разработки CV-систем: предобработка изображений, архитектуры CNN, современные детекторы и сегментационные модели. Практика на реальных датасетах ImageNet, COCO и медицинских данных.
Что вы изучите
Основы работы с изображениями
OpenCV, PIL, аугментации данных. Цветовые пространства, фильтрация, морфологические операции.
Сверточные нейронные сети
Операция свертки, pooling, BatchNorm, Dropout. Архитектуры LeNet, AlexNet, VGG, ResNet, EfficientNet.
Transfer Learning
Использование предобученных весов (ImageNet). Стратегии Feature Extraction и Fine-Tuning.
Детекция объектов
Two-stage: R-CNN, Fast R-CNN, Faster R-CNN. One-stage: YOLO v8, SSD, RetinaNet. Метрики mAP, IoU.
Сегментация изображений
Семантическая (FCN, DeepLab), инстанционная (Mask R-CNN), паноптическая сегментация.
Vision Transformers (ViT)
Архитектура ViT и DeiT. Сравнение с CNN: точность, скорость, требования к данным.