Computer Vision Software Engineer / Разработчик систем компьютерного зрения Профессиональный
ИТ инженер. Опыт работы по специальности
более 10 лет.
Опыт решения
задач связанных с :- Онлайн
обработкой потокового видео с IP-камер;
- Детектированием
объектов в видеопотоке;
- Трекингом
объектов;
- Распознаванием
/ классификацией / фильтрацией объектов;
- Выделением
аттрибутов / извлечением признаков /
поиском в пространстве признаков;
- Разворачиванием
моделей с использованием ONNX и TensorRT.
Знаком с
большинством современных технологий
применяющихся для извлечения информации
из изображений и видео:
Классификаторы:
Resnet -*,DenseNet, MobileNet ... / оптимизаторы /
функции активации
Детекторы:
tinyYolo, YOLOv3
Сегментация
YOLACT, Fr-RCNN, UNET
Распознавание
действий на видео ResNet3D/2+1
Семантическая
сегментация DeepLab.
Нахождение
ключевых точек/ landmark detection / pose estimation
Посторонние
векторов-признаков (embedding) , MetricLearning, кластеризация.
Image2Text: CLIP, OWLVit
Использую
технологический
стек: Python / Pytorch / Numpy / OpenCV / TensorRT / git / Docker
.
Кроме того
этого есть значительный опыт разработки
web - приложений (backend, REST, PHP/Laravel) может пригодится
для быстрого прототипирования.
Интересны
проекты связанные с обучением сверхточных
нейросетей для анализа изображений: поиск объекта на изображении, определение свойств,
распознавание надписей и.т.п.
Приоритет работе с командами в которыйх есть по крайне мерее один project-manager и тестировщик.
Образование, опыт, проекты здесь:ru:
http://gan4x4.ruen:
https://stackoverflow.com/story/gan4x4Памятка для заказчика.Прежде чем
приступать к проекту связанным с машинным
обучением нужно иметь ответы на два
вопроса:
1. На каких
данных обучать модель?
Если задача
кем-то уже решалась, то данные для нее
скорее всего уже есть в одном из
открытых dataset:
Объекты
популярные объекты (люди, машины,
предметы)
http://cocodataset.org/
https://storage.googleapis.com/openimages/web/index.html
Лица:
http://www.cfpw.io/http://www.robots.ox.ac.uk/~vgg/data/vgg_face2/
Улицы:
https://www.cityscapes-dataset.com/https://www.mapillary.com/dataset/
Действия:
https://research.google.com/youtube8m/https://deepmind.com/research/open-source/kinetics
Тогда можно
не обучать собственную модель, использовать
уже обученную и переходить ко 2-му
вопросу.
В противном
случае надо решить:
- где взять
данные?
- кто их будет
размечать?*
*Поручить
разметку программисту плохая идея: это
сделает проект в 10 раз дороже и в три
раза дольше.
2. Какой
требуется результат и как работа будет
приниматься?Стандартный
способ иметь в запасе некоторое количество
данных на которых модель должна отработать
с определённой точностью.
При этом:
- данные
должны быть того же качества что и те
на которых модель обучалась
- данные не
должны находиться в открытом доступе**
**Так как
недобросовестный исполнитель просто
может обучить модель на них.
Например,
критерий приёмки может звучать так:
Пропуск не
более 20% целевых объектов, при этом
ложных срабатываний не более 7%. Тест
проводится на ….