Оптическое распознавание текста кодов

7 000 руб. за проект

13 октября 2020, 12:06 • 9 откликов • 63 просмотра

На присланных посетителями сайта фотографиях упаковок надо разбирать 11-значный код.

Код фиксированной длины, из 11 символов, напечатанных матричным шрифтом (отдельные точки).
Алфавит кодов — 21 символ, исключающих похожие.
Фотографии могут быть под разными углами и с плохим освещением.

Нужно решение на Tensorflow (будет деплоиться в Tensorflow Serving), с высокой достоверностью распознающее такие коды на снимках. На тестовом наборе фотографий надо показать > 95%

* есть 200 фотографий по 5 снимков одного кода, итого 40 кодов (два примера приложены);
* есть синтетические картинки кодов на идеальном фоне - можно нагенерить любое число;
* есть сгенерённые картинки отдельных символов а-ла MNIST.

Тессеракт плохо справляется с dot-matrix шрифтом. Вероятнее, нужно построить RCNN. Задача чем-то похожа на распознавание автомобильных номеров.

[Папка](https://drive.google.com/drive/folders/1WzRuBBf_ehDiWVJR5bFIA7u5l9QgKTNr?usp=sharing) с датасетами.

Файлы

Войдите или зарегистрируйтесь, чтобы откликаться на заказы