Проверка рукописных текстов, этап 4: распознавание символов

5 000 руб. за проект
20 августа 2021, 12:39 • 6 откликов • 43 просмотра
Общая задача:
Нужно написать нейросеть, проверяющую диктанты на русском языке.
Сети на вход дается фото рукописного текста и оригинальный текст (word файл), требуется вывести ошибки (орфографические, пунктуационные и тп) - их можно находить путем сравнения оригинала и рукописного текста.
Итоговая точность измеряется F-мерой (β^2 = 2, но это значение может уточняться по ходу работы).
Должна быть возможность загрузить картинку с компьютера для распознавания.
Задача решается по этапам:
1. разбиение текста на строки
2. разбиение текста на слова
3. разбиение текста на символы
4. распознавание символов
5. проверка текста (сравнение распознанного текста с оригиналом)
-------------------------------------------------------------------------------------------------------------------------------------------------
Этап 4:
Заказчик предоставляет датасет из 10 текстов, остальные датасеты берутся из опенсорс.