Проверка рукописных текстов, этап 1: разбиение на строки

5 000 руб. за проект
20 августа 2021, 12:34 • 2 отклика • 33 просмотра
Общая задача:
Нужно написать нейросеть, проверяющую диктанты на русском языке.
Сети на вход дается фото рукописного текста и оригинальный текст (word файл), требуется вывести ошибки (орфографические, пунктуационные и тп) - их можно находить путем сравнения оригинала и рукописного текста.
Итоговая точность измеряется F-мерой (β^2 = 2, но это значение может уточняться по ходу работы).
Должна быть возможность загрузить картинку с компьютера для распознавания.
Задача решается по этапам:
1. разбиение текста на строки
2. разбиение текста на слова
3. разбиение текста на символы
4. распознавание символов
5. проверка текста (сравнение распознанного текста с оригиналом)
-------------------------------------------------------------------------------------------------------------------------------------------------
Этап 1:
Заказчик предоставляет датасет из 10 текстов, остальные датасеты берутся из опенсорс.