1. Автоматизировать классификацию товарных знаков • Автоматизировать классификацию товарных знаков (Венская классификация и СИЛОИЗ) по изображению. • Распознавать текст на средствах индивидуализации
2. Автоматизировать экспертизу средств индивидуализации • Построить архитектуру системы и данных - Реализовать интеграцию с 32-мя государственными источниками данных • Реализовать структурирование и хранение данных • Реализовать четкий, нечеткий, семантический, фонетический поиски по данным
3. Создать интерфейс для удобной работы экспертов • поиск по данным • сохранения настроек каждого вида поиска • классификация средств индивидуализации • проверка работы автоматической системы и возможность внести корректировки • загрузка отчета по экспертизе в Роспатент • просмотр, фильтрация, сортировка отправленных экспертиз
Разработка
1. Архитектура БД • Проектирование архитектуры базы данных • Разработка ER моделей
2. Архитектура системы • Проектирование архитектуры системы • Разработка UML диаграмм • Масштабируемая и быстрая в развертывании инфраструктура проекта, микросервисная архитектура
3. Frontend разработка • Frontend на языке JS с использованием фреймворка Vue JS • Верстка интерфейса (HTML, CSS) и программирование взаимодействия с сервером (Vue JS)
4. Backend разработка • Хранение структурированных данных в базе PostgreSQL • Хранение неструктурированных данных в базe MongoDB • Разработка API • Разработка модулей интеграции с внешними источниками
5. Нейросеть • Обучение нейросети на архивных данных для классификации изображений СИ по СИЛОИЗ и Венской Классификации. • Доработка и дообучение модели OCR для распознавания обычного и специфичного текста на товарных знаках, генерация эмбеддингов слов и словосочетаний для семантического поиска
6. Поиск • Реализация полнотекстового, семантического и фонетического поиска с использованием Elasticsearch • Построение индексов Elasticsearch • Тонкая настройка Elasticsearch с использованием словарей и анализаторов • Индексирование эмбеддингов (результатов работы нейросети) в Elasticsearch и семантический поиск посредством сравнения расстояния между векторами (эмбеддингами)
Результаты
Автоматическая предварительная обработка заявки на регистрацию средств индивидуализации нейросетью, описание изобразительных элементов по международным классификациям и поисковое индексирование текстового контента Интеграция и синхронизация с внешними системами хранения данных и порталом Роспатента Возможность доубучать нейронную сеть в процессе роста обработанных заявок и развития федеральной службы