R50 21419d04c7961b4e6bf3e5b9fd8456c9
Высоконагруженные систем

АВТОМАТИЗИРОВАННАЯ СИСТЕМА РАСПОЗНОВАНИЯ И ПОСКА ТОВАРНЫХ ЗНАКОВ

Добавлено 13 апр 2021 в 17:30
Задачи проекта

1. Автоматизировать классификацию товарных знаков
• Автоматизировать классификацию товарных знаков (Венская классификация и СИЛОИЗ) по изображению.
• Распознавать текст на средствах индивидуализации

2. Автоматизировать экспертизу средств индивидуализации
• Построить архитектуру системы и данных - Реализовать интеграцию с 32-мя государственными источниками данных
• Реализовать структурирование и хранение данных
• Реализовать четкий, нечеткий, семантический, фонетический поиски по данным

3. Создать интерфейс для удобной работы экспертов
• поиск по данным
• сохранения настроек каждого вида поиска
• классификация средств индивидуализации
• проверка работы автоматической системы и возможность внести корректировки
• загрузка отчета по экспертизе в Роспатент
• просмотр, фильтрация, сортировка отправленных экспертиз


Разработка

1. Архитектура БД
• Проектирование архитектуры базы данных
• Разработка ER моделей


2. Архитектура системы
• Проектирование архитектуры системы
• Разработка UML диаграмм
• Масштабируемая и быстрая в развертывании инфраструктура проекта, микросервисная архитектура


3. Frontend разработка
• Frontend на языке JS с использованием фреймворка Vue JS
• Верстка интерфейса (HTML, CSS) и программирование взаимодействия с сервером (Vue JS)


4. Backend разработка
• Хранение структурированных данных в базе PostgreSQL
• Хранение неструктурированных данных в базe MongoDB
• Разработка API
• Разработка модулей интеграции с внешними источниками


5. Нейросеть
• Обучение нейросети на архивных данных для классификации изображений СИ по СИЛОИЗ и Венской Классификации.
• Доработка и дообучение модели OCR для распознавания обычного и специфичного текста на товарных знаках, генерация эмбеддингов слов и словосочетаний для семантического поиска

6. Поиск
• Реализация полнотекстового, семантического и фонетического поиска с использованием Elasticsearch
• Построение индексов Elasticsearch
• Тонкая настройка Elasticsearch с использованием словарей и анализаторов
• Индексирование эмбеддингов (результатов работы нейросети) в Elasticsearch и семантический поиск посредством сравнения расстояния между векторами (эмбеддингами)


Результаты

Автоматическая предварительная обработка заявки на регистрацию средств индивидуализации нейросетью, описание изобразительных элементов по международным классификациям и поисковое индексирование текстового контента
Интеграция и синхронизация с внешними системами хранения данных и порталом Роспатента
Возможность доубучать нейронную сеть в процессе роста обработанных заявок и развития федеральной службы



72aadd351e