Мы с важной новостью: с 28 февраля 2025 года сервис Хабр Фриланс прекратит свою работу.

Купить услуги можно до 28 февраля 2025, но пополнить баланс уже нельзя. Если на вашем счете остались средства, вы можете потратить их на небольшие услуги — служба поддержки готова поделиться бонусами, на случай, если средств немного не хватает.
R50 21419d04c7961b4e6bf3e5b9fd8456c9
Высоконагруженные систем

АВТОМАТИЗИРОВАННАЯ СИСТЕМА РАСПОЗНОВАНИЯ И ПОСКА ТОВАРНЫХ ЗНАКОВ

Добавлено 13 апр 2021 в 17:30
Задачи проекта

1. Автоматизировать классификацию товарных знаков
• Автоматизировать классификацию товарных знаков (Венская классификация и СИЛОИЗ) по изображению.
• Распознавать текст на средствах индивидуализации

2. Автоматизировать экспертизу средств индивидуализации
• Построить архитектуру системы и данных - Реализовать интеграцию с 32-мя государственными источниками данных
• Реализовать структурирование и хранение данных
• Реализовать четкий, нечеткий, семантический, фонетический поиски по данным

3. Создать интерфейс для удобной работы экспертов
• поиск по данным
• сохранения настроек каждого вида поиска
• классификация средств индивидуализации
• проверка работы автоматической системы и возможность внести корректировки
• загрузка отчета по экспертизе в Роспатент
• просмотр, фильтрация, сортировка отправленных экспертиз


Разработка

1. Архитектура БД
• Проектирование архитектуры базы данных
• Разработка ER моделей


2. Архитектура системы
• Проектирование архитектуры системы
• Разработка UML диаграмм
• Масштабируемая и быстрая в развертывании инфраструктура проекта, микросервисная архитектура


3. Frontend разработка
• Frontend на языке JS с использованием фреймворка Vue JS
• Верстка интерфейса (HTML, CSS) и программирование взаимодействия с сервером (Vue JS)


4. Backend разработка
• Хранение структурированных данных в базе PostgreSQL
• Хранение неструктурированных данных в базe MongoDB
• Разработка API
• Разработка модулей интеграции с внешними источниками


5. Нейросеть
• Обучение нейросети на архивных данных для классификации изображений СИ по СИЛОИЗ и Венской Классификации.
• Доработка и дообучение модели OCR для распознавания обычного и специфичного текста на товарных знаках, генерация эмбеддингов слов и словосочетаний для семантического поиска

6. Поиск
• Реализация полнотекстового, семантического и фонетического поиска с использованием Elasticsearch
• Построение индексов Elasticsearch
• Тонкая настройка Elasticsearch с использованием словарей и анализаторов
• Индексирование эмбеддингов (результатов работы нейросети) в Elasticsearch и семантический поиск посредством сравнения расстояния между векторами (эмбеддингами)


Результаты

Автоматическая предварительная обработка заявки на регистрацию средств индивидуализации нейросетью, описание изобразительных элементов по международным классификациям и поисковое индексирование текстового контента
Интеграция и синхронизация с внешними системами хранения данных и порталом Роспатента
Возможность доубучать нейронную сеть в процессе роста обработанных заявок и развития федеральной службы



72aadd351e