Доработка NPL Модели (русский язык)

45 000 руб. за проект
16 июня 2021, 01:15 • 5 откликов • 68 просмотров
Мы используем метод коррекции Damerau Levenshtein 1 в deeppavlov.

Модель обрабатывает слова и фразы и считает количество слов/фраз в комментарии.

Есть некорректное поведение модели, нужно пофиксить:

1. https://www.notion.so/thedirection/e2204574f3f54b1...
Модель несколько раз считает фразы в одном и том же комментарии.
Мы бы хотели это исключить и считать фразу единожды, чтобы не множить топ, как на скринах.

2. https://www.notion.so/thedirection/90050dc7d3fe441...
Модель сама редактирует имена собственные. Из-за этого получаем корявый счёт.
Примеры приведены в задаче.

3. https://www.notion.so/thedirection/9fd214a5947e4a7...
Некоторые "комментаторы" спамят в комментах, изза чего мы получаем некорректный счёт.
Не считать эти слова кодом мы посчитали некорректной задачей. Их нужно отсекать моделью.

4.Создать список минус-фраз в БД. (Такой есть на слова, но на фразы правильнее сделать в модели)

5. Оптимизация/рефакторинг питон сервисов.
Отзывы
Яков специалист высшего класса.

Плюс к этому помог с нашими задачками, на которые не хватило компетенций.
Так же Яков бонусом выполнил задачку, которую по своей глупости не включил в изначальный список задач.
3 года назад
R50 7d5200ef6d8f752b484fe457ca35b194
Фрилансер
 
3 года назад