NLP анализ текста

200 000 руб. за проект
25 мая 2021, 23:45 • 7 откликов • 105 просмотров
Ищу человека или команду, которые в сжатые сроки смогут взять в работу проект по NLP.

Проект состоит из двух частей:
1) Необходимо сделать пайплайн для обработки текста и доставить его на продакшен через fastapi.
2) Необходимо создать модельку способную отвечать на текст.

Что представляет собой пайплайн(должен работать с русским и английским языком):
1) Определение языка текста
2) Перевод текста на английский, если текст отличен от русского либо английского
3) Очистка текста / Стоп слова
4) Выделение предложений
5) Токенизация
6) Определение частей речи
7) Лемматизация
8) Парсинг зависимостей / Выделение n-грамм
9) Анализ тональности
10) Определение тем( ключевых фраз)

Данный пайплайн необходимо завернуть в fastapi. Ограничение по скорости ответа api 1sec.
Для обучения модели определения тональности сразу необходимо будет использовать датасет с размеченными твитами, а затем по предоставленному датасету переразметить и заново обучить. Для разметки будем использовать яндекс толоку. Какой использовать алгоритм обсуждаемо.

Во второй части задания необходимо создать модель, способную отвечать на отзывы. Для обучения будет предоставлен датасет на 3кк записей. В этой части необходимо провести хороший ресерч на тему выбора необходимого алгоритма. Текс на русском языке. Как итог работы по второй части должен быть отдельный метод в fastapi который по заданному тексту и параметрам возвращает текста ответа.

В откликах опишите свой опыт работы с обработкой текста, тем кто меня заинтересует я напишу и сброшу подробное тз.

Работа через договор-подряда. Оплата 2 частями, по выполнению работы.