R50 07e8e55842131ced568184067bdf4c34
Разработка / Тимлид

Рекомендательная система текстов

Добавлено 09 сен 2021 в 20:23
Задача: Создание системы рекомендации статей пользователю, на основании понравившихся.



Решение: Решение с использованием nlp методов из классического ML. Использую CountVectorizer из sklearn. Использую простые Леммы токенов (корни слов) для векторизации. Полученный эмбединг статьи сравниваю просто Эвклидовой метрикой со всеми эмбедингами корпуса статей.



Stack: DS, Python, scipy, sklearn
A67976b76c