R50 5c2d31ceaa87350e36a0dbd4659f89e5
программирование

Определение токсичных комментариев

Добавлено 14 янв 2020 в 14:31
Для создания векторов слов применяется эмбеддинг, реализованный по технологии Byte-Pair Encoding.

Для решения задачи бинарной классификации (toxic / nontoxic) применяется фреймворк Flair, работающий на Pytorch.

Для создания эмбеддинга документов используется 2 слоя двунаправленной сети GRU.
De5d490527