Открытый инструмент для Python3 разработчика, предназначенный для работы с текстами в сферах анализа, обработки, семантического анализа и поиска.
Предоставляет возможности
- Сбора текстовой информации социальной сети ВКонтакте с помощью приложения
- Лемматизации, стемминга текстов, очистки их от синтаксического, семантического, служебного мусора
- Объединения текстов в CSV таблицу, сохранения
- Извлечения данных из CSV таблицы
- TF-IDF векторизации текстов
- Обучения нейронной сети Keras
- Сброса дампа сети и векторов на диск
- Загрузки весов нейросетей и векторайзеров с диска
- Использования сети для семантического анализа или поиска
Репозиторий
GithubP.S: в репозитории также имеется ветка frontend, в которой присутствуют наработки графического интерфейса проекта по семантическому поиску постов ВК. Фронтенд реализован на Flask.