R50 63e5e77d821c15d0697e7de4b1227bdf
Python Developer, ML engineer

IMAGEnizeGPT

Добавлено 11 мая 2024 в 23:18
Разговорный ассистент с модальностью изображений, который использует контекстуальные изображения (так называемые мемы) в диалоге с пользователем, что делает общение более живым и непринужденным.
Для обучения модели были собраны 2 датасета формата csv:
  • Датасет с картинками и их описанием
  • Датасет с контекстными диалогами и используемыми в них картинками
Для обучения и работы был использован русскоязычный CLIP, Fromage.
Обучение модели для подбора нужного изображения по контексту происходило с использованием метода нахождения минимального косинусного расстояния между эмбеддингом описания и эмбеддингом изображения.

Ссылка на Github проекта: IMAGEnize GPT

583712acc5 86d6e9c46d