Разработать NLP-модель классификации медицинских текстов

2 000 руб.за час
23 ноября 2021, 19:00 • 5 откликов • 38 просмотров
Общая задача: по данным электронной медицинской карты (набор текстов во времени) определить были ли исполнены критерия качества оказания помощи.

Ограничения: данные в карте могут быть неполными или не соответствовать диагнозу, приемов может быть несколько в рамках лечения одного кейса.

Данные электронной медицинской карты (ЭМК) это неструктурированный текст. Карта делится на отдельные приемы. Пациент может прийти один раз, а может несколько. Критерии качества относятся к некоторому набору приемов, в рамках которого лечатся одни диагнозы (медицинский случай). Скорее всего нужен будет отдельный классификатор для определения границ медицинского случая.

В идеале необходимо извлекать из данных карты определенные факторы, которые отвечают за “правила” по которым решается было ли соответствие критериям качества. На вход подается неструктурированный текст (диагноз, жалобы, анамнез и тд), а на выход список критериев, которым случай не соответствует. Выглядит, как задача мультиклассификации. В идеале интерпретируемая.

Как видятся варианты разработки mvp:
Первым шагом строится классификатор медицинского случая (это один прием или несколько). Далее:
а) Разрабатываются эмбединги для медицинских текстов. Врачи-эксперты классифицируют каждую ЭМК на наличие определенных показаний к назначениям. Тренируем нейросеть.
б) Решаем задачу NER с использованием медицинской онтологии. В зависимости от найденных факторов в карте определяем, какое правило использовать.
в) Разрабатываем медицинский парсер, чтобы извлекать медицинские сущности. А дальше также в зависимости от сущностей решаем какое правило использовать.

Задача сложная и долгая, требующая совместной работы. Необходимо будет совместно разработать схему для разметки.