Группировка новостей по теме

Цена договорная
10 октября 2021, 23:34 • 5 откликов • 75 просмотров
Привет!
Есть новости в таком формате:

{
"domain": "%домен источника%",
"url": "%url новости в источнике%",
"title": "%заголовок новости в источнике%",
"short_description": "%короткое описание в сервисе, если есть, иначе null%"
"text": "текст в источнике",
"tags": ["tag1", "tag2"] // тэги в источнике, если есть
}

Есть датасет (за месяц-два-три) в формате:

{
"url": "%url новости в сервисе%",
"timestamp": %unix timestamp выхода новости%,
"lang": "%двухсимвольный код языка — ru, en, etc",
"title": "%заголовок в сервисе%",
"short_description": "%короткое описание в сервисе%",
"sources": [ // массив оригинальных текстов из источников
{
"domain": "%домен источника%",
"url": "%url новости в источнике%",
"title": "%заголовок новости в источнике%",
"short_description": "%короткое описание в сервисе, если есть, иначе null%"
"text": "текст в источнике",
"tags": ["tag1", "tag2"] // тэги в источнике, если есть
},
// и тд
]
}

В оригинальных данных новости сгруппированы по теме.

Нужно обучить нейросеть группировать похожие новости из массива с таким же форматом, как выше.
Грубо говоря, сделать нейросеть, которая умеет группировать новости так же, как Яндекс.Новости.

Использоваться оно будет на Linux из проекта на Python, без GPU. Предпочтительно keras или tensorflow.

Пожалуйста, сразу пишите примерную цену и сроки.