Применить алгоритм кластеризации на python

3 000 руб. за проект
06 апреля 2021, 09:59 • 3 отклика • 25 просмотров
Есть данные:
  • Id документа
  • Id категории
  • Дробное значение релевантности категории 0.001 до 5 и выше
У одного документа множество категорий. Нужно сделать кластеризацию стандартными средствами, число кластеров не известно.
Число документов сотни тысяч.

На выходе id кластера и перечень id документов, если возможно, то и степень насколько документ близок к калстеру.