Нужен специалист по Pandas, NumPy, scikit-learn, задача кластеризации

10 000 руб. за проект
27 марта 2023, 15:28 • 12 откликов • 54 просмотра
Есть база с 10000000 сущностями, имеющими около 20 параметров, каждый параметр имеет свой вес, имеет значение встречающиеся от 1 до 10000 раз, требуется вычислить наиболее схожие сущности.
Изначально вычислить вес значения параметра исходя из частоты и веса параметра, потом вычислить кластеры по сходству.