Разработать алгоритм сопоставления деталей поставщика и наших деталей

10 000 руб. за проект
04 июля 2024, 19:14 • 11 откликов • 100 просмотров
Имеется большой датасет, состоящий из примерно 200 000 строк, который содержит соотнесение предложений поставщиков с моими деталями. В датасете следующие колонки: имя от поставщика, бренд от поставщика, артикул от поставщика и все то же самое, только с моей стороны. Одна и та же деталь может называться по-разному у разных поставщиков, однако уже правильно сопоставлена в данных с моими деталями.

Требуется создать модель машинного обучения (или любой другой алгоритм), который будет с нормальной точностью сопоставлять новые предложения поставщиков с моими деталями.

Прилагаю три файла:
1) Для обучения (уже корректные привязки) - https://docs.google.com/spreadsheets/d/1Tz3prx7yaT...
2) Предложения поставщиков - https://docs.google.com/spreadsheets/d/1EfPrgzaMPh...
3) Наши детали (все) - https://docs.google.com/spreadsheets/d/1Yz7mbffDwW...

Итогом работы будет правильно сопоставленные файлы 2 и 3