Обработать дублирующиеся данные в эксель

18 000 руб. за проект
09 февраля 2022, 15:30 • 14 откликов • 63 просмотра

У нас есть список компаний по 40 городам из разных отраслей (всего 4,2 млн строк). Компании дублируются, поэтому нужно обработать их данные и избавиться от дублей. 4,2 млн строк разбиты на 40+ файлов по 100 000 строк в каждом.

На выходе должны получить экселевские файлы (не более 100 000 строк в каждом, иначе эксель будеть лагать) в таком формате - https://docs.google.com/spreadsheets/d/1z_hqffRsLVoowFH17klrdtCtvUbu9rOJhJn2-2EduS4/edit#gid=0

Подробный алгоритм выполнения задачи в ТЗ: https://docs.google.com/document/d/1kVwE1ggvOt7COfbZ1sosG9rDxIAOI9F6xzRTomlTGqU/edit#

Работаем по безопасной сделке. В отклике пишите, имелся ли подобный опыт, и контакт в телеграм, так легче общаться
Бюджет и сроки оговариваем в личной переписке