Конкатенация файлов xml (разметка YML)

5 000 руб. за проект
26 января 2022, 13:29 • 11 откликов • 48 просмотров
Торговые каталоги выгружаются сторонним сервисом в множество xml файлов. В данном конкретном случае, один товар может присутствовать в нескольких каталогах, в следствии чего получаем товар (<offer id>) присутствующий в одном или нескольких файлах выгрузки. Структура файлов одинаковая. Шапка и валюта в том числе, набор параметров в каждом конкретном <offer id> может отличаться. Требуется объединить с лимитом по размеру файла.

Я вижу это как скрипт или программу, которая будет объединять до 30 xml файлов с разметкой YML в n- кол-во файлов с размеров <450мб и удалять дубли товаров <offer id>. Например:
Есть 10 файлов xml общим объемом в 1Гб. Скрипт нацелен на папку содержащую исходные xml, после выполнения получаем 3 файла, 1,2 с объемом каждого в 450мб и 3 с объемом в 100мб. С условиями:

1. Во всех трех файлах нет дублей товаров (<offer id>), уточняю - <offer id> должен быть уникален в пределах всех файлов. Дубли с абсолютно идентичными параметрами, поэтому оставляем первый попавшийся или на ваше усмотрение.
2. Добавить мой произвольный текст <description>"МОЙ ТЕКСТ"</description> или если параметр уже присутствует то <description>"МОЙ ТЕКСТ" xxxx</description>, где xxxx- то что было ранее заполнено, т.е. текст не заменяем на "МОЙ ТЕКСТ", а добавляем.
3. <offer id="6137021" available="true">, где "true" меняем на "false"

Ссылка на примеры xml:
https://1drv.ms/u/s!AkpQdvJKGVVHg9gBYKPssoSNwaqqNA...


Отзывы
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Заказчик
Исполнитель отличный! Сделал все быстро и без замечаний!
4 месяца назад
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Фрилансер
Работать с Сергеем было приятно. Отличный заказчик.
4 месяца назад