Написать парсер

Цена договорная
29 мая 2020, 16:25 • 8 откликов • 96 просмотров
Необходимо спарсить сайт http://www.oreht. ru/modules.php?name=orehtPriceLS. Не весь сайт, частично, около 30000 товаров. Список категорий и, соответствующие им категории, в приложенном файле.

Для каждого товара необходимы следующие поля:
- id категории (записаны в файле),
- артикул (код),
- название,
- изображение (в виде ссылки),
- остаток (рассчитывается по формулам, записаны в файле),
- цена (рассчитывается по формулам, записаны в файле).

Колонка (поле) "склад" видно после авторизации. Данные предоставим.
Имена файлов изображений должны остаться такие же как на исходном сайте.
В зависимости от единицы измерения (колонка ед.изм.) остаток и цена рассчитывается по разному, формулы записаны в файле.

Описание необходимо спарсить с html кодами, а не просто текст.
Из поля описания необходимо удалить лишнее:
- слово "Описание" в зеленом блоке;
- в конце описания текст "Более точную информацию о товаре уточняйте у операторов и консультантов торгового зала. Изображение может отличаться от представленного на витрине."
- также бывает описание, где в конце текст ошибками кодировки, начинается с "Ѓолее";
- пустые строки, абзацы в начале текста и в конце (теги br, p и тп);
- еще какие-то артефакты, если найдете.

Необходим скрипт на php+mysql для первоначального парсинга всех товаров.
Также необходим скрипт на php+mysql, который будет с заданной периодиностью проверять сайт на изменения товаров: обновлять изменения (остатки, цены и прочее), добавлять новые созданные товары, удалять удаленные товары. Скрипт также должен авторизоваться на сайте.

Очень важен вопрос ресурсоемкости этого скрипта.

Предлагайте сроки + бюджет.
Файлы
Отзывы
R50 03296b463a34340d690a850c1691991f
Заказчик
 
4 года назад