Парсинг сайтов сделанных на системе пробазон

20 000 руб. за проект
01 июля 2020, 17:30 • 20 откликов • 87 просмотров
Есть список сайтов https://yadi.sk/i/Sk_hMVkA5WO-pw
Все они однотипные и созданы на системе пробозон, например сайт https://art-parts.ru/
Требуется создать скрипт для парсинга этих сайтов в таблицу mysql
Скрипт будет запускаться раз в месяц и должен обновлять и удалять сменившиеся запчасти

Пример заполненых данных таблицы для объявления https://art-parts.ru/honda/fit/starter/starter-hon...
id 14254353543 // произвольный уникальный ид объявления в вашей таблице
site_id 1 // ид сайта
owner_id 6430 // Код товара (ид объявления на этом сайте)
date_create '2020-06-30 14:35:01'
date_update '2020-06-30 14:35:01'
date_delete '' // дата удаления объявления
delete 0 // флаг 1 если удалено
price 1000 // цена
address 'На складе в г. Вавилова 2'
datail 'Стартер' // Название детали
mark 'Honda'
model 'Fit'
donor 'Honda FIT' // Автомобиль-донор
body 'GE6' // Кузов
engine 'L13A' // Двигатель
year '2007' // Год выпуска
oems '["4280004740"]' // OEM массив (может быть несколько)
oem_text '428000-4740' // OEM text
side '' // Сторона запчасти
manufacturer '' // Производитель
condition 'Контрактная' // Состояние
photos '["https://art-parts.ru/pub/c594/products/pics/0000/20/starter-honda-fit-ge6-l13a-2007-b-u-20174. jpg","https://art-parts.ru/pub/c594/products/pics/0000/20/starter-honda-fit-ge6-l13a-2007-b-u-20175. jpg",...] // Все картинки
photos_count 5

Пример для таблицы https://filtok4.ru/chevrolet/tahoe/support/support...
id 2321321321 // произвольный уникальный ид объявления в вашей таблице
site_id 225 // ид сайта
owner_id 21223 // Код товара (ид объявления на этом сайте)
date_create '2020-06-30 14:35:01'
date_update '2020-06-30 14:35:01'
date_delete '' // дата удаления объявления
delete 0 // флаг 1 если удалено
price 6000 // цена
address 'На складе в г. Новосибирск'
datail 'Суппорт ' // Название детали
mark 'Chevrolet'
model 'Tahoe'
donor 'CHEVROLET TAHOE, SUBURBAN, AVALANCHE' // Автомобиль-донор
body 'GMT900' // Кузов
engine 'LY5' // Двигатель
year '' // Год выпуска
oem '' // OEM
oem_text '' // OEM text
side 'Задн. / Лев.' // Сторона запчасти
manufacturer 'АМЕРИКА' // Производитель
condition 'Контрактная' // Состояние
photos '["https://filtok4.ru/pub/c219/products/pics/0000/33/support-chevrolet-tahoe-gmt900-ly5-zadn-lev-33358. jpg","https://filtok4.ru/pub/c219/products/pics/0000/33/support-chevrolet-tahoe-gmt900-ly5-zadn-lev-33359. jpg"] // Картинки
photos_count 2

Пример еще ссылки https://filtok4.ru/bmw/3-series-5-series/razdatoch...

Если встретятся дополнительные поля в объявлениях, добавить их в таблицу (возможно я что-то упустил)
Также создать вторую таблицу, где будет список этих сайтов и сколько у них объявлений и дата последнего обновления.
Разместить это на отдельном линукс сервере (доступы я дам) и запускать обновления раз в месяц (или скажите как я сам буду запускать)

Отзывы
Аноним
Работаем с Иваном уже второй раз, что могу сказать: заказчик просто супер, приятно работать, желаю Ивану успехов в его проекте.
4 года назад