Нужен парсер на php для 2х новостных сайтов, и загружаем в wordpress

2 600 руб. за проект
14 июля 2020, 05:27 • 9 откликов • 49 просмотров
Надо парсить ежедневные новости с 2х сайтов (скину в личку) и складывать их в базу вордпресса.

PHP скрипт будет запускаться кроном несколько раз в сутки. Он должен обходить сайты (можно брать из их sitemap), находить новости опубликованные за последние 24 часа, еще не добавленные, парсить и добавлять в базу.
Скрипт должен маскироваться под нормальный браузер.
В скрипте должны быть комментарии к основным блокам, чтобы можно было его нормально дорабатывать. Лучше использовать Laravel. Иметь возможность в дальнейшем удобно дорабатывать под дополнительные сайты-источники.
После отработки скрипта выводить в консоли результаты работы: успешно добавлено XXX статей с сайта YYY.
Если html разметка сайта-источника поменялась, то сообщать об этом.

Элементы одной статьи, требования:
- заголовок
- основная картинка (добавляется в отдельное поле, название файла переименовывается в транслит из названия статьи)
- текст (вырезать из текста упоминания сайта-источника, вырезать ссылки, вырезать весь лишний html. Оставлять только абзацы, списки, переносы)
- категория
- картинки по тексту (скачивается, название файла переименовывается в транслит из названия статьи и порядковый номер)
Отзывы
R50 1bceb1552cd2d78f1ee7d2ca97e6f0b1
Заказчик
Точно по ТЗ и оперативно!
20 дней назад
R50 df6693b0f121cb6ed0eadcc1e75b73d9
Фрилансер
Понятное ТЗ и быстрая оплата - рекомендую!
20 дней назад