Нужен парсер на php для 3х новостных сайтов, и загружаем в wordpress

4 000 руб. за проект
30 июня 2020, 11:30 • 11 откликов • 51 просмотр
Надо парсить ежедневные новости с 3х сайтов (скину в личку) и складывать их в базу вордпресса.

PHP скрипт будет запускаться кроном несколько раз в сутки. Он должен обходить сайты (можно брать из их sitemap), находить новости опубликованные за последние 24 часа, еще не добавленные, парсить и добавлять в базу.
Скрипт должен маскироваться под нормальный браузер.
В скрипте должны быть комментарии к основным блокам, чтобы можно было его нормально дорабатывать. Лучше использовать Laravel. Иметь возможность в дальнейшем удобно дорабатывать под дополнительные сайты-источники.
После отработки скрипта выводить в консоли результаты работы: успешно добавлено XXX статей с сайта YYY.
Если html разметка сайта-источника поменялась, то сообщать об этом.

Элементы одной статьи, требования:
- заголовок
- основная картинка (добавляется в отдельное поле, название файла переименовывается в транслит из названия статьи)
- текст (вырезать из текста упоминания сайта-источника, вырезать ссылки, вырезать весь лишний html. Оставлять только абзацы, списки, переносы)
- категория
- картинки по тексту (скачивается, название файла переименовывается в транслит из названия статьи и порядковый номер)
Отзывы
R50 1bceb1552cd2d78f1ee7d2ca97e6f0b1
Заказчик
Разработчик написал требуемый скрипт с функционалом соотвествующии ТЗ. В общении приятный человек, рекомендую к сотрудничеству.
4 года назад
R50 df6693b0f121cb6ed0eadcc1e75b73d9
Фрилансер
Понятное ТЗ, быстрая оплата, всегда на связи - рекомендую!
4 года назад