Нужен парсер на php для 2х новостных сайтов, и загружаем в wordpress
2 600 руб. за проект
Надо парсить ежедневные новости с 2х сайтов (скину в личку) и складывать их в базу вордпресса.
PHP скрипт будет запускаться кроном несколько раз в сутки. Он должен обходить сайты (можно брать из их sitemap), находить новости опубликованные за последние 24 часа, еще не добавленные, парсить и добавлять в базу.
Скрипт должен маскироваться под нормальный браузер.
В скрипте должны быть комментарии к основным блокам, чтобы можно было его нормально дорабатывать. Лучше использовать Laravel. Иметь возможность в дальнейшем удобно дорабатывать под дополнительные сайты-источники.
После отработки скрипта выводить в консоли результаты работы: успешно добавлено XXX статей с сайта YYY.
Если html разметка сайта-источника поменялась, то сообщать об этом.
Элементы одной статьи, требования:
- заголовок
- основная картинка (добавляется в отдельное поле, название файла переименовывается в транслит из названия статьи)
- текст (вырезать из текста упоминания сайта-источника, вырезать ссылки, вырезать весь лишний html. Оставлять только абзацы, списки, переносы)
- категория
- картинки по тексту (скачивается, название файла переименовывается в транслит из названия статьи и порядковый номер)
PHP скрипт будет запускаться кроном несколько раз в сутки. Он должен обходить сайты (можно брать из их sitemap), находить новости опубликованные за последние 24 часа, еще не добавленные, парсить и добавлять в базу.
Скрипт должен маскироваться под нормальный браузер.
В скрипте должны быть комментарии к основным блокам, чтобы можно было его нормально дорабатывать. Лучше использовать Laravel. Иметь возможность в дальнейшем удобно дорабатывать под дополнительные сайты-источники.
После отработки скрипта выводить в консоли результаты работы: успешно добавлено XXX статей с сайта YYY.
Если html разметка сайта-источника поменялась, то сообщать об этом.
Элементы одной статьи, требования:
- заголовок
- основная картинка (добавляется в отдельное поле, название файла переименовывается в транслит из названия статьи)
- текст (вырезать из текста упоминания сайта-источника, вырезать ссылки, вырезать весь лишний html. Оставлять только абзацы, списки, переносы)
- категория
- картинки по тексту (скачивается, название файла переименовывается в транслит из названия статьи и порядковый номер)
Отзывы
В заказе есть исполнитель
При переводе заказа из архивного в актуальный, текущий исполнитель будет снят с задачи.
Выберите тип сделки
С безопасной сделкой вы всегда сможете вернуть средства, если что-то пойдет не так. С простой сделкой вы самостоятельно договариваетесь с исполнителем об оплате и берете на себя решение конфликтов.