Парсер главных страниц со всеми внутренностями

Цена договорная
23 марта 2022, 16:27 • 1 отклик • 125 просмотров
Есть работающий аналог: https://github.com/website-scraper/node-website-scraper/
На каком языке будет реализовано? Вообще без разницы: nodejs / php / python или какой-то другой.
Можно модифицировать работающий аналог!

Если кратко: передаёшь POST запрос к парсерсу. Параметры: url_for_copy (какой сайт скопировать), path (путь на сервере куда закинуть результат)

Кроме копирования парсер должен сделать:
1. Вырезать любую аналитику в исх коде;
2. Уникализировать пикчи (с помощью любой либы), чтобы для поисковиков они были уникальны;
3. Уникализировать названия файлов и пути, где будут лежать файлы стилей/скриптов (к примеру, на оригинальном сайте пути WP: wp-contents/img/1.jpg. Вы же модифицируете на image/1.jpg). Варианты уникализации путей всегда разные (где-то в глубину на 1 папку, где-то на image/1/1/2.jpg закинуть);
4. Код css/js необходимо уникализировать, т.е. чтоб от оригинального сайта отличие были существенные в плане названий функций javascript, id/class (css) и т.п.;
5. Любые ваши тайные желания по максимальной уникализации странички в пределах разумного)))

Предлагаю, в заявке указывать то, что ещё можно доделать или указать на явные ошибки "попыток уникализации" лендинга в пунктах выше.