Парсер под Python
5 000 руб. за проект
Необходимо написать парсер под Python.
ТЗ что должен уметь парсер
Парсить все страницы сайта
Спарсеные страницы переименовывать в html файлы следущего типа: У сайта sss.ru(Для примера), парситься страница sss.ru/catalog/sertifikacia-iso.html(адрес возможен без .html). Необходимо получить страницу sertifikacia-iso.html создать в одной папке файл с адресом sertifikacia-iso.html очистить его содержимое, должен быть просто пустой html файл с адресом sertifikacia-iso.html. В этот файл на следующем шаге необходимо залить текст:
---
layout: url/url-2/{sertifikacia-iso}(в фигурные скобки подставляется адрес без html)
title: '{Спарсеный заголовок}' (в фигурные скобки подставляется адрес заголовок со страницы H1)
description: {Спарсеный заголовок со страницы H1}
--- Во вторую папку залить html файл с таким же именем sertifikacia-iso.html, но текст будет заливаться в него другой, он будет одинаков для всех страниц.
Парсер должен уметь работать со всеми сайтами, в том числе и по протоколу https
Должна быть возможность менять текст в первом и втором файле, желательно что-бы статическая часть текста подгружалась из файла.
Бюджет предлагайте поставил на просто так, так как не знаю сколько это, нужно очень срочно. Без Бюджета в ответе не пишите лучше, что-бы время не тратить мое.
ТЗ что должен уметь парсер
Парсить все страницы сайта
Спарсеные страницы переименовывать в html файлы следущего типа: У сайта sss.ru(Для примера), парситься страница sss.ru/catalog/sertifikacia-iso.html(адрес возможен без .html). Необходимо получить страницу sertifikacia-iso.html создать в одной папке файл с адресом sertifikacia-iso.html очистить его содержимое, должен быть просто пустой html файл с адресом sertifikacia-iso.html. В этот файл на следующем шаге необходимо залить текст:
---
layout: url/url-2/{sertifikacia-iso}(в фигурные скобки подставляется адрес без html)
title: '{Спарсеный заголовок}' (в фигурные скобки подставляется адрес заголовок со страницы H1)
description: {Спарсеный заголовок со страницы H1}
--- Во вторую папку залить html файл с таким же именем sertifikacia-iso.html, но текст будет заливаться в него другой, он будет одинаков для всех страниц.
Парсер должен уметь работать со всеми сайтами, в том числе и по протоколу https
Должна быть возможность менять текст в первом и втором файле, желательно что-бы статическая часть текста подгружалась из файла.
Бюджет предлагайте поставил на просто так, так как не знаю сколько это, нужно очень срочно. Без Бюджета в ответе не пишите лучше, что-бы время не тратить мое.
В заказе есть исполнитель
При переводе заказа из архивного в актуальный, текущий исполнитель будет снят с задачи.
Выберите тип сделки
С безопасной сделкой вы всегда сможете вернуть средства, если что-то пойдет не так. С простой сделкой вы самостоятельно договариваетесь с исполнителем об оплате и берете на себя решение конфликтов.