Разработка скрипта на Python по парсингу сайта

2 000 руб. за проект
22 октября 2022, 18:03 • 11 откликов • 110 просмотров
Интересует разработка скрипта на Python по парсингу сайта.
Скрипт должен работать с домашнего компьютера (Python и стандартные библиотеки установлены).

Сайт: https://строим.дом.рф/igs/project
Каталог проектов строительства частных домов, Дом.РФ, порядка 800 страниц.

Техзадание:

1. Нужно зайти в каждую карточку проекта и скачать оттуда всю информацию в плоскую таблицу Excel.
Сейчас максимальный ID 1007, но страниц меньше.
Пример карточки проекта
https://строим.дом.рф/igs/project/1007
1007 - ID проекта

2. В карточке проекта есть внутренние вкладки, между которыми необходимо переключаться в составе:
Все характеристики - порядка 40 параметров
План проекта - картинки 2-5 штук
Схема фасада - картинки 2-5 штук
Сметный расчет - порядка 40 параметров

Сметный расчет может быть нескольких видов (Без отделки / Whitebox / Под ключ)
Например: https://xn--h1aieheg.xn--d1aqf.xn--p1ai/igs/projec...
Тогда в выгрузке нужно будет совместить все 3 (отдельно обсудим с исполнителем как).

3. Все параметры нужно скачать в "плоскую" таблицу EXCEL / CSV. Заголовок - наименование параметра.

4. Картинки нужно скачать в папку с ID проекта и разложить по внутренним папкам с соответствующим наименованием.

5. По ходу могут будут другие мелкие доработки.

6. Графическая часть для скрипта не нужна

7. Желательно не использовать Selenium и CromeDriver, а по JavaScript сайта найти прямые ссылки на API сайта.
Но это не обязательное требование, а пожелание, показывающее уровень исполнителя и улучшающее время работы конечного скрипта.
Файлы
Отзывы
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Заказчик
Очень положительный опыт работы в Вячеславом.
Все сделано быстро и качественно в соответствии с отправленным ТЗ.
В процессе уточнили некоторые моменты обработки.
1 год назад
ТЗ чёткое и понятное, с заказчиком крайне приятно работать. Рекомендую.
1 год назад