Разработка скрипта на Python по парсингу сайта
2 000 руб. за проект
Интересует разработка скрипта на Python по парсингу сайта.
Скрипт должен работать с домашнего компьютера (Python и стандартные библиотеки установлены).
Сайт: https://строим.дом.рф/igs/project
Каталог проектов строительства частных домов, Дом.РФ, порядка 800 страниц.
Техзадание:
1. Нужно зайти в каждую карточку проекта и скачать оттуда всю информацию в плоскую таблицу Excel.
Сейчас максимальный ID 1007, но страниц меньше.
Пример карточки проекта
https://строим.дом.рф/igs/project/1007
1007 - ID проекта
2. В карточке проекта есть внутренние вкладки, между которыми необходимо переключаться в составе:
Все характеристики - порядка 40 параметров
План проекта - картинки 2-5 штук
Схема фасада - картинки 2-5 штук
Сметный расчет - порядка 40 параметров
Сметный расчет может быть нескольких видов (Без отделки / Whitebox / Под ключ)
Например: https://xn--h1aieheg.xn--d1aqf.xn--p1ai/igs/projec...
Тогда в выгрузке нужно будет совместить все 3 (отдельно обсудим с исполнителем как).
3. Все параметры нужно скачать в "плоскую" таблицу EXCEL / CSV. Заголовок - наименование параметра.
4. Картинки нужно скачать в папку с ID проекта и разложить по внутренним папкам с соответствующим наименованием.
5. По ходу могут будут другие мелкие доработки.
6. Графическая часть для скрипта не нужна
7. Желательно не использовать Selenium и CromeDriver, а по JavaScript сайта найти прямые ссылки на API сайта.
Но это не обязательное требование, а пожелание, показывающее уровень исполнителя и улучшающее время работы конечного скрипта.
Скрипт должен работать с домашнего компьютера (Python и стандартные библиотеки установлены).
Сайт: https://строим.дом.рф/igs/project
Каталог проектов строительства частных домов, Дом.РФ, порядка 800 страниц.
Техзадание:
1. Нужно зайти в каждую карточку проекта и скачать оттуда всю информацию в плоскую таблицу Excel.
Сейчас максимальный ID 1007, но страниц меньше.
Пример карточки проекта
https://строим.дом.рф/igs/project/1007
1007 - ID проекта
2. В карточке проекта есть внутренние вкладки, между которыми необходимо переключаться в составе:
Все характеристики - порядка 40 параметров
План проекта - картинки 2-5 штук
Схема фасада - картинки 2-5 штук
Сметный расчет - порядка 40 параметров
Сметный расчет может быть нескольких видов (Без отделки / Whitebox / Под ключ)
Например: https://xn--h1aieheg.xn--d1aqf.xn--p1ai/igs/projec...
Тогда в выгрузке нужно будет совместить все 3 (отдельно обсудим с исполнителем как).
3. Все параметры нужно скачать в "плоскую" таблицу EXCEL / CSV. Заголовок - наименование параметра.
4. Картинки нужно скачать в папку с ID проекта и разложить по внутренним папкам с соответствующим наименованием.
5. По ходу могут будут другие мелкие доработки.
6. Графическая часть для скрипта не нужна
7. Желательно не использовать Selenium и CromeDriver, а по JavaScript сайта найти прямые ссылки на API сайта.
Но это не обязательное требование, а пожелание, показывающее уровень исполнителя и улучшающее время работы конечного скрипта.
- Файлы
Отзывы
В заказе есть исполнитель
При переводе заказа из архивного в актуальный, текущий исполнитель будет снят с задачи.
Выберите тип сделки
С безопасной сделкой вы всегда сможете вернуть средства, если что-то пойдет не так. С простой сделкой вы самостоятельно договариваетесь с исполнителем об оплате и берете на себя решение конфликтов.
Все сделано быстро и качественно в соответствии с отправленным ТЗ.
В процессе уточнили некоторые моменты обработки.