R50 2f9994ef5642c990792b800d06da2265
Верстка, Парсинг, Боты

Парсинг Каталога Товаров

Добавлено 16 июл 2021 в 14:38
Этот проект основан на парсинге каталога товаров с сайта "promled.com", задача состояла в том, чтобы собрать данные со всех категорий и их подкатегорий и занести их в Excel.

Парсер написан на языке Python, с использованием библиотек requests и bs4.

Каждая запись в таблице Excel имеет:
- Категорию
- Подкатегорию
- Ссылки на изображения, если они есть
- Наименование товара
- ID товара
- Описание товара, если оно есть
- Какие-то характеристики о товаре, если они есть
- Стоимость товара

Основной особенностью было то, что доступ к цене можно было получить только через авторизированного пользователя, с чем программа отлично справляется.

За время работы скрипта удалось собрать 5727 записей, каждая из которых заполнена правильно, потому что программа отлавливала исключения, которые могли возникнуть, если у товара, например, отсутствовало описание или изображения или какие-либо характеристики, все это учитывалось.

На основе данного проекта можно сделать парсер любого каталога товаров по заданным критериям, выгрузить данные куда угодно, будь то база данных, Excel, блокнот или формат csv.
8b3c1a9ce2 8418e948d1 2e9b40085f