Этот проект основан на парсинге каталога товаров с сайта "promled.com", задача состояла в том, чтобы собрать данные со всех категорий и их подкатегорий и занести их в Excel.
Парсер написан на языке Python, с использованием библиотек requestsиbs4.
Каждая запись в таблице Excel имеет: - Категорию - Подкатегорию - Ссылки на изображения, если они есть - Наименование товара - ID товара - Описание товара, если оно есть - Какие-то характеристики о товаре, если они есть - Стоимость товара
Основной особенностью было то, что доступ к цене можно было получить только через авторизированного пользователя, с чем программа отлично справляется.
За время работы скрипта удалось собрать 5727 записей, каждая из которых заполнена правильно, потому что программа отлавливала исключения, которые могли возникнуть, если у товара, например, отсутствовало описание или изображения или какие-либо характеристики, все это учитывалось.
На основе данного проекта можно сделать парсер любого каталога товаров по заданным критериям, выгрузить данные куда угодно, будь то база данных, Excel, блокнот или формат csv.