Мы с важной новостью: с 28 февраля 2025 года сервис Хабр Фриланс прекратит свою работу.

Купить услуги можно до 28 февраля 2025, но пополнить баланс уже нельзя. Если на вашем счете остались средства, вы можете потратить их на небольшие услуги — служба поддержки готова поделиться бонусами, на случай, если средств немного не хватает.
R50 7b61f8c9525c544c3853f8505344bcd5
python backend developer

Парсер поиска наименьшей цены и отзывов на препараты по 5 аптекам

Добавлено 27 июн 2024 в 23:45
Парсер написан на python 3.11 c использованием PostgreSQL, Selenium и прокси. Парсер получает информацию сразу с 5 сайтов аптек с указанием города (в каждой аптеке свой город):
- apteka.ru
- eapteka.ru
- zhivika.ru
- lekkupi.ru
- maksavit.ru
Парсер проходит по каждой ссылке и городу, которые были указаны в csv файле, и собирает по требуемому товару наименьшую цену, рейтинг, и количество отзывов.
Принцип работы парсера:
1)На вход подаются csv файлы с url-ом и городом (кладутся в отдельную папку). Все исходные данные заносятся в БД.
2)Дальнейшая обработка данных происходит с БД.
3)Сбор данных. По окончании результат кладется в отдельную папку.
4)Парсер сам создает таблицу в БД и все необходимые для работы папки и файлы.
5)Парсер работает через прокси. Настройки прокси находятся в отдельном файле, там же находятся и все необходимые данные для подключения к БД.
6)Запускается парсер через консоль.
На выходе получаем csv файл со следующими данными:
- Название сайта аптеки
- Город
- Название препарата
- Стоимость
- Рейтинг
- Количество отзывов
- Исходный файл с запросом

stack - csv, proxy, postgresql, beautifulsoup, selenium, python
D49ee9cba4