Парсер поиска наименьшей цены и отзывов на препараты по 5 аптекам

Добавлено 27 июн 2024 в 23:45
Парсер написан на python 3.11 c использованием PostgreSQL, Selenium и прокси. Парсер получает информацию сразу с 5 сайтов аптек с указанием города (в каждой аптеке свой город):
- apteka.ru
- eapteka.ru
- zhivika.ru
- lekkupi.ru
- maksavit.ru
Парсер проходит по каждой ссылке и городу, которые были указаны в csv файле, и собирает по требуемому товару наименьшую цену, рейтинг, и количество отзывов.
Принцип работы парсера:
1)На вход подаются csv файлы с url-ом и городом (кладутся в отдельную папку). Все исходные данные заносятся в БД.
2)Дальнейшая обработка данных происходит с БД.
3)Сбор данных. По окончании результат кладется в отдельную папку.
4)Парсер сам создает таблицу в БД и все необходимые для работы папки и файлы.
5)Парсер работает через прокси. Настройки прокси находятся в отдельном файле, там же находятся и все необходимые данные для подключения к БД.
6)Запускается парсер через консоль.
На выходе получаем csv файл со следующими данными:
- Название сайта аптеки
- Город
- Название препарата
- Стоимость
- Рейтинг
- Количество отзывов
- Исходный файл с запросом

stack - csv, proxy, postgresql, beautifulsoup, selenium, python
D49ee9cba4