Мы с важной новостью: с 28 февраля 2025 года сервис Хабр Фриланс прекратит свою работу.

Купить услуги можно до 28 февраля 2025, но пополнить баланс уже нельзя. Если на вашем счете остались средства, вы можете потратить их на небольшие услуги — служба поддержки готова поделиться бонусами, на случай, если средств немного не хватает.
R50 4cd3e09e7672a60b2883d876545ae568
Написание парсеров, веб-крауле

Написание онлайн бота для парсинга данных.

Добавлено 11 фев 2024 в 02:44
Проект нацелен на создание мощного онлайн бота, способного автоматически собирать и анализировать данные из необходимых источников в режиме реального времени. Этот бот стал эффективным инструментом для одной компании, которой было необходимо еженедельно получать актуальную информацию об интернет-провайдерах в РФ. Во вложении представлен небольшой код для запуска бота.

Стек технологий:
- Python
- SQL
- Библиотеки Python для парсинга данных: Beatiful Soup
- Фреймворк для создания ботов: Selenium
- Дополнительные библиотеки Python: Requests, Pandas, Airflow.

Функциональность:
1. Парсинг веб-страниц: Бот способен автоматически извлекать данные с веб-страниц по заданным критериям.
2. Автоматизация: Бот будет работать в автоматическом режиме, периодически обновляя данные и предоставляя пользователю последние обновления c помощью Airflow.
3. Хранение данных: Полученные данные сохраняются в базе данных SQL для последующего доступа и анализа.

B9b1a5753a A8991c2523