Разработка парсер Python, Selenium, BeautifulSoup4

Цена договорная
12 июня 2024, 13:13 • 14 откликов • 88 просмотров
Есть старый парсер, который видимо после обновления капчи, перестал работать корректно

Описание ТЗ парсера


При парсинге используется две библиотеки DrissionPage и BeautifulSoup4. При помощи первой библиотеки осуществляется обход капчи Cloudflare и скачивание HTML-страницы, а при помощи BeautifulSoup4 осуществляется парсинг элементов страницы.


Проблема сейчас - это ошибки при обходе капчи


Решение для которого нужен Python-разработчик с опытом парсинга:


1) Для обхода капчи будет использоваться сервис https://rucaptcha.com/api-rucaptcha


2) Вместо DrissionPage, необходимо использовать Selenium в связке с расширением rucaptcha, то есть переписать код обхода капчи


Стек: Python, Selenium, BeautifulSoup4

Отзывы
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Заказчик
Очень быстро, недорого и с понятной коммуникацией. Рекомендую!
6 месяцев назад
R50 2245165356b3ef3173b0018e52104000
Фрилансер
Очень приятный заказчик, приятно было сотрудничать
6 месяцев назад