Парсинг фалов по списку ссылок на Python

10 000 руб. за проект
06 декабря 2021, 12:25 • 13 откликов • 110 просмотров
Для связи прошу использовать Telegram @skvvdl

Необходимо написать код парсера на Python который будет выгружать судебные акты в формате pdf с сайта https://kad.arbitr.ru. Необходимо обработать HTML содержащий JS и произвести выгрузку файлов по уже имеющемуся списку ссылок на файлы. Сайт имеет встроенные механизмы борьбы с автоматизированным сбором информации. Исполнителю можем предоставить список платных прокси, которыми сами пользуемся при сборе информации.


Пример ссылок:

'https://kad.arbitr.ru/PdfDocument/f8991117-2583-489c-8e3c-c253cc962d1d/A40-183194-2015_20211125_Opredelenie.pdf', 'https://kad.arbitr.ru/PdfDocument/3583cada-8273-40dd-9559-9f929bd62dbb/A40-183194-2015_20211123_Opredelenie.pdf', 'https://kad.arbitr.ru/PdfDocument/4a8ea9df-0e4f-4aad-9bf9-17306414d10c/A40-183194-2015_20211110_Opredelenie.pdf', 'https://kad.arbitr.ru/PdfDocument/e56300cf-6837-4dfd-ab74-6e09aae6957b/A40-183194-2015_20211109_Prochie_sudebnye_dokumenty.pdf', 'https://kad.arbitr.ru/PdfDocument/15bcce24-4dda-43fe-ac2f-cb03ce226aa9/A40-183194-2015_20211109_Opredelenie.pdf', 'https://kad.arbitr.ru/PdfDocument/ea549609-f824-4154-8c22-5c8782e9dbf2/A40-183194-2015_20211026_Opredelenie.pdf'
Отзывы
Хороший в общении и надежный в работе исполнитель. Остался доволен
2 года назад
R50 18911b97af7c65425531e9530071121b
Фрилансер
Заказчик отличный, работать можно.
2 года назад