Парсинг информации о судебных делах наших клиентов

2 000 руб.за час
13 ноября 2023, 23:59 • 8 откликов • 76 просмотров
Мы -компания, которая оказывает широкий спектр юридических услуг по иммиграции в США.

Проблема

Есть сайт acis.eoir.justice.gov/en/, на котором размещается информация по судебным делам. В нашем случае там размещается информация по делам наших клиентов, иммигрирующих в США. Наши юристы (и сами клиенты) регулярно проверяют информацию на сайте по т. н. A-номерам, чтобы не пропустить назначаемые слушания по делам. Клиентов у нас много, получать эту информацию руками не очень удобно, с ростом компании это делать всё сложнее, а публичного API у этого комитета пока нет.

Мы хотим автоматически собирать эту информацию, сохранять её в нашей базе данных и уведомлять клиентов и юристов об изменениях, чтобы они не пропустили назначенные слушания.

Что нужно сделать

  1. Проверить возможность сбора информации по A-номерам (будут предоставлены) через имитацию действий реального пользователя в браузере (используя Puppeteer или другие аналогичные инструменты). Нужно понять возможно ли это в принципе или запросы будут блокироваться капчей и ничего не выйдет. Если на этом этапе подтвердится, что информацию собирать можно, то двигаемся дальше.
  2. Написать скрипт, который с заданной периодичностью (скорее всего, раз в неделю) собирает информацию по всем A-номерам наших клиентов и сохраняет её через наш API в базу данных. Если получить информацию по какой-то причине не удалось, то нужно будет уведомлять нашу систему об этом через соответствующий API endpoint. Детали реализации обсудим с исполнителем.
Что ждем от исполнителя

  1. Большой опыт спайдеринга и парсинга различных сайтов, понимание возможных проблем и ограничений, использования прокси, обхода капч и т. п.;
  2. Опыт имитации действий пользователей в браузере с заполнением и отправкой форм;

При отклике, пожалуйста, опишите свой релевантный заказу опыт.
Файлы
Отзывы
Отличный специалист по парсингу сайтов и, я уверен, по другим вопросам тоже. Быстро нашёл способ решения задачи, с которой не справились другие программисты и также быстро всё реализовал. Остались только положительные впечатления от работы с Александром Буду рад сотрудничать снова.
12 месяцев назад
R50 7dbc847b3cb37315504e3769ae3bc718
Фрилансер
Не забывайте про скайнет
12 месяцев назад