Разработать парсер архива новостей Wall Street Journal

Цена договорная
06 декабря 2024, 16:07 • 20 откликов • 93 просмотра
Необходимо написать парсер новостей с архива Wall Street Journal.
У них есть архив новостей за каждый день. Пример такой странички: https://www.wsj.com/news/archive/2022/12/03


В качестве параметров URL можно передать интересующий день месяц и год, далее собрать все новости с каждой новости за этот день (иногда новостей много и надо пролистать страницы внизу).

Задача написать код (который можно будет в дальнейшем автоматизировать кронами) и собрать табличку CSV с датой, заголовком и текстом каждой новости с 1 сент 2014 по 1 дек 2024.

Проблема в том что при парсинге вылезают капчи (на сайте стоит защита) - скриншот примера капчи прилагаю




Файлы