Парсинг аудио с сайтов - selenium, прокси

30 000 руб. за проект
29 мая 2023, 11:09 • 6 откликов • 125 просмотров
Убедительная просьба - отликаться только если у вас есть опыт с высоконагруженным парсингом через Selenium.

Надо спарсить аудио и мета-данные с сайтов:

- https://www.faithcomesbyhearing.com/audio-bible-re...
- https://globalrecordings.net/en/search/language?se...

На сайтах есть JavaScript, который блокирует доступ к содержимому, для скачивания каждого аудио нужен свой ключ и пароль (который генерируется при открытии страницы).

Нужны данные:

- Аудио в максимальном качестве без пережатия;
- Текст данного фрагмента аудио;
- Название языка;
- Страна спикера (при наличии);
- ISO код языка;
- ID спикера (или любое поле, чтобы два спикера не спутать на одном языке, можно порядковый номер просто);
- Флаг, что аудио взято просто из аудио;
- Флаг, что аудио взято со слайда с видео и музыкой (откроете, поймете о чем я);
- Флаг, что есть текст;

Общаемся в телеграме: @ silero_job