Парсер поисковой выдачи на Python (Bs4 или Selenium)

2 000 руб. за проект
23 октября 2021, 10:51 • 3 отклика • 22 просмотра
Необходим парсер выдачи 2 поисковых систем:
1) Изначально передаём список ключевых слов, стоп-слов и доменов-исключений (в таблицах mysql)
2) По каждому ключевому слову получаем 50 страниц выдачи
3) По каждой ссылке найденной в выдаче (если не относится к доменам исключениям и если на самой странице нет одного из указанных стоп-слов) сохраняем в таблицу mysql: дата-время, поисковая система, url, номер позиции в выдаче (проверяем, если такой url существует, делаем update, если нет insert)
4) При запросах к поисковыми системами используем прокси (будут доступны как json), каждую минуту список обновляется
5) При запросах также берём случайный user-agent (список будет предоставлен)
6) Реализация на базе bs4+requests или selenium