Скрипт для парсинга страниц яндекс форм

2 000 руб. за проект
12 января 2020, 21:14 • 16 откликов • 73 просмотра
Нужно сделать скрипт, который будет гулять по ссылкам по простому алгоритму и искать страницы, где кодовое слово (к примеру "промокод", "акция", "промо-код", "промо код" и тд) должно быть в Title страницы

Подробное видео объяснение задания -> youtu.be/kaBWkXACdxc

шаблон ссылки следующий
https://forms.yandex.ru/surveys/"N", где N просто число.

Для примера вот рабочая ссылка – https://forms.yandex.ru/surveys/10011455/ (где как раз таки в тайле есть пример слова "промокод")

Скрипт должен пройтись по алгоритму N + 1 (то бишь идти по одной странице вверх), изучая тайтл и создавая отчет со страницами, где он нашел кодовое слово. Остальной текст на странице робот должен игнорировать. Только "тайтл".

Нужна страница, где можно будет нажать "старт"/"стоп" и задавать параметры работы робота:
1) Задать значение "Nнач" с которого робот "скрипт" начинает работать
2) Задать значение "Nmax", на котором робот остановится
3) Задать кодовые слова списком (по одному в строке), по которым ищет робот.
4) Увидеть текущее число страницы "Nтек", на котором находиться робот (если он запущен)
5) Выводить результаты найденных страниц, которые робот нашел в процессе работы (прям в процессе работы выводить страницы, которые он нашел в таком виде, чтобы их можно было скопировать)
5) Тумблер поиска "строгого соответствия и не строгого" Допустим искать именно слово "промокод" и искать только те страницы, где так и написано. Либо искать в варианте "промокод" и находить его в слове "промокодЫ"

У робота должны быть сделана обработка ошибок, потому что периодически попадаются совсем пустые страницы (от слова совсем), а также страницы без титла или с пустым. Поэтому будет крайне печально, если он "вылетит" на какой-то фигне ))) и мы потеряем его результаты.

P.S. Конечно же он должен работать в бэкграунде
Отзывы
R50 c1b39e343e79cf9fb0f9c626235f4014
Заказчик
Работой Ивана доволен. Сделано в срок, учтены все пункты ТЗ. Предлагаю вам поручить своё задание ему, думаю, что будете довольны как слон:)
~ 4 года назад
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Фрилансер
Хороший заказчик, подробное задание, был на связи. Спасибо!
~ 4 года назад