R50 3548a4a176f9f8e354988a9d20206c11
Parsing Scrapy, Selenium, BS4

Parsing script http://franchisedirect.com/

Добавлено 12 июн 2022 в 00:44
Проект по написанию скрипта для парсинга сайта топ 100 франчайзинговых компаний мира. Скрипт в первую очередь собирает ссылки по рейтингу топ 100 компаний за последние 10 лет(10 ссылок). Далее начинает парсить рейтинг за каждый год начиная с последнего( на каждой странице список из 20 компаний т.е. обрабатывает все 5 страниц) и по ссылке открывает страницу каждой компании и только оттуда сохраняются данные. Результат выводится в отдельном csv файле за каждый год(10 файлов) .
C2a732710c