Написать парсер для выгрузки контактной информации компаний с сайта

10 000 руб. за проект • безналичный расчёт, электронные деньги
27 июня 2018, 00:23 • 24 отклика • 107 просмотров
Необходимо выгрузить в формат xls/xlsx контактную информацию компаний (около 100 тыс. уникальных записей в открытом доступе на сайте). Необходимые данные распределены по двум страницам для каждой компании (см. приложенные скриншоты). 1 страница - страница каталога (около 50 записей на каждой странице) и основная информация о компании (название, адрес, телефон). Затем необходимо перейти по гиперссылке в названии компании на её лэндинг страницу внутри каталога. Там необходимо проскролить вниз на 1-2 экрана и выгрузить данные из блока "контактная информация", а именно - email, веб сайт и имя владельца компании (они также находятся в открытом доступе и ничем не закрыты). Разумеется, для некоторых компаний информация будет неполной - необходимо выгрузить то, что есть.
Также, некоторые названия нужных данных могут разниться (к примеру, owner/name/contact person - нам нужно любое из трех)
Линк на сайт - на стадии обсуждения заказа.
Сайт в US и большинство русских IP ими заблокированы, так что будет необходимо использование любого VPN для работы
Файлы