Парсер ссылок (web crawler)

35 000 руб. за проект
17 мая 2022, 15:57 • 13 откликов • 68 просмотров
Необходимо сделать кравлер исходящих ссылок с предоставленных мной сайтов (seed или сиды), с очередями и многопоточный и с возможностью выгрузить результаты прогонов.

Принцип работы: на вход даются (1...10к) сайтов-сидов, которые индексирует кравлер. Он же достаёт все внешние ссылки с этих сайтов и добавляет уже их в очередь на индексацию. Это максимальный уровень вложенности, дальше доставать ссылки и индексировать не надо.

Сохранять картинки с сайтов не надо. Стэк на ваше усмотрение. Предоставлю хостинг (DO?), прокси и любые инструменты которые потребуются.

Предпочтение исполнителям, которые уже делали нечто подобное и имеются готовые наработки и опыт, так всем нам будет проще. Если делали какой-либо парсинг больших маркетплейсов или сайтов обьявлений - проблем точно не будет с моей задачей.

ТЗ и больше подробностей вышлю по отклику, дедлайн на работающий прототип - неделя максимум.

P.S. если сработаемся, будем продолжать дальше + есть ещё схожие задачи
Отзывы
R50 446a7ce7218c82ba11786ee9901007bf
Заказчик
Благодарю Вячеслава за выполненную работу! Он очень быстро вник в суть моей довольно нетривиальной задачи, проконсультировал по всем вопросам, оперативно и качественно сделал всё по ТЗ. Более того, посоветовал как и что сделать лучше, сам отловил и пофиксил все баги, оптимизировал код и полностью подготовил проект под ключь. Очень доволен сотрудничеством, рекомендую!
2 года назад
Приятный в общении человек, быстро отвечает на вопросы. Чёткое ТЗ. Оплата без проблем.
2 года назад