Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Парсинг и разработка ботов

Парсинг сайта

Добавлено 30 мая 2023 в 17:10
Цель была создание парсера сайта http://feb-web.ru/feb/sl18/slov-abc/ ,который собирал бы текст с каждого слова(сайт словарь сделан с использованием frame, ) чтобы получить доступ к тексту нужно перейти по ссылке находящейся на каждом слове. В итоге получилось примерно 50000 ссылак. Главная сложность в периодическом отваливание сайта. В итоге получаем текстовый документ
F3afdfb06a