Спарсить тексты с сайтов

1 000 руб. за проект
14 июля 2022, 12:23 • 2 отклика • 31 просмотр
Нужно пройти по столбцу «Е» скачать и сохранить html странички (без css/js файлов) с доменов из списка, на один домен только одна страница.
Отдельно пометить домены, которые не открылись / не удалась скачать.
Из сохраненных страниц собрать и сохранить абзацы с текстом. Если абзац 270 и более символов, то сохраняем этот абзац, если менее 270 символов игнорируем текст. (Картинка «принцип определения текста.png»)
Положить собранные абзацы (только 270 и более символов) в табличку где каждый абзац текста своя ячейка (табличка.xlsx). Данных мало, всего 879 доменов, но сайты указаны без протолкала https или http нужно попробовать оба варианта т.к редирект настроен не везде.
При отклике: цена, сроки
Файлы