Программа скачивания файлов и сохранения текстового слоя

5 000 руб. за проект
07 июля 2023, 13:51 • 10 откликов • 134 просмотра
Нужна программа для скачивания файлов и сохранения текстового слоя.
В папке имеются архивы с html файлами страниц сайтов, на страницах есть ссылки с текстовыми документами pdf, doc, docx rtf, csv, xls, xlsx, в том числе ссылки на файлы на гугл\яндекс диске.
Нужно скачать файл, выдернуть из него текст и сохранить в архиве в виде txt файла.
Подробно о задаче: На диске есть папки, в них еще папки, в папках zip архивы, в архивах скачанные html страницы, страница содержат ссылки на файлы следующих форматов: pdf, doc, docx, rtf, csv, xls, xlsx. Ссылки могут быть в том числе и на файлы находящиеся на файлообменниках, таких как гугл диск, яндекс диск.
Программа должна открывать зип архив, начинать сканирование с главной страницы сайта, находить на странице ссылки и скачивать файл при условии что он будет размером не более 3мб, открывать файл, сохранять текстовой слой файла в файл .txt которых сохранять в томже архиве что и страница, файл называть так-же как скачанный. Всего скачиваем не более 10 файлов с одного архива. Закрывать архив. И так по всем папкап и всем архивам.
Отзывы
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Заказчик
Задача выполнена, ответственный исполнитель.
1 год назад
R50 5d26b2c82096811071d76b5eb085fdb5
Фрилансер
На все уточняющие вопросы незамедлительно получил ответы, с Евгением приятно раьотать
1 год назад