Программа скачивания файлов и сохранения текстового слоя
5 000 руб. за проект
Нужна программа для скачивания файлов и сохранения текстового слоя.
В папке имеются архивы с html файлами страниц сайтов, на страницах есть ссылки с текстовыми документами pdf, doc, docx rtf, csv, xls, xlsx, в том числе ссылки на файлы на гугл\яндекс диске.
Нужно скачать файл, выдернуть из него текст и сохранить в архиве в виде txt файла.
Подробно о задаче: На диске есть папки, в них еще папки, в папках zip архивы, в архивах скачанные html страницы, страница содержат ссылки на файлы следующих форматов: pdf, doc, docx, rtf, csv, xls, xlsx. Ссылки могут быть в том числе и на файлы находящиеся на файлообменниках, таких как гугл диск, яндекс диск.
Программа должна открывать зип архив, начинать сканирование с главной страницы сайта, находить на странице ссылки и скачивать файл при условии что он будет размером не более 3мб, открывать файл, сохранять текстовой слой файла в файл .txt которых сохранять в томже архиве что и страница, файл называть так-же как скачанный. Всего скачиваем не более 10 файлов с одного архива. Закрывать архив. И так по всем папкап и всем архивам.
В папке имеются архивы с html файлами страниц сайтов, на страницах есть ссылки с текстовыми документами pdf, doc, docx rtf, csv, xls, xlsx, в том числе ссылки на файлы на гугл\яндекс диске.
Нужно скачать файл, выдернуть из него текст и сохранить в архиве в виде txt файла.
Подробно о задаче: На диске есть папки, в них еще папки, в папках zip архивы, в архивах скачанные html страницы, страница содержат ссылки на файлы следующих форматов: pdf, doc, docx, rtf, csv, xls, xlsx. Ссылки могут быть в том числе и на файлы находящиеся на файлообменниках, таких как гугл диск, яндекс диск.
Программа должна открывать зип архив, начинать сканирование с главной страницы сайта, находить на странице ссылки и скачивать файл при условии что он будет размером не более 3мб, открывать файл, сохранять текстовой слой файла в файл .txt которых сохранять в томже архиве что и страница, файл называть так-же как скачанный. Всего скачиваем не более 10 файлов с одного архива. Закрывать архив. И так по всем папкап и всем архивам.
Отзывы
В заказе есть исполнитель
При переводе заказа из архивного в актуальный, текущий исполнитель будет снят с задачи.
Выберите тип сделки
С безопасной сделкой вы всегда сможете вернуть средства, если что-то пойдет не так. С простой сделкой вы самостоятельно договариваетесь с исполнителем об оплате и берете на себя решение конфликтов.