Мы с важной новостью: с 28 февраля 2025 года сервис Хабр Фриланс прекратит свою работу.

Купить услуги можно до 28 февраля 2025, но пополнить баланс уже нельзя. Если на вашем счете остались средства, вы можете потратить их на небольшие услуги — служба поддержки готова поделиться бонусами, на случай, если средств немного не хватает.
R50 f2d20836317d779f9646b51c16384837
Python разработчик

Приложение-парсер реестра российского ПО https://reestr.digital.gov.ru

Добавлено 09 фев 2021 в 01:56
Программа вынимает из страниц реестра следующие поля:

  • Название ПО
  • Вид правообладателя
  • Название организации(или ФИО владельцев, разделенные двумя двоеточиями '::')
  • ИНН организации/владельца/владельцев, разделенные двумя двоеточиями '::')
  • Ссылка на все продукты правообладателя
  • Сайт организации
  • Альтернативные наименования продукта(разделенные символом '::', если их несколько)
  • Класс ПО(разделенные символом '::', если их несколько)
  • Дата регистрации продукта(dd.mm.yyyy)
  • Регистрационный номер ПО
  • Дата решения уполномоченного органа(dd.mm.yyyy)
  • Решение уполномоченного органа
  • Ссылка на приказ минкомсвязи
  • Сведения об исключительном праве
Использование:
  • запуск в консоли в директории, содержащей интерпретатор Python3
  • после запуска создается файл со ссылками на все ПО
  • далее скрипт предлагает ввести диапазон ссылок для парсинга(например, если вам нужны только добавленные продукты, старые парсить смысла нет)
  • далее нужно вести название файла
  • настройки задержек - в случае возникновения timeout-ошибок
  • выбор формата: данные могут записываться в csv-файл(как наиболее легкий и универсальный формат), а так же xlsx-файл(для тех, кому удобней Excel)
B534e0d01b 4452cef914 D8107c829e 504e4016e7