R50 f2d20836317d779f9646b51c16384837
Python разработчик

Приложение-парсер реестра российского ПО https://reestr.digital.gov.ru

Добавлено 09 фев 2021 в 01:56
Программа вынимает из страниц реестра следующие поля:

  • Название ПО
  • Вид правообладателя
  • Название организации(или ФИО владельцев, разделенные двумя двоеточиями '::')
  • ИНН организации/владельца/владельцев, разделенные двумя двоеточиями '::')
  • Ссылка на все продукты правообладателя
  • Сайт организации
  • Альтернативные наименования продукта(разделенные символом '::', если их несколько)
  • Класс ПО(разделенные символом '::', если их несколько)
  • Дата регистрации продукта(dd.mm.yyyy)
  • Регистрационный номер ПО
  • Дата решения уполномоченного органа(dd.mm.yyyy)
  • Решение уполномоченного органа
  • Ссылка на приказ минкомсвязи
  • Сведения об исключительном праве
Использование:
  • запуск в консоли в директории, содержащей интерпретатор Python3
  • после запуска создается файл со ссылками на все ПО
  • далее скрипт предлагает ввести диапазон ссылок для парсинга(например, если вам нужны только добавленные продукты, старые парсить смысла нет)
  • далее нужно вести название файла
  • настройки задержек - в случае возникновения timeout-ошибок
  • выбор формата: данные могут записываться в csv-файл(как наиболее легкий и универсальный формат), а так же xlsx-файл(для тех, кому удобней Excel)
B534e0d01b 4452cef914 D8107c829e 504e4016e7