Программа вынимает из страниц реестра следующие поля:
- Название ПО
- Вид правообладателя
- Название организации(или ФИО владельцев, разделенные двумя двоеточиями '::')
- ИНН организации/владельца/владельцев, разделенные двумя двоеточиями '::')
- Ссылка на все продукты правообладателя
- Сайт организации
- Альтернативные наименования продукта(разделенные символом '::', если их несколько)
- Класс ПО(разделенные символом '::', если их несколько)
- Дата регистрации продукта(dd.mm.yyyy)
- Регистрационный номер ПО
- Дата решения уполномоченного органа(dd.mm.yyyy)
- Решение уполномоченного органа
- Ссылка на приказ минкомсвязи
- Сведения об исключительном праве
Использование:
- запуск в консоли в директории, содержащей интерпретатор Python3
- после запуска создается файл со ссылками на все ПО
- далее скрипт предлагает ввести диапазон ссылок для парсинга(например, если вам нужны только добавленные продукты, старые парсить смысла нет)
- далее нужно вести название файла
- настройки задержек - в случае возникновения timeout-ошибок
- выбор формата: данные могут записываться в csv-файл(как наиболее легкий и универсальный формат), а так же xlsx-файл(для тех, кому удобней Excel)