Парсинг научных журналов

30 000 руб. за проект
09 октября 2021, 17:24 • 13 откликов • 158 просмотров
Доработать парсер, который парсит 13000 rss ссылок

Есть два микросервсиса - Core и Parser
Core:
- хранит RSS ссылки журналов.
- принимает распарсенную информацию от Parser в виде статьи и сохраняет в БД.
- Содержит статус (success, error) парсинга каждой RSS ссылки

Parser:
- Получает от Core RSS ссылку и переходит на веб страницы указанные в этой ссылке. С веб страниц из head Мета-Тэгов получает необходимую информацию и дообогащает информацию из body страницы.
- Передает данные статьи в Core.

Что нужно сделать:
В приложении BMPN диаграмма, которая описывает взаимодействие парсера и core.
- Нужно настроить работу в соответствии с этой диаграммой
- Улучшить парсинг html страниц

Для полного понимания задачи предлагаю скачать приложение для которого реализуется эта задача
https://allpapers.online

В отклике укажите телеграм
Файлы