Авто новостной телеграмм-канал

5 000 руб. за проект
26 июля 2022, 12:04 • 7 откликов • 55 просмотров
Цель: сделать выжимку по главным новостям из иб в телеграмм канал.

В рамках этого ТЗ требуется только подготовить инфраструктуру – парсер и отправка в телеграмм канал первых 4 предложения

1. Необходимо написать на Python парсер для новостей. Можно использовать готовые библиотеки, например Article. Главное – чистый текст для дальнейшей обработки без каких-либо случайных фраз.

Парсер должен заходить на сайты, и скачивать новые новости. Регулярность – три раза в день.

Список сайтов:
https://www.anti-malware.ru/news
https://www.tadviser.ru/index.php/Новости
https://cisoclub.ru/category/news/
https://www.securitylab.ru/news/
https://www.rbc.ru/tags/?tag=%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F%20%D0%B1%D0%B5%D0%B7%D0%BE%D0%BF%D0%B0%D1%81%D0%BD%D0%BE%D1%81%D1%82%D1%8C
https://www.comnews.ru/information_security
https://xakep.ru/tag/news/
https://rb.ru/tag/cybersecurity/
https://ria.ru/product_informatsionnaya-bezopasnost/
https://www.itsec.ru/news
https://www.kommersant.ru/theme/1267


2. Подготовить пустой модуль для обработки текста.
Для этой задачи нужно взять все новые новости со всех источников, сохранить в csv.

Обработка текста не требуется, достаточно взять просто 4 первых предложения. Здесь в дальнейшем будут дополнительные операции с текстом, не в рамках этого ТЗ.

Текст необходимо добавлять в csv файл, в формате: дата, время, источник (главный домен сайта), название статьи, ссылка на источник, сам полный текст
Продумать об копировании этого файла после его переполнения.

3. Сделать пост в телеграмм-канале в формате:
Название статьи
4 первых предложения
Источник: название источника в формате ссылки


4. Выложить на хостинг. Предварительно, это reg.ru, но можно обсудить любой другой
Отзывы
Спасибо за оперативность! И грамотный, профессиональный подход, рекомендую.
2 года назад
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Фрилансер
 
2 года назад