Парсинг YT-каналов

3 500 руб. за проект
16 декабря 2021, 13:56 • 19 откликов • 86 просмотров
Задача: Есть список YT-каналов, нужно спарсить последние 40 видео с каждого канала и на выходе получить таблицу с данными - ссылка на ролик, описание, дата выхода видео, инфо о канале.

Чуть подробнее.

У нас есть большая таблица с ссылками на страницу с видео. Пример https://www.youtube.com/c/encyklop/videos


Что мы хотим:
Автоматизировать поиск информации. Для этого нужен парсер.

1.В парсер даем на вход ссылку(как в примере выше).

2.Парсер проверяет последние 40 видео на канале. Фиксирует информацию по каждому видео:
-ссылка на видео
-описание видео
-дата выхода видео

3.Далее проверяет раздел о канале и вытаскивает описание.
ВАЖНО: если в описании есть гиперссылки, их тоже должен вытащить

4.Парсер на выход отдает таблицу со всей собранной информацией. Примерно в таком формате https://docs.google.com/spreadsheets/d/1v-5MbfNSWo...

Уточнения:
-можем ли реализовать так, чтобы скармливать парсеру не по одной ссылке, а по много за раз?
-что будет с парсером, если на канале окажется меньше 40 видео, он остановится или вылетит в ошибку?
-будет ли выскакивать капча при парсинге и как можно это обойти?

Отзывы
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Заказчик
Благодарю Дмитрия за качественно выполненную работу. Выбрал Дмитрия не по отзывам, а по грамотно составленному отклику, четко написал, как будет работать, что требуется, поставил сроки и ответил на все вопросы из ТЗ.

Коммуникации во время работы были выстроены максимально комфортно, Дмитрий отвечал на все вопросы и не односложными ответами "да, можно/нет, нельзя", а с объяснением почему это так, а это вот так. Ответственно отнесся к срокам, быстро отвечал и был на связи.

По итогу, работу с Дмитрием оцениваю на 5+ и думаю это не последний заказ к нему. Приятно работать с профессионалами)
~ 3 года назад
R50 0c9dce73f370886c44dbcc6dc0790ffb
Фрилансер
Крайне приятный в общении человек. Грамотно ставит конечную цель проставляя ожидаемые промежуточные результаты. составляет подробное тз и постоянно выходит на связь, не исчезает. Не требует ничего что не было обозначено в тз
~ 3 года назад