Парсер аудио / видео потока на сайте Unmultimedia

30 000 руб. за проект
18 мая 2020, 15:25 • 2 отклика • 53 просмотра
Есть архив ООН с аудио-видео материалами. Там всего 46,885 материалов.
Примерно в трети есть "превью" на каком-то языке и транскрипт.
Это проще всего понять перебором, но в основном там генеральная ассамблея.

Разберем на одном примере, допустим на этом (откройте страничку).
Важные моменты:

- More from This Cut - тут ссылки на другие видео с этим транскриптом
- For further details please see official record - тут ссылка на транскрипт - тут есть pdf и doc документы
- Preview Language: English - тут написано какой язык на видео в превью - от этого зависит какой pdf качать

Что нужно собрать:

- Аудио (можно собрать видео, но нужно только аудио).
- Транскрипт на языке, который совпадает с языком превью - pdf или doc - любой (можно скачать все на самом деле, тут легко по идее)
- Нужно собрать под одним транскрипты и все аудио одного выступления

Основная сложность - прямых ссылок на видео я не нашел, там видео-поток приходит кусочками, если посмотреть на вкладку network в браузере.

Цену указал как некий минимум за такой проект при условии, что у исполнителя уже есть пул проксей и место на диске под файлы. Готов рассматривать любые адекватные варианты.

Пишите сразу в телеграм @snakers4. Интересны исполнители с опытом высоко-нагруженного парсинга. Плюс вы должны понимать как распарсить видео-выдачу.
Отзывы
Аноним
Всё отлично, рекомендую к сотрудничеству
4 года назад