Парсер для Instagram

Цена договорная
03 февраля 2021, 16:29 • 4 отклика • 116 просмотров
Источник: Instagram
Результат работ: парсер в виде скрипта на python, запакованный в docker контейнер, и протестированный на работтоспособность на машине EC2 AWS. Код должен предусматривать обход блокировок Instagramm.
Технологии: : Желательно использовать Selenium, (но возможны и другие варианты, по предложения исполнителя)
Требования к парсеру:
  • Парсер должен принимать на вход список аккаунтов в Инстаграмм которые необходимо скачать.
  • Есть ли возможность выгружать с картинкой строку с описанием того, что на картинке (пока картинка прогружается такую строку можно видеть в браузере)?
  • Парсер должен быть выполнен в докер контейнере, который будет размещен на машине в облаке AWS. Исполнителю необходимо будет проверить чтобы все работало непосредственно в облаке. То есть нужно учесть то что Инстграмм может блокировать конкретные IP от AWS. Парсер должен обеспечивать возможность обхода блокировки.
Расписание и логика работы парсера: Пользователь запускает самостоятельно парсер, т.е. не требуется его работа в автоматическом режиме по расписанию.

Что должен качать парсер:

1.Скачивать нужно в обязательном порядке Фотографию в оригинальном разрешении и timestamp поста, количество лайков, а также все сопутствующую информацию которую выдает Инстаграмм. (Пример того что выкачивали ранее предоставим)

2.Текст поста, Геолокацию, Количество лайков, Комментарии (текст, эмодзи), Хэштеги, Теги, Ники фолоуверов аккаунта и т.п.

В каком виде должен записывать парсер данные (с примером):

1.Текстовые данные в формате json

2.Картинки в jpeg

3.Можно ли качать видео? (уточнить у исполнителя)

Остальные детали описаны в приложенном файле.
Файлы