Парсер данных из маркетплейсов

Цена договорная
18 марта 2024, 19:06 • 20 откликов • 140 просмотров
Привет! Ищем python-разработчика для парсера данных конкурентов из 2х индонезийских маркетплейсов Shopee и Tokopedia.

ТЗ

1. В парсере должен быть конфигурационный файл (массив в любом виде), в котором мы должны задавать:
- Название нашего товара (по одному товару будет несколько конкурентов)
- Ссылка прямая на конкурента
- Задать паузу между запросами (с какой скоростью перебираются URL)

2. Логика работы парсера (запрос за запросом):
- Сразу переход по ссылке из конфиг файла (для Shopee требуется предварительная авторизация логин/пароль/подтверждение по почте)
- Забираем данные:
1. Цена товара со скидкой
2. Цена товара без скидки
3. (Если есть) кол-во на складе
4. Необходимо найти товар из акций и показать как это выглядит и в таблице должно быть наличие/отсутствие акции (либо название акции, либо NO)
5. Кол-во продаж (именно как отображается, например: 37 или 2rb+)
6. средний рейтинг и кол-во отзывов
- Вставляем в таблицу: date, tovar, ссылка на конкурента и все-все данные которые мы собираем

3. Необходимо по [API]
(https://developers.google.com/sheets/api/samples/rowcolumn ) добавлять строку в Google Sheets файл. Добавляем столбцы: сегодняшняя дата в формате 01.01.2023, ключевое слово, урл товара, который искали, его позиция (если не найдено - пишем 0).


Уточнения:
- Парсер должен иметь возможность быть установленным на VPS и запуска по CRON.
- Парсер должен писать лог во время работы: событие запуска, обработку каждого ключа (ключ - старт, переход на след. страницу, найдена позиция или переход к след ключу), событие завершения работы.
- Для парсеринга на Shopee требуется авторизация и подтверждение по письму на почту. Также вероятны слайд-капчи и разгадка цифр (возможно, можно избегать, если подобрать таймауты). На Tokopedia достаточно ходить по URL чтоб собрать данные.


В комментариях прошу указать вилку цены и сроки.