Написание Python-парсера объявлений недвижимости (Зарубежные сайты)

10 000 руб. за проект
02 июня 2022, 15:28 • 41 отклик • 202 просмотра
Цена - не окончательная. Она основывается на вашей способности обосновать, почему 15, а не 10. или почему 7, а не 10. Экономить я не собираюсь, но нужна объективная оценка с вашей стороны.

Заказы размещаю от лица компании. Мы активно расширяем сферу деятельности, поэтому каждые 3-5 недель будет появляться запрос на всё новые и новые парсеры.

Суть: по мере расширения на зарубежные рынки (Вьетнам, Таиланд, ОАЭ, Турция и т.д.) для наполнения собственной базы данных нам нужна статистика по объёму предложения и ценообразованию на рынке недвижимости отдельно взятой страны. Парсинг нужно настроить напрямую в нашу SQL базу. Не знаю, есть ли разница, но у нас Postgre диалект. Качать планирую 1 раз в неделю. Качать хотелось бы через открытый код Python.

По-хорошему мне нужен человек на долгосрочное сотрудничество, с которым мы найдём общий язык. Я не сведущ в большом множестве нюансов, связанных с парсингом, поэтому (если вдруг), в процессе использования вашего парсера будут возникать какие-то ошибки или важные вопросы, я ожидаю, что вы мне поможете с ними разобраться. Разумеется, я не собираюсь садиться вам на уши сутками, но хочется получать своевременную обратную связь.

На данный момент в первую очередь интересует этот сайт: https://www.zingat.com/en/for-sale
Он очень специфический, и вот почему: Загвоздка в том, что там вроде как 100 000 + объявлений, но при этом отображение страниц имеет лимит до 48 штук. Поэтому почти все элементы поиска скрыты до тех пор, пока не выберешь конкретные фильтры.

Если этот сайт не получится спарсить, но надо будет спарсить: https://www.properstar.ru/turkey/buy.
Оба эти сайта - по Турции.

Помимо этого есть острая необходимость в статистике по ОАЭ. Предварительно понадобится этот сайт: https://www.bayut.com/for-sale/property/uae/

Подробное (очень подробное) ТЗ будет мной составляться под каждый отдельный сайт.

Мера моей удовлетворенности парсером будет выражаться в 3 вещах:

1) 100% (или 99.9%) собранных объявлений
2) Отсутствие ошибок при работе парсера.
3) Вы полностью тестируете .csv выгрузку на предмет того, что там не съехали столбцы\строки перед тем, как предъявлять мне результат. Чтобы мы не тратили ни ваше, ни моё время.

Прикрепил к объявлению пример цсв файла, который используется для парсинга другого сайта и удовлетворяет моим потребностям.


Файлы