Написать скрипт для парсинга данных с сайта Discogs.com
5 000 руб. за проект
Доброго времени суток! Имеется коллекция музыки в размере ~20000 альбомов. Список всех альбомов есть в .xlsx файле. Требуется написать скрипт, который мог бы спарсить данные с сайта Discogs.com в другой файл Excel. Данные нужны следующие: полное название (artist - album), жанр, стиль и год.
При этом на Discogs.com часто находится несколько релизов одного и того же альбома. Интересует только первый в списке из Мастер-релизов, сортированных по количеству желаемых.
Более подробно всё показал на прикрепленных скриншотах:
1, 2, 3, 4 - что необходимо спарсить
5, 6 - данные каких релизов требуется спарсить
7 - пример списка artist-album, который предоставлю
8 - пример того, что хотелось бы получить на выходе
Если в каком нибудь из полей информации нет, то ячейку Excel оставить пустой или поставить какой-либо символ или слово.
Если Мастер-релиза альбома не существует (а такое тоже бывает), то вместо "Мастер-релизы" (скриншот 5) выбрать просто "Релизы" , далее процесс тот же. Как вариант, сделать этот скрипт отдельным, который бы запускался после прохождения основного скрипта, только по тем альбомам, которые не нашел первый скрипт. В общем, возможны варианты, но главная цель - получить список как в скриншоте 8 всех 20000 альбомов или же 2 отдельных списка с Мастер-релизами и Релизами, чтобы их потом совместить.
При этом на Discogs.com часто находится несколько релизов одного и того же альбома. Интересует только первый в списке из Мастер-релизов, сортированных по количеству желаемых.
Более подробно всё показал на прикрепленных скриншотах:
1, 2, 3, 4 - что необходимо спарсить
5, 6 - данные каких релизов требуется спарсить
7 - пример списка artist-album, который предоставлю
8 - пример того, что хотелось бы получить на выходе
Если в каком нибудь из полей информации нет, то ячейку Excel оставить пустой или поставить какой-либо символ или слово.
Если Мастер-релиза альбома не существует (а такое тоже бывает), то вместо "Мастер-релизы" (скриншот 5) выбрать просто "Релизы" , далее процесс тот же. Как вариант, сделать этот скрипт отдельным, который бы запускался после прохождения основного скрипта, только по тем альбомам, которые не нашел первый скрипт. В общем, возможны варианты, но главная цель - получить список как в скриншоте 8 всех 20000 альбомов или же 2 отдельных списка с Мастер-релизами и Релизами, чтобы их потом совместить.
Отзывы
В заказе есть исполнитель
При переводе заказа из архивного в актуальный, текущий исполнитель будет снят с задачи.
Выберите тип сделки
С безопасной сделкой вы всегда сможете вернуть средства, если что-то пойдет не так. С простой сделкой вы самостоятельно договариваетесь с исполнителем об оплате и берете на себя решение конфликтов.