Написать парсер страницы в википедии

Цена договорная • безналичный расчёт, электронные деньги
18 августа 2018, 22:39 • 4 отклика • 26 просмотров
Нужно спарсить изображения шрифтов по ссылкам страницы википедии по шрифтам https://en.m.wikipedia.org/wiki/List_of_typefaces
Изображения назвать в формате «год создания шрифта – название шрифта – имя дизайнера»
Например, 1495 – Garamond – Claude Garamond

Код обязательно на питоне 3.5+, на выходе нужен рабочий файлик скрипта, который я запускаю у себя на компе и он сохраняет картинки в папку fonts images wiki

Детали, и вопросы, которые могут возникнуть
- логика выглядит так — переходим по ссылке шрифта, находим в статье год создания и дизайнера и сохраняем картинку в формате «год создания шрифта – название шрифта – имя дизайнера»

- год создания и дизайнер могут быть как в таблице описания шрифта, н-р https://en.m.wikipedia.org/wiki/Aster_(typeface), так и в тексте описания статьи https://en.m.wikipedia.org/wiki/Microgramma_(typeface) — нужно обработать эти кейсы

- Если инфа есть в таблице, берём из неё, если нет, ищем в тексте.

- Если даты нет в описании статьи, то вместо даты пишите no date, например, no date - Optima - Hermann Zaph https://en.m.wikipedia.org/wiki/Optima
с дизайнером аналогично no desgner

- если дизайнеров несколько, берем первых 2х, остальных не берем

- на странице может быть несколько изображений шрифта — берите первое в описании статьи.

- если изображения нет, нужен список этих ссылок, можно просто вывести в консоли
Отзывы
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Заказчик
Все быстро качественно, легок в общении, спасибо
5 лет назад
R50 787a444d6b5118a56782574df0693bad
Фрилансер
 
5 лет назад