Обучить модель ML на поиск ключевых элементов в HTML-странице

20 000 руб. за проект
29 марта 2023, 11:41 • 7 откликов • 71 просмотр
Есть набор данных:
50000 веб-страниц товаров из интернет-магазинов в формате MHTML или WTL

С указанием ключевых элементов:
  • наименование товара
  • цена
  • изображение
  • кнопка Купить
  • кнопка Корзина

Задача:
Обучить модель (или несколько моделей), которая сможет находить ключевые элементы (все 5) на других веб-страницах товаров

Модель должна:
  • анализировать код страницы (возможно, также и ее изображение-скриншот)
  • принимать во внимание названия классов и прочих атрибутов html-элементов
  • на выходе давать указатели на ключевые элементы (лучше всего - в виде XPath или CSS-селектора)
  • для каждого найденного элемента должна выводиться вероятность/уверенность предсказания

Результат - скрипт, который применяет модель к новой странице и выводит найденные элементы. Формат входных данных (MHTML или WTL) зависит от Вашей реализации.


Требования к исполнителю:
  • опыт репрезентации HTML для использования в ML
  • опыт построения NLP-моделей


Внимание!
Успехом будет считаться корректное нахождение Наименований и Цен на 80% страниц из тестового датасета (будет подготовлен отдельно).

В ином случае (при точности 60-79%) оплата - 50%