Machine learning / Data Science: классификация автомобилей

800 руб.за час • электронные деньги
12 марта 2017, 14:51 • 2 отклика • 88 просмотров
В автомобильной промышленности существует понятие отзыва (recall) - производственного дефекта, который объявляется производителем для некоторой группы автомобилей. Критерии, по которым определяется эта группа, известны не всегда или не полностью. Recalls периодически закрываются при техобслуживании автомобилей у дилеров.

Точную информацию о наличии recalls у автомобиля можно получить у производителя, предоставив VIN, но такой запрос занимает время. Необходимо научиться предсказывать возможность наличия recall у автомобиля, имея:

  • Базу уже известных автомобилей, recalls, и соответствий между ними
  • Характеристики автомобиля, полученные из декодирования VIN, такие как год, модель, производитель, тип двигателя, тип топлива, число цилиндров и многое другое (разные recalls могут зависеть от разных подмножеств этих характеристик)
  • Некоторые дополнительные источники данных
Те автомобили, для которых предсказывающая модель сообщит о наличии отзыва, будут отправлены для проверки производителю. Результат проверки используется для обучения модели (желательно, в реальном времени).

Требования и технологии:
  • Python 2.7
  • Опыт решения таких задач и умение выбрать оптимальное средство (decision trees, linear regression, neural networks, ...)
  • Знакомство с PostgreSQL
  • Возможность читать документацию на английском языке
Может быть полезно, но не обязательно, знакомство с Django.

Также:
  • Будет предоставлена база vehicles, recalls, VIN decoder data и других связанных данных в виде дампа для PostgreSQL
  • Плюс более подробная документация по задаче
  • Когда модель будет готова, один из участников нашей команды будет работать с вами, чтобы интегрировать подготовленное решение в нашу систему.