Выполнить задания по анализу данных в Python
1 500 руб. за проект
Необходимо выполнить следующие действия с уже имеющимися дата сетами:
- Провести обучение по трем классификаторам (knn, naïve bayes, tree). Необходимо делить датасет в пропорции 67 на 33. Провести кросс-валидацию на 4 запуска. При обучении необходимо проводить поиск оптимальных параметров на основе F1 score.
- Определить 12 наилучших фич для каждого из классов
- Определить какие из наилучших фич входят во все классы.
- Провести усечение датасета и пересчитать классификаторы (та же пропорция и те же параметры), показать как изменилось качество работы классификаторов на новом датасете.
- Объединить три файла (в именах этих файлов есть слово ‘labelled’) в один файл
- Разделить датасет в пропорции 65 на 35
- Определить наилучший классификатор (svm, naïve Bayes, tree). При обучении использовать кросс - валидацию на 6 запусков. При обучении подобрать наиболее оптимальные значения гипер-параметров.
- Сделать предсказание на тестовом датасете.
- Определить какой из трех источников данных дает наиболее позитивную оценку. Данная оценка должна рассматриваться как сумма соответствующих оценок.
В заказе есть исполнитель
При переводе заказа из архивного в актуальный, текущий исполнитель будет снят с задачи.
Выберите тип сделки
С безопасной сделкой вы всегда сможете вернуть средства, если что-то пойдет не так. С простой сделкой вы самостоятельно договариваетесь с исполнителем об оплате и берете на себя решение конфликтов.