Предсказывание рейтинга отелей. В этой работе, Вы можете проследить уже все этапы Data-Science проекта, начиная от разведивательного анализа данных, заканчивая обучением модели и расчетом метрики. Мы провели огромную работу по исследованию и преобразованию признаков датасета. С помощью визуализации данных смогли понять и зафиксировать связи между признаками, выявили мультиколлинеарность, от которой впоследствии избавились. В проекте изпользовалась модель машинного обучения RandomForestRegressor, которая была реализована с помощью библиотеки sklearn.
Для оценки проекта перейдите по ссылке:
https://github.com/Thinkgularity/SF_DataSciense/tr...