Помощь c курсовой работой (настройка LSTM и CatBoost модели)

1 000 руб.за час
12 июля 2022, 07:06 • 6 откликов • 41 просмотр
  • Нужная помощь с дипломным проектом "Прогнозная модель цены Bitcoin". По семейным обстоятельствам выбился из графика и самостоятельно в дедлайны не вписываюсь :(

писание проекта:

- Вопросы к изучению:

  • какие фичи мы должны использовать для прогнозов?
  • какая задача лучше - регрессия или классификация для задачи прогнозирования цены?
  • какую модель ML мы должны использовать?
- Задачи проекта:
  • определить фичи для датасета
  • использовать необходимые Data Cleaning/Pre-processing активности
  • построить модели CatBoost and LSTM для задачи регрессии и классификатора и сравнить их

Что уже сделано:

  1. Подготовлен первичный датасет с фичами для тестирования (катировки качаются с Yahoo Finance)
    • Open price
    • High price
    • Low price
    • Close price
    • Trading Volume
    • SMA (14) from RSI (14)
    • SMA (14) from OBV
    • EMA (12)
    • EMA (26)
    • MACD=EMA(12) - EMA(26)
    • Таргет фича LSMA (14) from Close price
  1. Dataset нормализован методом MinMaxScaler
  2. Добавлены фичи изменения индикаторов относительно цены:
    1. ∆ Нормализованная Цена закрытия /∆ нормализованное SMA (14) from RSI (14)
    2. ∆ Нормализованная Цена закрытия /∆ нормализованное SMA (14) from OBV
    3. ∆ Нормализованная Цена закрытия /∆ нормализованное EMA (12)
    4. ∆ Нормализованная Цена закрытия /∆ нормализованное EMA (26)
  3. Удалены NA
  4. Проведен лейблинг расширенного нормализованного датасета с классификацией -1, 0, 1 (для тестирования моделей классификаторов)
  5. Для нормализованного датасета собрана регрессионная модель CatBoost
  6. Проведено тестирование гипперпараметров. Выбран наилучший набор для CatBoost
    1. Для валидации использовался метод TimeSeriesSplit (split = 3)
    2. В качесте метрик для валидации модели были использованы:
      1. RMSE
      2. WAPE%
      3. BIAS%
  7. Подготовлен классификатор CatBoost. Реализован на старой версии датасета.

Что нужно сделать?

  1. Нужно настроить LSTM регрессор для валидации и тестирования модели по метрикам
    1. RMSE
    2. WAPE%
    3. BIAS%
  1. Провести тестирование гипперпараметров, выбрать наилучшую комбинацию для LSTM регрессор (возьму задачу на себя)
  2. Нужно настроить CatBoost и LSTM классификатор для валидации и тестирования модели по метрикам для датасета после лейблинга:
    1. ROCAUC,
    2. Confusion matrix
  3. Провести тестирование гипперпараметров, выбрать наилучшую комбинацию для CatBoost и LSTM классификатор (возьму задачу на себя)
  4. Сравниваем полученные результаты и выбираем модель - лидер (возьму задачу на себя)
  5. Если успеваем, то деплой выбранной модели в streamlit.io в виде графика фактической и прогнозной цены. Если не успеваем, то график фактической и прогнозной цены через pandas
Дедлайн до 17.07 (чем быстрее, тем лучше)
Стэк файлов с проделанной работой пришлю соискателю после предварительного интервью
Отзывы
R50 28a376e19eb92bb339ed90e50cae91cd
Заказчик
Александр без преувеличения - профессионал высокого уровня. Код очень аккуратный и чистый. На все вопросы отвечает быстро и детально. Часы не накручивает, а может даже наоборот ;)) работу получил досрочно и в лучшем виде. Обязательно обращусь еще!
~ 2 года назад
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Фрилансер
Очень приятный заказчик, интересная задача, достойная и своевременная оплата
~ 2 года назад