Разработать среду на основе gym для задачи RL

Цена договорная

11 апреля 2024, 15:04 • 3 отклика • 16 просмотров

reinforcement learning
python

Цель - обучить 2 алгоритма RL (Q, PPO) в среде, разработанной на основе gym. Адаптировать зависимости для запуска в колабе.

Результат:
- тетрадка колаб с кодом среды
- код обучения с графиком обучения
- визуализация поведения агента в среде, простое видео или gif с идеальной стратегией, отображаемое в колабе

Антон К

Фрилансер

7 месяцев назад

Войдите или зарегистрируйтесь, чтобы откликаться на заказы