Доработать игру Pacman на Python

1 000 руб. за проект
08 мая 2024, 11:37 • 2 отклика • 65 просмотров
Написана игра Pacman на Python, использован GYM ATARI
Обучение с подкреплением, модель DQN
Нейросеть играет сама
Состояние - это описание того где находится игрок в пространстве на данный момент, помогает агенту понять, что происходит вокруг него
Действие - решение агента, следует ли совершить какое-то действие для перемещения в пространстве
Награда - то, как мы поощряем агента за за период прожитой одной жизни (из 3), в случае смерти, отнимаем 100 очков, иначе - добавляем
Флаг завершения - сигнал о завершении игры путем расходования всех доступных жизней, когда переменная флага завершения станет истинной - агент узнает что игра завершена и перейдет в обучению следующей эпохи
Обучение уже написано, но хотелось бы модернизировать, чтобы PacMan смог набрать большое количество очков, при этом адекватно двигался, выводить процент съеденных очков от общего количества. Для упрощения, если это возможно, то можно убрать энерджайзеры или уменьшить количество призраков
Сейчас Пакман обучается в медленном режиме, но почему то игра идет в быстром режиме, надо бы это исправить.
Прокомментировать код, ответить на вопросы
Постановка задачи

a.описание среды;

b.описание функций агента.

2.Формализация задачи.
Описание

a.модели поведения среды,

b.состояний среды,

c.вознаграждений,

d.действий агента,

e.целевой функции агента.

3.Выбор метода обучения с
подкреплением.

4.Реализация имитационной
модели поведения среды.

5.Реализация алгоритма
обучения с подкреплением.

6.Обучение агента.

7.Оценка качества обучения
агента