Да я тебе говорю, вправо давай , или как я боролся с агентом в среде Mountain Car. Привет, сетка! 🔥 Задач в искусственном интеллекте непостижимое множество

Да я тебе говорю, вправо давай , или как я боролся с агентом в среде Mountain Car.

Привет, сетка! 🔥 Задач в искусственном интеллекте непостижимое множество. Нашлось место и немножко игровому виду задач — обучение с подкреплением, вся суть которого сводится к обучению агента выполнять определенную задачу. Типичных данных здесь нет, здесь есть только ~~боль и страдания~~ вознаграждения и штрафы... и чуть-чуть данных о среде и состоянии. Но что делать, когда агент наотрез отказывается идти к флагу? Когда он намеренно уезжает в другую сторону или выходит время эпизода? Притом, даже ни разу не выполнив действие, которое приблизит его к флагу? Неужели придется его заставлять? Да, именно этим я и занялся в своем блокноте. Сказ о том, как заставить гору сдвинуться и ей это даже понравится, прикреплен ниже по ссылке. https://github.com/Vadiman728/MountainCar_from_OpenAiGym_with_epsilon-greedy_strategy/blob/main/MountainCar.ipynb

еще контент в этом сообществе