Да я тебе говорю, вправо давай , или как я боролся с агентом в среде Mountain Car.

Привет, сетка! 🔥 Задач в искусственном интеллекте непостижимое множество. Нашлось место и немножко игровому виду задач — обучение с подкреплением, вся суть которого сводится к обучению агента выполнять определенную задачу. Типичных данных здесь нет, здесь есть только боль и страдания вознаграждения и штрафы... и чуть-чуть данных о среде и состоянии. Но что делать, когда агент наотрез отказывается идти к флагу? Когда он намеренно уезжает в другую сторону или выходит время эпизода? Притом, даже ни разу не выполнив действие, которое приблизит его к флагу? Неужели придется его заставлять? Да, именно этим я и занялся в своем блокноте. Сказ о том, как заставить гору сдвинуться и ей это даже понравится, прикреплен ниже по ссылке. https://github.com/Vadiman728/MountainCar_from_OpenAiGym_with_epsilon-greedy_strategy/blob/main/MountainCar.ipynb

repost

27

input message

напишите коммент

еще контент в этом сообществе

еще контент в этом соообществе

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь