Вадимка и Машинки
14.02
Да я тебе говорю, вправо давай , или как я боролся с агентом в среде Mountain Car.
Привет, сетка! 🔥
Задач в искусственном интеллекте непостижимое множество. Нашлось место и немножко игровому виду задач — обучение с подкреплением, вся суть которого сводится к обучению агента выполнять определенную задачу. Типичных данных здесь нет, здесь есть только боль и страдания вознаграждения и штрафы... и чуть-чуть данных о среде и состоянии. Но что делать, когда агент наотрез отказывается идти к флагу? Когда он намеренно уезжает в другую сторону или выходит время эпизода? Притом, даже ни разу не выполнив действие, которое приблизит его к флагу? Неужели придется его заставлять? Да, именно этим я и занялся в своем блокноте. Сказ о том, как заставить гору сдвинуться и ей это даже понравится, прикреплен ниже по ссылке. https://github.com/Vadiman728/MountainCar_from_OpenAiGym_with_epsilon-greedy_strategy/blob/main/MountainCar.ipynb
еще контент в этом сообществе
еще контент в этом соообществе
Вадимка и Машинки
14.02
войдите, чтобы увидеть
и подписаться на интересных профи