Лига AlphaStar

+7 926 604 54 63 address

Лига AlphaStar

Лига AlphaStar. Агенты сначала обучаются на повторах игр людей, а затем в игре против других соперников в лиге. На каждой итерации “отпочковываются” новые соперники, изначальные соперники “замораживаются”, а также могут быть адаптированы вероятности подбора соперников (matchmaking) и гиперпараметры, которые определяют цель обучения каждого агента, что увеличивает сложность при сохранении разнообразия. Параметры агента обновляются c помощью обучения с подкреплением на основе результатов игр. Конечный агент собирается (без замен) из распределения Нэша [агентов] лиги.

.
Комментарии