Команда исследователей из DeepMind Technologies Ltd. создала алгоритм DeepNash, который способен играть в игру Stratego на экспертном уровне. Отмечается, что специалисты разработали уникальную программу обучения, которая позволила ИИ стать опасным соперником и побеждать людей.
Stratego – это настольная игра для двух игроков. Цель каждого – захватить флаг своего противника, спрятанный среди 40 игровых фигур, каждая из которых имеет свой ранг и предназначение. Игроки не могут видеть расстановку соперника, что еще более запутывает эту настолку.
Считается, что сложность Stratego выше, чем в шахматах или японской Го – количество возможных игровых сценариев здесь составляет 10 535. Для сравнения, в шахматах этот показатель равен 10 120.
Такая высокая сложность игры делает невероятно трудным подготовку алгоритма, который смог бы обыгрывать людей. Чтобы создать игровой ИИ экспертного уровня, исследователи применили новый подход обучения. Сначала ученые учили алгоритм DeepNash по старинке – он отыграл 5,5 млрд партий в Stratego, что эквивалентно нескольким сотням лет игрового времени. Затем исследователи начали обучать ИИ в соответствии с теорией игр, чтобы каждый ход давал минимум 50% шансов на успех.
Такая стратегия оправдалась – DeepNash побеждает людей в 84% игр, став одним из лучших игроков в соревнованиях.