0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Как выиграть в камень ножницы бумага в игре shini game

Как выигрывать в игре камень-ножницы-бумага? (реализация оптимальной стратегии в Wolfram Mathematica)

Перевод поста Джона Маклуна (Jon Mcloone, директор департамента международного бизнеса и стратегического развития Wolfram Research). Оригинал поста: How to Win at Rock-Paper-Scissors
Скачать пост в виде документа Mathematica

С точки зрения математики игра камень-ножницы-бумага (см. Дополнение 1 в конце) не является особо интересной. Стратегия равновесия Нэша очень проста: случайно и с одинаковой вероятностью выбирайте из трех вариантов, и при условии проведения большого числа игр ни вы, ни ваш соперник не сможете одержать победу. Хотя, при обсчитывании стратегии при помощи компьютера всё ещё возможно выиграть у человека после большого числа игр.

Моя девятилетняя дочь показала мне программу, созданную ей при помощи Scratch, которая выигрывала абсолютно каждый раз просто отслеживая, какой выбор сделали вы, перед тем, как сделать свой! Но я познакомлю вас с простым решением, которое выигрывает у человека в камень-ножницы-бумагу без обмана.

Поскольку того, кто всегда совершает абсолютно случайный выбор победить невозможно, мы будем рассчитывать на то, что люди не очень-то и случайны. Если компьютер сможет заметить некий шаблон, по которому вы действуете в своих попытках быть случайным, он станет на шаг ближе к тому, чтобы предсказать ваши будущие действия.

Я думал о создании алгоритма в качестве одной из тем нашего курса статистики в рамках концепции Computer-Based Math. Но первая же статья, на которую я наткнулся в поисках предсказательных алгоритмов, рассматривала решение при помощи сложной конструкции на основе копула-распределений. Это решение было трудным для понимания школьника (а возможно, и для меня), поэтому я решил разработать более простое решение, которое я мог бы объяснить простыми словами. И пусть даже оно уже и было разработано ранее, намного веселее создавать вещи по-своему, чем находить их готовую реализацию.

Для начала нам необходимо просто иметь возможность начать игру. На тот момент уже была разработана и доступна демонстрация, позволяющая играть в камень-ножницы-бумагу, но это было не совсем то, что мне нужно, поэтому я написал свою версию. Этот пункт не требует особых пояснений:

По большей части этот код описывает пользовательский интерфейс и правила игры. Вся стратегия компьютерного игрока содержится в этой функции:

где 1 соответствует камню, 2 — бумаге и 3 — ножницам. Это оптимальное решение. Как бы вы ни играли, вы выиграете столько же игр, сколько и компьютер, и ваш показатель побед будет колебаться в районе нуля.

Итак, теперь было бы интересно переписать функцию chooseGo чтобы осуществлять предсказание касаемо вашего выбора, используя данные о последних играх, хранящиеся в переменной history. Первым шагом будет анализ совершённых в течение последних нескольких игр выборов и поиск всех случаев вхождения какой-либо последовательности. Наблюдая за тем, что человек делал в каждой следующей игре, мы можем обнаружить некий шаблон поведения.

Первый аргумент функции представляет собой историю прошлых игр. Например, в наборе данных, представленных ниже, компьютер (вторая колонка — второй элемент каждого подсписка) только что сыграл бумагу (ей соответствует число 2) против камня, сыгранного человеком (число 1). Это видно по последнему элементу списка. Также видно, что такая ситуация уже возникала дважды, и оба раза следующим ходом человека был снова камень.

Второй аргумент это количество последних элементов истории, по которым и будет вестись поиск. В данном случае в качестве аргумента функции передано число 1, что осуществляет поиск в данных только случаев вхождения <1,2>. Если мы выберем 2, то функция будет искать вхождения последовательности <3,2>, <1,2>и вернёт пустой список, поскольку такая последовательность ранее не встречалась.

Третий аргумент, All, указывает на то, что в искомых последовательностях должны совпадать и ходы человека, и ходы компьютера. Аргумент можно изменить на 1, чтобы смотреть только на историю ходов человека (то есть предполагая, что человеческий выбор зависит только от его же предыдущих ходов), или 2, чтобы обращать внимания только на второй столбец, то есть на историю ходов компьютера (то есть предполагая, что человек отвечает на предыдущие ходы компьютера независимо от того, какие сам совершал ходы и, следовательно, независимо от того, выиграл он или проиграл).

Например, в данном случае мы находим, что человек выбирал после камня, вне зависимости от того, что в тех же играх выбирал компьютер.

Имея большое количество данных, мы можем обойтись только аргументом All, и программа сможет сама решить, чьи ходы, компьютера или человека, более важны. Например, если история ходов компьютера игнорируется человеком в ходе осуществления выбора, тогда набор данных, полученый для какой-либо истории ходов компьютера будет иметь то же распределение, что и для любой другой истории ходов компьютера, при условии, что данных о предыдущих играх достаточно. Осуществляя поиск по всем парам игр, получим тот же результат, как и если бы мы сначала выбирали данные по истории ходов компьютера, а потом использовали это подмножество для показанной выше функции. То же произойдёт в случае, если имеет значение только история ходов компьютера. Но при этом, производя поиск при учёте обоих этих предположений по отдельности можно получить более верные совпадения в истории, и больше всего это проявляется в случаях, когда набор данных об играх поначалу мал.

Таким образом из этих двух проверок мы можем обнаружить, что первый даёт оценку в 100%, что следующим выбором человека будет камень, а второй показывает, что с 75% вероятностью человек выберет камень и с 25% вероятностью — ножницы.

И здесь я несколько застопорился в решении задачи.

В данном случае два предсказания по крайне мере более менее близки по результату, хотя и расходятся в численных значениях вероятностей. Но если вы проводите поиск по трём «срезам» данных c рядом различных длин истории, и результаты предсказаний противоречивы — как их объединить?

Я поместил заметку об этой проблеме в папку «Написать про это в блог» и забыл о ней до тех пор, пока несколько недель назад не произошёл спор о том, как осветить концепцию «статистической значимости» в курсе Computer-Based Math.

Я понял, что вопрос состоит не в том, как скомбинировать полученные предсказания, а в том, как определить, какое из предсказаний наиболее значимое. Одно из предсказаний могло бы быть более значимым, чем остальные, поскольку оно отражает более выраженную тенденцию или, может быть, основано на большем наборе данных. Это было неважно для меня, и поэтому я просто использовал p-значение теста на значимость (с нулевой гипотезой о том, что оба игрока играют случайно), чтобы упорядочить полученные предсказания.

Думаю, мне следовало бы прислушаться к нашему же первому принципу о том, что первым шагом в решении любой математической проблемы является “верная постановка вопроса”.

Теперь, если мы возьмём последний полученный нами результат, обнаруживается, что лучшее предсказание — камень, имеющее p-значение 0.17. Это значит, что лишь с вероятностью 0.17, данные, используемые для данного предсказания, отклоняются от дискретного равномерного распределения (DiscreteUniformDistribution[<1,3>]), причём скорее случайно, чем из-за систематической ошибки, производимой человеческом или по какой-либо другой причине, которая могла изменить распределение.

Чем меньше это p-значение, тем более уверенными мы можем быть в том, что нашли настоящий шаблон поведения. Так что мы просто осуществляем предсказания для различных длин истории и срезов данных и выбираем предсказание с наименьшим p-значением.

И делаем такой выбор, который побьёт выбор человека.

Здесь вы видите результат. Вы можете скачать и самостоятельно опробовать его с сайта Wolfram Demonstrations.

Когда программа имеет слишком мало данных, она играет случайно, так что начинаете вы на равных. Поначалу, когда она только начинает обучаться, она принимает несколько глупые решения, поэтому вы можете вырваться вперёд. Но после 30-40 игр она начинает получать действительно значимые предсказания, и вы увидите, как ваш показатель побед опустится в отрицательную область и так там и останется.

Конечно, такое решение хорошо только против примитивных попыток казаться случайным. Его предсказуемость делает его подверженным возможному проигрышу против хорошо просчитанной и намеченной стратегии. Крайне интересно попробовать победить эту программу при помощи интуиции. Это возможно, но если вы перестанете думать либо будете думать слишком усердно, вы скоро отстанете. Конечно, программа могла бы с лёгкостью это сделать, применяя тот же алгоритм с целью предсказать следующий ход этой программы.

Такой подход ведёт к началу некой «гонки вооружений», соревнований по написанию алгоритмов, которые будут выигрывать в камень-ножницы-бумагу у алгоритма соперника, и единственный способ прекратить это — вернуться к стратегии равновесия Нэша, осуществляя выбор через RandomInteger[<1,3>].

Дополнение 1
В том случае, если вы не знаете, как играть в эту игру, правила таковы: вы выбираете камень, ножницы или бумагу, используя один из трёх жестов, показанных одновременно вами и вашим соперником. Камень побеждает ножницы (делает их тупыми), ножницы побеждают бумагу (они её режут), а бумага побеждает камень (она его заворачивает). Победивший получает одно очко, в случае ничьей оба игрока не получают очков.

Благодарю Сергея Шевчука за помощь, оказанную в переводе данного поста.

Все секреты победы в игре «Камень, ножницы, бумага»

Два игрока. Три фигуры. Три попытки. Только один конечный результат. Камень бьет ножницы, которые бьют бумагу, которая бьет камень. Ни один из предметов не является доминантным над всеми другими. Каждая игра заканчивается явным победителем и проигравшим, а в случае страшной ничьей — мгновенным реваншем. Чтобы определить победителя из двух участников игры, нужно в среднем 1,5 попытки, для определения победителя из трех игроков нужно в среднем 2,25 попытки. По теории вероятностей в классическом варианте вероятность победы, проигрыша и переигровки — одинаковая: 1/3=0,333. Это идеальный интернациональный способ жеребьевки. В «камень, ножницы, бумага» нет места предвзятости, мухлежу или несправедливости. Все просто.

С другой стороны, если все было так просто, то не существовало бы глобальных научных исследований и соревнований по этой «простой» игре. Да, вы все правильно поняли: есть всемирный чемпионат по игре в «камень, ножницы, бумага» и организация the World Rock Paper Scissors Association («Всемирная ассоциация «камень, ножницы, бумага»»). Несмотря на то, что исход идеальной игры случаен, при наличии определенных навыков игры с реальными противниками ее исход можно предугадать, так как многие люди сознательно не действуют случайным образом или даже не способны на такое. Но вам же это вся эта общеобразовательная информация неинтересна, вам рецепт успеха подавай, верно? Тут все действительно просто.

Есть несколько стратегий. Начнем с научной. В 2015 году трое китайских исследователей Чжицзянь Ван, Бин Сюй и Хай-джун Чжоу провели масштабный эксперимент. Они наблюдали за 360 студентами, разделенными на 60 команд по шесть человек, каждая из которых должна была сыграть 300 раундов в «камень, ножницы, бумага». На все про все ушло более двух часов. И вот выводы, к которым пришли ученые:

  • Люди, которые победили, как правило, снова выбирают тот же предмет
  • Проигравшие практически всегда меняют предмет

То есть, давайте представим, что вы показали ножницы, а ваш соперник выиграл камнем. Во второй раз он наверняка снова выберет камень, значит вам надо выбрать бумагу. Итак, первое правило:

Если вы победили, соперник ожидает в следующем раунде от вас тот же предмет, которым вы только что его победили. Другими словами, если вы показали камень, который победил ножницы, то соперник ждет от вас опять камень и готовится показать бумагу. Значит, вам надо показать ножницы. Следовательно, второе правило:

Профессиональные игроки в «камень, ножницы, бумага» говорят, что хоть и есть только 27 возможных комбинаций в трех раундах, восемь из них — «Великие восемь гамбитов» — являются наиболее широко используемыми и имеют полуофициальные названия.

  • «Лавина» — камень, камень, камень
  • «Клерк» — бумага, бумага, бумага
  • «Ящик с инструментами» — ножницы, ножницы, ножницы
  • «Крещендо» — бумага, ножницы, камень
  • «Развязка» — камень, ножницы, бумага
  • «Пачка денег» — камень, бумага, бумага
  • «Бумажная кукла» — ножницы, бумага, бумага
  • «Сэндвич» — бумага, ножницы, бумага

В дополнение к этим комбинациям, обсуждая выигрышные стратегии, профессиональные игроки в один голос говорят о способности предсказать следующий ход противника через положение и движение его играющей руки. В 2012 году японцы построили робота по имени Janken (так по-японски называется эта игра). Он побеждал человека в «камень, ножницы, бумага» со стопроцентным результатом не с помощью определенной стратегии, а за счет анализа движений с помощью высокоскоростной камеры. Для распознавания ему было достаточно 20 миллисекунд. Спустя год ученые из лаборатории Исикавы Оку изобрели вторую версию машины, который распознавал движения всего лишь за миллисекунду.

Вдобавок ко всему, профессиональные игроки в «камень, ножницы, бумага» обратили внимание, что новички чаще других фигур показывают камень. Стало быть, если ваши друзья, с которыми вы засиделись в баре, не суперпрофи в «камень, ножницы, бумага», то вы знаете как минимум три способа, как не стать крайним и не платить за всех по счету, или как гарантированно получить последний кусок пиццы. Не благодарите.

Ссылка на основную публикацию
Статьи c упоминанием слов:
Adblock
detector