Человек доказал свое превосходство над компьютером в безлимитном покере

Человек доказал свое достоинство над компьютером в безлимитном покере
Двухнедельный турнир по покеру среди лучшей компьютерной программой и четырьмя профессионалами (из первой десятки рейтинга лучших игроков мира) закончился победой человека. Разработанная в Университете Карнеги-Меллон программа Claudico проиграла в безлимитный техасский холдем около 732 тысяч долларов. о научно значимых результатах турнира сообщается в пресс-релизе университета.
Человек доказал свое главенство над компьютером в безлимитном покере
Двухнедельный турнир по покеру посреди лучшей компьютерной программой и четырьмя профессионалами (из первой десятки рейтинга лучших игроков мира) закончился победой человека. Разработанная в Университете Карнеги-Меллон программа Claudico проиграла в безлимитный техасский холдем около 732 тысяч долларов. о научно значимых результатах турнира сообщается в пресс-релизе университета.

Соревнование проходило в питтсбургском казино Rivers. человеки и компьютер соревновались ежедневный с 11 утра до 10 вечера. только прошло около 80 тысяч раздач. Три игрока закончили турнир с выигрышем 529, 213 и 70 тысяч долларов, а 1 — с проигрышем 80 тысяч.

Однако при всей величине выигрыша главенство людей на самом деле оказалось очень шатким: 732 тысячи долларов при общем объеме ставок в 170 миллионов. Таким образом, истинным итогом оказалась статистическая ничья (сумма выигрыша не дотянула до статистически значимой).

«Наша мишень — это не победить человека. Мы стремимся создать неестественный интеллект, какой поможет людям пить решения в ситуациях с множеством неизвестных фактов — в лечении болезней, в деловых переговорах, при покупке машины», — отметил первенствующий разработчик Claudico Туомас Сандхольм (Tuomas Sandholm).

Стратегия системы опирается на ее собственные алгоритмы, а не на ходы и тактику известных игр с участием человека. Claudico уже сыграл самостоятельно с собой не мало триллионов партий. Запускаются эти алгоритмы на суперкомпьютере Blacklight, причем единственной информацией на вводе являются правила зрелище в покер. К концу зрелище файлы со стратегией Claudico заняли около двух терабайт — много больше, чем способны учить исследователи.

Сильной стороной системы оказалась дарование борзо и случайным образом переключаться посреди различными стратегиями, слабой — медленная настройка на манеру зрелище индивидуального противника.

«Это хороший, Но не лучший игрок. Некоторые его ставки ставили меня в тупик. навряд ли какой муж поставит 19 тысяч, что бы сорвать банк 700 долларов. Зато Claudico сроду не теряет хладнокровия — даже громадный проигрыш не влияет на его дальнейшую игру», — поделился своими впечатлениями 1 из участников турнира Дуг Полк (Doug Polk).

Покер является важнейшим испытанием для искусственного интеллекта, да как это потеха с неполной информацией, где участники обладают скрытым от остальных знанием о своих картах, а да могут извлекать эту информацию в свою пользу (например, блефовать). если в играх с полной информацией (например, шахматах, где пара игрока видят размещение всех фигур на доске) неестественный интеллект либо обыгрывает человека, либо как минимум добивается паритета с ним, то над покером программисты втуне бьются с 2006 возраст (когда прошел пионер ежегодный чемпионат по этой игре между компьютеров).

В январе 2015 возраст канадским ученым удалось извещать компьютерную программу, способную на слабое приговор техасского холдема с лимитированными ставками. Иными словами, компьютер смог создать стратегию игры, настолько близкую к оптимальной, что никакой особа не способен обыграть его (со статистическим уровнем значимости) зa всю свою жизнь.