O novo ReBel Poker AI do Facebook pontua mais alto que o Pluribus
Apenas um ano depois de desenvolver o Pluribus (que acumulou um total de R$ 1.000 por hora ao competir com profissionais humanos), os pesquisadores do Facebook criaram o ReBel. Este novo Sistema de IA que aprende pôquer de uma maneira nova e mais eficiente, e alcançou uma pontuação agregada mais alta do que a Pluribus.
Como Rebel AI funciona
O ReBel AI é baseado no modelo comum de aprendizado por reforço que permite aprender um jogo rapidamente do zero. O que diferencia esse sistema de outras IAs é que existem dois modelos em jogo, um representando valor e o outro representando valor.
Isso cria algo chamado “estado de crença pública” que permite que a IA crie probabilidades com base em todos os aspectos relevantes em jogo. Isso inclui o pote geral e os vários resultados possíveis da mão. Como o ReBel usa um estado de crença pública em vez do “conhecimento de domínio específico” usado por outros programas de IA, ele tem uma aplicação mais geral.
A coisa mais interessante sobre o ReBel não é que ele provavelmente pode vencer alguns dos melhores jogadores de pôquer do mundo. Na verdade, é que essa IA originalmente desenvolvida para resolver o jogo de pôquer pode têm outras aplicações fora do feltro – no desenvolvimento de carros autônomos e precauções de segurança cibernética. Na verdade, um bot de pôquer foi realmente contratado pelo Pentágono para ajudar no planejamento militar!
Jogando contra profissionais de pôquer
Para testar o sucesso do ReBel AI, o sistema competiu contra Dong Kim, que é amplamente conhecido como um dos melhores jogadores de heads-up na comunidade do pôquer. Três outros jogadores de topo jogaram contra ReBel, e os resultados foram muito interessantes ao longo de 7500 mãos.
ReBel conseguiu jogar em um ritmo muito mais rápido que os jogadores humanos, levando menos de cinco segundos para tomar suas decisões. Ao longo dos testes, a IA atingiu uma pontuação agregada de 165, enquanto a pontuação de Kim foi de 136 . Para referência, o primeiro bot de pôquer do Facebook, Pluribus, obteve 147 pontos.
Deve Jogadores estão preocupados?
O Facebook declarou que não lançará a base de código Rebel. Portanto, os jogadores de pôquer online podem ter certeza de que nunca encontrarão esse bot de IA que quebra o jogo no mundo real.
No entanto, isso nos leva à questão dos bots de pôquer mais comuns que podem ser encontrados no mundo dos jogos online. Muitos jogadores se perguntam se os hackers serão capazes de recriar o tipo de IA de alto nível no tipo de bots que abrem caminho para os jogos de pôquer online.
Para desenvolver AI como Pluribus e ReBel, uma extensa pesquisa deve ser feita. Na verdade, o Pluribus foi criado em conjunto com pesquisadores da Carnegie Mellon University. Esses pesquisadores acadêmicos tornaram o trabalho de suas vidas desenvolver esse tipo de software, enquanto os pesquisadores do Facebook provavelmente recebem um bom dinheiro para fazer o mesmo. É muito improvável que as mesmas pessoas que desenvolvem bots de pôquer online em seus porões tenham o mesmo tempo e dinheiro para investir nesse tipo de projeto.
Há também o fato de que muitos sites de pôquer online têm equipes inteiras comprometidas em identificar bots. Portanto, mesmo que AIs de pôquer muito sofisticadas sejam lançadas, existem processos em vigor na maioria das salas de pôquer para desligá-las imediatamente.