A Anthropic utilizou o clássico jogo de Game Boy Pokémon Red para testar seu mais recente modelo de IA, o Claude 3.7 Sonnet. Ao contrário de seu antecessor, Claude 3.0 Sonnet, que teve dificuldades para sair da área inicial, o modelo atualizado enfrentou com sucesso três líderes de ginásio, demonstrando um progresso impressionante. Equipado com memória básica, entrada de pixels na tela e chamadas de função, o Claude 3.7 Sonnet aproveitou o "pensamento estendido" para realizar 35.000 ações e atingir marcos significativos. A empresa revelou que, em poucas horas, a IA derrotou Brock e, posteriormente, conquistou Misty, demonstrando sua capacidade avançada de resolução de problemas. Pokémon Red se junta a uma série de jogos agora usados para avaliar o desempenho da IA