Anthropic ha utilizado el clásico juego Pokémon Rojo de Game Boy para probar su último modelo de IA, Claude 3.7 Sonnet. A diferencia de su predecesor, Claude 3.0 Sonnet, que tenía dificultades para salir de la zona de inicio, el modelo actualizado luchó con éxito contra tres líderes de gimnasio, demostrando un progreso impresionante. Equipado con memoria básica, entrada de píxeles en pantalla y llamadas a funciones, Claude 3.7 Sonnet aprovechó el "pensamiento extendido" para realizar 35.000 acciones y lograr hitos significativos. La compañía reveló que, en cuestión de horas, la IA derrotó a Brock y posteriormente conquistó a Misty, demostrando sus avanzadas capacidades de resolución de problemas. Pokémon Rojo se une a una serie de juegos que ahora se utilizan para evaluar el rendimiento de la IA