Google lanza Gemini 3.1 Pro con mejora significativa en razonamiento
Nuevo modelo duplica el puntaje anterior en ARC-AGI-2 y se implementa en la app Gemini, NotebookLM, Vertex AI y herramientas para desarrolladores.
Conclusiones Clave
- Gemini 3.1 Pro logra un 77.1% en el benchmark de razonamiento ARC-AGI-2, superando a modelos anteriores en más del doble.
- El modelo soporta una ventana de contexto de un millón de tokens, permitiendo el procesamiento de extensos conjuntos de datos y entradas multimodales.
Compartir este artículo
Google ha lanzado Gemini 3.1 Pro, una versión mejorada de su modelo estrella diseñado para mejorar significativamente el razonamiento básico y la resolución de problemas complejos en productos para consumidores, empresas y desarrolladores.
La compañía afirmó que Gemini 3.1 Pro más que duplica la puntuación del benchmark ARC-AGI-2 de Gemini 3 Pro, logrando un 77.1% verificado en la prueba que mide la capacidad de un modelo para resolver patrones lógicos completamente nuevos. La mejora posiciona al modelo para flujos de trabajo que requieren razonamiento de múltiples pasos en lugar de respuestas simples.
Gemini 3.1 Pro se está implementando en vista previa para desarrolladores a través de la API de Gemini en Google AI Studio, Gemini CLI, Google Antigravity y Android Studio. Los usuarios empresariales pueden acceder a través de Vertex AI y Gemini Enterprise, mientras que los consumidores lo verán en la aplicación Gemini y en NotebookLM para suscriptores de Google AI Pro y Ultra.
Google dijo que la actualización se basa en la actualización de la semana pasada Gemini 3 Deep Think, que se enfocó en casos de uso científicos, de investigación e ingenieriles. La compañía planea usar la fase de vista previa para refinar flujos de trabajo agentic ambiciosos antes de su disponibilidad general más amplia.
La serie Gemini de Google, que evolucionó a partir de Bard en 2023, ha desarrollado rápidamente desde su lanzamiento inicial con capacidades básicas hasta lanzar Gemini 3.1 Pro como el modelo más avanzado hasta la fecha. Esta iteración enfatiza el razonamiento multimodal y la eficiencia, presumiendo de ventanas de contexto mejoradas y benchmarks sofisticados, lo que indica el compromiso de Google de mejorar las experiencias de consumidores y desarrolladores en IA, mientras prioriza las características de seguridad en mercados competitivos.
