Google lanza Gemini 3 con razonamiento SOTA y respuestas generativas de UI


Google anunció hoy Gemini 3 con el objetivo de dar vida a «cualquier idea”. El primer modelo disponible en esta familia es el Gemini 3 Pro, que comienza a implementarse hoy para la aplicación Gemini y el modo AI.

Con Gemini 1.0, Google se centró en la multimodalidad nativa y las ventanas emergentes largas. Un año después, Gemini 2.0 trajo el razonamiento avanzado y el comienzo de las capacidades de agente, mientras que Gemini 2.5 introdujo capacidades de codificación y razonamiento en profundidad.

Gemini 3, que elimina el «.0», es el «modelo más inteligente» de Google y está posicionado para ayudarle a «dar vida a cualquier idea».

Esto comienza con una mejor comprensión del contexto y la intención de su solicitud, de modo que «obtenga lo que necesita con menos indicaciones». Gemini 3 está a la vanguardia de la tecnología de razonamiento con la capacidad de «captar la profundidad y los matices», como «percibir las señales sutiles de una idea creativa o eliminar las capas superpuestas de un problema difícil».

Publicidad: desplácese para ver más contenido

Las respuestas de Gemini 3 Pro pretenden ser «inteligentes, concisas y directas, intercambiando clichés y halagos por información real».

Actúa como un verdadero compañero de pensamiento que le brinda nuevas formas de comprender la información y expresarse, desde traducir conceptos científicos densos hasta generar código para visualizaciones de alta fidelidad y una lluvia de ideas creativa.

Puntos de referencia

Gemini 3 Pro tiene una puntuación de 1501 en LMArena y supera al 2.5 Pro (1451), que aún ocupaba la primera posición. Supera con creces al modelo al que reemplaza en todos los puntos de referencia principales:


  • …demuestra razonamiento a nivel de doctorado con puntuaciones máximas en El último examen de la humanidad (37,5% sin uso de herramientas) y Diamante GPQA (91,9%).
  • …establece un nuevo estándar para los modelos de frontera en matemáticas, logrando un nuevo estado del arte del 23,4% en Mathan MeAx.
  • Más allá del texto, Gemini 3 Pro redefine el razonamiento multimodal con puntuaciones innovadoras del 81% en MMMU-Pro y 87,6% en Vídeo-MMMU.
  • …obtiene una puntuación máxima del 72,1% en SimpleQA verificadomostrando un gran progreso en la precisión fáctica.
  • …en la cima del Clasificación de WebDev Arena anotando un impresionante ELO de 1487.
  • …obtiene el 54,2% sobre Banco de terminales 2.0que prueba la capacidad de un modelo para usar una herramienta para operar una computadora a través de una terminal
  • …supera con creces al 2.5 Pro en Banco SWE verificado (76,2%), referente que mide los agentes codificadores.

Esto significa que Gemini 3 Pro es altamente capaz de resolver problemas complejos en una amplia gama de materias como ciencias y matemáticas con un alto grado de confiabilidad.

Google también anunció hoy el modo Deep Think de Gemini 3 con un razonamiento y comprensión multimodal aún mejores. Supera a Gemini 3 Pro en Mankind’s Last Review (41,0% sin utilizar herramientas) y GPQA Diamond (93,8%). Estará disponible en las próximas semanas para los suscriptores de AI Ultra.

También logró una puntuación sin precedentes del 45,1 % en ARC-AGI (con ejecución de código), lo que demuestra su capacidad para resolver nuevos desafíos.

Interfaz de usuario generativa

Gemini 3 permite una interfaz de usuario generativa (o interfaces generativas) en las que los LLM generan contenido y experiencias de usuario completas. Esto incluye páginas web, juegos, herramientas y aplicaciones que están «diseñadas automáticamente y totalmente personalizadas en respuesta a cualquier pregunta, instrucción o sugerencia».

Este trabajo representa un primer paso hacia experiencias de usuario totalmente generadas por Al, donde los usuarios obtienen automáticamente interfaces dinámicas adaptadas a sus necesidades, en lugar de tener que seleccionar de un catálogo de aplicaciones existente.

Detrás de escena, Gemini 3 Pro aprovecha el acceso a herramientas como búsqueda web y generación de imágenes, así como «instrucciones del sistema cuidadosamente diseñadas».

El sistema se guía por instrucciones detalladas que incluyen propósito, planificación, ejemplos y especificaciones técnicas, incluido formato, manuales de herramientas y consejos para evitar errores comunes.

Finalmente, el resultado se envía a través de postprocesadores que resuelven «potenciales problemas comunes”.

Esto se lanza hoy en la aplicación Gemini como experimentos. La vista dinámica permite a Gemini 3 diseñar y codificar una «respuesta interactiva totalmente personalizada para cada mensaje».

Personaliza la experiencia al saber que explicar el microbioma a un niño de 5 años requiere un contenido y un conjunto de funciones diferentes que explicárselo a un adulto, del mismo modo que crear una galería de publicaciones en las redes sociales para una empresa requiere una interfaz completamente diferente para generar un plan para un próximo viaje.

El diseño visual es la segunda experiencia y crea una «vista inmersiva estilo revista con fotografías y módulos». La principal diferencia con la Vista dinámica es cómo Gemini generará controles deslizantes, casillas de verificación y otros filtros que le permitirán personalizar aún más los resultados.

Inicialmente, es posible que solo veas una de estas experiencias a la vez para permitir que Google recopile comentarios.

Para obtener más información sobre lo que Gemini 3 aporta a la aplicación Gemini (incluido Gemini Agent), lea nuestra historia aquí.

Mientras tanto, esta es la primera vez que llega un nuevo modelo a la Búsqueda de Google y al Modo AI junto con la aplicación Gemini. A partir de esta semana, los suscriptores de AI Pro y AI Ultra pueden ir al menú desplegable en la esquina superior izquierda y seleccionar «Pensamiento: 3 razonamiento profesional y diseños generativos».

Con Gemini 3, la técnica de distribución de consultas de Google puede realizar búsquedas adicionales que antes y formular preguntas más matizadas para mejorar la respuesta final que obtiene.

AI Mode también creará interfaces de usuario generativas para simulaciones y herramientas interactivas creativas. Por ejemplo, Google puede crear una calculadora de hipotecas que le permita cambiar las tasas de interés y el pago inicial. Otra es obtener una simulación de física cuando estudias temas.

Gemini 3 estará disponible para todos los usuarios (gratuitos) del modo AI en los Estados Unidos, y los suscriptores se beneficiarán de límites más altos.

De cara al futuro, Google actualizará la selección automática de plantillas de búsqueda en las próximas semanas para que los suscriptores envíen preguntas difíciles a Gemini 3 «sin dejar de utilizar plantillas más rápidas para tareas sencillas».

Antigravedad de Google

Con Gemini 3, se anunció Google Antigravity como una nueva plataforma de desarrollo de agentes que permite a los desarrolladores «operar a un nivel superior, orientado a tareas». Este IDE permite a los agentes trabajar en el editor, terminal y navegador. Disponible ahora en Mac, Windows y Linux, utiliza Gemini 3, Gemini 2.5 Computer Use y Nano Banana.

Ahora los agentes pueden planificar y ejecutar de forma autónoma y de extremo a extremo tareas de software complejas simultáneamente en su nombre mientras validan su propio código.

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.



Fuente