Google Cloud presenta oficialmente su TPU especial de octava generación para dar la bienvenida a la era de la IA Agentic

Las Vegas (ANTARA) – Google Cloud presentó oficialmente la octava generación de Unidades de procesamiento tensorial (TPU), a saber, TPU 8t y TPU 8i, que están diseñados para acelerar las cargas de trabajo de inteligencia artificial (IA) en la era de agente.

Vicepresidente sénior y jefe tecnologíat, IA e infraestructura, Google Cloud, Amin Vahdat en el evento The Future of AI Infrastructure, Google Cloud Next 26, en Las Vegas, Estados Unidos, el martes, dijo que este año, dos chip especializado lanzado de inmediato, para dar la bienvenida a la era de la IA agente.

«Por primera vez, dos TPU especialmente diseñados, el 8t y el 8i, fueron realmente diseñados desde cero para satisfacer las necesidades actuales. El 8t TPU, por ejemplo capacitación (capacitación). Este es el motor principal. Esta es la escala más grande. TPU 8i, verdaderamente diseñado para inferencia (inferencia)», dijo Vahdat.

Vahdat dijo que a lo largo de los años, TPU ha impulsado los principales modelos básicos, incluido el Gemini. Esta TPU combinada de octava generación ofrecerá escala, eficiencia y capacidad que abarcarán cargas de trabajo de capacitación y cumplimiento de los requisitos. agente.

Lea también: Datalabs.id ganó el premio Google Cloud Partner del año 2026

Google Cloud considera que en la era de los agentes de IA agenteLos modelos deben poder razonar problemas, ejecutar flujos de trabajo de varias etapas y aprender de sus propias acciones en un ciclo continuo. Sin embargo, esto plantea un nuevo conjunto de exigencias a la infraestructura.

Por tanto, 2026 es el momento para que el gigante tecnológico introduzca dos chip Superalta potencia especializada a la vez, que es fruto del desarrollo de los últimos dos años.

Vahdat explicó que el 8t TPU está optimizado para el entrenamiento y es capaz de ejecutar incluso los modelos más complejos en un grupo de memoria integrado gigante.

Mientras tanto, el TPU 8i está diseñado específicamente para permitir que los agentes de IA completen este proceso muy rápidamente para brindar una experiencia de usuario satisfactoria.

Lea también: Los casos de cuotas de Google Cloud y Hajj serán investigados de inmediato

Vahdat enfatizó que estos dos chips fueron diseñados específicamente desde cero para esfuerzos de entrenamiento e inferencia, en lugar de simplemente derivados uno del otro. Especificaciones, capacidades, conectividad, todo está diseñado de manera diferente porque está especializado en necesidades individuales.

«Si necesitas la máxima potencia para entrenar, tienes 8t. Si necesitas una inferencia ultrarrápida, tienes 8i», explica Vahdat.

A través de disponibilidad comercial chip Más recientemente, a finales de año, Google Cloud buscó redefinir los límites de las capacidades de IA para desarrolladores y empresas globales.

Se espera que el uso de esta tecnología, una de las cuales está en el servicio Gemini Enterprise, pueda acelerar los descubrimientos científicos y transformar el sector de la salud a escala internacional.

Reportero: Kuntum Khaira RiswanSubidor: También

DERECHOS DE AUTOR © ANTARA 2026



Fuente