Dentro del auge de la IA con el director ejecutivo de Fireworks AI, Lin Qiao

 | AI,Tech,fireworks,meta,pytorch,ai-inference,artificial-intelligence,cloud-computing,cloud,ceos,ceo-interview,exclusive,startups,generative-ai,ai,data-centers

📂 Categoría: AI,Tech,fireworks,meta,pytorch,ai-inference,artificial-intelligence,cloud-computing,cloud,ceos,ceo-interview,exclusive,startups,generative-ai,ai,data-centers | 📅 Fecha: 1775512971

🔍 En este artículo:

El auge de la IA no se está desacelerando; se está acelerando.

Lin Qiao, una ex ingeniera de Meta que ayudó a fundar PyTorch, ahora dirige Fireworks AI, una startup de 4 mil millones de dólares que procesa 15 billones de tokens de IA por día, y dice que la demanda apenas está comenzando.

«Este es el año en el que el consumo de tokens crecerá exponencialmente», me dijo Qiao en una entrevista reciente.

La plataforma de inferencia en la nube de Fireworks AI ahora procesa alrededor de 15 billones de tokens de IA por día, en comparación con los 13 billones de hace apenas unos meses y los 10 billones a fines de 2025. (Los modelos descomponen las palabras y otras entradas en tokens numéricos para hacerlos más fáciles de procesar y comprender. Un token equivale aproximadamente a ¾ de una palabra. También se utilizan para fijar el precio del uso del modelo de IA, a través de un costo estándar de la industria por millón de tokens.

Qiao ha estado aquí antes. Mucho antes del actual auge de la IA generativa, trabajó en Meta para ayudar a crear PyTorch, el marco de código abierto que impulsó la primera ola de adopción de la IA moderna. En ese momento, no había GPU optimizadas para IA, ni herramientas maduras ni una hoja de ruta clara.

«Tuvimos que construir todo desde cero», dijo Qiao.

La escala de este crecimiento, dijo Qiao, refleja la rapidez con la que la IA se está integrando en los flujos de trabajo cotidianos en todas las industrias.

El uso de tokens no se limita a los equipos técnicos. Qiao describió los servicios financieros que utilizan IA para automatizar los pronósticos, su propio equipo legal creando herramientas internas de IA e incluso trabajadores que crean música bajo demanda con modelos generativos de IA. Su hija en edad universitaria utiliza múltiples sistemas de inteligencia artificial simultáneamente: uno para generar respuestas y otros para verificarlas.

«Este es el mundo en el que vivimos», dijo Qiao. «Literalmente todo el mundo utiliza estas herramientas».

Este impulso se extiende a toda la pila tecnológica. El suministro de GPU es limitado, los precios están subiendo e incluso la infraestructura eléctrica está bajo presión a medida que las empresas se apresuran a implementar más capacidades de IA.

«Todo el sistema está saturado», dijo Qiao, describiendo cuellos de botella que se extienden desde componentes semiconductores hasta redes de energía.

Su credibilidad sobre estas tendencias proviene de su papel en la creación de PyTorch, que ayudó a democratizar el desarrollo de la IA en empresas que van desde Tesla hasta Walmart. Esta exposición temprana le mostró lo rápido que la IA podría extenderse más allá de Silicon Valley a sectores como la agricultura y la manufactura.

Ahora ve desplegarse una ola similar, pero mucho más rápida.

¿Por qué existe?

Sin embargo, una pregunta central se cierne sobre empresas como Fireworks AI: ¿por qué existen? Si los hiperescaladores Amazon, Google, Microsoft y Oracle ya están alquilando GPU, ¿por qué no recurrir directamente a ellos?

La respuesta de Qiao es complejidad y velocidad. Las empresas, dijo, están luchando por mantenerse al día con los modelos y el hardware que cambian rápidamente, desde nuevos chips Nvidia que llegan cada pocos meses hasta nuevos modelos de IA cada pocas semanas. Fireworks aborda este problema optimizando el rendimiento, administrando la infraestructura y ayudando a los clientes a migrar rápidamente para que no tengan que hacerlo.

Para Qiao, la lección de PyTorch y Fireworks es consistente: una vez que la IA se vuelve utilizable, su adopción se acelera dramáticamente. Y según los volúmenes actuales de tokens, esta aceleración apenas está comenzando.

Suscríbase al boletín Tech Memo de BI aquí. Contáctame por correo electrónico a abarr@businessinsider.com.