📂 Categoría: AI,Tech,Strategy,coinbase,ai,tokens,tokenmaxxing,large-language-models | 📅 Fecha: 1780982336
🔍 En este artículo:
No todas las indicaciones de IA necesitan Opus 4.8.
A medida que el fervor de tokenmaxxing disminuye, algunos usuarios de IA se preguntan cómo sacar más provecho de su inversión y controlar sus costos mensuales. El director ejecutivo de Coinbase, Brian Armstrong, compartió la estrategia de la empresa de cifrado: no escatimar en modelos más baratos.
«Estamos trabajando arduamente para dirigir las solicitudes a modelos más baratos cuando sea apropiado y, en algunos casos, hemos logrado mantener los costos más o menos estables, mientras que el uso de tokens continúa creciendo exponencialmente», escribió Armstrong. en el domingo.
Si bien los últimos modelos como Opus 4.8 o GPT-5.5 prometen beneficios de vanguardia, también pueden devorar más tokens. (Esto es antes de habilitar el modo Rápido). Cuando Anthropic lanzó Opus 4.7, muchos usuarios se quejaron de que estaban alcanzando rápidamente los límites de rendimiento.
Armstrong escribió que predijo que «el 80% de las cargas de trabajo se ejecutarán en modelos 99% más baratos dentro de 12 a 18 meses».
La única vez que la gente utilizará los últimos modelos, predice Armstrong, es cuando necesiten «maximizar su coeficiente intelectual». Esto incluye avances científicos u orquestación de agentes.
«Esto me lleva a creer que el factor limitante será la energía y la computación, no mejores modelos», escribió Armstrong.
La publicación del CEO de Coinbase llamó la atención de algunas luminarias de la tecnología. Marc Andreessen, capitalista de riesgo lo llamé «interesante.» Julien Chaumond, cofundador de Hugging Face escribió esto «Los modelos de enrutamiento están creciendo mucho estos días».
Aaron Levie, director ejecutivo de Box, escribió que las cifras de Armstrong eran «un poco extremas», pero que el uso de A.I. probablemente estratificar en los años venideros. El trabajo de “alta gama” será realizado por modelos de primer nivel, escribió Levie, mientras que el trabajo de “alto volumen” quedará relegado a modelos más baratos.
«La asignación de inteligencia será extremadamente importante», cofundador de Harvey Winston Weinberg escribió.
La mentalidad de eficiencia es relativamente nueva, o al menos nueva para mostrarla públicamente. No hace mucho, cuando el tokenmaxxing estaba de moda, los líderes tecnológicos hacían alarde de sus billetes de token o adaptaban el uso de los últimos modelos.
Esta mentalidad es particularmente popular en el sector de las startups, donde el director ejecutivo de Y Combinator, Garry Tan, aconseja a los fundadores «dejarlo explotar» con tokens. Lance Yan, fundador de una startup respaldada por YC, dijo a Business Insider en abril que el racionamiento de tokens era «estúpido».
El viento parece estar cambiando. Tony Gentilcore, cofundador de Glean comentó que El mensaje de Armstrong fue «perfecto».
«Todos los técnicos ya saben esto», escribió Gentilcore. “Los mercados financieros son los únicos que extrapolan los precios del Opus hasta el infinito”.








