En Star Trek, la nave Enterprise tenía un ingeniero jefe, Montgomery Scotty Scott, que a menudo tenía que explicar al capitán Kirk que ciertas cosas eran imposibles de llevar a cabo debido a cuestiones prácticas como las leyes de la física.
«¡Los motores no pueden soportarlo, Capitán!» es una famosa frase que el actor puede no haber dicho en la serie de televisión. Pero ya nos hacemos una idea.
Puede que nos estemos acercando a un momento así en la industria tecnológica, a medida que la tendencia de los agentes de inteligencia artificial (IA) cobra impulso.
Se está empezando a pasar de los chatbots relativamente sencillos a agentes de IA más capaces que pueden realizar tareas complejas de forma autónoma. ¿Hay suficiente potencia informática para sostener esta transformación?
Según un reciente informe de Barclays, la industria de la IA tendrá capacidad suficiente para soportar entre 1.500 y 22.000 millones de agentes de IA.
Esto podría bastar para revolucionar el trabajo de los empleados de cuello blanco, pero es posible que se necesite más potencia informática para hacer funcionar estos agentes y, al mismo tiempo, satisfacer la demanda de chatbots por parte de los consumidores, según han explicado los analistas de Barclays en una nota reciente.
Todo depende de los tokens
Los agentes de IA generan muchos más tokens por consulta del usuario que los chatbots tradicionales, lo que los hace más caros desde el punto de vista informático.
Los tokens son el lenguaje de la IA generativa y constituyen el núcleo de los nuevos modelos de tarificación del sector. Los modelos de IA descomponen las palabras y otras entradas en tokens numéricos para facilitar su procesamiento y comprensión. Un token es aproximadamente ¾ de una palabra.
Los agentes de IA más potentes pueden basarse en modelos de razonamiento, como o1 y o3 de OpenAI y R1 de DeepSeek, que dividen las consultas y tareas en trozos más manejables.
Cada paso en estas cadenas de pensamiento crea más tokens, que deben ser procesados por servidores y chips de IA.
«Los productos de agente funcionan en su mayor parte con modelos de razonamiento y generan unas 25 veces más tokens por consulta que los productos de chatbot», escriben los analistas de Barclays.
‘Superagentes’
OpenAI ofrece un servicio ChatGPT Pro que cuesta 200 dólares (176 euros) al mes y aprovecha sus últimos modelos de razonamiento. Los analistas de Barclays calculan que, si este servicio utilizara el modelo o1 de la startup, generaría unos 9,4 millones de tokens al año por suscriptor.
Los medios de comunicación han informado recientemente de que OpenAI podría ofrecer servicios de agentes de IA aún más potentes que costarían 2.000 dólares (1.760 euros) al mes o incluso 20.000 dólares (17.600 euros) al mes.
Los analistas de Barclays se refieren a ellos como superagentes y estiman que estos servicios podrían generar entre 36 y 356 millones de tokens al año por usuario.
¡Más chips, capitán!
Es una cantidad alucinante de tokens que consumirían una montaña de potencia de cálculo.
Se espera que la industria de la IA tenga 16 millones de aceleradores, un tipo de chip de IA, en línea este año. Aproximadamente el 20% de esa infraestructura podría dedicarse a la inferencia de IA, es decir, a la potencia informática necesaria para ejecutar aplicaciones de IA en tiempo real.
Si los productos agénticos despegan y resultan muy útiles a consumidores y empresas, es probable que necesitemos «muchos más chips de inferencia», advierten los analistas de Barclays.
La industria tecnológica podría incluso tener que reutilizar algunos chips que antes se empleaban para entrenar modelos de IA y utilizarlos también para la inferencia, añaden los analistas.
También prevén que los agentes de IA tendrán que utilizar modelos más baratos, pequeños y eficientes, como los desarrollados por DeepSeek, en lugar de modelos patentados más caros.