Inferencia vs entrenamiento: los dos motores del gasto en IAInference vs training: the two engines of AI spending
Qué esWhat it is
El entrenamiento consume miles de GPU durante semanas para crear el modelo: un gasto enorme pero puntual. La inferencia es cada respuesta que da el modelo a un usuario: individualmente barata, pero multiplicada por miles de millones de peticiones se convierte en el mayor coste continuo.Training consumes thousands of GPUs for weeks to create the model: a huge but one-off cost. Inference is each answer the model gives a user: individually cheap, but multiplied by billions of requests it becomes the largest ongoing cost.
Por qué importa para invertirWhy it matters for investing
Para el inversor, la clave es que la inferencia crea demanda recurrente, no puntual. A medida que la IA se integra en productos que usa todo el mundo, el gasto en chips y energía para inferencia crece de forma estructural, lo que sostiene la tesis a largo plazo de toda la cadena.For the investor, the key is that inference creates recurring demand, not one-off. As AI is embedded in products everyone uses, spending on chips and energy for inference grows structurally, which sustains the long-term thesis of the whole chain.
Quién lo controlaWho controls it
Nvidia domina el entrenamiento; en inferencia hay más competencia (AMD, los ASIC de los hiperescaladores). La inferencia también dispara la demanda de energía y centros de datos.Nvidia dominates training; in inference there is more competition (AMD, the hyperscalers' ASICs). Inference also drives demand for energy and data centers.
Cómo invertir en elloHow to invest in it
Ambos motores benefician a la cadena de semiconductores y a la energía. La inferencia, por ser recurrente, es el argumento más sólido contra la tesis de "burbuja".Both engines benefit the semiconductor chain and energy. Inference, being recurring, is the strongest argument against the "bubble" thesis.
RiesgosRisks
Si la eficiencia mejora mucho (modelos que hacen lo mismo con menos cómputo), el gasto por petición podría bajar más rápido de lo previsto.If efficiency improves a lot (models doing the same with less compute), spending per request could fall faster than expected.
Conceptos y guíasConcepts and guides
Contenido educativo, no asesoramiento. Datos verificados a junio de 2026; cambian, confírmalos antes de invertir. Autor: Tomás Castillo Giménez.Educational content, not advice. Data verified as of June 2026; it changes, confirm before investing. Author: Tomás Castillo Giménez.