El mercado ha madurado. Si bien las empresas emergentes compraban previamente instancias H100 a granel con años de anticipación "por si acaso", el ciclo de flujo de trabajo ahora está dividido. El entrenamiento de un modelo requiere un consumo pico (ráfaga) colosal, mientras que la inferencia posterior necesita una potencia estable pero menor. El nuevo esquema de facturación unificado de CoreWeave permite a los desarrolladores reasignar dinámicamente cuotas entre clústeres sin penalizaciones. Esto reducirá la barrera de entrada para las empresas emergentes de IA y aumentará la presión sobre las nubes clásicas como AWS y GCP, que son conocidas por su burocracia al asignar GPU.
Fuente: BusinessWire / CoreWeave
NubeCoreWeaveGPUInfraestructuraIaaS