Build / Buy / API: el arbitraje que nadie plantea correctamente

La pregunta equivocada es “qué IA elegir”. La correcta es “quién controla la inferencia”. Tres familias de arbitrajes que no tienen los mismos protagonistas al final, los mismos compromisos contractuales y la misma exposición reglamentaria de dieciocho meses.

La API propietaria de un jugador americano

Se llama a una API. Pagas por token. No tienes que preocuparte por la infraestructura, el mantenimiento del modelo ni las actualizaciones.

Lo que esto significa en la práctica es que externalizas la capa de inteligencia de tus procesos a un actor estadounidense. Usted no tiene control sobre los cambios de modelo, los cambios de precio, la disponibilidad o las políticas de uso. Tienes un SLA contractual, pero si OpenAI cambia su política de formación de datos o sus precios, tú te adaptas o cambias.

Cuando proceda: creación rápida de prototipos, uso no crítico, datos no sensibles, ausencia de restricciones normativas sobre la ubicación. Presupuesto Opex preferible a capex.

El riesgo subestimado: la dependencia de los proveedores. Migrar de un modelo a otro es factible, pero cuesta dinero. La pronta ingeniería desarrollada para GPT-4 no puede transferirse de forma idéntica a Claude o Llama. Existe una auténtica deuda de migración.

Una solución vertical adquirida a un editor externo

Usted compra una solución a un editor que ha creado una aplicación de IA para su sector: CRM con IA integrada, herramienta de generación jurídica, asistente de atención al cliente.

En la práctica, casi siempre se trata de una envoltura de API (GPT, Claude u otra) con una capa de aplicación. El valor añadido reside en la interfaz, el aviso del sistema y, posiblemente, el ajuste de los datos específicos del sector.

Cuando es apropiado: no hay recursos técnicos internos, la solución cubre con precisión su caso de uso y la dependencia del proveedor es aceptable.

Lo que la gente se olvida de mirar: tiene una doble dependencia. Del editor de la solución. Y del modelo subyacente. Si el editor desaparece, cambia su modelo o cambia sus precios, tu capacidad de migración está limitada por la realidad de los contratos que has firmado.

El modelo de pesos abiertos en su propia infra

Usted despliega un modelo de ponderaciones abiertas (Llama 3, Mistral, Mixtral, Qwen, etc.) en su infraestructura. Usted controla la inferencia, los datos y las versiones.

Qué se necesita: inversión en infraestructura (GPU/APU) o costes de nube de GPU, además de conocimientos internos de MLOps. El rendimiento es inferior al de los modelos de frontera patentados en tareas genéricas, pero suele ser comparable en tareas especializadas una vez ajustadas.

En su caso: datos sensibles, restricciones reglamentarias (RGPD, secreto industrial, secreto de defensa), grandes volúmenes de inferencia que rentabilizan las inversiones, deseo de control a largo plazo.

Coste: la compra de un servidor con 2 GPU H100 para inferir un modelo de 70.000 millones de parámetros cuesta entre 50 y 70.000 euros. La amortización en 3 años puede ser inferior a los costes equivalentes de API si el volumen es suficiente.

La variable que falta: soberanía

La mayoría de las comparaciones entre construcción/compra/api se detienen en los costes. Olvidan la cuestión de la soberanía.

Si su diferenciación competitiva se basa en sus datos patentados, enviar estos datos a una API de terceros para su puesta a punto (incluso con una garantía contractual de no reutilización) crea un riesgo que debe evaluar conscientemente. La dependencia crítica de una API estadounidense también crea exposición a decisiones reguladoras (controles de exportación, restricciones sectoriales), averías y cambios políticos. Este riesgo es bajo en probabilidad, pero potencialmente alto en impacto.

El RGPD, las obligaciones de la Ley de Inteligencia Artificial y las normativas sectoriales (sanidad, finanzas) pueden imponer limitaciones a la localización y el tratamiento de datos que hagan que determinadas arquitecturas de API no sean conformes.

El arbitraje correcto

La compensación adecuada no es una respuesta, es una cuadrícula. Sensibilidad de los datos, volumen de inferencia, recursos internos, tolerancia a la dependencia, exposición reglamentaria a 36 meses. No hay dos empresas que se apunten a las cinco dimensiones de la misma manera. Una cosa es constante: optar por la API más conocida porque es de la que habla tu proveedor, sin haber examinado la opción de pesos abiertos en tu propia infraestructura, significa que no has tomado la decisión. Has dejado que otro la tome por ti.

La API propietaria de un jugador americano#

Una solución vertical adquirida a un editor externo#

El modelo de pesos abiertos en su propia infra#

La variable que falta: soberanía#

El arbitraje correcto#

En el mismo eje

El verdadero coste de un proyecto de IA: lo que el presupuesto no muestra

La API propietaria de un jugador americano

Una solución vertical adquirida a un editor externo

El modelo de pesos abiertos en su propia infra

La variable que falta: soberanía

El arbitraje correcto