Glosario de IA

Términos de IA, sin jerga innecesaria.

Algoritmo: Secuencia de instrucciones formales para resolver un problema. Precede a la IA y sigue siendo omnipresente sin ella.; Un algoritmo es una secuencia finita e inequívoca de instrucciones para resolver un problema. La mayoría de los sistemas que utilizas a diario (ordenación, búsqueda, recomendaciones sencillas) se basan en algoritmos deterministas, no en IA en el sentido de aprendizaje automático.; mechanics
Aprendizaje automático: El ordenador aprende a partir de ejemplos, sin reglas codificadas.; El aprendizaje automático es un subcampo de la IA en el que el sistema infiere reglas a partir de los datos, en lugar de seguir instrucciones explícitas. Incluye regresión, clasificación, agrupación, etc.; mechanics
Aprendizaje profundo: Aprendizaje automático con redes neuronales profundas (multicapa).; El aprendizaje profundo utiliza redes neuronales artificiales con varias capas ocultas. Ha dado lugar a avances recientes en el reconocimiento de imágenes, el reconocimiento del habla y la traducción automática.; mechanics
Red neuronal: Arquitectura informática inspirada (muy vagamente) en el cerebro biológico.; Una red neuronal artificial es un grafo de nodos (neuronas) organizados en capas, que transforman una entrada en una salida mediante parámetros (pesos) ajustados durante el entrenamiento. La analogía con el cerebro es útil desde un punto de vista pedagógico, pero engañosa desde un punto de vista sustantivo: no hay conciencia, no hay comprensión.; mechanics
Modelo: Un programa entrenado con datos para producir un resultado. No es inteligencia.; En el contexto de la IA, un modelo es el resultado del entrenamiento con un conjunto de datos. Codifica correlaciones estadísticas. GPT-4, Mistral y Llama son modelos. Producen resultados plausibles, no razonamientos.; mechanics
Formación: Fase durante la cual el modelo aprende de los datos. Lleva mucho tiempo, es costosa y solo se realiza una vez (o pocas veces).; El entrenamiento consiste en ajustar los parámetros (pesos) de una red neuronal para minimizar el error en un conjunto de datos. En el caso de modelos lingüísticos de gran tamaño, esto puede implicar el uso de miles de GPU durante semanas y costar decenas de millones de dólares.; mechanicseconomics
Conjunto de datos: La colección de ejemplos sobre la que se entrena el modelo.; Un conjunto de datos es la materia prima del aprendizaje. Su calidad, tamaño y representatividad determinan directamente la calidad del modelo. La IA sólo aprende lo que hay en los datos.; mechanics
Parámetros: Valores numéricos internos ajustados durante el entrenamiento. A menudo expresados en miles de millones.; Los parámetros (o pesos) son las variables internas de un modelo. Un LLM con 70.000 millones de parámetros almacena 70.000 millones de números en coma flotante. Cuantos más parámetros tenga un modelo, más patrones complejos podrá modelar, pero más memoria y capacidad de cálculo consumirá.; mechanics
Sobreaprendizaje: El modelo ha aprendido demasiado bien los datos de entrenamiento y generaliza incorrectamente.; La sobreadaptación se produce cuando un modelo memoriza los ejemplos de entrenamiento en lugar de extraer reglas generales de ellos. Funciona bien con los datos que ha visto, pero falla con los nuevos. Esto indica que el conjunto de datos es demasiado pequeño o que el modelo es demasiado complejo.; mechanicsrisks
Inferencia: Utilización del modelo entrenado para producir una respuesta. Coste continuo.; La inferencia es la fase operativa: se envía una entrada al modelo y se obtiene una salida. A diferencia de la formación (un coste único), la inferencia se produce con cada solicitud y genera costes variables en función del volumen de uso.; mechanicseconomics
token: Unidad de desglose de texto para un LLM. Aproximadamente 3/4 de una palabra inglesa.; Un token es la unidad de procesamiento de un modelo lingüístico. Los textos se descomponen en tokens antes de ser procesados. Los precios de la API se cobran por token (entrada + salida). 1.000 tokens ≈ 750 palabras en inglés, algo menos en francés.; mechanicseconomics
LLM: Gran modelo lingüístico: GPT-4, Claude, Llama, Mistral... Predice el siguiente token probable.; Un gran modelo lingüístico es una red neuronal entrenada en grandes corpus de texto para predecir el siguiente token. GPT-4, Claude, Llama y Mistral son algunos ejemplos. Se trata de sistemas de compleción estadística, no de inteligencias que comprenden.; mechanics
Inserción: Representación numérica de un texto en un espacio vectorial.; Una incrustación es la conversión de un texto (palabra, frase, documento) en un vector digital. Los textos semánticamente similares tienen vectores similares. Las incrustaciones son la base de los motores de búsqueda semántica y los sistemas RAG.; mechanics
Vectorización: Proceso de conversión de datos en vectores digitales.; La vectorización transforma datos no estructurados (texto, imágenes, sonido) en representaciones digitales manipulables matemáticamente. Fundamental para la búsqueda semántica, la comparación de similitudes y los sistemas de recomendación.; mechanics
RAG: Recuperación-Generación mejorada: buscamos documentos y se los entregamos al LLM para que responda.; RAG (Retrieval-Augmented Generation) combina un motor de búsqueda vectorial con un LLM. En lugar de contextualizar todo, los pasajes pertinentes se recuperan sobre la marcha. Reduce las alucinaciones sobre corpus especializados, pero no las elimina.; mechanicsusage
fine-tuning: Formación complementaria de un modelo existente sobre datos específicos.; El ajuste fino consiste en tomar un modelo preentrenado y continuar el entrenamiento con un conjunto de datos más específicos (dominio, estilo, formato). Es menos costoso que la formación completa, pero más que la orientación. Sólo es pertinente si el formato o el vocabulario no se pueden captar con un indicador.; mechanicseconomics
Alucinación: El modelo afirma algo falso con confianza. Propiedad por diseño, no hay error que corregir.; Una alucinación es un resultado incorrecto producido con aplomo por un modelo. No es un error: es una consecuencia directa del modo de funcionamiento predictivo. El modelo genera lo que es estadísticamente probable, no lo que es cierto. No desaparecerá con futuras versiones.; mechanicsrisks
Agente: Un LLM que sepa utilizar herramientas y vincular acciones.; Un agente de IA es un sistema que utiliza un LLM para decidir qué acciones realizar (llamar a una API, buscar en la web, escribir archivos) y las ejecuta en secuencia. Esto es útil para automatizar tareas complejas, pero también aumenta el riesgo de error: las alucinaciones se extienden por toda la cadena de acciones.; mechanicsrisks
Razonamiento: Lo que los modelos recientes llaman "pensamiento": finalización por etapas, no pensamiento.; Los modelos de razonamiento (o1, o3, R1...) generan una cadena de fichas intermedias antes de la respuesta final. Se trata de una técnica de compleción más desarrollada, no de razonamiento en el sentido humano. El modelo no tiene una representación interna del mundo: genera un texto plausible en cada etapa.; mechanicsreality
GPU: Procesador gráfico paralelo masivo. El hardware básico para entrenar e inferir modelos de IA.; Una GPU (unidad de procesamiento gráfico) ejecuta miles de operaciones en paralelo, lo que la hace idónea para cálculos matriciales intensivos en el aprendizaje automático. Las GPU NVIDIA H100/A100 dominan el mercado de la IA. Escasez crónica desde 2022.; mechanicssovereignty
APU: Procesador que integra CPU y GPU en el mismo chip. Permite ejecutar modelos localmente.; Una APU (unidad de procesamiento acelerado) combina CPU y GPU en la misma matriz. El Apple Silicon (serie M) y el AMD Ryzen AI son ejemplos. Permiten ejecutar localmente modelos con entre 7.000 y 30.000 millones de parámetros, con un consumo de energía razonable.; mechanicssovereignty
on-premise: La infraestructura funciona en sus instalaciones, bajo su control.; El término "in situ" hace referencia al despliegue informático dentro de la propia infraestructura de una organización, en contraposición a la nube. Para la IA, esto significa poseer o alquilar hardware de GPU/APU. Es la única opción para garantizar que los datos no salgan del perímetro.; sovereignty
open weights: Los pesos del modelo son públicos, pero no necesariamente el código de entrenamiento o los datos.; Un modelo de pesos abiertos (Llama, Mistral, DeepSeek...) publica sus pesos, lo que permite descargarlo y ejecutarlo localmente. Esto NO es lo mismo que código abierto: el código de entrenamiento y los datos pueden seguir siendo propiedad del usuario. Los límites importan: algunos modelos "abiertos" prohíben el uso comercial.; sovereignty
open source: El código, los datos y las ponderaciones son públicos y libremente reutilizables.; En sentido estricto, un verdadero modelo de IA de código abierto publica el código de entrenamiento, los datos de entrenamiento Y las ponderaciones. Muy pocos modelos alcanzan este nivel. La mayoría de los llamados modelos "abiertos" son, de hecho, sólo pesos abiertos.; sovereignty
Soberanía: Capacidad para dominar sus herramientas de IA sin dependencia crítica de terceros.; La soberanía digital sobre la IA se refiere a la capacidad de una organización (o un Estado) para controlar sus sistemas de IA: acceso a datos, modelos e infraestructura. No significa construirlo todo uno mismo, sino evitar crear dependencias inaceptables de terceros.; sovereignty
Sesgo: Error sistemático en el resultado de un modelo, heredado de los datos o del diseño.; Un sesgo en un modelo de IA es una tendencia sistemática a producir resultados incorrectos o discriminatorios para determinados grupos o contextos. Puede proceder de los datos de entrenamiento, la arquitectura o el proceso de alineación. No puede eliminarse por completo, solo reducirse y documentarse.; risks