Si estás empezando en el mundo del AI Red Teaming, te habrás encontrando con una gran cantidad de términos técnicos como LLM, prompt injection, fine-tuning, confabulación, embeddings o jailbreaking.
En esta guía te ofrecemos un glosario claro y simplificado, en español, con definiciones y ejemplos fáciles de entender.
Tanto si eres profesional técnico como si te estás iniciando en la ciberseguridad aplicada a modelos de inteligencia artificial, estas definiciones pueden ayudarte a tenerlo todo más claro.
Aprende qué significa realmente la confabulación de un modelo, qué hace un LLM Agente o qué es una Sentient IA.
A
Agente LLM: Componente de código que genera prompts, interpreta respuestas y ejecuta acciones con un modelo LLM.
Alucinación: Generación de información falsa por parte del modelo, presentada como cierta.
Aprendizaje automático: Rama de la IA que entrena modelos para aprender a partir de datos.
Aprendizaje auto-supervisado: Técnica de entrenamiento donde el modelo predice partes faltantes del input.
Aprendizaje profundo: Uso de redes neuronales complejas con muchas capas para analizar datos.
Aprendizaje no supervisado: Descubrimiento de patrones en datos sin etiquetas.
Aprendizaje por transferencia: Reutilización de un modelo entrenado en una tarea diferente.
Aprendizaje supervisado: Entrenamiento con datos etiquetados para predecir o clasificar.
C
Confabulación: Respuesta inventada pero plausible que genera el modelo. Preferida frente a "alucinación".
Contaminación del conjunto de datos: Cuando el modelo es evaluado con datos que ya vio en el entrenamiento.
E
Embeddings: Representación numérica del significado de palabras o frases como vectores.
F
Fine-tuning: Ajuste específico de un modelo generalista para una tarea concreta.
I
IA (Inteligencia Artificial): Tecnología que realiza tareas que normalmente requieren inteligencia humana.
Inferencia: Uso de un modelo entrenado para generar predicciones o respuestas.
L
LLM (Large Language Model): Modelo de lenguaje entrenado con grandes volúmenes de texto.
LLM Plugin: Extensión que conecta un modelo con servicios externos, usado en chatbots.
LLM Tool: Herramienta externa usada por un agente para ejecutar tareas (leer archivos, consultar URLs, etc.).
M
Memoria del agente LLM: Permite al agente recordar interacciones pasadas y mantener contexto.
Modelo fundacional: Modelo entrenado con datos generales, adaptable a múltiples tareas.
N
NLP (Procesamiento del Lenguaje Natural): Rama de la IA que enseña a las máquinas a entender y generar lenguaje humano.
P
Política: Reglas que controlan cómo responde un sistema de IA ante distintos inputs.
S
Sentient AI: Concepto teórico de una IA con conciencia o emociones. No existe actualmente.
T
Tarjeta de modelo: Documento que describe el rendimiento, usos y limitaciones de un modelo.
Transformer: Arquitectura de red neuronal usada en modelos LLM para entender texto.
Turing Test: Prueba para evaluar si una máquina puede simular comportamiento humano.
Z
Zero-Shot Learning: Capacidad del modelo de resolver tareas sin ejemplos previos.