Términos de IA,
explicados claramente.
Un glosario práctico para equipos que evalúan agentes de IA, sistemas RAG e integraciones de LLM.
Agente de IA
Un sistema autónomo que recibe un objetivo, planifica pasos, ejecuta acciones a través de herramientas externas y se adapta cuando algo falla. A diferencia de los chatbots que responden preguntas, los agentes completan tareas — consultar bases de datos, enviar correos electrónicos, actualizar CRMs, tomar decisiones.
RAG (Generación Aumentada por Recuperación)
Un patrón que permite a los modelos de IA responder con precisión sobre tus datos privados. En lugar de entrenar un modelo, buscas documentos relevantes en el momento de la consulta y los inyectas en el prompt. Esto ofrece respuestas precisas y fundamentadas sin un costoso ajuste fino.
Incrustaciones
Representaciones numéricas de texto (o imágenes) como vectores de alta dimensión. El contenido similar produce vectores similares, lo que permite la búsqueda semántica: encontrar documentos por su significado en lugar de por coincidencias exactas de palabras clave. Generados por modelos de embeddings como OpenAI o Cohere.
Base de datos vectorial
Una base de datos optimizada para almacenar y buscar embeddings. Ejemplos: Pinecone, Weaviate, pgvector, Chroma. Esencial para sistemas RAG — almacenas embeddings de documentos y los consultas con el embedding de la pregunta del usuario para encontrar contenido relevante.
Uso de herramientas (Llamada a funciones)
La capacidad de un modelo de IA para invocar funciones externas durante una conversación. Defines las herramientas como esquemas JSON y el modelo decide cuándo llamarlas. Esto convierte a la IA de un generador de texto en un componente activo que puede consultar APIs, realizar cálculos o activar acciones.
Salidas estructuradas
Forzar a un modelo de IA a responder en un esquema JSON específico en lugar de texto libre. Elimina el análisis frágil y hace que las respuestas de la IA sean predecibles para flujos de trabajo automatizados. La fiabilidad pasa de ~90% con prompts de texto libre a ~99% con esquemas estrictos.
Ingeniería de prompts
La práctica de diseñar instrucciones para modelos de IA para obtener resultados confiables y precisos. Incluye prompts de sistema, ejemplos de pocos disparos (few-shot), razonamiento de cadena de pensamiento y especificación de restricciones. Una buena ingeniería de prompts es la diferencia entre una demo y un sistema de producción.
Fragmentación
El proceso de dividir documentos en fragmentos más pequeños para sistemas RAG. La fragmentación ingenua (conteo de tokens fijo) pierde el contexto. La fragmentación inteligente respeta la estructura del documento — encabezados, párrafos, bloques de código — y traslada los metadatos del documento original.
Re-clasificación
Una puntuación de relevancia de segunda pasada tras la recuperación inicial. Un modelo de cross-encoder evalúa cada par consulta-documento para determinar la relevancia real, no solo la similitud vectorial. Mejora drásticamente la precisión en los sistemas RAG, especialmente para consultas ambiguas.
Humano en el bucle
Un patrón de diseño en el que un agente de IA se detiene y escala a un humano cuando la confianza es baja o la acción tiene un alto impacto. Es fundamental para los agentes en producción que gestionan procesos financieros, legales o de cara al cliente. El agente sabe cuándo pedir ayuda.
Sistema Multiagente
Una arquitectura donde múltiples agentes de IA especializados se coordinan para completar tareas complejas. Cada agente tiene un rol definido, un presupuesto y una cadena de mando. Los agentes toman tareas, se comunican mediante comentarios y escalan bloqueos — de manera similar a un equipo de ingeniería humano.
Alucinación
Cuando un modelo de IA genera información que suena segura pero es fácticamente incorrecta. Los sistemas RAG reducen las alucinaciones al basar las respuestas en documentos reales. Los buenos sistemas también detectan cuando no tienen suficiente información y lo dicen explícitamente.
¿Listo para construir?
Ahora que conoces los términos, hablemos de tu proyecto.
Reservar una llamada de descubrimiento