Generación aumentada por recuperación (RAG)
Combinar un recuperador sobre documentos o herramientas con un LLM generador para que las respuestas puedan citar contexto más actualizado o privado.
RAG recupera fragmentos relevantes de un índice, base de datos o corpus y condiciona la decodificación del LLM con ese contexto, reduciendo la dependencia exclusiva del conocimiento paramétrico memorizado.
Compensaciones: calidad de la recuperación, latencia, ajuste al prompt y atribución; el anclaje aún necesita revisión humana para hechos de alto riesgo.