Generación aumentada por recuperación (RAG)

Combinar un recuperador sobre documentos o herramientas con un LLM generador para que las respuestas puedan citar contexto más actualizado o privado.

RAG recupera fragmentos relevantes de un índice, base de datos o corpus y condiciona la decodificación del LLM con ese contexto, reduciendo la dependencia exclusiva del conocimiento paramétrico memorizado.

Compensaciones: calidad de la recuperación, latencia, ajuste al prompt y atribución; el anclaje aún necesita revisión humana para hechos de alto riesgo.