Gran modelo de lenguaje (LLM)

Un modelo estadístico de lenguaje entrenado en grandes corpus de texto, típicamente usando una arquitectura transformer, utilizado para tareas de generación y comprensión.

Un gran modelo de lenguaje (LLM) es una red neuronal (generalmente basada en la arquitectura transformer) entrenada para predecir el siguiente token en una secuencia. A escala, este objetivo produce sistemas que pueden seguir instrucciones, resumir texto, traducir y asistir con programación: dentro de los límites de fiabilidad factual y seguridad.

Los LLM no son “bases de datos de hechos”; generalizan a partir de patrones en los datos de entrenamiento. Para el uso autónomo de herramientas y planificación, consulta agentes de IA.