Gran modelo de lenguaje (LLM)
Un modelo estadístico de lenguaje entrenado en grandes corpus de texto, típicamente usando una arquitectura transformer, utilizado para tareas de generación y comprensión.
Un gran modelo de lenguaje (LLM) es una red neuronal (generalmente basada en la arquitectura transformer) entrenada para predecir el siguiente token en una secuencia. A escala, este objetivo produce sistemas que pueden seguir instrucciones, resumir texto, traducir y asistir con programación: dentro de los límites de fiabilidad factual y seguridad.
Los LLM no son “bases de datos de hechos”; generalizan a partir de patrones en los datos de entrenamiento. Para el uso autónomo de herramientas y planificación, consulta agentes de IA.