Apprentissage profond

Réseaux de neurones à nombreuses couches successives et méthodes d'entraînement adaptées aux représentations empilées (souvent rebaptisé vers 2006–2012).

L’apprentissage profond désigne généralement des réseaux à multiples couches cachées : ou des Transformers modernes très larges : pour apprendre des représentations hiérarchiques de caractéristiques à partir d’entrées relativement brutes comme des pixels, des formes d’onde et des tokens.

Les époques de percée incluent les réseaux CNN en perception et les Transformers basés sur l’attention, dont les grands modèles de langage (LLM), pré-entraînés sur d’énormes corpus.