
Un schéma d'architecture d'apprentissage profond propre et professionnel d'un Auto-encodeur Variationnel (VAE) est présenté. À gauche, un réseau encodeur, composé de couches convolutionnelles, sous-échantillonne progressivement une image RVB de 32×32. L'encodeur produit deux vecteurs étiquetés "μ(x)" et "σ(x)". Au centre, un bloc d'espace latent illustre l'astuce de reparamétrisation : z = μ + σ ⊙ ε, avec ε échantillonné à partir d'une distribution gaussienne standard. À droite, un réseau décodeur reconstruit l'image en utilisant une architecture robuste incorporant des blocs résiduels, des modules d'attention et des couches de suréchantillonnage PixelShuffle, augmentant progressivement la résolution spatiale jusqu'à 32×32×3. Des flèches indiquent le flux de données de l'encodeur à l'espace latent au décodeur. La conception est minimaliste et plate, avec un fond blanc, des étiquettes claires et un style académique, adapté à une présentation sur l'apprentissage automatique.
Le processus se déroule en cinq étapes principales : saisie ...