
변분 오토인코더(VAE)의 깔끔하고 전문적인 딥러닝 아키텍처 다이어그램을 제시합니다. 왼쪽에는 컨볼루션 레이어로 구성된 인코더 네트워크가 32×32 RGB 이미지를 점진적으로 다운샘플링합니다. 인코더는 "μ(x)" 및 "σ(x)" 레이블이 지정된 두 개의 벡터를 출력합니다. 중앙에는 잠재 공간 블록이 재매개변수화 트릭을 보여줍니다: z = μ + σ ⊙ ε (ε은 표준 정규 분포에서 샘플링됨). 오른쪽에는 잔차 블록, 어텐션 모듈 및 PixelShuffle 업샘플링 레이어를 통합한 강력한 아키텍처를 사용하여 이미지를 재구성하는 디코더 네트워크가 공간 해상도를 점진적으로 다시 32×32×3으로 증가시킵니다. 화살표는 인코더에서 잠재 공간, 디코더로의 데이터 흐름을 나타냅니다. 디자인은 미니멀하고 평면적이며, 흰색 배경, 명확한 레이블, 머신 러닝 프레젠테이션에 적합한 학술적 스타일을 갖습니다.
다섯 가지 핵심 단계로 전개되는 과정: 데이터 입력, 그래프 구성, 특징 처리, 핵심 연산, 출력 예측. 이...