Descrição do Prompt
Um organograma foi analisado, e modelos de detecção correspondentes foram projetados e implementados a partir de diferentes perspectivas de combinação modal, integrando conteúdo textual, estrutura de propagação e informações de imagem.