Description du prompt
Une organigramme a été analysé, et des modèles de détection correspondants ont été conçus et mis en œuvre à partir de différentes perspectives de combinaison modale, intégrant le contenu textuel, la structure de propagation et les informations d'image.