Le processus se déroule en cinq étapes principales : saisie des données, construction du graphe, traitement des caractéristiques, calcul central et prédiction de la sortie, en mettant l'accent sur les rôles clés des caractéristiques du graphe hétérogène, de la construction d'index de méta-chemin et des mécanismes d'attention au niveau des nœuds. Voici une description détaillée du processus : Aperçu du processus global du modèle Le modèle THAN, basé sur un graphe hétérogène (contenant des utilisateurs, des nœuds en cascade et diverses relations), capture les associations sémantiques entre les nœuds grâce à l'indexation des méta-chemins, combine un mécanisme de décroissance temporelle et une attention multi-tête pour calculer les embeddings de nœuds, et est finalement utilisé pour la prédiction en une seule étape de la propagation en cascade. Le processus peut être divisé en 5 étapes principales, comme suit : 1. Saisie et initialisation des données Données d'entrée : Données de graphe hétérogène (graphe) : comprend les nœuds (utilisateur, cascade), les arêtes (social, interaction, diffusion) et les attributs d'arête (tels que l'horodatage). Caractéristiques initiales : Caractéristiques de l'utilisateur (user_initial_features) et caractéristiques de la cascade (cascade_initial_features), stockées sous forme de dictionnaire (id_to_idx mappe l'ID du nœud à l'index de la caractéristique). Paramètres de configuration : Types de méta-chemin (par exemple, U-U-social, U-U-interact, C-U-C), nombre de têtes d'attention, coefficient de décroissance temporelle lambda_time, etc. Opérations d'initialisation : Configuration du périphérique (CPU/GPU) et optimisation de la mémoire (effacement du cache, transfert de données asynchrone). Initialisation des composants du modèle : Couche de projection des caractéristiques (type_transform), paramètres d'attention multi-tête (att_params), etc. 2. Construction d'index de méta-chemin de graphe hétérogène La méthode build_metapath_index est utilisée pour précalculer l'index de méta-chemin, en capturant les associations entre différents types de nœuds et les caractéristiques de décroissance temporelle, afin d'accélérer les calculs d'attention ultérieurs : Définition du méta-chemin : U-U-social : Utilisateur - Social - Utilisateur (pas d'horodatage, stocke uniquement les relations de voisinage). U-U-interact : Utilisateur - Interact - Utilisateur (stocke l'horodatage de l'interaction, la valeur de décroissance temporelle et la somme préfixe). C-U-C : Cascade - Utilisateur - Cascade (relation de cascade connectée via des utilisateurs intermédiaires, stocke l'horodatage de la diffusion, la valeur de décroissance temporelle et la somme préfixe). Contenu de l'index : Pour les méta-chemins contenant des informations temporelles (U-U-interact, C-U-C), stocker par paire de nœuds : Liste triée des horodatages (ts). Valeur de décroissance temporelle (decay, calculée sur la base de 1 - exp(-lambda*(t-T_earliest))). Somme préfixe des valeurs de décroissance (prefix, accélère le calcul du poids cumulatif). Cache d'index : Les résultats du calcul sont enregistrés localement (save_metapath_full_cache) pour éviter les calculs répétés. 3. Projection des caractéristiques et initialisation de l'embedding des nœuds Projection des caractéristiques : Par type_tr
Diagramme technique d'architecture système : Atterrissage au...