Der Prozess entfaltet sich in fünf Kernphasen: Dateneingabe, Graphkonstruktion, Feature-Verarbeitung, Kernberechnung und Ausgabevorhersage, wobei die Schlüsselrollen heterogener Grapheigenschaften, der Meta-Pfad-Indexkonstruktion und knotenbezogener Aufmerksamkeitsmechanismen hervorgehoben werden. Im Folgenden eine detaillierte Prozessbeschreibung: Modell Gesamtprozessübersicht Das THAN-Modell, basierend auf einem heterogenen Graphen (der Benutzer, Kaskadenknoten und verschiedene Beziehungen enthält), erfasst semantische Assoziationen zwischen Knoten durch Meta-Pfad-Indizierung, kombiniert einen Zeitverfallsmechanismus und Multi-Head-Attention zur Berechnung von Knoteneinbettungen und wird letztendlich für die Einzelschrittvorhersage der Kaskadenpropagation verwendet. Der Prozess kann in 5 Kernphasen unterteilt werden, wie folgt: 1. Dateneingabe und Initialisierung Eingabedaten: Heterogene Graphendaten (Graph): Beinhaltet Knoten (Benutzer, Kaskade), Kanten (sozial, Interaktion, Diffusion) und Kantenattribute (wie z. B. Zeitstempel). Anfangs-Features: Benutzer-Features (user_initial_features) und Kaskaden-Features (cascade_initial_features), gespeichert in Form eines Dictionary (id_to_idx ordnet die Knoten-ID dem Feature-Index zu). Konfigurationsparameter: Meta-Pfad-Typen (z. B. U-U-sozial, U-U-interagieren, C-U-C), Anzahl der Aufmerksamkeitsköpfe, Zeitverfallskoeffizient lambda_time usw. Initialisierungsoperationen: Gerätekonfiguration (CPU/GPU) und Speicheroptimierung (Cache-Löschung, asynchrone Datenübertragung). Modellkomponenteninitialisierung: Feature-Projektionsebene (type_transform), Multi-Head-Attention-Parameter (att_params) usw. 2. Heterogene Graph Meta-Pfad-Indexkonstruktion Die Methode build_metapath_index wird verwendet, um den Meta-Pfad-Index vorzuberechnen, die Assoziationen zwischen verschiedenen Knotentypen und Zeitverfalls-Features zu erfassen, um nachfolgende Aufmerksamkeitsberechnungen zu beschleunigen: Meta-Pfad-Definition: U-U-sozial: Benutzer - Sozial - Benutzer (kein Zeitstempel, speichert nur Nachbarschaftsbeziehungen). U-U-interagieren: Benutzer - Interagieren - Benutzer (speichert Interaktionszeitstempel, Zeitverfallswert und Präfixsumme). C-U-C: Kaskade - Benutzer - Kaskade (Kaskadenbeziehung, die durch Zwischenbenutzer verbunden ist, speichert Diffusionszeitstempel, Zeitverfallswert und Präfixsumme). Indexinhalt: Für Meta-Pfade, die Zeitinformationen enthalten (U-U-interagieren, C-U-C), speichern nach Knotenpaar: Sortierte Liste von Zeitstempeln (ts). Zeitverfallswert (decay, berechnet basierend auf 1 - exp(-lambda*(t-T_earliest))). Präfixsumme der Verfallswerte (prefix, beschleunigt die kumulative Gewichtsberechnung). Index-Cache: Die Berechnungsergebnisse werden lokal gespeichert (save_metapath_full_cache), um wiederholte Berechnungen zu vermeiden. 3. Feature-Projektion und Knoten-Embedding-Initialisierung Feature-Projektion: Durch type_tr
Technische Systemarchitekturdiagramm: Automatisches Landeflu...