Il processo si sviluppa in cinque fasi fondamentali: input dei dati, costruzione del grafo, elaborazione delle caratteristiche, calcolo centrale e previsione dell'output, enfatizzando i ruoli chiave delle caratteristiche del grafo eterogeneo, della costruzione dell'indice meta-path e dei meccanismi di attenzione a livello di nodo. Di seguito è riportata una descrizione dettagliata del processo: Panoramica del Processo Complessivo del Modello Il modello THAN, basato su un grafo eterogeneo (contenente utenti, nodi cascade e varie relazioni), cattura le associazioni semantiche tra i nodi attraverso l'indicizzazione meta-path, combina un meccanismo di decadimento temporale e l'attenzione multi-testa per calcolare gli embedding dei nodi e viene infine utilizzato per la previsione a singolo passo della propagazione a cascata. Il processo può essere suddiviso in 5 fasi fondamentali, come segue: 1. Input dei Dati e Inizializzazione Dati di Input: Dati del grafo eterogeneo (grafo): Include nodi (utente, cascade), archi (social, interazione, diffusione) e attributi degli archi (come il timestamp). Caratteristiche iniziali: Caratteristiche dell'utente (user_initial_features) e caratteristiche della cascade (cascade_initial_features), memorizzate in forma di dizionario (id_to_idx mappa l'ID del nodo all'indice della caratteristica). Parametri di configurazione: Tipi di meta-path (es. U-U-social, U-U-interact, C-U-C), numero di teste di attenzione, coefficiente di decadimento temporale lambda_time, ecc. Operazioni di Inizializzazione: Configurazione del dispositivo (CPU/GPU) e ottimizzazione della memoria (pulizia della cache, trasferimento asincrono dei dati). Inizializzazione dei componenti del modello: Livello di proiezione delle caratteristiche (type_transform), parametri di attenzione multi-testa (att_params), ecc. 2. Costruzione dell'Indice Meta-Path del Grafo Eterogeneo Il metodo build_metapath_index viene utilizzato per pre-calcolare l'indice meta-path, catturando le associazioni tra diversi tipi di nodi e le caratteristiche di decadimento temporale, per accelerare i successivi calcoli di attenzione: Definizione del Meta-Path: U-U-social: Utente - Social - Utente (nessun timestamp, memorizza solo le relazioni di vicinato). U-U-interact: Utente - Interact - Utente (memorizza il timestamp dell'interazione, il valore di decadimento temporale e la somma prefissa). C-U-C: Cascade - Utente - Cascade (relazione cascade connessa tramite utenti intermedi, memorizza il timestamp di diffusione, il valore di decadimento temporale e la somma prefissa). Contenuto dell'Indice: Per i meta-path contenenti informazioni temporali (U-U-interact, C-U-C), memorizzare per coppia di nodi: Elenco ordinato di timestamp (ts). Valore di decadimento temporale (decay, calcolato in base a 1 - exp(-lambda*(t-T_earliest))). Somma prefissa dei valori di decadimento (prefix, accelera il calcolo del peso cumulativo). Cache dell'Indice: I risultati del calcolo vengono salvati localmente (save_metapath_full_cache) per evitare calcoli ripetuti. 3. Proiezione delle Caratteristiche e Inizializzazione dell'Embedding dei Nodi Proiezione delle Caratteristiche: Attraverso type_tr
Diagramma tecnico dell'architettura del sistema: Atterraggio...