El proceso se desarrolla en cinco etapas centrales: entrada de datos, construcción de grafos, procesamiento de características, cálculo central y predicción de salida, enfatizando los roles clave de las características de grafos heterogéneos, la construcción de índices de meta-rutas y los mecanismos de atención a nivel de nodo. La siguiente es una descripción detallada del proceso: Descripción General del Proceso del Modelo El modelo THAN, basado en un grafo heterogéneo (que contiene usuarios, nodos de cascada y varias relaciones), captura asociaciones semánticas entre nodos a través de la indexación de meta-rutas, combina un mecanismo de decaimiento temporal y atención multi-cabeza para calcular incrustaciones de nodos, y finalmente se utiliza para la predicción de un solo paso de la propagación en cascada. El proceso se puede dividir en 5 etapas centrales, como sigue: 1. Entrada de Datos e Inicialización Datos de Entrada: Datos de grafos heterogéneos (grafo): Incluye nodos (usuario, cascada), aristas (social, interacción, difusión) y atributos de arista (como la marca de tiempo). Características iniciales: Características del usuario (user_initial_features) y características de la cascada (cascade_initial_features), almacenadas en forma de diccionario (id_to_idx mapea el ID del nodo al índice de características). Parámetros de configuración: Tipos de meta-ruta (por ejemplo, U-U-social, U-U-interact, C-U-C), número de cabezas de atención, coeficiente de decaimiento temporal lambda_time, etc. Operaciones de Inicialización: Configuración del dispositivo (CPU/GPU) y optimización de la memoria (borrado de caché, transferencia asíncrona de datos). Inicialización de componentes del modelo: Capa de proyección de características (type_transform), parámetros de atención multi-cabeza (att_params), etc. 2. Construcción del Índice de Meta-Ruta del Grafo Heterogéneo Se utiliza el método build_metapath_index para precalcular el índice de meta-ruta, capturando las asociaciones entre diferentes tipos de nodos y características de decaimiento temporal, para acelerar los cálculos de atención posteriores: Definición de Meta-Ruta: U-U-social: Usuario - Social - Usuario (sin marca de tiempo, solo almacena relaciones de vecindad). U-U-interact: Usuario - Interactúa - Usuario (almacena la marca de tiempo de interacción, el valor de decaimiento temporal y la suma de prefijos). C-U-C: Cascada - Usuario - Cascada (relación de cascada conectada a través de usuarios intermedios, almacena la marca de tiempo de difusión, el valor de decaimiento temporal y la suma de prefijos). Contenido del Índice: Para meta-rutas que contienen información de tiempo (U-U-interact, C-U-C), almacenar por par de nodos: Lista ordenada de marcas de tiempo (ts). Valor de decaimiento temporal (decay, calculado en base a 1 - exp(-lambda*(t-T_earliest))). Suma de prefijos de valores de decaimiento (prefix, acelera el cálculo del peso acumulativo). Caché del Índice: Los resultados del cálculo se guardan localmente (save_metapath_full_cache) para evitar cálculos repetidos. 3. Proyección de Características e Inicialización de la Incrustación de Nodos Proyección de Características: A través de type_tr
Diagrama técnico de la arquitectura del sistema: Aterrizaje ...