O processo se desenrola em cinco etapas principais: entrada de dados, construção de grafo, processamento de características, computação central e previsão de saída, enfatizando os papéis-chave das características de grafo heterogêneo, construção de índice de meta-caminho e mecanismos de atenção em nível de nó. A seguir, uma descrição detalhada do processo: Visão Geral do Processo Geral do Modelo O modelo THAN, baseado em um grafo heterogêneo (contendo usuários, nós de cascata e vários relacionamentos), captura associações semânticas entre nós por meio da indexação de meta-caminho, combina um mecanismo de decaimento temporal e atenção multi-cabeça para computar embeddings de nós e, finalmente, é usado para previsão de etapa única da propagação em cascata. O processo pode ser dividido em 5 etapas principais, como segue: 1. Entrada de Dados e Inicialização Dados de Entrada: Dados de grafo heterogêneo (grafo): Inclui nós (usuário, cascata), arestas (social, interação, difusão) e atributos de aresta (como timestamp). Características iniciais: Características do usuário (user_initial_features) e características da cascata (cascade_initial_features), armazenadas em formato de dicionário (id_to_idx mapeia o ID do nó para o índice de característica). Parâmetros de configuração: Tipos de meta-caminho (por exemplo, U-U-social, U-U-interact, C-U-C), número de cabeças de atenção, coeficiente de decaimento temporal lambda_time, etc. Operações de Inicialização: Configuração do dispositivo (CPU/GPU) e otimização de memória (limpeza de cache, transferência assíncrona de dados). Inicialização de componentes do modelo: Camada de projeção de características (type_transform), parâmetros de atenção multi-cabeça (att_params), etc. 2. Construção do Índice de Meta-Caminho do Grafo Heterogêneo O método build_metapath_index é usado para pré-computar o índice de meta-caminho, capturando as associações entre diferentes tipos de nós e características de decaimento temporal, para acelerar os cálculos de atenção subsequentes: Definição de Meta-Caminho: U-U-social: Usuário - Social - Usuário (sem timestamp, armazena apenas relacionamentos de vizinhança). U-U-interact: Usuário - Interage - Usuário (armazena timestamp de interação, valor de decaimento temporal e soma de prefixo). C-U-C: Cascata - Usuário - Cascata (relacionamento de cascata conectado através de usuários intermediários, armazena timestamp de difusão, valor de decaimento temporal e soma de prefixo). Conteúdo do Índice: Para meta-caminhos contendo informações de tempo (U-U-interact, C-U-C), armazene por par de nós: Lista ordenada de timestamps (ts). Valor de decaimento temporal (decay, calculado com base em 1 - exp(-lambda*(t-T_earliest))). Soma de prefixo de valores de decaimento (prefix, acelera o cálculo cumulativo de peso). Cache do Índice: Os resultados do cálculo são salvos localmente (save_metapath_full_cache) para evitar cálculos repetidos. 3. Projeção de Características e Inicialização de Embedding de Nó Projeção de Características: Através de type_tr
Diagrama técnico da arquitetura do sistema: Aeronave de pous...