
Cette expérience vise à étudier l'impact de l'hétérogénéité de la distribution des données sur la performance des algorithmes d'apprentissage fédéré. L'expérience utilise un nombre fixe de 3 clients, chacun représentant un point d'enquête. Dix-sept niveaux d'hétérogénéité (0-16) sont conçus pour simuler des scénarios de distribution de données allant de complètement homogène à extrêmement hétérogène. La stratégie d'allocation des données assigne un client cible à chaque catégorie d'espèce. Par exemple, 'zhaoshui' est assigné au client 2, 'xiaotuan' au client 0, et 'nizi' au client 1. Le niveau d'hétérogénéité 0 représente une distribution complètement uniforme, où chaque catégorie d'espèce représente environ 33% dans chacun des trois clients. Les niveaux d'hétérogénéité 1-6 indiquent que la proportion de la catégorie cible dans le client cible augmente progressivement de 43% à 90%, les échantillons restants étant répartis uniformément entre les deux autres clients. Les niveaux d'hétérogénéité 7-15 indiquent que la proportion de la catégorie cible dans le client cible augmente progressivement de 91% à 99%, où seulement 8 à 10 échantillons des deux autres espèces restent dans chaque client en plus de l'espèce principale. Le niveau d'hétérogénéité 16 représente une hétérogénéité complète, où la catégorie cible représente 100% dans le client cible et 0% dans les deux autres clients. La catégorie 'bruit' reste uniformément répartie sur tous les niveaux d'hétérogénéité. Les résultats d'évaluation pour chaque niveau d'hétérogénéité sur un ensemble de test indépendant sont présentés dans le tableau.
Un schéma en format 16:9 avec un fond blanc, dans le style d...