
본 실험은 연합 학습 알고리즘의 성능에 미치는 데이터 분포 이질성의 영향을 조사하는 것을 목표로 합니다. 실험은 각각 조사 지점을 나타내는 3개의 고정된 클라이언트를 사용합니다. 17개의 이질성 수준(0-16)은 완전히 동질적인 시나리오부터 극도로 이질적인 시나리오까지 데이터 분포 시나리오를 시뮬레이션하도록 설계되었습니다. 데이터 할당 전략은 각 종 범주에 대상 클라이언트를 할당합니다. 예를 들어 'zhaoshui'는 클라이언트 2에, 'xiaotuan'은 클라이언트 0에, 'nizi'는 클라이언트 1에 할당됩니다. 이질성 수준 0은 완전히 균등한 분포를 나타내며, 각 종 범주가 세 클라이언트 각각에서 약 33%를 차지합니다. 이질성 수준 1-6은 대상 클라이언트에서 대상 범주의 비율이 43%에서 90%로 점진적으로 증가하고, 나머지 샘플은 다른 두 클라이언트에 균등하게 분배됨을 나타냅니다. 이질성 수준 7-15는 대상 클라이언트에서 대상 범주의 비율이 91%에서 99%로 점진적으로 증가하며, 주 종 외에 다른 두 종의 샘플이 각 클라이언트당 8-10개만 남음을 나타냅니다. 이질성 수준 16은 완전한 이질성을 나타내며, 대상 클라이언트에서 대상 범주가 100%를 차지하고 다른 두 클라이언트에서는 0%를 차지합니다. 'noise' 범주는 모든 이질성 수준에서 균등하게 분배된 상태로 유지됩니다. 독립적인 테스트 세트에서 각 이질성 수준에 대한 평가 결과는 표에 나와 있습니다.

이 다이어그램은 컴퓨터 과학 분야에서 정적 프롬프트 생성과 동적 프롬프트 생성의 차이점을 보여줍니다. 이미지...