Genera un'immagine: Il fulcro della combinazione di algoritmi di clustering con NIPALS (lineare) e KPLS (non lineare) è la costruzione di un'architettura a tre stadi di "stratificazione tramite clustering - adattamento del modello - previsione di fusione" per adattarsi alle esigenze di modellazione di dati eterogenei (inclusi sottogruppi multipli, caratteristiche lineari e non lineari miste). Il processo specifico è il seguente: 1) Principio di stratificazione tramite clustering: L'algoritmo di clustering gerarchico viene utilizzato per raggruppare il set di dati pre-elaborato. Il coefficiente di silhouette viene utilizzato come indice di valutazione e il numero ottimale di cluster viene determinato automaticamente all'interno dell'intervallo del "numero massimo di cluster" impostato dall'utente. Allo stesso tempo, i cluster con dimensioni del campione inferiori alla "soglia minima del numero di campioni" vengono uniti per garantire che ogni cluster abbia un numero sufficiente di campioni di modellazione (si consigliano 20-50). 2) Rilevamento della non linearità intra-cluster: Per ogni cluster indipendente, le prestazioni del modello di NIPALS lineare e KPLS non lineare vengono confrontate tramite cross-validation interna (utilizzando l'aumento di R² come criterio). Se l'aumento di R² di KPLS rispetto a NIPALS supera la "soglia di rilevamento della non linearità" (predefinito 5.0%), il cluster viene determinato come una caratteristica non lineare e KPLS viene selezionato per la modellazione; altrimenti, viene determinato come una caratteristica lineare e NIPALS viene selezionato per la modellazione. 3) Fusione del modello e previsione: Quando viene inserito un nuovo campione, viene assegnato al modello di cluster corrispondente tramite l'algoritmo di corrispondenza del vicino più prossimo. Il sistema calcola automaticamente l'R² ponderato di ciascun cluster (ponderato in base alla dimensione del campione del cluster), restituisce il risultato della previsione complessiva e conserva i parametri di modellazione indipendenti e gli indicatori di performance di ciascun cluster per supportare l'analisi interattiva. Si prega di disegnare il diagramma di flusso dell'algoritmo di CPLS con riferimento all'immagine fornita ed esportarlo in formato mermaid.