Innovazione di processo nella filiera cerealicola: il progetto Quote

La spettroscopia Nir è tra le metodiche più utilizzate in campo agro-alimentare, in continua espansione grazie alla rapidità, facilità d’uso e potenza di predizione. Nel caso del frumento, la metodica Nir è ormai consolidata per la predizione di umidità, hardness della granella, contenuto in proteine e amido. Per quanto riguarda invece la predizione dei parametri alveografici e farinografici, i risultati sono ancora insoddisfacenti.
Il progetto “Quote” (Qualità del frumento tenero: strumenti per la valorizzazione e l’incremento), nell’ambito del progetto di filiera di Molini Industriali spa di Modena, finanziato dalla Regione Emilia-Romagna (PSR 2014-2020), ha avuto come obiettivo generale la razionalizzazione e il potenziamento dell’attività di logistica del molino mediante l’implementazione delle operazioni di analisi del prodotto, in modo da avere una caratterizzazione e segregazione dello stesso più rispondente alle esigenze tecniche e commerciali dell’impresa.
A questo scopo, i laboratori del Crea (Centro di ricerca cerealicoltura e colture industriali) e di Molini Industriali hanno eseguito analisi alveografiche e farinografiche in doppio su 334 campioni di frumento tenero; sugli stessi sono stati ricavati gli spettri Nir utilizzando gli strumenti Inframatic 9500 Grain Analyzer (Perten) e NirSystem 6500 (Foss). I dati spettroscopici, alveografici e farinografici sono stati inizialmente sottoposti ad analisi esplorativa multivariata dei dati mediante PCA (Principal Component Analysis). In seguito, una parte dei dati è stata utilizzata per l’allenamento di diversi modelli predittivi, Random Forest (RF), Generalized Linear Model via Penalized Maximum Likelihood (GLM) e eXtreme Gradient Boosting with Linear Kernel (XGB) mediante tecniche di machine learning. La parte rimanente dei dati è stata utilizzata per validare i modelli in predizione, utilizzarti singolarmente o in ensemble.
I risultati ottenuti sul dataset di validazione hanno dimostrato che la robustezza e validità della metodologia impiegata. I valori di R2 (coefficiente di determinazione, proporzione di variabilità spiegata dal modello, es. figura 1 e figura 2) ottenuti sono variati tra 36% (P) e 72% (tempo di impasto) con una media di 49%, a eccezione di due parametri per cui sono stati ottenuti valori bassi (P/L e G con R2 pari a 7% e 17%, rispettivamente). Il modello Glm è risultato sinora quello caratterizzato da migliori performance, con errore medio entro limiti accettabili anche se, come atteso, la migliore capacità predittiva è stata ottenuta nell’intervallo di valori in cui la numerosità dei campioni era più elevata.


In occasione dell’incontro tecnico di chiusura del progetto, Molini Industriali e Crea, giudicando molto significativi i risultati raggiunti e già potenzialmente applicabili, hanno convenuto di continuare con l’attività di elaborazione statistica, secondo la proposta Crea di:
- Aumentare il numero dei campioni, come descritto precedentemente.
- Applicare tecniche di pre-processing dei dati di spettroscopia, quali per esempio l’algoritmo di Savitzky-Golay, per riduzione del “rumore” nei dati in ingresso.
- Perfezionare i modelli selezionati attraverso la regolazione dei parametri.
- Allenamento di reti neurali a diversa complessità.
Ciò consentirà un ulteriore irrobustimento del sistema predittivo, cui seguirà una ingegnerizzazione pienamente operativa dei modelli sulla strumentazione in dotazione a Molini Industriali.
N.B. Iniziativa realizzata nell’ambito del Programma regionale di sviluppo rurale 2014-2020 dell’Emilia Romagna– Tipo di operazione 16.2.01 – “Supporto per progetti pilota e per lo sviluppo di nuovi prodotti, pratiche, processi e tecnologie nel settore agricolo e agroindustriale” Focus Area 3A