La spinta dell’Industry 4.0 porta sempre più linee di produzione ad essere totalmente sensorizzate: i dispositivi IoT di cui sono dotate generano Data Lake, grandi quantità di dati che spesso vengono storicizzati e mai più utilizzati.
Come estrapolare del valore da dati che si trovano in quantità non gestibili dall’essere umano?
La risposta è il Machine Learning, che permette di creare algoritmi che automatizzano il discovery della conoscenza contenuta nei dati.
Il task forse più noto per cui il Machine Learning viene applicato è l’addestramento di modelli predittivi: fornendo degli esempi derivati dai dati collezionati, si può addestrare un algoritmo per fare previsioni su un indice obiettivo, che rappresenta l’evento o il valore di business che si è interessati a conoscere in anticipo.
Questo processo permette la creazione di uno strumento statistico di supporto alle decisioni da fornire agli esperti di dominio.
I modelli predittivi che si possono costruire si dividono in due macro-famiglie:
- Modelli di classificazione: l’indice obiettivo è un valore discreto, potrebbe essere l’accadimento o non accadimento di un determinato evento da monitorare.
- Modelli di regressione: l’indice obiettivo è un valore continuo, potrebbe in questo caso essere una determinata variabile di processo nel tempo di cui si vuole prevedere l’andamento.
Data Mining e Machine Learning
Il Machine Learning però non è solo creazione di modelli previsionali: al suo interno si inquadra anche il Data Mining, un insieme di tecniche il cui intento è l’estrapolazione di pattern o regole contenute nei dati.
Un esempio di questi approcci è il clustering, che permette di raggruppare gli esempi in famiglie, all’interno dei quali si riconoscono comportamenti simili, che potrebbero essere difficilmente individuabili ad occhio umano.
I due use case più noti dove viene sfruttata la potenzialità dei dati di processo, sono certamente:
- Predictive Maintenance, dove l’obiettivo è stimare la vita residua dei componenti, per intervenire in manutenzione sugli asset di processo prima che questi possano guastarsi. L’obiettivo è preservare la Business Continuity, in quanto le operazioni di manutenzione incidono in maniera nettamente inferiore sull’availability dell’impianto, rispetto al fermo per guasto.
- Predictive Quality, dove l’obiettivo è stimare la qualità di un semilavorato o prodotto finito, dove un controllo su di esso potrebbe richiedere di lavorare in condizioni critiche (come alte temperature) oppure dove la prelevazione di campioni di test potrebbe essere insostenibile nei costi o nei tempi.