Self-learning modules for spectra evaluation

Sadeghi Vasafi, Pegah

Doctoral Thesis

2022

Self-learning modules for spectra evaluation

Sadeghi Vasafi, Pegah

Diss_Sadeghi_Vasafi.pdf (4.11 MB)

Abstract (English)

Monitoring milk processing is an essential task as it affects the quality and safety of the final product. The aim of this investigation was to develop and analyse the self-learning system for the supervision of the processing of milk. In the self-learning evaluation module, several algorithms for data analysis of near infrared (NIR) and Raman spectra was implemented for the prediction of sample quality and safety. In the first part of this thesis, the use of NIR spectroscopy for controlling milk processing was investigated. For this reason, a high-quality quartz flow cell with a 1 mm pathlength including temperature controlling option for liquids was implemented. For sample preparation, UHT-milk with 1.5 % fat content was measured at 5 °C and considered as the reference milk. Samples with various changes such as added water and cleaning solution, different fat content and temperature as well as milks from various suppliers were investigated as the modified samples. A data set from reference and modified samples was obtained with NIR measurements. In this study, first Savitzky-Golay derivative with second polynomial order and window size of 15 was applied. It was compared with the usefulness of raw spectrum and also the combination of raw and first derivative spectrum. For the self-learning sector, an autoencoder neural network was employed. Within this thesis, it was shown that the trained autoencoder using first derivative spectra was capable to detect 5 % added water and 9 % cleaning solution in the milk. However, by using the combination spectra, the difference of 0.1 % in fat concentration was perfectly recognized. These two procedures were able to detect milks from different suppliers and difference of 10 °C in the measurement temperature. Another part of this work was done using Raman spectroscopy. The aim of this part was to check if the previous result can be improved. In this step, the circulation method was again employed the same as in the previous part. However, because of the heat introduced to the sample by the laser using in Raman spectroscopy and the length of plastic tubes which can be affected by the temperature of the laboratory, the measurement temperature was kept at 10 °C. 1.5 % fat UHT milk was utilized as the reference sample. Milks with various changes such as different fat contents, various measurement temperatures and added water or cleaning solution were investigated as the modified samples. In this investigation, not only the autoencoder but also some chemometric models were utilized with the purpose of anomaly detection. Principal component analysis (PCA) was investigated to check if the various samples can becategorized separately. In addition, two chemometric modelling techniques such as principal component regression and Gaussian process regression were tested to check the ability for change detection. By using the results obtained by PCA, a sufficient categorization of various samples was not achieved. While the PCR did not present a promising prediction as the related R2 was 0.7, Gaussian process regression with R2 of 0.97 predicted the changes almost perfectly. The trained autoencoder and Gaussian process regression both were able to define 5 % water and cleaning solution, difference of 0.1 % fat content, and variation of 5 °C in the measurement temperature. In comparison between the autoencoder and Gaussian process regression, it should be mentioned that the Gaussian process regression was capable to determine more abnormal signals than the autoencoder, however, it must be trained with all the possible changes. In contrast, the autoencoder can be trained once just with reference signals and used in online monitoring properly. As the final part and to detect which type of anomalies happened during the milk processing, several classification approaches such as linear discriminant analysis, decision tree, support vector machine, and k nearest neighbour were utilized. While decision trees and linear discriminant analysis failed to effectively characterize the various types of anomalies, the k nearest neighbor and support vector machine presented promising results. The support vector machine presented an accuracy of 81.4 % for test set, while the k nearest neighbor showed an accuracy of 84.8 %. As a result, it is reasonable to assume that both algorithms are capable of classifying various groups of data accurately. It can help the milk business figure out whats going wrong during the processing of milk. In general, Raman spectroscopy produced better findings than NIR spectroscopy, because the typical absorption bands of milk components in NIR spectrometers may be impacted by high water absorption combined with substantial light scattering by fat globules. Additionally, the autoencoder as self-learning system was capable of correctly detecting changes during milk processing, however, classification algorithms can aid in obtaining more details.

Abstract (German)

Die Überwachung der Milchverarbeitung ist eine wesentliche Aufgabe, da sie die Qualität und Sicherheit des Endprodukts beeinflusst. Das Ziel dieser Untersuchung war die Entwicklung und Analyse eines selbstlernenden Systems zur Überwachung der Milchverarbeitung. In dem selbstlernenden Auswertungsmodul wurden verschiedene Algorithmen zur Datenanalyse implementiert, um die Qualität und Sicherheit der Proben mit Hilfe spektroskopischer Methoden vorherzusagen. Im ersten Teil dieser Arbeit wurde der Einsatz der Nahinfrarot-Spektroskopie (NIR) zur Kontrolle der Milchverarbeitung untersucht. Zu diesem Zweck wurde eine hochwertige Quarzdurchflusszelle mit einer Schichtdicke von 1 mm und einer Temperiermöglichkeit für Flüssigkeiten eingesetzt. Zur Probenvorbereitung wurde UHT-Milch mit 1,5 % Fettgehalt bei 5 °C gemessen und als Referenzmilch betrachtet. Als modifizierte Proben wurden Proben mit verschiedenen Veränderungen wie Wasser- und Reinigungsmittelzusatz, unterschiedlichem Fettgehalt und Temperatur sowie Milch von verschiedenen Lieferanten untersucht. Mit NIR Messungen wurde ein Datensatz von Referenz- und modifizierten Proben gewonnen. In dieser Studie wurde die erste Savitzky-Golay-Ableitung mit zweiter Polynomordnung und einer Fenstergröße von 15 verwendet. Sie wurde mit der Auswertegüte des Rohspektrums und auch der Kombination aus Roh- und erstem Ableitungsspektrum verglichen. Für den selbstlernenden Bereich wurde ein neuronales Netz als Autoencoder eingesetzt. Im Rahmen dieser Arbeit wurde gezeigt, dass der trainierte Autoencoder unter Verwendung der ersten Ableitung in der Lage war, 5 % zugesetztes Wasser und 9 % Reinigungslösung in der Milch zu erkennen. Durch die Verwendung der Kombinationsspektren wurde auch der Unterschied von 0,1 % in der Fettkonzentration perfekt erkannt. Diese beiden Verfahren waren in der Lage, Milch von verschiedenen Lieferanten und einem Unterschied von 10 °C bei der Messtemperatur zu erkennen. Ein weiterer Teil dieser Arbeit wurde mit der Raman-Spektroskopie durchgeführt. Ziel dieses Teils war es, zu prüfen, ob das vorherige Ergebnis verbessert werden kann. In diesem Schritt wurde wieder die gleiche Zirkulationsmethode wie im vorherigen Teil verwendet. Wegen der Wärme, die durch den Laser bei der Raman-Spektroskopie in die Probe eingebracht wird, und der Länge der Kunststoffrohre, die durch die Temperatur im Labor beeinflusst werden kann, wurde die Messtemperatur jedoch bei 10 °C gehalten. Als Referenzprobe wurde UHT-Milch mit 1,5 % Fett verwendet. Milch mit verschiedenen Veränderungen wie unterschiedlichen Fettgehalten, verschiedenen Messtemperaturen und Zusatz von Wasser oder Reinigungslösung wurde als modifizierte Probe untersucht. In dieser Untersuchung wurden nicht nur der Autoencoder, sondern auch einige chemometrische Modelle zur Erkennung von Anomalien eingesetzt. Die Hauptkomponentenanalyse (PCA) wurde untersucht, um zu prüfen, ob die verschiedenen Proben separat kategorisiert werden können. Darüber hinaus wurden zwei chemometrische Modellierungstechniken wie die Hauptkomponentenregression und die Gaußsche Prozessregression getestet, um die Fähigkeit zur Erkennung von Veränderungen zu prüfen. Mit den Ergebnissen der PCA konnte keine ausreichende Kategorisierung der verschiedenen Proben erreicht werden. Während die Hauptkomponentenregression (PCR) keine vielversprechende Vorhersage lieferte, da das zugehörige R2 bei 0,7 lag, sagte die Gaußsche Prozessregression mit einem R2 von 0,97 die Veränderungen nahezu perfekt voraus. Sowohl der trainierte Autoencoder als auch die Gaußsche Prozessregression waren in der Lage, 5 % Wasser und Reinigungslösung, einen Unterschied von 0,1 % Fettgehalt und eine Variation der Messtemperatur von 5 °C zu detektieren. Im Vergleich von Autoencoder und der Gaußschen Prozessregression ist zu erwähnen, dass die Gaußsche Prozessregression in der Lage war, mehr anormale Signale zu bestimmen als der Autoencoder, allerdings muss sie mit allen möglichen Änderungentrainiert werden. Im Gegensatz dazu muss der Autoencoder nur einmal mit Referenzsignalentrainiert und kann dann für die Online-Überwachung verwendet werden. Als letzter Teil und umzu erkennen, welche Art von Anomalien während der Milchverarbeitung auftraten, wurden verschiedene Klassifizierungsansätze wie lineare Diskriminanzanalyse, Entscheidungsbaum, Support Vector Machine und K Nearest Neighbour verwendet. Während die Entscheidungsbäume und die lineare Diskriminanzanalyse nicht in der Lage waren, die verschiedenen Arten von Anomalien effektiv zu charakterisieren, lieferten die K Nearest Neighbour und die Support Vector Machine Methode vielversprechende Ergebnisse. Die Support Vector Machine wies eine Genauigkeit von 81,4 % für den Testsatz auf, während die K Nearest Neighbour Methode eine Genauigkeit von 84,8 % ergab. Daher kann man davon ausgehen, dass beide Algorithmen in der Lage sind, verschiedene Datengruppen genau zu klassifizieren. Dies kann der Milchwirtschaft helfen, herauszufinden, was bei der Verarbeitung von Milch falsch läuft. Im Allgemeinen lieferte die Raman-Spektroskopie bessere Ergebnisse als die NIR-Spektroskopie, da die typischen Absorptionsbanden der Milchbestandteile in NIR-Spektrometern durch eine hohe Wasserabsorption in Kombination mit einer erheblichen Lichtstreuung durch Fettkügelchen beeinträchtigt werden können. Darüber hinaus war der Autoencoder als selbstlernendes System in der Lage, Veränderungen während der Milchverarbeitung korrekt zu erkennen, jedoch können Klassifizierungsalgorithmen helfen, mehr Details zu erhalten.

Publication license

Copyright

Faculty

Faculty of Natural Sciences

Institute

Institute of Food Science and Biotechnology

Examination date

2022-02-10

Supervisor

Hitzmann, Bernd

Cite this publication

Sadeghi Vasafi, P. (2022). Self-learning modules for spectra evaluation. https://hohpublica.uni-hohenheim.de/handle/123456789/6702

Identification

https://hohpublica.uni-hohenheim.de/handle/123456789/6702

Language

English

Classification (DDC)

570 Biology

Collections

Institut für Lebensmittelwissenschaft und Biotechnologie

Free keywords

FT-Raman-Spectroscopy Fourier-Spectroscopy Chemometry

Standardized keywords (GND)

FT-Raman-Spektroskopie Fourier-Spektroskopie Chemometrie

BibTeX@phdthesis{Sadeghi Vasafi2022,
url = {https://hohpublica.uni-hohenheim.de/handle/123456789/6702},
author = {Sadeghi Vasafi, Pegah},
title = {Self-learning modules for spectra evaluation},
year = {2022},
school = {Universität Hohenheim},
}

Share this publication

Full item page

A new version of this entry is available:

Self-learning modules for spectra evaluation

Abstract (English)

Abstract (German)

File is subject to an embargo until

This is a correction to:

A correction to this entry is available:

This is a new version of:

Other version

Notes

Publication license

Publication series

Published in

Other version

Faculty

Institute

Examination date

Supervisor

Cite this publication

Edition / version

Citation

Identification

DOI

ISSN

ISBN

Language

Publisher

Publisher place

Classification (DDC)

Collections

Original object

University bibliography

Free keywords

Standardized keywords (GND)

Sustainable Development Goals

BibTeX

Share this publication