Spektroskopie und Chemometrie Neuigkeiten Wöchentlich #48+49, 2016

Leider ist der Eintrag nur auf English verfügbar.

Arbeitsweisen zur NIR Kalibrierung – Erstellung von NIRS-Spektroskopie Kalibrierungskurven

Kennen Sie den Effekt, dass Sie bevorzugt ihre Lieblings-Datenvorbehandlungen in Kombination durchprobieren und oft die gleichen Wellenlängen-Selektionen anhand der visualisierten Spektren ausprobieren?

Man probiert z.B. sechs bis zehn Kombinationen aus, bis man davon sein favorisiertes Kalibrationsmodell auswählt, um es dann weiter zu optimieren. Da fallen dann plötzlich Ausreisser (Outlier) auf, weil man in die Tiefe geht, also mit den Daten vertraut ist, man kennt mittlerweile die Spektren-Nummern der Ausreisser und ist mit den Extremwerten vertraut.

Jetzt fokussiert man sich auf die Hauptkomponenten (Principal Components, Latent Variables, Faktoren) und achtet darauf nicht zu über-fitten und nicht zu unter-fitten. Das ganze dauert ein paar Stunden und schliesslich begnügt man sich mit dem gefundenen Modell.

Was wäre nun, wenn man in all den zu Beginn ausprobierten Varianten, die gefundenen Ausreisser entfernt und nochmals berechnet und vergleicht? Wären die Ergebnisse besser als die von der bisherigen Modell Wahl? Man probiert es nicht aus? Weil es mühsam ist und wieder Stunden dauert?

Wir haben eine Software entwickelt die dies so vereinfacht, dass auch die Anzahl der Modell Variationen beliebig erhöht werden kann. Die Varianten Erzeugung läuft automatisiert mit einem intelligenten Regelsystem, so auch die Optimierung und das Vergleichen der Modelle und schliesslich die finale Auswahl des Besten Kalibrations Modell.

Unsere Software beinhaltet alle üblichen bekannten Datenvorbehandlungs Methoden (Preteatments) und kann diese sinnvoll kombinieren. Da viele Preteatments direkt abhängig sind von der Wellenlängen Selektion, so z.B. die Normalisierungen die innerhalb eines Wellenlängen-Bereiches die Skalierungsfaktoren ermittelt, um die Spektren damit zu normieren, werden die Pretreatments mit dem Wellenlängen-Bereichen kombiniert. So kommt eine Vielzahl von sinnvollen Modell Einstellungen zusammen die alle berechnet und optimiert werden.

Für die automatische Auswahl der relevanten Wellenlängen Bereiche kommen verschiedene Methoden zum Einsatz, die sich an den Spektren Intensitäten orientieren. So werden z.B. Bereiche mit Totalabsorption nicht verwendet, oftmals störende Wasserbanden entfernt oder beibehalten.

Über all die berechneten Modell Variationen können so zusammenfassende Outlier Analysen gemacht werden. Werden durch die gefahrenen Versuche neue Outlier (Hidden Outlier) entdeckt, können alle bisherigen Modelle automatisch ohne diese Ausreisser nachberechnet, optimiert und verglichen werden.

Aus dieser Vielzahl berechneter Modelle mit deren Statistischen Güte Bewertungen (Prediction Performance) kann nun die optimale Kalibration ausgewählt werden. Dazu wird nicht einfach nach dem Vorhersage Fehler (Prediction Error, SEP, RMSEP) oder nach dem Bestimmtheitsmaß (Coefficient of Determination r2) sortiert, sondern mehrere Statistik- und Testwerte gemeinsam zur umfänglichen Beurteilung der optimalen Kalibration herangezogen.

Somit haben wir eine Plattform geschaffen, die es ermöglicht hochgradig automatisiert das zu tun, was ein Mensch niemals mit einer handelsüblichen Software tun kann.

Wir bieten damit die grösste Anzahl auf Ihr Applikations-Problem angepasste Modellierungs-Berechnungen und wählen die beste Kalibration für Sie aus!

Das heisst, unsere Ergebnisse sind schneller, genauer, robuster und objektiv ausgewählt (Personen unabhängig) und für Sie ganz einfach anzuwenden.

Die Kontrolle über die von uns gelieferten Modelle haben Sie vollumfänglich, denn wir liefern einen klar strukturierten und detaillierten Bauplan der  kompletten Kalibration, mit allen Einstellungen und Parametern, mit allen notwendigen Statistischen Kenngrössen und Grafiken.

Anhand dieses Bauplans können Sie das quantitative Kalibrations Modell selbst in der von Ihnen verwendeten Software nachstellen, nachvollziehen und vergleichen. Sie haben so alles im Griff, für die Modell-Validierung und die Modellpflege.

Der Datenschutz ist uns sehr wichtig. Die NIR Daten, die Sie uns für die Kalibrations-Erstellung kurzzeitig zu Verfügung stellen bleiben selbstverständlich Ihr Eigentum. Ihre NIR Daten werden nach Abschluss des Auftrags bei uns gelöscht.

Interessiert, dann zögern Sie nicht uns zu kontaktieren.

NIR Spectroscopy Calibration Report for quantitative predictive models

When you send your quantitative NIR spectra data to our NIR Calibration Model Service, you get a detailed calibration report (calibration protocol) of the found optimal calibration settings, so you are able to see all insights and easily re-build the model in your NIR/Chemometric software.

Here is a part of our calibration report, that exactly describes the data used in the calibration set (CSet), the validation set (VSet) and the test set (TSet). The numbers are the number ids of the spectra in your delivered NIR data file.


The calibration method settings and parameters are
Waveselection : the variable selection or wavenumber selection or wavelength selection
Pretreatments : the spectral data pre-processing
PCs : the number of Principal Components (PC) or Latent Variables (LV)
Method : the modeling method algorithm used, e.g. PLS

Then the statistical analysis of the PLS model by the different sets (CSet, VSet, Tset).

Calibration Report

Statistical analysis of calibration, validation and test results : 1 Name, 2 Unit, 3 N : number of spectra, 4 N : number of samples, 5 Average spectra count per sample, 6 Reference values, 7 Min, 8 Mean, 9 Median, 10 Max, 11 Standard deviation, 12 Skewness : left (-) or right (+) lack of symmetry, 13 Kurtosis : flat (-) or peaked (+) shape, 14 Model statistics, 15 RPD, 16 R², 17 RMSEC, RMSEP, RMSET : root mean square of prediction errors, 18 SEC, SEP, SET : standard error (bias corrected), 19 Bias, 20 Skewness of prediction errors, 21 Kurtosis of prediction errors, 22 Intercept, 23 Slope, 24 Intercept (reverse), 25 Slope (reverse), 26 Sample Prediction Repeatability Error, 27 Sample Prediction Repeatability Error (of Missing data MSet)

This shows how we deliver the optimal settings. With the statistical values, the NIR model predicted values of all spectra and additional plots you are able to compare with your re-built model to verify that the models perform nearly equally.

Proof of Concept

Chemometric software competitions (aka shootouts) are a good way to check algorithms, software and knowledge against all other experts in the field.

Imagine that the prediction results can be produced with any kind of software and newest algorithms.

And we just use PLS right to generate models that can be used on all NIR software systems, because PLS is a quasi standard, supported in all major chemometrics software.

Our software framework reached very good results, got gold (rank #1) and silver (rank #2) during well known international NIR Chemometric software shootouts* so far, the competitions are held bi-annual.

Rank / competitors Competition / Conference Year
#1 / 1 ** Kaji / ANSIG 2014
#1 / 150 Kaji / ANSIG 2012
#2 / ??? IDRC / IDRC 2012
The Kaji Competition

A set of NIR spectral data will be available for downloading from the ANISG website and contestants will be asked to find and explain a “best” chemometric model to robustly predict samples of the same type.
A panel will select the three “best” entries based on the predicted results and spectroscopic explanation of the products and attributes of interest.

http://www.anisg.com.au/the-kaji-competition


The IDRC Competition

The Software Shootout has been a staple of the IDRC. It is a competition amongst participants of the conference that aims at determining the person who developed the best model and obtained the lowest prediction error for a particular problem.
Every IDRC, a new challenge is proposed to participants. The challenge consists of a data set with calibration, test and a validation set.
Participants are given target values for the calibration and test sets but must do their best to develop a model that will predict the validation set as accurately and precisely as possible. Challenges from all sorts of fields of NIRS have been used (agriculture, biomedical, pharmaceutical, soil, …).

IDRC


*) The author was unable to present the results at the conferences, so this ranking was not official but confirmed by the shootout organizers. Thanks go to Benoit Igne, IDRC 2012 shootout organizer and Steve Holroyd, Kaji Competition organizer at ANISG Conference 2012.

Conclusion

Our chemometric software framework can significantly reduce the time spent for NIR method development and fine optimization. The time saving can be achieved through highly automated experiments and the usage of cloud computing. Calibrations are built and evaluated using automated good practices protocols resulting in useful, precise and robust Calibrations. The high number of experiments enables a deep screening of the solution domain to find the optimum calibration settings, something currently unavailable in standard chemometric software.

**) We were the only participator that got the 4 competition tasks (4-times more than usual) completed in that short time and submitted the fully documented results. After the competition, the information was given, that the data was originated from forages and the constituents were dry matter, organic matter digestibility, protein and ash. Thanks go to Daniel Cozzolino, Kaji 2014 Competition organizer.

Summary of the NIR Chemometric survey polls

Summary of the NIR Chemometric survey polls (as of end of Sept. 2013)

The interesting finding is that most of the answers fit the following pattern. The most companies that use NIR have one NIR Instrument and only one employee that is able to develop NIR calibrations. For that the most common off-the-shelf chemometrics program is used and spent 2 hours or over a month and therefore gets no calibration training about the complex topics like Chemometrics and NIR Spectroscopy or only once (introduction). The calibration maintenance ranges from never to 3 times a year. Interestingly, there was no one who uses portable NIR instruments. We continue our surveys, for the discovery of new trends. Conclusion Seeing this picture, we think that there is huge potential to improve the calibrations. Advanced knowledge can help individuals to build the calibrations with best practices and improve their models accuracy and reliability. Once the decision and investment in NIR technology is done, you should get the best out of your data, because this extra NIR performance can be given by calibration optimization. We offer this as an easy to use and independent service.

NIR Kalibrationsentwicklung

Die Mehrheit der NIR Kalibrierungen werden unter Verwendung einer kleinen Anzahl von verschiedenen Parametereinstellungen erzeugt und allzu oft eingeschränkt durch die zu Verfügung stehende Zeit die ein Benutzer hat, deren spektroskopisches und chemometrisches Fachwissen und die Fähigkeit (mühsames bedienen der Software) alle möglichen Parametereinstellungen zu wählen und zu kombinieren, die für gute Kalibrierungen erforderlich sind.

Es gibt viele veröffentlichte Normen und Richtlinien (Protokolle) für die Entwicklung von NIR-Kalibrierungen von Normierungsbehörden wie ASTM, EMEA, ICH, IUPAC, ISO, USP, PASG etc. sowie viele gute Empfehlungen und Richtlinien die in verschiedenen Lehrbüchern und Fachbeiträgen gefunden werden können.

Die Schwierigkeit mit so vielen ‘Protokollen’ für den NIR Benutzer besteht darin, dass sie alle verfügbar und in ihren Denkprozessen präsent sind während der Kalibrierungs Arbeit und zusätzlich beim Ausführen, Überprüfen und Bewerten aller manuell erzeugten Kalibrierungen. Dies ist zeitaufwendig und manchmal langweilig wiederholende Arbeit.

Um dies für die Person die NIR-Kalibrierung entwickeln zu vereinfachen, haben wir die guten Praktiken Protokolle gesammelt und sie in unseren Service integriert, der die Kalibrierungs Erstellung und das Evaluierungsverfahren automatisiert.

zu Teil 2

Nutzen

Der NIR Kalibrations Service bietet Ihnen folgende Vorteile: Geldersparnis
  • Die Verbesserung der Genauigkeit und Zuverlässigkeit bereits eingesetzter/angewandter NIR Kalibrationsmodelle hat hohes Einsparpotenzial bei verschiedenen Produktions Prozessen wie auch in der Qualitätssicherung.
  • Erhöhte Analysen Genauigkeit => den Produktionsprozess besser im Griff => optimaler Prozessablauf => bessere Qualität => weniger Ausschuss => mehr Durchsatz
  • Schnell und günstig professionelle NIR Kalibrations Modelle erstellen.
  • Entlasten von eigenem Personal
Zeitersparnis
  • beim Datenbereinigung (Steigerung der Datenqualität) – Fehlende Daten, Ausreisser Erkennung, fehlerhafte Daten (widersprüchliche Informationen), Ausreisser Elimination
  • beim Suchen nach den optimalen Parameter Kombinationen für das Modell (calibration set, wavelength selection, data pretreatments, factor selection)
  • beim zeitintensiven Berechnungen von diversen Variationen des Modells
  • bei der Validation, Bewertung und Auswahl des optimalen Modells (error, SEP, RMSEP, RMSEC, RPD, fit, R2, bias, slope, …)
  • Nicht lange rumprobieren in der verwendeten NIR Software bis die Kalibration einigermassen funktioniert.
NIR Analysen Genauigkeit
  • höhere Zuverlässigkeit durch Genauigkeit und Robustheit der NIR Kalibrations Modelle
  • Vergleichsmöglichkeit mit ihren eigenen erstellten oder schon vorhandenen oder gekauften NIR Kalibrationen
  • was ist an Performance Steigerung der Analysen Genauigkeit möglich
  • was ist an Robustheit bzgl. ändernder Produkt Matrix, Instrumenten Drift möglich
Professionelle NIR Kalibrations Modelle
  • Jahrzehnte lange Erfahrung in Chemometrics for NIR-Spectroscopy
  • basierend auf theoretischer und angewandter Good Practice und Know How
  • Anwendung verschiedenster Richtlinien und Regeln
  • Anwendung von Hersteller unabhängiger NIR Chemometrie Software
  • Auslagerung (Outsourcing) der NIR-Kalibrations Methoden Entwicklung und NIR Kalibrations Pflege
  • Verbesserung der Robustheit von NIR-Kalibrationen
  • Vermeidung von Fallstricken und Fallgruben der komplexen Chemometrie
Detaillierte Ergebnisse
  • Der Service liefert die optimalen Kalibrations Einstellungen für ihre NIR Daten.
  • Sie erhalten vollen Einblick in die NIR Kalibration, wie sie erzeugt wird und detaillierte statistische Werte als Performance Übersicht unterstützt mit Grafiken.
Ein weiterer Aspekt des chemometrischen Modellierung Services.