english

Die Technologieplattform Pattern Expert

Ziel der Firma PATTERN EXPERT ist es, für und mit ihren Kunden intelligente Produkte - Software - und Dienstleistungen zu entwickeln. Dabei bedient sich die Firma ihrer proprietären Technologieplattform Pattern Expert. Pattern Expert beinhaltet Verfahren der Mustererkennung, des maschinellen Lernens, der Neuroinformatik und der künstlichen Intelligenz. Als Beispiele seien genannt: Bayes'sche Klassifikatoren, künstliche neuronale Netze und Verfahren der Merkmalsbewertung und der Merkmalsauswahl.

+ Funktionsweise

- Funktionsweise

In der Mustererkennung versucht man, in Daten homogene Muster oder Ähnlichkeiten zu erkennen und dieses Wissen auf neue unbekannte Daten anzuwenden, was man mit generalisieren bezeichnet. Der Ähnlichkeitsbegriff steht dabei an ganz zentraler Stelle. Im konkreten Anwendungsfall geht es immer darum, welches ähnliche Objekte sind und worin sich ihre Ähnlichkeit auszeichnet.

Numerische Verfahren der Mustererkennung, im Gegensatz zu den regelbasierten Verfahren, die in Pattern Expert nicht enthalten sind, können mathematisch mit Hilfe des Funktionsbegriffes beschrieben werden, deshalb werden sie auch numerische Verfahren genannt. Die zu untersuchenden Objekte werden mit Hilfe von Eigenschaften, Merkmale genannt, beschrieben. Jedem Objekt entspricht also ein n-Tupel von Zahlen, üblicherweise von reellen Zahlen. Jedem dieser n-Tupel wird dann eine Klasse Y zugeordnet. Die Zahl Y kann aus einer endlichen Menge, dann sprechen wir von einem Klassifikationsproblem, oder aus der Menge der reellen Zahlen ausgewählt werden, dann sprechen wir von einem Regressionsproblem.

Y=f(x1,...,xn)

Für eine Lernmenge sei die Funktion f vorgegeben. Gesucht ist nun eine Funktion F, die auf der Lernmenge möglichst gut mit der Funktion f übereinstimmt, und ausserhalb der Lernmenge möglichst sinnvolle Vorhersagen macht. Die Funktion F bezeichnet man traditionell auch als Klassifikations- oder Regressionsalgorithmus.

Die Qualität der Generalisierung überprüft man dadurch, indem man die Funktion F auf einer Testmenge, für die f bekannt ist, berechnet und die Funktionswerte vergleicht. Wie man nun die Ergebnisse vergleicht, bzw. die Fehler auszählt, ist im speziellen Fall nicht so einfach zu entscheiden. Zum Beispiel in der Medizin sind falsch positive Diagnosen, der Patient ist gesund aber ein Diagnosetest liefert ein positives Ergebnis, anders zu bewerten als ein falsch negatives Ergebnis, wobei der Patient zwar krank ist, der Test jedoch negativ ausfällt.

Wie man nun einen solchen Klassifikationsalgorithmus F berechnet, das ist Sache der Lernverfahren.

Wir wollen dies an einem einfachen Beispiel demonstrieren. In Wahrheit ist die Sache meist viel komplizierter, deshalb macht es ja Sinn, dass sich zum Beispiel Firmen auf solche Methoden spezialisieren.

Der einfachste Fall ist in der Abbildung dargestellt. Die Objekte sind in der Ebene der reellen Zahlenebene angeordnet. Gesucht ist nun eine möglichst einfache Funktion, die die zwei Klassen, als Kreise und Dreiecke kenntlich gemacht, möglichst gut trennt. Die Gerade Y=F(x1,x2) erfüllt offenbar diesen Zweck schon recht gut. Lernverfahren, wie man also solch eine Gerade findet, sind ein sehr gutes Beispiel, um die allgemeinen Prinzipien des maschinellen Lernens zu erklären. Von dieser einfachen Idee ausgehend kann man zum Beispiel sehr schön die bekannten Support Vector Machines - SVM - erklären.
Lernverfahren für künstliche neuronale Netze und Bayes'sche Klassifikatoren sind in der Literatur ausreichend beschrieben worden, so dass es an dieser Stelle nur eine Wiederholung bekannter Tatsachen wäre. Jedoch ist es oft ein sehr weiter Weg bis man zu ausgereiften implementierten Methoden kommt.

Für die Praxis ist neben den geeigneten Lernverfahren oft die Auswahl und Entwicklung geeigneter Merkmale der ausschlaggebende Erfolgsfaktor. Bewertungsverfahren, auch Merkmals-Scores genannt, sind bei der Auswahl und Entwicklung geeigneter Merkmale oft sehr hilfreich. In Pattern Expert sind eine Reihe solcher Methoden implementiert. Die Merkmals-Scores sind für unterschiedliche Anwendungsgebiete unterschiedlich geeignet. So sind für SNP-Analysen völlig andere Merkmals-Scores notwendig, als zum Beispiel für die Analyse von Aktivitätsmustern von lebenden Nervenzellen. Als Beispiele für Scores seien der Fisher-Score und die "mutual information divergence" - MID - genannt.

+ Die Vorteile

- Die Vorteile

Der Entwicklungsprozess von intelligenten Methoden erfordert sehr viel Erfahrung und ist sehr zeitaufwendig. Pattern Expert wurde an einer Vielzahl von Beispielen aus den unterschiedlichsten Anwendungsgebieten entwickelt und getestet und mit veröffentlichten und nicht veröffentlichen Ergebnissen verglichen. In diesem Sinne kann eine hohe Qualität der Ergebnisse garantiert werden.
Für praktische Entwicklungen ist der Zeitfaktor ebenfalls sehr wichtig. In Pattern Expert sind eine Reihe von Verfahren zur Optimierung von Merkmalen und zur Parametrisierung von Lernverfahren implementiert, die weitgehend einen automatischen Entwicklungsprozess unterstützen. Diese Verfahren können in Applikationen mittels einer speziellen Skriptsprache genutzt werden. Damit ist es möglich, dass der Anwender sehr komplexe Entwicklungen aus seiner Anwendung startet, ohne dass er diese im einzelnen steuern und verstehen muss.

+ Anwendungsbereiche

- Anwendungsbereiche

Die Firma PATTERN EXPERT hat umfangreiche Erfahrungen auf den Gebieten der Bilderkennung, Bioinformatik und Spektroskopie gesammelt. Hier eine Auflistung der wichtigsten Beispiele:

Pattern Expert kann auch in folgenden Anwendungsbereichen, wie Data-Mining, Patternanalyse, Such- und Retrievalverfahren eingesetzt werden.