Learning comprehensible models for analysis and predictions in scientific databases

Zimmer, Anca M.; Seidl, Thomas (Thesis advisor)

1. Aufl.. - Aachen : Apprimus-Verl. (2014)
Doktorarbeit

In: Ergebnisse aus der Informatik 2
Seite(n)/Artikel-Nr.: III, 193 S. : Ill., graph. Darst.

Kurzfassung

Eine effiziente Bearbeitung und Analyse von experimentellen Messungen ist ein wesentlicher Bestandteil der Forschung und Entwicklung in einer Vielzahl von Disziplinen (z.B. Maschinenbau, Chemie, Biologie). Forscher führen Experimente durch und ziehen Schlussfolgerungen basierend auf ihre Beobachtungen. Der aktuelle Stand der Technologie erlaubt es, riesige Datenbestände zu sammeln, die dann ausgewertet werden müssen. In der Umweltforschung werden drahtlose Sensor-Netzwerke verwendet, um Daten an räumlich und zeitlich diskreten Positionen zu sammeln. Im Maschinenbau werden komplexe Prüfstände aufgebaut und Beobachtungen werden aufgezeichnet. Die Forscher streben sowohl nach einer effizienten und effektiven Untersuchung der Ergebnisse, als auch nach der Identifikation von Korrelationen innerhalb der gemessenen Daten. Typischerweise werden analytische Funktionen verwendet, um die experimentellen Daten zu modellieren. Solche Modelle bieten eine kompakte und intuitive Darstellung der zugrunde liegenden Prozesse. Daher können Vorhersagen für Betriebspunkte gemacht werden, für die keine Messungen bereitgestellt wurden. Eine Klasse solcher Modelle sind (stückweise) lineare Funktionen, die üblicherweise in wissenschaftlichen Datenbanken eingesetzt werden, um die Daten darzustellen und Vorhersageanfragen zu beantworten. Diese Arbeit behandelt Techniken zur Identifizierung stückweise linearer Modelle durch den Aufbau von Regressionsbäumen. Neue algorithmische Lösungen für den Aufbau kompakter und gleichzeitig genauer Modelle werden eingeführt und evaluiert. Darüber hinaus wird, bei der Verfügbarkeit solcher Modelle in wissenschaftlichen Datenbanken, das Konzept von inversen Vorhersageanfragen präsentiert und eine vielfalt von Anfragen neu eingeführt.

Identifikationsnummern