Predictive analytics and protection of massive data

Assam, Roland; Seidl, Thomas (Thesis advisor); Pedersen, Torben Bach (Thesis advisor); Hunger, Axel (Thesis advisor)

1. Aufl.. - Aachen : Apprimus-Verl. (2015, 2016)
Buch, Doktorarbeit

In: Ergebnisse aus der Informatik

Kurzfassung

Täglich wird eine Vielzahl von unterschiedlichen Daten generiert. Tragbare Geräte sind heutzutage auf dem Vormarsch und sogar in den kleinsten solcher Geräte sind meist Sensoren für z. B. Tracking verbaut. Sollte das Internet der Dinge sein volles Potential weiter entfalten, so wird die Datengenerationsrate weiter exponentiell ansteigen. Diese Datenflut erschwert nicht nur die Aufgabe der Datenanalyse sondern bedroht zudem auch den Datenschutz. Als Konsequenz fokussiert sich diese Arbeit sowohl auf Wissensextraktion als auch den Schutz dieses Wissens. Die Herausforderungen der Datenanalyse sind für ein weites Feld von Industriebranchen offenkundig. Ein Beispiel hier ist die Telekommunikationsbranche, in der Organisationen verzweifelt versuchen, Muster für den Verlust von Kunden aufzudecken oder im Bereich der Biowissenschaften, wo Wissenschaftler bestrebt sind entscheidende Muster in der DNA zu erfassen. Ein Ansatz zur Bewältigung dieser Herausforderungen ist die Verwendung von prädiktiven Analysemethoden. In dieser Arbeit wird eine große Bandbreite neuer Data Mining Lösungen zur prädiktiven Analyse vorgestellt, welche von der Positionsvorhersage über Aktivitätserkennung bis zu medizinischen Vorhersagen unter Verwendung probabilistischer, graphischer Modelle wie Markov-Ketten, Hidden Markov Models und Conditional Random Fields reichen. Ferner wird die Nutzung von Wavelets zur Erkennung von Ähnlichkeiten und Korrelationen zwischen Zeitreihen untersucht. Um die Privatsphäre eines Individuums zu schützen, werden zudem neue, verbesserte Privacy Preserving Data Mining Techniken vorgestellt, welche Nutzer und große Netzwerke anonymisieren sowie Positionen verbergen.

Identifikationsnummern

Downloads