Efficient adaptive retrieval and mining in large multimedia databases

Assent, Ira; Seidl, Thomas (Thesis advisor)

Aachen / Publikationsserver der RWTH Aachen University (2008) [Doktorarbeit]

Seite(n): IX, 247 S. : Ill., graph. Darst.

Kurzfassung

Multimediadaten, von Bildern über Videos bis hin zu Zeitreihen, entstehen in vielen wissenschaftlichen, kommerziellen oder privaten Anwendungen. Der Zugriff auf die zunehmend großen Datenmengen, die in Multimediadatenbanken gespeichert werden, ist eine Hauptaufgabe für die Suche ähnlicher Objekte oder für Überblicksdarstellungen des gesamten Datenbankinhalts. Beispiele sind die Kernspinresonanztomographie für diagnostische Zwecke oder automatische Ermittlung von Kundengruppen für die Verkaufsförderung. Sinnvolle Suche und Mustererkennung setzen inhaltsbasierte Methoden voraus, die die relevanten Charakteristika der Multimediadaten beschreiben. Im Gegensatz zur manuellen Verschlagwortung, die typischerweise für große Datenmengen nicht praktikabel ist, verwenden inhaltsbasierte Methoden Ähnlichkeitsmodelle um Multimediadaten zu verarbeiten. Ähnlichkeitsmodelle spezifizieren entsprechende Merkmale und deren Verhältnis für effektiven inhaltsbasierten Zugriff. Da die meisten Multimediamerkmale viele verschiedene Attribute voraussetzen, stellen die hohe Dimensionalität der Multimediamerkmale sowie die riesigen Datenbankgrößen hauptsächliche Herausforderungen für effizienten und effektiven Suchzugriff und Data Mining dar. In dieser Arbeit werden weitverbreitete Merkmalstypen für Multimediadaten untersucht: Histogramm- und Zeitreihendaten. Histogramme werden für viele verschiedene Merkmale wie Farbe, Form oder Textur genutzt. Zeitreihen sind vorherrschend im Bereich Sensormesswerte, Börsendaten und können sogar für Formen und weitere Merkmale verwendet werden. Für diese Datentypen sind effektive Ähnlichkeitsmodelle normalerweise von zu hoher Berechnungskomplexität, als daß sie in großen hochdimensionalen Multimediadatenbanken eingesetzt werden könnten. Daher werden effiziente Algorithmen für diese effektiven Modelle vorgeschlagen. Genutzt werden in dieser Arbeit Indexierungstechniken, die effiziente Anfragebearbeitung und Mining ermöglichen, indem sie den Suchraum auf die für die Aufgabe relevanten Daten beschränken. Mehrstufige Filter-und-Verfeinerungsansätze mit neuen Filterfunktionen, die Qualitätsgarantien erfüllen, stellen sicher, dass schnelle Antwortzeiten ohne Qualitätsverlust erreicht werden.

Identifikationsnummern

  • URN: urn:nbn:de:hbz:82-opus-22593
  • REPORT NUMBER: RWTH-CONV-112600