Global gene expression profile mining in stem cells and their progeny

Ruau, David; Zenke, Martin (Thesis advisor)

Aachen / Publikationsserver der RWTH Aachen University (2009) [Doktorarbeit]

Seite(n): 125 S. : Ill., graph. Darst.

Kurzfassung

Die heutigen biologischen Erkenntnisse stützen sich vor allem auf die technologischen Fortschritte der lezten 30 Jahre. Zur selben Zeit hat sich die Art und Weise, ein biologisches Problem anzugehen, verändert, in dem man auf ein globales Verständnis der zu untersuchenden Systeme hinarbeitet. Die Technik der DNA microarrays erlaubt es, Fragestellungen auf Genomebene zu beantworten. Die Erstellung eines globalen Genexpressionsprofils ist die häufigste Anwendung von DNA microarrays. In dieser Arbeit wurde diese Methode angewandt, um ein besseres, globales Verständnis für die Differenzierung verschiedener Zelltypen unter unterschiedlichsten experimentellen Bedingungen zu erforschen. In dieser Arbeit habe ich (1) DNA microarray Daten mit Hilfe unterschiedlicher Methoden bearbeitet, um neue Gensignaturen in Stammzelldifferenzierung und „Reprogramming“ zu identifizieren und (2) einen Arbeitsablauf für semantische Annotation von DNA microarrays aus öffentlich zugänglichen Datenbanken entwickelt. Dendritische Zellen (DC) wurden mit TGF-beta behandelt und einer globalen Genexpressionsanalys zugeführt. DC stammen von hämatopietischen Stammzellen. Sie initiieren Immunität und induzieren antigen-spezifische Toleranz in der Körperabwehr, daher sind diese Zellen besonders für zellbasierende Therapieansätze von Interesse. In dieser Studie wurden Schlüsselgene aufgedeckt, die bei der Reaktion der dendritischen Zelle auf TGF-beta eine Rolle spielen. Die Chromatinstruktur kann die Genexpression bestimmen und somit auch die Zellidentität und das Zellschicksal. Daher können Substanzen, die die DNA- Methylierung und die Histonacetylierung beeinflussen, die Chromatinstruktur modifizieren, so dass ein erweitertes Entwicklungspotential von zum Beispiel neuralen Stammzellen möglich ist. Microarray Analysen offenbarten die Induktion von Pluripotenz und pluripotenz-assoziierten Genen durch solche Substanzen, und somit eine mögliche Erklärung des veränderten Potentials dieser Zellen. Pluripotente Stammzellen, einschließlich embryonale Stammzellen (ESC), sind in der Lage alle Zelltypen des Körpers zu generieren. Auch wenn die Eigenschaften pluripotenter Stammzellen besonders attraktiv für medizinische Zwecke sind, haben die Isolation und Kultivierung solcher Zellen ethische und technische Bedenken hervorgerufen. Daher haben sich alternative Methoden für die Generierung ES-ähnlicher Zellen von somatischen Zellen oder adulten Stammzellen entwickelt. Die medizinische und wissenschaftliche Anwendung solcher Zellen ist sehr vielversprechend. Genexpressionsprofile von induzierten pluripotenten Stammzellen (iPS Zellen), generiert entweder durch zwei oder vier „reprogramming“ Transkriptionsfaktoren (Oct4 und Klf4 oder Oct4, Klf4, Sox2 und c-Myc), zeigen eine genomische Signatur, die den ESC ähnlich ist. Die Anwendung von DNA microarrays für genomweite Studien bringt eine enorme Menge an Daten mit sich, die in öffentlichen Datenbanken gespeichert sind. Die Beschreibung der Daten erfolgt jedoch in freiem Text. Es ist Aufgabe der Forscher diese Daten mit verständlichen Labeln zu beschreiben, um eine Zuordnung von Experimenten und Anfragen darauf zu ermöglichen. Das Verknüpfen von verschiedenen Informationsquellen benötigt ein einheitliches Vokabular, wie z.B. biomedizinische Ontologien, auf das sich alle Beteiligten geeinigt haben. Ontologien organisieren Informationen in einem definierten Netzwerk von Relationen. In dieser Arbeit wurde ein Arbeitsablauf erstellt, um öffentlich zugängliche microarray Datensätze semantische zu annotieren. Dazu wurden Daten aus Gene Expression Omnibus (GEO), der größten öffentlichen Datenbank für DNA microarrays, extrahiert und mit Hilfe unterschiedlicher Ontologien annotiert. Zur Anwendung kamen dabei „Textmining“, „Outlier Detection“ und „Label Propagation“ Techniken. Label Propagation überträgt dabei Label von bereits annotierten auf noch nicht beschriebene Datensätze, anhand der Ausprägung von Expressionsprofilen, um die Menge an korrekt annotierten Datensätzen zu erhöhen. Integrative Bioinformatik, beschäftigt sich mit einem solchen Zusammenbringen von unterschiedlichen Datentypen, um neue Zusammenhänge unter anderem zwischen Krankheiten, deren Ausprägungen und Genexpressionsprofilen aufzudecken, und wird von dieser Art der standardisierten Annotierung profitieren.

Identifikationsnummern

  • URN: urn:nbn:de:hbz:82-opus-28118
  • REPORT NUMBER: RWTH-CONV-113341