Servicenavigation


Sie sind hier:

C7 : Statistische Komplexitätsreduktion in der molekularen Epidemiologie

Projektleitung

Prof. Dr. Dr. Hermann Bolt
Prof. Dr. Katja Ickstadt
 

Kurzbeschreibung

Zur Untersuchung chronischer Erkrankungen durch multifaktorielle Gen-Umwelt-Interaktionen tragen die Fächer Toxikologie, Molekulargenetik und Epidemiologie unter Mitarbeit klinischer Disziplinen wesentlich bei. Die große Variabilität der Sequenz des Humangenoms und moderne Technologien, die diese Sequenzvarianten mit einem hohen Durchsatz bestimmen lassen, führen in Studien über solche Gen-Umwelt-Interaktionen zu einem Aufkommen von Datenmengen, das eine Herausforderung an die Statistik in Zusammenarbeit mit den vorgenannten Disziplinen darstellt. Der Stand der Forschung auf dem Gebiet der individuell unterschiedlichen genetischen Suszeptibilität im Hinblick auf toxische Umweltbelastungen wurde im Jahre 2000 durch die Deutsche Forschungsgemeinschaft in einem Rundtischgespräch ausführlich diskutiert. Im vorliegenden Teilprojekt wird als Beispieldatensatz zur Untersuchung von Gen-Umwelt-Interaktionen eine molekular-epidemiologische Studie zu Risikofaktoren bei der Entstehung von Brustkrebs genutzt. Diese Studie läuft in dem multidisziplinären Projektverbund "GENICA" im Rahmen des Deutschen Humangenomprojekts (DHGP). Hierbei handelt es sich um eine bevölkerungsbasierte Fall-Kontroll-Studie, in der der Einfluss genetischer Polymorphismen fremdstoffmetabolisierender Enzyme und weiterer für den Brustkrebs relevanter Faktoren auf die Entstehung und Prognose des Mammakarzinoms geprüft wird. Dabei werden mehr als 100 Sequenzvarianten in rund 50 Genen untersucht. Die Rekrutierung von 600 Fällen und 600 Kontrollen aus der Region Bonn lief zunächst bis Mitte 2002. Eine Verlängerung des GENICA-Projekts bis Mitte 2004 erlaubt jetzt die Einbeziehung von insgesamt 1000 Fällen und 1000 Kontrollen. Bei ca. 100 untersuchten genetischen Varianten ergibt sich somit aus dieser Studie ein Datenaufkommen von 200.000 untersuchten genetischen Einzelmerkmalen sowie dazu gehörende klinische und anamnestische Daten. Im Rahmen der GENICA-Studie ist lediglich eine deskriptive Analyse, aber keine weiterführende statistische Auswertung vorgesehen. Diese, verknüpft mit entsprechender Methodenentwicklung, wird innerhalb dieses Teilprojekts geleistet. Die Untersuchung von genetischen Varianten bildet dabei innerhalb der Statistik momentan ein wachsendes und aktives Forschungsgebiet. Auf diesem Hintergrund werden in diesem Teilprojekt statistische Verfahren zur Komplexitätsreduktion adaptiert und entwickelt, um die für die Entstehung von Brustkrebs relevanten Einflussfaktoren und Gen-Umwelt-Interaktionen aus der potentiell sehr großen Zahl von Faktoren und Faktorkombinationen zu bestimmen. Im Vordergrund stehen dabei clusteranalytische Methoden und Klassifikationsverfahren. Ziel bei der Weiterentwicklung der clusteranalytischen Methoden ist es, in den genetischen Varianten bzw. deren Kombinationen Muster zu finden. Bei der Adaption von Klassifikationsverfahren (z.B. Logic Regression, Multifactor Dimensionality Reduction, CART) liegt das Hauptaugenmerk darauf, bestmöglich zwischen Fällen und Kontrollen zu unterscheiden.
 

Arbeitspakete

  • Clusterfindung
  • Inter- und Intra-Cluster-Interaktionen
  • Klassifikation
  • Gen-Umwelt-Interaktionen
  • Haplotyping

 

Veröffentlichungen

Die Veröffentlichungen des Projekts finden Sie hier.

 

 

Workshops

Statistical Methods in Molecular Epidemiology (SMiME) 

 

Vorträge

Die Vorträge des Projekts finden Sie hier.
 

Kooperationen