Bioinformatik

Die Arbeitsgruppe Bioinformatik entwickelt und etabliert computergestützte Methoden zur Identifikation und Verifizierung neuer Biomarker für die personalisierte Diagnose und Prognose von Erkrankungen sowie zur Detektion neuer therapeutischer Targets.

Erst seit wenigen Jahren ist bekannt, dass eine Vielzahl von RNA-Molekülen nicht in Proteine übersetzt werden. Neueste wissenschaftliche Erkenntnisse zeigen, dass diese nicht-proteinkodierenden RNAs (ncRNAs) feinregulatorische Aufgaben in der Genregulation wahrnehmen und somit als Marker für individuelle Krankheitsbilder und Krankheitsverläufe geeignet sind. Die Arbeitsgruppe entwickelt Strategien zur effizienten Verarbeitung und (statistischen) Auswertung von molekularbiologischen Daten, die aus umfangreichen klinischen Kohorten, basierend auf Next-Generation-Sequencing, Microarrays, sowie der DNA-, RNA- und epigenetischen Analytik gewonnen werden, um krankheitsrelevante ncRNAs zu detektieren. Unter Verwendung von Methoden aus der Systembiologie und RNA-Bioinformatik werden genregulatorische Wirkungsweisen von ncRNAs modelliert.

Unser Ziel ist es, das Potenzial dieser neuartigen RNA-Moleküle als Biomarker oder als therapeutische Targets zu analysieren und sie als entsprechende Marker oder Targets zu etablieren.

  • Analyse von Next-Generation Sequenzierungen mittels einer eigens entwickelten Pipeline zur strukturierten und dokumentierten Verarbeitung und Auswertung
  • RNA-Bioinformatik
  • Design von Custom Expression Microarrays
  • Analyse von Expression Microarray Daten
  • Statistische Lernverfahren zur Detektion von Biomarkern
  • Systembiologie, um den genregulatorischen Mechanismus von langen nicht-protein kodierenden RNAs aufzudecken

RNA Biomarker Discovery

Die Arbeitsgruppe Bioinformatik ist Mitglied von RIBOLUTION – Integrierte Plattform für die Identifizierung und Validierung innovativer RNA-basierter Biomarker für die Personalisierte Medizin – ein von der Fraunhofer Zukunftsstiftung geförderten Forschungsverbund. Wir detektieren und etablieren RNA-basierte Biomarker, die als zuverlässige Indikatoren für eine Erkrankung bzw. für deren Verlauf geeignet sind. In diesem Kontext sind wir für die Speicherung, computergestützte Verarbeitung und statistischen Auswertung der durch modernste Messverfahren gewonnenen molekularbiologischen Hochdurchsatzdaten verantwortlich. Die von uns umgesetzten Prozesse decken den gesamten Daten-Lebenszyklus im Biomarker Discovery Bereich, beginnend von der Datenerzeugung, primären und sekundären Analyse bis hin zur medizinischen Wissensgenerierung, ab. Alle Software-Konzepte werden unter Berücksichtigung von Standards im Qualitätsmanagement implementiert. Durch den Zugriff auf ein High-Performance Computing Cluster können auch rechenintensive Lösungen, die aufgrund der Datenmenge und Datenvielfalt anfallen, effizient realisiert werden.

Computational RNA Biology

Seit einigen Jahren ist bekannt, dass RNA-Moleküle nicht nur ausschließlich Erbinformation der DNA in Aminosäuresequenzen übermitteln, sondern selbst umfangreiche regulatorische Funktionen wahrnehmen. Nicht-protein kodierende RNAs werden dabei in zwei grobe Gruppen unterteilt, ncRNAs mit einer Nukleotid-Sequenzlänge von weniger als 200 nt (kurze ncRNAs) und den neuartigen langen ncRNAs, die eine Sequenzlänge von mehr als 200 nt aufweisen. Die genregulatorischen Mechanismen der kurzen ncRNAs, wie z.B. miRNAs und snoRNAs, sind meist sehr gut aufgeklärt, während für die Gruppe der langen ncRNAs Funktionen nur exemplarisch beschrieben sind. Studien zu individuellen langen ncRNAs haben gezeigt, dass sie zentrale zelluläre Prozesse, wie Transkription und Translation, kontrollieren. Darüber hinaus sind sie auch in subzellulärer Lokalisierung, in den Aufbau zellulärer räumlicher Strukturen und in die Steuerung epigenetischer Modifikationen involviert. Wir und andere konnten zeigen, dass lange ncRNAs in verschiedenen Geweben und krankheitsassoziierten Signalwegen spezifisch reguliert sind. Neuartige Therapien basierend auf langen ncRNAs könnten somit spezifischer wirken und geringere Nebenwirkungen aufweisen als herkömmliche Ansätze. Mit Methoden aus der RNA-Bioinformatik und Systembiologie, wie die Vorhersage, Modellierung und Klassifizierung von RNA-Sekundärstrukturmotiven, sowie durch Evolutions- und Transkriptionsstudien adressieren wir die Fragestellung über welche genregulatorischen Mechanismen die als Biomarker identifizierten langen ncRNAs zelluläre Prozesse steuern, und inwieweit diese als therapeutische Targets geeignet sind.

Optimierung der Verarbeitung und Analyse von Sequenzierdaten für klinische Routineanwendungen

Der labortechnische sowie der bioinformatische Zeitaufwand für die Erzeugung, Prozessierung und Auswertung von Hochdurchsatz-Sequenzierdaten beträgt derzeit mehrere Tage. Während die labortechnische Datenerzeugung mittels neuer Sequenziermethoden kontinuierlich verkürzt wird, sind solche Optimierungen für die Datenanalyse kaum umgesetzt. Dies wirkt sich auf klinische Routineanwendungen nachteilig aus, da Wartezeiten bis zur Therapieentscheidung unnötig lang sind. Ziel ist es, die Analyse von Sequenzierdaten dahingehend zu optimieren, dass sie in klinischen Routineanwendungen einsetzbar ist. Eine von uns entwickelte Analyse-Pipeline entspricht höchsten Qualitätskriterien, denn sie stellt zu jedem Zeitpunkt die Verfügbarkeit, die Integrität, die Vertraulichkeit und die Authentizität der Daten sicher.

Ausgewählte abgeschlossene Projekte

Entwicklung eines Custom Expression Microarrays für eine effiziente und kostengünstige Analyse der Expressionsmuster tumorassoziierter RNAs. Mithilfe des Custom Expression Microarrays konnten wir zeigen, dass eine Vielzahl von langen nicht-kodierenden RNAs im Mammakarzinom und Glioblastom signifikant reguliert und somit als Biomarker geeignet sind.

  • Hackermüller J, Reiche K, Otto C, Hösler N, Blumert C, Brocke-Heidrich K, Böhlig L, Nitsche A, Kasack K, Ahnert P, Krupp W, Engeland K, Stadler PF, Horn F. Cell cycle, oncogenic and tumor suppressor pathways regulate numerous long and macro non-protein-coding RNAs. Genome Biol. 2014 Mar 4;15(3):R48.
  • Reiche K, Kasack K, Schreiber S, Lüders T, Due EU, Naume B, Riis M, Kristensen VN, Horn F, Børresen-Dale AL, Hackermüller J, Baumbusch LO. Long non-coding RNAs differentially expressed between normal versus primary breast tumor tissues disclose converse changes to breast cancer-related protein-coding genes. PLoS One. 2014 Sep 29;9(9):e106076.
  • Arnold C, Externbrink F, Hackermüller J, Reiche K. CEMDesigner: Design of custom expression microarrays in the post-ENCODE Era. Journal of Biotechnology. 2014 Nov 10;189:154-6. DOI dx.doi.org/10.1016/j.jbiotec.2014.09.012

 

Die Analyse von transkriptomweiten Expressionsstudien ergab, dass lange nicht-kodierende RNAs nicht nur spezifisch exprimiert, sondern auch spezifischer als protein-kodierende Gene, durch krankheitsrelevante Signalwege reguliert werden.

  • Hackermüller J, Reiche K, Otto C, Hösler N, Blumert C, Brocke-Heidrich K, Böhlig L, Nitsche A, Kasack K, Ahnert P, Krupp W, Engeland K, Stadler PF, Horn F. Cell cycle, oncogenic and tumor suppressor pathways regulate numerous long and macro non-protein-coding RNAs. Genome Biol. 2014 Mar 4;15(3):R48.

 

Entwicklung eines Algorithmus (TileShuffle) zur effizienten Analyse von transkriptomweiten Expressionsdaten, die mittels Tiling Arrays gemessen worden. Uns war es möglich mittels Permutationen die Verteilung der Hintergrundsignale unter Berücksichtigung von sondenspezifischen Artefakten besser als andere Methoden zu schätzen. Somit erreichen wir eine höhere Sensitivität bei gleichbleibender Spezifität.

  • Otto C, Reiche K, Hackermüller J. Detection of differentially expressed segments in tiling array data. Bioinformatics. 2012 Jun 1;28(11):1471-9.

  • High-Performance Computing Cluster

  • Helmholtz-Zentrum für Umweltforschung GmbH – UFZ, Leipzig
  • Helmholtz-Zentrum für Umweltforschung GmbH – UFZ, Department Bioanalytische Ökotoxikologie, Leipzig
  • Helmholtz-Zentrum für Umweltforschung GmbH – UFZ, Department Molekulare Systembiologie, Proteomics, Leipzig
  • Oslo University Hospital, Institute for Cancer Research, Oslo, Norwegen
  • Universität Leipzig, Professur für Bioinformatik, Leipzig
  • Universität Leipzig / Technische Universität Dresden, Competence Center for Scalable Data Services and Solutions ScaDS, Leipzig
  • Universitätsklinikum Carl Gustav Carus Dresden, Klinik und Poliklinik für Urologie, Dresden
  • University of Oslo, Faculty of Medicine, Institute of Basic Medical Sciences, Oslo, Norwegen
  • Fraunhofer-Institut für Grenzflächen- und Bioverfahrenstechnik IGB, Abteilung Molekulare Biotechnologie, Stuttgart

  • Kirsten H, Al-Hasani H, Holdt L, Gross A, Beutner F, Krohn K, Horn K, Ahnert P, Burkhardt R, Reiche K, Hackermüller J, Löffler M, Teupser D, Thiery J, Scholz M. Dissecting the genetics of the human transcriptome identifies novel trait-related trans-eQTLs and corroborates the regulatory relevance of non-protein coding loci. Hum Mol Genet. 2015 May 27.
  • Nitsche A, Rose D, Fasold M, Reiche K, Stadler PF. Comparison of splice sites reveals that long noncoding RNAs are evolutionarily well conserved. RNA. 2015 May;21(5):801-12.
  • Arnold C, Externbrink F, Hackermüller J, Reiche K. CEMDesigner: Design of custom expression microarrays in the post-ENCODE Era. Journal of Biotechnology. 2014 Nov 10;189:154-6. DOI http://dx.doi.org/10.1016/j.jbiotec.2014.09.012
  • Hackermüller J, Reiche K, Otto C, Hösler N, Blumert C, Brocke-Heidrich K, Böhlig L, Nitsche A, Kasack K, Ahnert P, Krupp W, Engeland K, Stadler PF, Horn F. Cell cycle, oncogenic and tumor suppressor pathways regulate numerous long and macro non-protein-coding RNAs. Genome Biol. 2014 Mar 4;15(3):R48.
  • Reiche K, Kasack K, Schreiber S, Lüders T, Due EU, Naume B, Riis M, Kristensen VN, Horn F, Børresen-Dale AL, Hackermüller J, Baumbusch LO. Long non-coding RNAs differentially expressed between normal versus primary breast tumor tissues disclose converse changes to breast cancer-related protein-coding genes. PLoS One. 2014 Sep 29;9(9):e106076.
  • Boll K, Reiche K, Kasack K, Mörbt N, Kretzschmar AK, Tomm JM, Verhaegh G, Schalken J, von Bergen M, Horn F, Hackermüller J. MiR-130a, miR-203 and miR-205 jointly repress key oncogenic pathways and are downregulated in prostatecarcinoma. Oncogene. 2013 Jan 17;32(3):277-85.
  • Otto C, Reiche K, Hackermüller J. Detection of differentially expressed segments in tiling array data. Bioinformatics. 2012 Jun 1;28(11):1471-9.
  • Tramontano A, Donath A, Bernhart SH, Reiche K, Böhmdorfer G, Stadler PF, Bachmair A. Deletion analysis of the 3' long terminal repeat sequence of plant retrotransposon Tto1 identifies 125 base pairs redundancy as sufficient for first strand transfer. Virology. 2011 Mar 30;412(1):75-82.
  • Sharma CM, Hoffmann S, Darfeuille F, Reignier J, Findeiss S, Sittka A, Chabas S, Reiche K, Hackermüller J, Reinhardt R, Stadler PF, Vogel J. The primary transcriptome of the major human pathogen Helicobacter pylori. Nature. 2010 Mar 11;464(7286):250-5.
  • Kaczkowski B, Torarinsson E, Reiche K, Havgaard JH, Stadler PF, Gorodkin J. Structural profiles of human miRNA families from pairwise clustering. Bioinformatics. 2009 Feb 1;25(3):291-4.
  • Rose D, Hertel J, Reiche K, Stadler PF, Hackermüller J. NcDNAlign: plausible multiple alignments of non-protein-coding genomic sequences. Genomics. 2008 Jul;92(1):65-74.
  • Rose D, Jöris J, Hackermüller J, Reiche K, Li Q, Stadler PF. Duplicated RNA genes in teleost fish genomes. J Bioinform Comput Biol. 2008 Dec;6(6):1157-75.
  • Athanasius F Bompfünewerer Consortium, Backofen R, Bernhart SH, Flamm C, Fried C, Fritzsch G, Hackermüller J, Hertel J, Hofacker IL, Missal K, Mosig A, Prohaska SJ, Rose D, Stadler PF, Tanzer A, Washietl S, Will S. RNAs everywhere: genome-wide annotation of structured RNAs. J Exp Zool B Mol Dev Evol. 2007 Jan 15;308(1):1-25.
  • ENCODE Project Consortium. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project. Nature. 2007 Jun 14;447(7146):799-816.
  • Reiche K, Stadler PF. RNAstrand: reading direction of structured RNAs in multiple sequence alignments. Algorithms Mol Biol. 2007 May 31;2:6.
  • Rose D, Hackermüller J, Washietl S, Reiche K, Hertel J, Findeiss S, Stadler PF, Prohaska SJ. Computational RNomics of drosophilids. BMC Genomics. 2007 Nov 8;8:406.
  • Snyder M, Gerstein MB, Reymond A, Hofacker IL, Stadler PF. Structured RNAs in the ENCODE selected regions of the human genome. Genome Res. 2007 Jun;17(6):852-64.
  • Washietl S, Pedersen JS, Korbel JO, Stocsits C, Gruber AR, Hackermüller J, Hertel J, Lindemeyer M, Reiche K, Tanzer A, Ucla C, Wyss C, Antonarakis SE, Denoeud F, Lagarde J, Drenkow J, Kapranov P, Gingeras TR, Guigó R, Will S, Reiche K, Hofacker IL, Stadler PF, Backofen R. Inferring noncoding RNA families and classes by means of genome-scale structure-based clustering. PLoS Comput Biol. 2007 Apr 13;3(4):e65.
  • Hertel J, Lindemeyer M, Missal K, Fried C, Tanzer A, Flamm C, Hofacker IL, Stadler PF; Students of Bioinformatics Computer Labs 2004 and 2005. The expansion of the metazoan microRNA repertoire. BMC Genomics. 2006 Feb 15;7:25.
  • Missal K, Cross MA, Drasdo D. Gene network inference from incomplete expression data: transcriptional control of hematopoietic commitment. Bioinformatics. 2006 Mar 15;22(6):731-8.
  • Missal K, Zhu X, Rose D, Deng W, Skogerbø G, Chen R, Stadler PF. Prediction of structured non-coding RNAs in the genomes of the nematodes Caenorhabditis elegans and Caenorhabditis briggsae. J Exp Zool B Mol Dev Evol. 2006 Jul 15;306(4):379-92.
  • Missal K, Rose D, Stadler PF. Non-coding RNAs in Ciona intestinalis. Bioinformatics. 2005 Sep 1;21.
  • Bompfünewerer AF, Flamm C, Fried C, Fritzsch G, Hofacker IL, Lehmann J, Missal K, Mosig A, Müller B, Prohaska SJ, Stadler BM, Stadler PF, Tanzer A, Washietl S, Witwer C. Evolutionary patterns of non-coding RNAs. Theory Biosci. 2005 Apr;123(4):301-69.