Bioinformatik

Die Arbeitsgruppe Bioinformatik entwickelt und etabliert computergestützte Methoden zur Identifikation und Verifizierung neuer Biomarker für die personalisierte Diagnose und Prognose von Erkrankungen sowie zur Detektion neuer therapeutischer Targets.

Erst seit wenigen Jahren ist bekannt, dass eine Vielzahl von RNA-Molekülen nicht in Proteine übersetzt werden. Neueste wissenschaftliche Erkenntnisse zeigen, dass diese nicht-proteinkodierenden RNAs (ncRNAs) feinregulatorische Aufgaben in der Genregulation wahrnehmen und somit als Marker für individuelle Krankheitsbilder und Krankheitsverläufe geeignet sind. Die Arbeitsgruppe entwickelt Strategien zur effizienten Verarbeitung und (statistischen) Auswertung von molekularbiologischen Daten, die aus umfangreichen klinischen Kohorten, basierend auf Next-Generation-Sequencing, Microarrays, sowie der DNA-, RNA- und epigenetischen Analytik gewonnen werden, um krankheitsrelevante ncRNAs zu detektieren. Unter Verwendung von Methoden aus der Systembiologie und RNA-Bioinformatik werden genregulatorische Wirkungsweisen von ncRNAs modelliert.

Unser Ziel ist es, das Potenzial dieser neuartigen RNA-Moleküle als Biomarker oder als therapeutische Targets zu analysieren und sie als entsprechende Marker oder Targets zu etablieren.

  • Analyse von Next-Generation Sequenzierungen mittels einer eigens entwickelten Pipeline zur strukturierten und dokumentierten Verarbeitung und Auswertung
  • RNA-Bioinformatik
  • Design von Custom Expression Microarrays
  • Analyse von Expression Microarray Daten
  • Statistische Lernverfahren zur Detektion von Biomarkern
  • Systembiologie, um den genregulatorischen Mechanismus von langen nicht-protein kodierenden RNAs aufzudecken

Prognostische Biomarker für Prostatakrebs

Prostatakrebs ist innerhalb Europas die häufigste Krebsart und dritthäufigste tödliche Krebserkrankung bei Männern. Die klinische Auswirkung lokal begrenzter Prostatakarzinome ist äußerst variabel. Einige Patienten leiden an einer sehr aggressiven Form, die rasch zum Tode führt. Viele andere jedoch haben eine indolente (träge) Variante, die mittels Therapie geheilt oder unbedenklich beobachtet werden könnte. Patienten werden oftmals unnötigen Operationen unterzogen, da klinische und histopathologische Risiko­faktoren sowie bisherige Biomarker und entsprechende Klassifikations­modelle unzureichend genau sind. Es besteht daher ein hoher Bedarf nach Biomarkern, die eine frühzeitige Prognose für den klinischen Verlauf von Prostatakrebs ermöglichen.

Um dies zu adressieren, werden am Fraunhofer IZI die zugrundeliegenden molekularen Mechanismen in Prostatakarzinomen analysiert. Es wurden Veränderungen im Transkriptom untersucht, um Gensignaturen von protein-kodierenden und nicht-protein kodierenden Genen zu identifizieren, die eine prognostische Aussage ermöglichen. Dazu wurden frisch eingefrorene Proben von radikalen Prostatektomien herangezogen und mit formalinfixierten paraffin­eingebetteten Proben einer radikalen Prostatektomie sowie Biopsien abgeglichen.

Das Transkriptom von mehr als zweihundert Gewebeproben von Prostatakrebspatienten unter klinischer Langzeit­beobachtung wurden mittels transkriptomweiter Sequen­zierung und Genexpressions-Microarrays bewertet. Es wurde eine Überlebenszeitanalyse durchgeführt, um die Expression einzelner Gene mit dem klinischen Verlauf abzugleichen. Mittels einer statistischen Meta-Analyse wurde die daraus gewonnene Evidenz für einzelne Gene auf verschiedene Arten von Probenmaterial übertragen. Für jeden Patienten wurden alle selektierten Gene in einem prognostischen Genexpressions-Score zusammengeführt. Dieser kombinierte Score zeigte sehr gute prognostische Effekte und korrelierte mit den Überlebenszeiten der Patienten. Der prognostische Score konnte anhand einer unabhängigen Testkohorte mit repräsentativer Stichprobengröße bestätigt werden und zeigte zudem eine Korrelation mit der Zeit zum bio­chemischen Rezidiv.

Es wurde ein transkriptombasierter Score entwickelt, der aggressive Formen von Prostatakrebs innerhalb einer Kohorte von Patienten identifiziert, die mittels radikaler Prostatek­tomie behandelt wurden. Weiterhin wurde der Score anhand von Gewebeproben einer unabhängigen Patientenkohorte bestätigt. Der Score eignet sich zur Unterstützung der klinischen Entscheidungsfindung für Patienten mit diagnostiziertem Prostatakarzinom. Gegenwärtig wird der Score anhand weiterer Gewebeproben, die klinischem Routine­material entsprechen, bestätigt.

Verbesserung von Diagnose und Behandlung bei Prostatakrebs durch Big Data Analysen

Das Fraunhofer IZI ist seit 2018 aktives Mitglied des EU-Konsortiums PIONEER (Prostate Cancer DIagnOsis and TreatmeNt Enhancement through the Power of Big Data in EuRope’), einem Exzellenzcluster für Big Data Analysen bei Prostatakrebs. Das Konsortium umfasst 32 Partner aus neun europäischen Ländern. Ziel der Zusammenarbeit ist es, durch die Generierung und Analyse großer wissenschaftlicher und klinischer Datenmengen die Versorgung von Prostatakrebspatienten zu verbessern. Eine zentrale Rolle kommt dabei der Standardisierung und Integration existierender Daten verschiedenster Quellen zu, die zu Forschungszwecken in einer innovativen Open Access Plattform zusammengefasst werden sollen. Das Fraunhofer IZI trägt dazu vor allem durch seine Expertise im Bereich der Datenharmonisierung transkriptomweiter Expressionsstudien sowie statistischer Analysen zur Identifizierung und Bestätigung von Biomarkern bei.

Das PIONEER Konsortium wird gefördert durch des IMI2 Gemeinschaftsunterfangen, gelistet unter der Fördernummer 777492. Es ist Teil des Big Data for Better Outcomes Programms (BD4BO). IMI2 erhält Unterstützung durch das Horizon 2020 Research and Innovation Programme der EU sowie durch die Federation of Pharmaceutical Industries and Associations (EFPIA).

Der obenstehende Text repräsentiert ausschließlich die Perspektive des Fraunhofer IZI.

RNA Biomarker Discovery

Die Arbeitsgruppe Bioinformatik ist Mitglied von RIBOLUTION – Integrierte Plattform für die Identifizierung und Validierung innovativer RNA-basierter Biomarker für die Personalisierte Medizin – ein von der Fraunhofer Zukunftsstiftung geförderten Forschungsverbund. Wir detektieren und etablieren RNA-basierte Biomarker, die als zuverlässige Indikatoren für eine Erkrankung bzw. für deren Verlauf geeignet sind. In diesem Kontext sind wir für die Speicherung, computergestützte Verarbeitung und statistischen Auswertung der durch modernste Messverfahren gewonnenen molekularbiologischen Hochdurchsatzdaten verantwortlich. Die von uns umgesetzten Prozesse decken den gesamten Daten-Lebenszyklus im Biomarker Discovery Bereich, beginnend von der Datenerzeugung, primären und sekundären Analyse bis hin zur medizinischen Wissensgenerierung, ab. Alle Software-Konzepte werden unter Berücksichtigung von Standards im Qualitätsmanagement implementiert. Durch den Zugriff auf ein High-Performance Computing Cluster können auch rechenintensive Lösungen, die aufgrund der Datenmenge und Datenvielfalt anfallen, effizient realisiert werden.

Computational RNA Biology

Seit einigen Jahren ist bekannt, dass RNA-Moleküle nicht nur ausschließlich Erbinformation der DNA in Aminosäuresequenzen übermitteln, sondern selbst umfangreiche regulatorische Funktionen wahrnehmen. Nicht-protein kodierende RNAs werden dabei in zwei grobe Gruppen unterteilt, ncRNAs mit einer Nukleotid-Sequenzlänge von weniger als 200 nt (kurze ncRNAs) und den neuartigen langen ncRNAs, die eine Sequenzlänge von mehr als 200 nt aufweisen. Die genregulatorischen Mechanismen der kurzen ncRNAs, wie z.B. miRNAs und snoRNAs, sind meist sehr gut aufgeklärt, während für die Gruppe der langen ncRNAs Funktionen nur exemplarisch beschrieben sind. Studien zu individuellen langen ncRNAs haben gezeigt, dass sie zentrale zelluläre Prozesse, wie Transkription und Translation, kontrollieren. Darüber hinaus sind sie auch in subzellulärer Lokalisierung, in den Aufbau zellulärer räumlicher Strukturen und in die Steuerung epigenetischer Modifikationen involviert. Wir und andere konnten zeigen, dass lange ncRNAs in verschiedenen Geweben und krankheitsassoziierten Signalwegen spezifisch reguliert sind. Neuartige Therapien basierend auf langen ncRNAs könnten somit spezifischer wirken und geringere Nebenwirkungen aufweisen als herkömmliche Ansätze. Mit Methoden aus der RNA-Bioinformatik und Systembiologie, wie die Vorhersage, Modellierung und Klassifizierung von RNA-Sekundärstrukturmotiven, sowie durch Evolutions- und Transkriptionsstudien adressieren wir die Fragestellung über welche genregulatorischen Mechanismen die als Biomarker identifizierten langen ncRNAs zelluläre Prozesse steuern, und inwieweit diese als therapeutische Targets geeignet sind.

Optimierung der Verarbeitung und Analyse von Sequenzierdaten für klinische Routineanwendungen

Der labortechnische sowie der bioinformatische Zeitaufwand für die Erzeugung, Prozessierung und Auswertung von Hochdurchsatz-Sequenzierdaten beträgt derzeit mehrere Tage. Während die labortechnische Datenerzeugung mittels neuer Sequenziermethoden kontinuierlich verkürzt wird, sind solche Optimierungen für die Datenanalyse kaum umgesetzt. Dies wirkt sich auf klinische Routineanwendungen nachteilig aus, da Wartezeiten bis zur Therapieentscheidung unnötig lang sind. Ziel ist es, die Analyse von Sequenzierdaten dahingehend zu optimieren, dass sie in klinischen Routineanwendungen einsetzbar ist. Eine von uns entwickelte Analyse-Pipeline entspricht höchsten Qualitätskriterien, denn sie stellt zu jedem Zeitpunkt die Verfügbarkeit, die Integrität, die Vertraulichkeit und die Authentizität der Daten sicher.

Ausgewählte abgeschlossene Projekte

Entwicklung eines Custom Expression Microarrays für eine effiziente und kostengünstige Analyse der Expressionsmuster tumorassoziierter RNAs. Mithilfe des Custom Expression Microarrays konnten wir zeigen, dass eine Vielzahl von langen nicht-kodierenden RNAs im Mammakarzinom und Glioblastom signifikant reguliert und somit als Biomarker geeignet sind.

  • Hackermüller J, Reiche K, Otto C, Hösler N, Blumert C, Brocke-Heidrich K, Böhlig L, Nitsche A, Kasack K, Ahnert P, Krupp W, Engeland K, Stadler PF, Horn F. Cell cycle, oncogenic and tumor suppressor pathways regulate numerous long and macro non-protein-coding RNAs. Genome Biol. 2014 Mar 4;15(3):R48.
  • Reiche K, Kasack K, Schreiber S, Lüders T, Due EU, Naume B, Riis M, Kristensen VN, Horn F, Børresen-Dale AL, Hackermüller J, Baumbusch LO. Long non-coding RNAs differentially expressed between normal versus primary breast tumor tissues disclose converse changes to breast cancer-related protein-coding genes. PLoS One. 2014 Sep 29;9(9):e106076.
  • Arnold C, Externbrink F, Hackermüller J, Reiche K. CEMDesigner: Design of custom expression microarrays in the post-ENCODE Era. Journal of Biotechnology. 2014 Nov 10;189:154-6. DOI dx.doi.org/10.1016/j.jbiotec.2014.09.012

 

Die Analyse von transkriptomweiten Expressionsstudien ergab, dass lange nicht-kodierende RNAs nicht nur spezifisch exprimiert, sondern auch spezifischer als protein-kodierende Gene, durch krankheitsrelevante Signalwege reguliert werden.

  • Hackermüller J, Reiche K, Otto C, Hösler N, Blumert C, Brocke-Heidrich K, Böhlig L, Nitsche A, Kasack K, Ahnert P, Krupp W, Engeland K, Stadler PF, Horn F. Cell cycle, oncogenic and tumor suppressor pathways regulate numerous long and macro non-protein-coding RNAs. Genome Biol. 2014 Mar 4;15(3):R48.

 

Entwicklung eines Algorithmus (TileShuffle) zur effizienten Analyse von transkriptomweiten Expressionsdaten, die mittels Tiling Arrays gemessen worden. Uns war es möglich mittels Permutationen die Verteilung der Hintergrundsignale unter Berücksichtigung von sondenspezifischen Artefakten besser als andere Methoden zu schätzen. Somit erreichen wir eine höhere Sensitivität bei gleichbleibender Spezifität.

  • Otto C, Reiche K, Hackermüller J. Detection of differentially expressed segments in tiling array data. Bioinformatics. 2012 Jun 1;28(11):1471-9.

  • High-Performance Computing Cluster

  • Helmholtz-Zentrum für Umweltforschung GmbH – UFZ, Leipzig
  • Helmholtz-Zentrum für Umweltforschung GmbH – UFZ, Department Bioanalytische Ökotoxikologie, Leipzig
  • Helmholtz-Zentrum für Umweltforschung GmbH – UFZ, Department Molekulare Systembiologie, Proteomics, Leipzig
  • Oslo University Hospital, Institute for Cancer Research, Oslo, Norwegen
  • Universität Leipzig, Professur für Bioinformatik, Leipzig
  • Universität Leipzig / Technische Universität Dresden, Competence Center for Scalable Data Services and Solutions ScaDS, Leipzig
  • Universitätsklinikum Carl Gustav Carus Dresden, Klinik und Poliklinik für Urologie, Dresden
  • University of Oslo, Faculty of Medicine, Institute of Basic Medical Sciences, Oslo, Norwegen
  • Fraunhofer-Institut für Grenzflächen- und Bioverfahrenstechnik IGB, Abteilung Molekulare Biotechnologie, Stuttgart

  • Essig K, Kronbeck N, Guimaraes JC, Lohs C, Schlundt A, Hoffmann A, Behrens G, Brenner S, Kowalska J, Lopez-Rodriguez C, Jemielity J, Holtmann H, Reiche K, Hackermüller J, Sattler M, Zavolan M, Heissmeyer V. Roquin targets mRNAs in a 3'-UTR-specific manner by different modes of regulation. Nat Commun. 2018 Sep 19;9(1):3810. dx.doi.org/10.1038/s41467-018-06184-3
  • Rehage N, Davydova E, Conrad C, Behrens G, Maiser A, Stehklein JE, Brenner S, Klein J, Jeridi A, Hoffmann A, Lee E, Dianzani U, Willemsen R, Feederle R, Reiche K, Hackermüller J, Leonhardt H, Sharma S, Niessing D, Heissmeyer V. Binding of NUFIP2 to Roquin promotes recognition and regulation of ICOS mRNA. Nat Commun. 2018 Jan 19;9(1):299. dx.doi.org/10.1038/s41467-017-02582-1
  • Binder S, Hösler N, Riedel D, Zipfel I, Buschmann T, Kämpf C, Reiche K, Burger R, Gramatzki M, Hackermüller J, Stadler PF, Horn F. STAT3-induced long noncoding RNAs in multiple myeloma cells display different properties in cancer. Sci Rep. 2017 Aug 11;7(1):7976
  • Schüttler A, Reiche K, Altenburger R, Busch W. The Transcriptome of the Zebrafish Embryo After Chemical Exposure: A Meta-Analysis. Toxicol Sci. 2017 Jun 1;157(2):291-304.
  • Kirsten H, Al-Hasani H, Holdt L, Gross A, Beutner F, Krohn K, Horn K, Ahnert P, Burkhardt R, Reiche K, Hackermüller J, Löffler M, Teupser D, Thiery J, Scholz M. Dissecting the genetics of the human transcriptome identifies novel trait-related trans-eQTLs and corroborates the regulatory relevance of non-protein coding loci. Hum Mol Genet. 2015 May 27.
  • Nitsche A, Rose D, Fasold M, Reiche K, Stadler PF. Comparison of splice sites reveals that long noncoding RNAs are evolutionarily well conserved. RNA. 2015 May;21(5):801-12.
  • Arnold C, Externbrink F, Hackermüller J, Reiche K. CEMDesigner: Design of custom expression microarrays in the post-ENCODE Era. Journal of Biotechnology. 2014 Nov 10;189:154-6. DOI http://dx.doi.org/10.1016/j.jbiotec.2014.09.012
  • Hackermüller J, Reiche K, Otto C, Hösler N, Blumert C, Brocke-Heidrich K, Böhlig L, Nitsche A, Kasack K, Ahnert P, Krupp W, Engeland K, Stadler PF, Horn F. Cell cycle, oncogenic and tumor suppressor pathways regulate numerous long and macro non-protein-coding RNAs. Genome Biol. 2014 Mar 4;15(3):R48.
  • Reiche K, Kasack K, Schreiber S, Lüders T, Due EU, Naume B, Riis M, Kristensen VN, Horn F, Børresen-Dale AL, Hackermüller J, Baumbusch LO. Long non-coding RNAs differentially expressed between normal versus primary breast tumor tissues disclose converse changes to breast cancer-related protein-coding genes. PLoS One. 2014 Sep 29;9(9):e106076.
  • Boll K, Reiche K, Kasack K, Mörbt N, Kretzschmar AK, Tomm JM, Verhaegh G, Schalken J, von Bergen M, Horn F, Hackermüller J. MiR-130a, miR-203 and miR-205 jointly repress key oncogenic pathways and are downregulated in prostatecarcinoma. Oncogene. 2013 Jan 17;32(3):277-85.
  • Otto C, Reiche K, Hackermüller J. Detection of differentially expressed segments in tiling array data. Bioinformatics. 2012 Jun 1;28(11):1471-9.
  • Tramontano A, Donath A, Bernhart SH, Reiche K, Böhmdorfer G, Stadler PF, Bachmair A. Deletion analysis of the 3' long terminal repeat sequence of plant retrotransposon Tto1 identifies 125 base pairs redundancy as sufficient for first strand transfer. Virology. 2011 Mar 30;412(1):75-82.
  • Sharma CM, Hoffmann S, Darfeuille F, Reignier J, Findeiss S, Sittka A, Chabas S, Reiche K, Hackermüller J, Reinhardt R, Stadler PF, Vogel J. The primary transcriptome of the major human pathogen Helicobacter pylori. Nature. 2010 Mar 11;464(7286):250-5.
  • Kaczkowski B, Torarinsson E, Reiche K, Havgaard JH, Stadler PF, Gorodkin J. Structural profiles of human miRNA families from pairwise clustering. Bioinformatics. 2009 Feb 1;25(3):291-4.
  • Rose D, Hertel J, Reiche K, Stadler PF, Hackermüller J. NcDNAlign: plausible multiple alignments of non-protein-coding genomic sequences. Genomics. 2008 Jul;92(1):65-74.
  • Rose D, Jöris J, Hackermüller J, Reiche K, Li Q, Stadler PF. Duplicated RNA genes in teleost fish genomes. J Bioinform Comput Biol. 2008 Dec;6(6):1157-75.
  • Athanasius F Bompfünewerer Consortium, Backofen R, Bernhart SH, Flamm C, Fried C, Fritzsch G, Hackermüller J, Hertel J, Hofacker IL, Missal K, Mosig A, Prohaska SJ, Rose D, Stadler PF, Tanzer A, Washietl S, Will S. RNAs everywhere: genome-wide annotation of structured RNAs. J Exp Zool B Mol Dev Evol. 2007 Jan 15;308(1):1-25.
  • ENCODE Project Consortium. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project. Nature. 2007 Jun 14;447(7146):799-816.
  • Reiche K, Stadler PF. RNAstrand: reading direction of structured RNAs in multiple sequence alignments. Algorithms Mol Biol. 2007 May 31;2:6.
  • Rose D, Hackermüller J, Washietl S, Reiche K, Hertel J, Findeiss S, Stadler PF, Prohaska SJ. Computational RNomics of drosophilids. BMC Genomics. 2007 Nov 8;8:406.
  • Snyder M, Gerstein MB, Reymond A, Hofacker IL, Stadler PF. Structured RNAs in the ENCODE selected regions of the human genome. Genome Res. 2007 Jun;17(6):852-64.
  • Washietl S, Pedersen JS, Korbel JO, Stocsits C, Gruber AR, Hackermüller J, Hertel J, Lindemeyer M, Reiche K, Tanzer A, Ucla C, Wyss C, Antonarakis SE, Denoeud F, Lagarde J, Drenkow J, Kapranov P, Gingeras TR, Guigó R, Will S, Reiche K, Hofacker IL, Stadler PF, Backofen R. Inferring noncoding RNA families and classes by means of genome-scale structure-based clustering. PLoS Comput Biol. 2007 Apr 13;3(4):e65.
  • Hertel J, Lindemeyer M, Missal K, Fried C, Tanzer A, Flamm C, Hofacker IL, Stadler PF; Students of Bioinformatics Computer Labs 2004 and 2005. The expansion of the metazoan microRNA repertoire. BMC Genomics. 2006 Feb 15;7:25.
  • Missal K, Cross MA, Drasdo D. Gene network inference from incomplete expression data: transcriptional control of hematopoietic commitment. Bioinformatics. 2006 Mar 15;22(6):731-8.
  • Missal K, Zhu X, Rose D, Deng W, Skogerbø G, Chen R, Stadler PF. Prediction of structured non-coding RNAs in the genomes of the nematodes Caenorhabditis elegans and Caenorhabditis briggsae. J Exp Zool B Mol Dev Evol. 2006 Jul 15;306(4):379-92.
  • Missal K, Rose D, Stadler PF. Non-coding RNAs in Ciona intestinalis. Bioinformatics. 2005 Sep 1;21.
  • Bompfünewerer AF, Flamm C, Fried C, Fritzsch G, Hofacker IL, Lehmann J, Missal K, Mosig A, Müller B, Prohaska SJ, Stadler BM, Stadler PF, Tanzer A, Washietl S, Witwer C. Evolutionary patterns of non-coding RNAs. Theory Biosci. 2005 Apr;123(4):301-69.