Bioinformatik

Prognostische Biomarker für Prostatakrebs

Prostatakrebs ist innerhalb Europas die häufigste Krebsart und dritthäufigste tödliche Krebserkrankung bei Männern. Die klinische Auswirkung lokal begrenzter Prostatakarzinome ist äußerst variabel. Einige Patienten leiden an einer sehr aggressiven Form, die rasch zum Tode führt. Viele andere jedoch haben eine indolente (träge) Variante, die mittels Therapie geheilt oder unbedenklich beobachtet werden könnte. Patienten werden oftmals unnötigen Operationen unterzogen, da klinische und histopathologische Risiko­faktoren sowie bisherige Biomarker und entsprechende Klassifikations­modelle unzureichend genau sind. Es besteht daher ein hoher Bedarf nach Biomarkern, die eine frühzeitige Prognose für den klinischen Verlauf von Prostatakrebs ermöglichen.

Um dies zu adressieren, werden am Fraunhofer IZI die zugrundeliegenden molekularen Mechanismen in Prostatakarzinomen analysiert. Es wurden Veränderungen im Transkriptom untersucht, um Gensignaturen von protein-kodierenden und nicht-protein kodierenden Genen zu identifizieren, die eine prognostische Aussage ermöglichen. Dazu wurden frisch eingefrorene Proben von radikalen Prostatektomien herangezogen und mit formalinfixierten paraffin­eingebetteten Proben einer radikalen Prostatektomie sowie Biopsien abgeglichen.

Das Transkriptom von mehr als zweihundert Gewebeproben von Prostatakrebspatienten unter klinischer Langzeit­beobachtung wurden mittels transkriptomweiter Sequen­zierung und Genexpressions-Microarrays bewertet. Es wurde eine Überlebenszeitanalyse durchgeführt, um die Expression einzelner Gene mit dem klinischen Verlauf abzugleichen. Mittels einer statistischen Meta-Analyse wurde die daraus gewonnene Evidenz für einzelne Gene auf verschiedene Arten von Probenmaterial übertragen. Für jeden Patienten wurden alle selektierten Gene in einem prognostischen Genexpressions-Score zusammengeführt. Dieser kombinierte Score zeigte sehr gute prognostische Effekte und korrelierte mit den Überlebenszeiten der Patienten. Der prognostische Score konnte anhand einer unabhängigen Testkohorte mit repräsentativer Stichprobengröße bestätigt werden und zeigte zudem eine Korrelation mit der Zeit zum bio­chemischen Rezidiv.

Es wurde ein transkriptombasierter Score entwickelt, der aggressive Formen von Prostatakrebs innerhalb einer Kohorte von Patienten identifiziert, die mittels radikaler Prostatek­tomie behandelt wurden. Weiterhin wurde der Score anhand von Gewebeproben einer unabhängigen Patientenkohorte bestätigt. Der Score eignet sich zur Unterstützung der klinischen Entscheidungsfindung für Patienten mit diagnostiziertem Prostatakarzinom. Gegenwärtig wird der Score anhand weiterer Gewebeproben, die klinischem Routine­material entsprechen, bestätigt.

Verbesserung von Diagnose und Behandlung bei Prostatakrebs durch Big Data Analysen

Das Fraunhofer IZI ist seit 2018 aktives Mitglied des EU-Konsortiums PIONEER (Prostate Cancer DIagnOsis and TreatmeNt Enhancement through the Power of Big Data in EuRope’), einem Exzellenzcluster für Big Data Analysen bei Prostatakrebs. Das Konsortium umfasst 32 Partner aus neun europäischen Ländern. Ziel der Zusammenarbeit ist es, durch die Generierung und Analyse großer wissenschaftlicher und klinischer Datenmengen die Versorgung von Prostatakrebspatienten zu verbessern. Eine zentrale Rolle kommt dabei der Standardisierung und Integration existierender Daten verschiedenster Quellen zu, die zu Forschungszwecken in einer innovativen Open Access Plattform zusammengefasst werden sollen. Das Fraunhofer IZI trägt dazu vor allem durch seine Expertise im Bereich der Datenharmonisierung transkriptomweiter Expressionsstudien sowie statistischer Analysen zur Identifizierung und Bestätigung von Biomarkern bei.

Das PIONEER Konsortium wird gefördert durch des IMI2 Gemeinschaftsunterfangen, gelistet unter der Fördernummer 777492. Es ist Teil des Big Data for Better Outcomes Programms (BD4BO). IMI2 erhält Unterstützung durch das Horizon 2020 Research and Innovation Programme der EU sowie durch die Federation of Pharmaceutical Industries and Associations (EFPIA).

Der obenstehende Text repräsentiert ausschließlich die Perspektive des Fraunhofer IZI.

RNA Biomarker Discovery

Die Arbeitsgruppe Bioinformatik ist Mitglied von RIBOLUTION – Integrierte Plattform für die Identifizierung und Validierung innovativer RNA-basierter Biomarker für die Personalisierte Medizin – ein von der Fraunhofer Zukunftsstiftung geförderten Forschungsverbund. Wir detektieren und etablieren RNA-basierte Biomarker, die als zuverlässige Indikatoren für eine Erkrankung bzw. für deren Verlauf geeignet sind. In diesem Kontext sind wir für die Speicherung, computergestützte Verarbeitung und statistischen Auswertung der durch modernste Messverfahren gewonnenen molekularbiologischen Hochdurchsatzdaten verantwortlich. Die von uns umgesetzten Prozesse decken den gesamten Daten-Lebenszyklus im Biomarker Discovery Bereich, beginnend von der Datenerzeugung, primären und sekundären Analyse bis hin zur medizinischen Wissensgenerierung, ab. Alle Software-Konzepte werden unter Berücksichtigung von Standards im Qualitätsmanagement implementiert. Durch den Zugriff auf ein High-Performance Computing Cluster können auch rechenintensive Lösungen, die aufgrund der Datenmenge und Datenvielfalt anfallen, effizient realisiert werden.

Computational RNA Biology

Seit einigen Jahren ist bekannt, dass RNA-Moleküle nicht nur ausschließlich Erbinformation der DNA in Aminosäuresequenzen übermitteln, sondern selbst umfangreiche regulatorische Funktionen wahrnehmen. Nicht-protein kodierende RNAs werden dabei in zwei grobe Gruppen unterteilt, ncRNAs mit einer Nukleotid-Sequenzlänge von weniger als 200 nt (kurze ncRNAs) und den neuartigen langen ncRNAs, die eine Sequenzlänge von mehr als 200 nt aufweisen. Die genregulatorischen Mechanismen der kurzen ncRNAs, wie z.B. miRNAs und snoRNAs, sind meist sehr gut aufgeklärt, während für die Gruppe der langen ncRNAs Funktionen nur exemplarisch beschrieben sind. Studien zu individuellen langen ncRNAs haben gezeigt, dass sie zentrale zelluläre Prozesse, wie Transkription und Translation, kontrollieren. Darüber hinaus sind sie auch in subzellulärer Lokalisierung, in den Aufbau zellulärer räumlicher Strukturen und in die Steuerung epigenetischer Modifikationen involviert. Wir und andere konnten zeigen, dass lange ncRNAs in verschiedenen Geweben und krankheitsassoziierten Signalwegen spezifisch reguliert sind. Neuartige Therapien basierend auf langen ncRNAs könnten somit spezifischer wirken und geringere Nebenwirkungen aufweisen als herkömmliche Ansätze. Mit Methoden aus der RNA-Bioinformatik und Systembiologie, wie die Vorhersage, Modellierung und Klassifizierung von RNA-Sekundärstrukturmotiven, sowie durch Evolutions- und Transkriptionsstudien adressieren wir die Fragestellung über welche genregulatorischen Mechanismen die als Biomarker identifizierten langen ncRNAs zelluläre Prozesse steuern, und inwieweit diese als therapeutische Targets geeignet sind.

Optimierung der Verarbeitung und Analyse von Sequenzierdaten für klinische Routineanwendungen

Der labortechnische sowie der bioinformatische Zeitaufwand für die Erzeugung, Prozessierung und Auswertung von Hochdurchsatz-Sequenzierdaten beträgt derzeit mehrere Tage. Während die labortechnische Datenerzeugung mittels neuer Sequenziermethoden kontinuierlich verkürzt wird, sind solche Optimierungen für die Datenanalyse kaum umgesetzt. Dies wirkt sich auf klinische Routineanwendungen nachteilig aus, da Wartezeiten bis zur Therapieentscheidung unnötig lang sind. Ziel ist es, die Analyse von Sequenzierdaten dahingehend zu optimieren, dass sie in klinischen Routineanwendungen einsetzbar ist. Eine von uns entwickelte Analyse-Pipeline entspricht höchsten Qualitätskriterien, denn sie stellt zu jedem Zeitpunkt die Verfügbarkeit, die Integrität, die Vertraulichkeit und die Authentizität der Daten sicher.

Ausgewählte abgeschlossene Projekte

Entwicklung eines Custom Expression Microarrays für eine effiziente und kostengünstige Analyse der Expressionsmuster tumorassoziierter RNAs. Mithilfe des Custom Expression Microarrays konnten wir zeigen, dass eine Vielzahl von langen nicht-kodierenden RNAs im Mammakarzinom und Glioblastom signifikant reguliert und somit als Biomarker geeignet sind.

  • Hackermüller J, Reiche K, Otto C, Hösler N, Blumert C, Brocke-Heidrich K, Böhlig L, Nitsche A, Kasack K, Ahnert P, Krupp W, Engeland K, Stadler PF, Horn F. Cell cycle, oncogenic and tumor suppressor pathways regulate numerous long and macro non-protein-coding RNAs. Genome Biol. 2014 Mar 4;15(3):R48.
  • Reiche K, Kasack K, Schreiber S, Lüders T, Due EU, Naume B, Riis M, Kristensen VN, Horn F, Børresen-Dale AL, Hackermüller J, Baumbusch LO. Long non-coding RNAs differentially expressed between normal versus primary breast tumor tissues disclose converse changes to breast cancer-related protein-coding genes. PLoS One. 2014 Sep 29;9(9):e106076.
  • Arnold C, Externbrink F, Hackermüller J, Reiche K. CEMDesigner: Design of custom expression microarrays in the post-ENCODE Era. Journal of Biotechnology. 2014 Nov 10;189:154-6. DOI dx.doi.org/10.1016/j.jbiotec.2014.09.012

 

Die Analyse von transkriptomweiten Expressionsstudien ergab, dass lange nicht-kodierende RNAs nicht nur spezifisch exprimiert, sondern auch spezifischer als protein-kodierende Gene, durch krankheitsrelevante Signalwege reguliert werden.

  • Hackermüller J, Reiche K, Otto C, Hösler N, Blumert C, Brocke-Heidrich K, Böhlig L, Nitsche A, Kasack K, Ahnert P, Krupp W, Engeland K, Stadler PF, Horn F. Cell cycle, oncogenic and tumor suppressor pathways regulate numerous long and macro non-protein-coding RNAs. Genome Biol. 2014 Mar 4;15(3):R48.

 

Entwicklung eines Algorithmus (TileShuffle) zur effizienten Analyse von transkriptomweiten Expressionsdaten, die mittels Tiling Arrays gemessen worden. Uns war es möglich mittels Permutationen die Verteilung der Hintergrundsignale unter Berücksichtigung von sondenspezifischen Artefakten besser als andere Methoden zu schätzen. Somit erreichen wir eine höhere Sensitivität bei gleichbleibender Spezifität.

  • Otto C, Reiche K, Hackermüller J. Detection of differentially expressed segments in tiling array data. Bioinformatics. 2012 Jun 1;28(11):1471-9.