Umgang mit Daten – Herausforderung für die Forschung
Die Forschung im Bereich der personalisierten Gesundheit schreitet voran. Daten spielen dabei eine wichtige Rolle. Mit Hilfe der neuen Technologien werden sie immer schneller, in besserer Qualität und in immer grösseren Mengen produziert. So ist das Sequenzieren eines ganzen Genoms heute relativ einfach und nicht mehr sehr kostspielig. Die Sequenz alleine bringt jedoch noch kein neues Wissen: Die Daten müssen analysiert und interpretiert werden.
In der Forschung im Bereich der seltenen oder teils auch sehr seltenen Krankheit wird normalerweise nach der einen oder den zwei Mutationen im Genom gesucht, die für die Krankheit verantwortlich sind. Sie sind oft die einzigen Faktoren, die zum Ausbruch der Krankheit führen. Die Herausforderung ist jedoch, diese Mutationen unter all den anderen Veränderungen im Genom zu finden und zu erkennen. Da sich die Genome von zwei Personen, unabhängig von Krankheiten, an Tausenden von Stellen unterscheiden (normale Polymorphismen), braucht es sehr leistungsstarke Computersysteme, um die relevante Veränderung zu erkennen. Die Suchen nach der für die Krankheit verantwortlichen Mutation wird deshalb oft mit der Suche nach der Nadel im Heuhaufen verglichen.
Auch bei der Erforschung häufiger Krankheiten, zum Beispiel Herz-Kreislauferkrankungen, sind grosse Datensätze essentiell. Diese Krankheiten sind meist nicht nur genetisch bedingt, sondern es ist das Zusammenspiel von Genetik und Umwelt, das zum Ausbruch der Krankheit führt. Um zu verstehen, was die Ursache ist, braucht es auch hier grosse Datenmengen von einer möglichst diversen Population. Nur so kann erforscht werden, welche genetischen Veränderungen relevant sind und welche nicht.
Da jede vollständige Sequenzierung eines menschlichen Genoms mindestens 300 Gigabyte Datenvolumen produziert, sind die Forschenden auf entsprechend grosse Datenspeicher angewiesen, nicht nur für die Datenverarbeitung, sondern auch für die Datensicherung. Der wichtigste Faktor ist aber wohl die Expertise der Fachkräfte. Um die Daten zu analysieren und interpretieren, braucht es Spezialistinnen und Spezialisten, die sich in verschieden Gebieten auskennen: biologisches und medizinisches Verständnis, sowie Expertise in Statistik und Informationstechnologien.
September 2018