Explorative Analyse der ClinVar Datenbank

Shawki, Mohamad Rafek (2022) Explorative Analyse der ClinVar Datenbank. Bachelor thesis, Institute for Visual and Analytic Computing, University of Rostock.

[img] Text
BA_SHAWKI.pdf - Published Version
Restricted to Registered users only

Download (10MB)

Abstract

ClinVar ist eine öffentliche kuratierte Datenbank, welche Informationen über gefundene genetische Varianten (Mutationen der DNA) und deren Einflüsse auf die menschliche Gesundheit sammelt. Diese Datenbank wird seit 2012 regelmäßig aktualisiert, begutachtet, und veröffentlicht. Damit zählt ClinVar zu einer der wichtigsten Datenquellen für die Entwicklung und Evaluation von Methoden zur maschinellen Einschätzung von genetischen Varianten. Gleichzeitig ermöglichen die verschiedenen ClinVar-Versionen eine Analyse des Prozesses, wie sich das Wissen über die genetischen Varianten im Laufe der Zeit verändert hat. Somit bildet diese Analyse die Grundlage für die Modellierung dieses Prozesses, z. B. zur automatischen Generierung von künstlichen Patientendaten. Grundlegend für beide Anwendungsfälle ist die Explorative Daten Analyse (EDA) der ClinVAR Datenbank. Ziel der EDA ist es Muster, Anomalien und Charakteristika der Daten zu ermitteln, diese zu beschreiben und letztendlich für konkrete Fragestellungen auszunutzen. Im Rahmen dieser Arbeit soll eine EDA der ClinVar Datenbank, inkl. einer Auswahl von vorigen ClinVar-Versionen, durchgeführt werden. Damit liegt der Fokus dieser Arbeit nicht nur auf der EDA der aktuellen ClinVar Datenbank, sondern auch auf der zeitlichen Entwicklung dieser Datenbank. Dazu gilt es Informationen von gleichen Varianten aus unterschiedlichen ClinVar Versionen zusammenzuführen und diese als Zeitreihe zu betrachten und zu analysieren.

Item Type: Thesis (Bachelor)
Projects: IDEA-PRIO-UR