- Abschlussarbeit:
- Bachelor in Mathematik
- Autor:
- Ilia Kats
- Titel:
- The horseshoe+ distribution and its application to modeling spatial cell state gradients in single-cell transcriptomics data
- Betreuer:
- Stefan Richter (Universität Heidelberg)
- Jan JOHANNES
- Abstrakt:
- In überwachten Regressionsmodellen ist oft nur ein kleiner Teil der Prädiktoren informativ. Der Bayessche Goldstandard für die Erkennung und Schätzung der informativen Prädiktoren ist das sogenannte Zwei-Gruppen-Modell, eine Mischverteilung aus einer Dirac-Delta-Verteilung und einer Normalverteilung. Diese Verteilung ist zwar theoretisch attraktiv, ist in der Praxis aber aufgrund immer größer werdender Datensätze mit erheblichem Rechenaufwand verbunden. Daher wurden etliche traktablere Näherungen entwickelt, angefangen bei den ehrwürdigen Ridge- und Lasso-Regressionsmodellen bis hin zu neueren Ansätzen wie Global-Lokal-Shrinkage a-priori-Verteilungen auf den Regressionskoeffizienten. Diese a-priori-Verteilungen erzielen beträchtliche Verzerrungen der Regressionskoeffizienten hin zur Null, während einzelne Koeffizienten, welche zu informativen Prädiktoren gehören, der Verzerrung entkommen können. Eine beliebte Global-Lokal-Shrinkage Verteilung ist die Hufeisenverteilung, welche dazu tendiert, Koeffizienten entweder sehr stark oder gar nicht zu verzerren. Dadurch ist diese Verteilung eine gute Näherung an das Zwei-Gruppen-Modell. Im ersten Teil dieser Arbeit wird die Hufeisen+-Verteilung, eine verbesserte Variante der Hufeisenverteilung, beschrieben und ihre Fehlerschranken werden hergeleitet. Der zweite Teil dieser Arbeit benutzt die Hufeisen+-Verteilung als Teil eines hierarchischen Bayesschen Modells, um räumliche Zellzustandsgradienten in Einzelzell-Transkriptomikdaten zu erkennen.
Literatur:- A. Bhadra, J. Datta, N.G. Polson and B. Willard. The Horseshoe+ estimator of ultra-sparse signals, Bayesian Analysis 12:1105–1131, 2017.