Univ. Heidelberg
Statistik-Gruppe   Institut für Mathematik   Fakultät für Mathematik und Informatik   Universität Heidelberg
Ruprecht-Karls-Universität Heidelberg Institut für Mathematik Arbeitsgruppe Statistik inverser Probleme
german english french



Publikationen
Kooperationen
Forschungsprojekte
Veranstaltungen
Lehre
Abschlussarbeiten
Personen
Kontakt


Zuletzt geändert am
17 Okt 2024 von JJ
.
Abschlussarbeit:
Bachelor in Mathematik

Autor:
Ilia Kats

Titel:
The horseshoe+ distribution and its application to modeling spatial cell state gradients in single-cell transcriptomics data

Betreuer:
Stefan Richter (Universität Heidelberg)
Jan JOHANNES

Abstrakt:
In überwachten Regressionsmodellen ist oft nur ein kleiner Teil der Prädiktoren informativ. Der Bayessche Goldstandard für die Erkennung und Schätzung der informativen Prädiktoren ist das sogenannte Zwei-Gruppen-Modell, eine Mischverteilung aus einer Dirac-Delta-Verteilung und einer Normalverteilung. Diese Verteilung ist zwar theoretisch attraktiv, ist in der Praxis aber aufgrund immer größer werdender Datensätze mit erheblichem Rechenaufwand verbunden. Daher wurden etliche traktablere Näherungen entwickelt, angefangen bei den ehrwürdigen Ridge- und Lasso-Regressionsmodellen bis hin zu neueren Ansätzen wie Global-Lokal-Shrinkage a-priori-Verteilungen auf den Regressionskoeffizienten. Diese a-priori-Verteilungen erzielen beträchtliche Verzerrungen der Regressionskoeffizienten hin zur Null, während einzelne Koeffizienten, welche zu informativen Prädiktoren gehören, der Verzerrung entkommen können. Eine beliebte Global-Lokal-Shrinkage Verteilung ist die Hufeisenverteilung, welche dazu tendiert, Koeffizienten entweder sehr stark oder gar nicht zu verzerren. Dadurch ist diese Verteilung eine gute Näherung an das Zwei-Gruppen-Modell. Im ersten Teil dieser Arbeit wird die Hufeisen+-Verteilung, eine verbesserte Variante der Hufeisenverteilung, beschrieben und ihre Fehlerschranken werden hergeleitet. Der zweite Teil dieser Arbeit benutzt die Hufeisen+-Verteilung als Teil eines hierarchischen Bayesschen Modells, um räumliche Zellzustandsgradienten in Einzelzell-Transkriptomikdaten zu erkennen.

Literatur:
A. Bhadra, J. Datta, N.G. Polson and B. Willard. The Horseshoe+ estimator of ultra-sparse signals, Bayesian Analysis 12:1105–1131, 2017.