Univ. Heidelberg
Statistik-Gruppe   Institut für Mathematik   Fakultät für Mathematik und Informatik   Universität Heidelberg
Ruprecht-Karls-Universität Heidelberg Institut für Mathematik Arbeitsgruppe Statistik inverser Probleme
german english french



Publikationen
Kooperationen
Forschungsprojekte
Veranstaltungen
Lehre
Abschlussarbeiten
Personen
Kontakt


Zuletzt geändert am
17 Okt 2024 von JJ
.
Abschlussarbeit:
Master in Mathematik

Autor:
Dennis Reichard

Titel:
Nicht-parametrische Dichteschätzung unter lokalen α-differenziellen Privatsphäreschutzbedingungen unter der Verwendung von Wavelet-Techniken

Betreuerïn:
Jan JOHANNES

Abstrakt:
In unserer modernen Gesellschaft, in der sich persönliche Daten zu einer wertvollen Ware entwickelt haben, treten zwei einander zuwiderlaufende Interessen miteinander in Konflikt: Zum einen das Interesse solche Daten zusammenzuführen und auszuwerten, um aus ihnen wissenschaftliche Erkenntnisse wie die gewissen Größen zu Grunde liegenden Wahrscheinlichkeitsverteilungen zu gewinnen. Zum anderen das Interesse der Privatpersonen die Kontrolle über die eigenen Daten zu behalten. Cristina Butucea, Amandine Dubois, Martin Kroll und Adrien Saumard haben mit ihrem Paper “Local Differential Privacy: Elbow Effect in Optimal Density Estimation and Adaptation over Besov Ellipsoids” versucht, diese beiden Interessen etwas mehr in Einklang miteinander zu bringen. Diese Arbeit wird weite Teile dieses Papers in einer ausführlicheren Form wiedergeben. Zum einen werden untere Schranken für die Konvergenzraten des Minimax-Risikos aller Schätzer hergeleitet, die Bedingungen erfüllen, welche die Privatsphäre in einem gewissen quantifizierten Maß schützen. Anschließend werden zwei solche Privatsphäreschutzmechanismen sowie zwei darauf basierende Dichteschätzverfahren vorgeschlagen und diese auf ihre Güte untersucht und mit den zuvor hergeleiteten Schranken verglichen. Diese basieren auf der Idee anhand jedes privaten Datenpunktes die Wavelet-Koeffizienten bezüglich einer zuvor passend fest gewählten Wavelet-Basis zu schätzen und diese Schätzung vor der Veröffentlichung mit einem passend skalierten Laplace-Rauschen zu anonymisieren. Dadurch sind Rückschlüsse aus den veröffentlichten Koeffizienten auf den konkreten Datenpunkt nur noch bis zu einem zuvor quantifizierten Maß an Sicherheit möglich. Nimmt man aber dann viele derart gestörte Schätzungen für ein und den selben Koeffizienten von verschiedenen Datenpunkten zusammen, lässt sich daraus wiederum eine Schätzung für den Koeffizienten gewinnen, bei der das hinzugefügte Rauschen dank des Gesetzes der großen Zahlen mit steigendem Stichprobenumfang eine immer geringere Rolle spielt. Im letzten Teil, der nicht mehr direkt auf dem genannten Paper basiert, werden die Ergebnisse einer Simulationsstudie zu den Privatsphäreschutz- und Schätzverfahren vorgestellt, ihre Praxistauglichkeit erörtert sowie denkbare Modifikationen diskutiert.

Literatur:
C. Butucea, A. Dubois, M. Kroll, und A. Saumard. Local differential privacy: Elbox effect in optimal density estimation adaptation over Besov ellipsoids. Bernoulli, 26(3):1727-1764, 2020.