07/2023 – 04/2025 (22 Monate)
»Deutsche Bank AG«
Verantwortung:
Softwareentwicklung in Python und Apache Spark.
Entwicklung von Datapipelines für Betrugs-Präventions-Modelle und statistische Auswertungen.
Interdisziplinäre Zusammenarbeit mit Architekten, Infrastrukturexperten und Data Scientisten an einem internationalen Framework zur automatischen Geldwäscheprävention.
Implementierung von PySpark Anwendungen, automatisierten Tests, CI/CD Prozessen.
Analyse und Auswertung von Daten.
Migration von Datapipelines nach GCP Dataproc und BigQuery. Debugging von Datenprozessen in der Cloud.
Implementierung von BigQuery SQL Skripten
Technologien:
Python, PySpark, Hadoop, Pytest, Pandas, SQL, CDSW, Hive, Impala
Resultat:
Datapipelines erfolgreich implementiert