Dieses Projekt wurde im Rahmen der Data SmartPoint Academy erstellt.
Ziel war es, mithilfe von Power BI weltweite COVID-19-Daten zu analysieren, aufzubereiten und visuell darzustellen, um Entwicklungen und Zusammenhänge über den gesamten Pandemiezeitraum hinweg sichtbar zu machen.
Ziel war es, die erlernten Power-BI-Kenntnisse praxisnah einzusetzen – von der Datenbereinigung über die Modellierung bis hin zur visuellen Analyse.
Das Projekt zeigt analytisches Denken, Verständnis für Datenmodellierung und die Fähigkeit, komplexe Informationen verständlich darzustellen.
Die Analyse basiert auf einem internationalen COVID-19-Datensatz mit folgenden Informationen:
- Neuinfektionen, Todesfälle und Testzahlen
- Impfquoten und Impfverläufe
- Zeitliche Entwicklungen über mehrere Jahre
- Länderspezifische und kontinentale Auswertungen
Der Datensatz wurde bereinigt, übersetzt und umstrukturiert, um ihn für Power BI optimal nutzbar zu machen.
Ein Fokus lag auf Vergleichbarkeit und Datenqualität, da die Rohdaten aus unterschiedlichen Quellen und Zeiträumen stammten.
Folgende Schritte wurden im Rahmen der Datenaufbereitung und Modellierung durchgeführt:
- Übersetzung aller Spaltennamen ins Deutsche für bessere Lesbarkeit
- Entfernung von Duplikaten und fehlerhaften Zeilen
- Ausschluss von Aggregatdaten (z. B. Kontinent-Gesamtsummen)
- Aufbau einer Dimensionstabelle für Länder (DimLänder)
- Verknüpfung aller Tabellen über Schlüsselbeziehungen
- Erstellung von DAX-Measures für Summen, Mittelwerte und Zeitvergleiche
- Vereinheitlichung von Datumsformaten und Kennzahlen
Die folgenden Analysen wurden mit Power BI Desktop umgesetzt:
- Entwicklung der Infektionszahlen im Zeitverlauf
- Vergleich der Test- und Impfzahlen nach Kontinenten
- Darstellung der Todesfälle und deren Veränderung über die Pandemiephasen hinweg
- Visualisierung globaler Trends mit Karten, Diagrammen und KPI-Karten
- Analyse der zeitlichen Zusammenhänge zwischen Impfungen, Fällen und Todesraten
Die Präsentation (Präsentation_covid.pptx) enthält die wichtigsten Erkenntnisse, Screenshots und Interpretationen der Visualisierungen, die mit Power BI erstellt wurden.
Es wurde kein vollständiges Dashboard aufgebaut, sondern gezielt einzelne Visualisierungen entwickelt, um zentrale Fragestellungen der Analyse anschaulich darzustellen.
- Impfungen: Starker Anstieg ab Ende 2020, Höhepunkt Mitte 2022
- Tests: Deutlicher Zuwachs 2021, Rückgang nach Wegfall der Testpflicht
- Todesfälle: Erhöhte Werte in den Hauptpandemiewellen 2020 – 2021
- Regionale Unterschiede: Deutlich unterschiedliche Impf- und Teststrategien nach Kontinent
- Datenqualität: Schwankungen und Lücken durch unterschiedliche Meldestandards
Der verwendete Datensatz wurde im Rahmen einer Schulung zur Verfügung gestellt und basiert auf öffentlich zugänglichen Übungsdaten von Kaggle.
Aus lizenzrechtlichen Gründen wird der Datensatz in diesem Repository nicht veröffentlicht.
Dieses Projekt ist kein perfektes Dashboard – und das ist auch gar nicht das Ziel.
Ein paar kleine Unstimmigkeiten und Ungenauigkeiten habe ich bewusst drin gelassen – sie zeigen, dass Analyse immer ein Lernprozess bleibt.
Wenn du also irgendwo einen Schönheitsfehler findest: Glückwunsch, dann hast du genauso genau hingeschaut wie ich beim Erstellen. 😄