Course Code: pythondtbasint
Duration: 14 hours
Prerequisites:

  • Grundkenntnisse in Programmierkonzepten oder Bereitschaft zum Lernen
  • Komfort bei der Verwendung der Kommandozeile oder des Terminals für die Paketinstallation
  • Erfahrung im Arbeiten mit Tabellenkalkulationen (CSV/Excel)

Zielgruppe

  • Datenanalysten und Operationsmitarbeiter, die Datenprozesse automatisieren möchten
  • Analytische Ingenieure, die auf leichte ETL-Skripte aus sind
  • Profis, die an praktischen Python-basierten Datenworkflows interessiert sind

Overview:

Python ist eine vielseitige Programmiersprache, die weit verbreitet für Datenmanipulation, Automatisierung und Analyse verwendet wird. Bibliotheken wie Pandas und Polars bieten leistungsfähige und praktische Tools zur Arbeit mit tabellarischen Daten im großen Maßstab.

Dieses von einem Trainer geführte Live-Training (online oder vor Ort) richtet sich an Anfänger- bis Mittelniveau-Professionals, die Python für alltägliche Datenanalysen, Dateiverarbeitung und Prozessautomatisierung mit Pandas und Polars anwenden möchten.

Am Ende dieses Trainings werden die Teilnehmer in der Lage sein:

  • Python verwenden, um CSV- und Excel-Dateien zu lesen, zu transformieren und zu schreiben.
  • Häufige Datenaufbereitungs- und Transformationsaufgaben mit Pandas und Polars durchzuführen.
  • Wiederkehrende Datenprozesse mit Python-Skripts zu automatisieren.
  • Einfache Skripts in ausführbare Dateien zu verpacken und Best Practices für Projekte zu befolgen.

Kursformat

  • Interaktive Programmierdemonstrationen und kurze Vorlesungen.
  • Praktische Übungen mit geleiteten Codebeispielen.
  • Praktische Miniprojekte zur Automatisierung realer Aufgaben.

Kursanpassungsmöglichkeiten

  • Um ein angepasstes Training für diesen Kurs anzufordern, kontaktieren Sie uns bitte zur Anordnung.

Course Outline:

Python Grundlagen für DatenAufgaben

  • Installation von Python und Einrichtung der Entwicklungsumgebung
  • Sprachgrundlagen: Variablen, Datentypen, Kontrollstrukturen
  • Schreiben und Ausführen einfacher Python-Skripte

Dateihandling: CSV und Excel

  • Lesen und Schreiben von CSV-Dateien mit dem csv-Modul und Pandas
  • Arbeiten mit Excel-Dateien mit openpyxl/xlrd und Pandas
  • Praktische Übungen: Automatisierung von Dateikonvertierungen

Einführung in Pandas

  • Grundlagen von DataFrames: Erstellung, Indizierung, Selektion und Filterung
  • Aggregations- und Gruppierungsoperationen
  • Häufige Reinigungsoperationen: Fehlende Werte, Duplikate und Typkonvertierungen

Einführung in Polars

  • Polars-Konzepte und Leistungseigenschaften im Vergleich zu Pandas
  • Grundlegende DataFrame-Operationen in Polars
  • Anwendungsfallbeispiel: Wann sollte man Polars anstelle von Pandas wählen?

Fortschrittliche Datenverarbeitung (Mittelstufe)

  • Komplexe Joins, Fensterfunktionen und Pivot-Operationen in Pandas
  • Effiziente Datenverarbeitungsmuster mit Polars
  • Verkettete Operationen und Optimierung des Speicherverbrauchs

Prozessautomatisierung mit Python

  • Schreiben von Skripten zur Automatisierung wiederkehrender Datenprozesse und ETL-Schritte
  • Planen von Skripten mit Betriebssystemplanern oder Aufgabenplannern
  • Protokollierung, Fehlerbehandlung und Benachrichtigungen

Packen von Skripten und Best Practices

  • Erstellen von Ausführbaren mit PyInstaller oder ähnlichen Tools
  • Projektstrukturierung, virtuelle Umgebungen und Abhängigkeitsmanagement
  • Versionskontrolle Grundlagen und Dokumentation von Workflows

Hands-on Miniprojekt

  • End-to-End-Aufgabe: Lesen roher Dateien, Reinigen und Transformieren der Daten, Erstellen von Ausgaben
  • Automatisieren des Workflows und Paketieren als ausführbares Skript oder Programm
  • Bewertung und Verbesserungen auf Basis von Peer-Feedback

Zusammenfassung und Nächste Schritte

Overview in Category: