Einführung in Data Science mit Python für Anfänger

Seminar Inhouse Individuell

DURCHFÜHRUNG MIT TERMIN

Dauer

21 Stunden

Preis

1.790,00 € netto
2.130,10 € inkl. 19% MwSt.

Nr.

54411

Termine und Orte anzeigen

Jetzt buchen

TERMIN UND ORT NACH ABSPRACHE

Nr.

54411

Dauer

21 Stunden

Inhouse-Paket - Erfahren Sie mehr über unser Inhouse Seminarangebot

Auf Anfrage

Kontaktieren Sie uns für ein Angebot!

On-demand Training

Sind Sie an diesem Thema interessiert?
Unsere Experten entwickeln Ihr individuell angepasstes Seminar!

Kontaktieren Sie uns

Download als PDF

Zur Merkliste hinzufügen

Kontaktieren Sie uns

Der dreitägige Data Science Kurs bietet eine praxisorientierte Einführung in die Grundlagen von Machine Learning mit pandas und scikit-learn in Python. Der Schwerpunkt liegt dabei auf dem Python Modul pandas und seinem DataFrame, das als gängiges Data Science Paket in Python gilt. Zusätzlich werden die Pakete seaborn und matplotlib erläutert, die zur Generierung von Grafiken und Plots verwendet werden. Der Kurs gibt zudem einen Einblick in erste Machine Learning Algorithmen wie Entscheidungsbaum, K-Means Clustering/DBSCAN und Neuronales Netz mit dem Python Paket scikit-learn. Weitere Themen umfassen wichtige Datenstrukturen, das Berechnen von Statistiken, das Schreiben eigener Funktionen sowie das Einlesen und Schreiben von Daten in verschiedenen Formaten. Der Kurs beinhaltet außerdem eine Einführung in lineare Regression, den Train-Test-Split und Kreuzvalidierung.

Lesen Sie mehr

Zielgruppe

Wer sollte teilnehmen:

Zielgruppe

Der Python Data Science Kurs richtet sich an Teilnehmer, die Python erlernen möchten, um Daten zu analysieren und Machine Learning Algorithmen zu programmieren. Dieser Kurs ist ideal für Anwender, die die Grundlagen der Data Science erlernen möchten.

Voraussetzungen

Um die Grundlagen der Data Science in Python zu erlernen, ist es nicht erforderlich, bereits Kenntnisse in Python zu besitzen. Es wird jedoch empfohlen, über Grundkenntnisse in einer anderen Programmiersprache zu verfügen, um mit Begriffen wie Variablen, Funktionen und Schleifen vertraut zu sein.

Das Data Science Seminar behandelt Machine Learning-Algorithmen, die auf statistischen Verfahren basieren. Daher sind grundlegende Kenntnisse der Statistik erforderlich. Sie sollten mit Begriffen wie Mittelwert, Median, Standardabweichung und Normalverteilung vertraut sein. Auch mathematische Symbole wie das Integral oder das Summenzeichen sowie Konzepte wie Funktionen und Ableitungen werden empfohlen. Es werden auch logische Operatoren wie Und, Oder und Nicht kurz verwendet.

Die Teilnehmer sollten bereits Erfahrung im Umgang mit Daten haben, z. B. in Excel oder einer BI-Software, um mit Konzepten wie spaltenweisen Berechnungen und einfachen Statistiken (Mittelwert, Varianz) vertraut zu sein.

Der Unterricht findet auf Deutsch statt, während die Folien auf Englisch sind, da Python und die Dokumentation der Pakete sowie Fachbegriffe des Machine Learnings auf Englisch sind. Es ist daher wichtig, dass ein englischer Text verstanden werden kann, um dem Seminar folgen zu können.

Trainingsprogramm

Grundlegende Konzepte in Python:

Installation neuer Pakete
Verwendung von PyCharm als integrierter Entwicklungsumgebung (IDE)
Unterschiede in Funktionen und Methoden
Vergleich wichtiger Python-Aspekte mit anderen Programmiersprachen

Arbeiten mit dem pandas-Paket und DataFrames:

Struktur eines DataFrames (Zeilen, Spalten)
Auswahl von Zeilen und Spalten
Erstellen, Löschen und Ändern von Zeilen und Spalten
Verwendung von Boolean-Indexing zur Zeilenauswahl anhand logischer Abfragen
Zusammenfassung von Daten für einen Überblick

Berechnung von Statistiken direkt in pandas DataFrames:

Durchführung einfacher Statistiken direkt auf DataFrames (Durchschnitt, Minimum, Maximum, Summe, Median, Varianz usw.)
Aggregation und Filterung von Daten
Ersetzen von fehlenden Werten
Erstellung von Kreuztabellen (Kontingenztabellen)

Datenverarbeitung: Einlesen und Schreiben von Daten:

Festlegung des Arbeitsverzeichnisses in Python und der IDE Spyder
Einlesen und Schreiben von CSV- und Excel-Dateien
Datenimport von einer URL
Übersicht über nützliche Parameter
Lesen und Schreiben im Python-Format "pickle"
Handhabung großer Datensätze

Kontrollstrukturen:

Erstellung eigener Funktionen
Festlegung von Standardparametern in Funktionen (Positional Arguments und Keyword Arguments)
Anwendung von For-Schleifen
Implementierung von If-Else-Bedingungen
Verwendung von List Comprehensions mit If-Else

Datenvisualisierung mit seaborn/matplotlib:

Grundlegende Aspekte von matplotlib
Anpassung von Achsenbeschriftung, Legende und Titel
Speichern von Diagrammen
Erstellung von Diagrammtypen wie Linien-, Box-, Histogramm-, Scatter- und Balkendiagrammen in seaborn
Variation oder Festlegung von Darstellungsmerkmalen (Punktgröße, Farbe, Gruppierung) durch eine Variable

Textmanipulation im DataFrame und Einführung in numpy:

Zeilenweise Textbearbeitung in DataFrames
Extraktion von Informationen aus Texten
Erstellung von numpy-Arrays und Slicing nach Zeilen und Spalten
Anwendung von Funktionen auf numpy-Arrays

Überblick über Machine Learning:

Einführung in das Konzept des Machine Learnings
Praktische Anwendungsbeispiele
Unterscheidung von künstlicher Intelligenz, Machine Learning und Deep Learning
Erklärung des Unterschieds zwischen überwachtem und unüberwachtem Lernen
Besprechung von Overfitting, Train-Test-Split und Kreuzvalidierung

Entscheidungsbaum mit scikit-learn:

Datenaufteilung in Test- und Trainingsdaten, Modellerstellung und Validierung
Grundlagen des Entscheidungsbaum-Algorithmus
Umsetzung in Python
Ergebnisvalidierung (u. a. Verwirrungsmatrix, Sensitivität, Genauigkeit)
Anpassung von Hyperparametern während des Trainings

Neuronales Netz und K-Nearest Neighbor:

Grundlagen dieser Algorithmen
Training eines Multi-Layer-Perceptrons (MLP)
Umsetzung in Python mit scikit-learn
Ergebnisvalidierung (u. a. Verwirrungsmatrix, Sensitivität, Genauigkeit)
Anpassung von Hyperparametern

K-Means Clustering:

Erstellung und Validierung eines Cluster-Modells
Grundlagen des K-Means-Algorithmus
Umsetzung in Python mit scikit-learn
Ergebnisvalidierung

Clustering mit DBSCAN:

Funktionsweise des DBSCAN-Clustering-Algorithmus
Worin liegt der Unterschied zu K-Means?
Umsetzung in Python mit scikit-learn
Ergebnisvalidierung (Sillhouette Score, Calinski-Harabasz)

Schulungsmethode

Diese Data Science Schulung beinhaltet eine Vielzahl von Programmieraufgaben. Die Teilnehmer haben die Möglichkeit, diese Aufgaben eigenständig mit Unterstützung des Trainers in Python zu lösen. Das Ziel ist es, das Gelernte zu festigen und zu vertiefen. Bei individuellen Unklarheiten steht der Trainer direkt zur Verfügung, um Fragen zu beantworten.

Im Seminar werden in jedem Block (meistens ca. 90 Minuten lang) sowohl theoretische als auch praktische Einheiten behandelt. Die theoretischen Einheiten dienen dazu, das notwendige Wissen zu vermitteln, um die Übungsaufgaben zu verstehen und eigenständig lösen zu können. Dabei konzentrieren wir uns auf den theoretischen Stoff, der das Verständnis verbessert und vermeiden ausführliche, wissenschaftliche Theorieeinheiten. Der Schwerpunkt liegt auf der praktischen Anwendung, also dem Schreiben von Code und dem Lösen von kleinen Verständnisaufgaben. Teilnehmer können jederzeit Fragen stellen, die während der praktischen Einheiten individuell vom Dozenten beantwortet werden. Fragen von allgemeinem Interesse werden allen Teilnehmern erklärt. Sie erhalten die Theorie und weitere Code-Erklärungen als PDF und gedruckte Version. Codebeispiele und Musterlösungen der Übungsaufgaben sind in digitaler Form verfügbar.

Die Übungen bestehen hauptsächlich aus Coding-Aufgaben, bei denen Sie entweder kurze Codebeispiele schreiben oder Lücken in vorhandenem Code ergänzen müssen. Letzteres fördert das Verständnis für Code. Die Aufgaben sind so gestaltet, dass sie von allen Teilnehmern innerhalb der verfügbaren Zeit gelöst werden können. Wir haben Aufgaben mit unterschiedlichem Schwierigkeitsgrad vorbereitet, damit schnellere Teilnehmer oder Teilnehmer mit Vorkenntnissen zusätzliche Übungsmöglichkeiten haben. Darüber hinaus gibt es für einige Kapitel kurze Kontrollfragen zum theoretischen Teil.

Hinweis

Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.
Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Kurs online zum Download zur Verfügung gestellt. Sie erhalten vor der Schulung per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.
Sie sollten sich in firmenfremde WLAN-Netze registrieren können.
Als Backup Lösung ist es möglich, dass der USB Port bei Ihrem Laptop freigeschaltet ist, um damit im Seminar verwendete Dateien oder sonstige Unterlagen übertragen zu können.
In der Schulung wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).

Weitere Informationen

Anfahrtsinformationen

Termine und Orte

1.790,00 € Netto
Noch freie Plätze
Jetzt buchen
online Training
Live Online Training
1.790,00 € Netto
Noch freie Plätze
Jetzt buchen
online Training
Live Online Training
1.790,00 € Netto
Noch freie Plätze
Jetzt buchen
online Training
Live Online Training

Schulung - Einführung in Data Science mit Python für Anfänger

Inhouse Seminare

Sparen Sie Zeit und Geld mit den Inhouse Seminaren von Integrata

Alle Seminare aus unserem offenen Angebot können Sie auch als Inhouse-Veranstaltung buchen. Im Fokus steht Ihr Unternehmen und Ihre Mitarbeiter. Wir bieten Ihnen die Möglichkeit, individuelle Anforderungen und Anpassungen der Inhalte an Ihr Unternehmen vorzunehmen.

Die individuelle Lösung:

- Individueller Termin
- Individueller Ort, entweder in unseren Trainingszentren oder in Ihren eigenen Räumen
- Auf Wunsch, individuelle, auf Ihre Bedürfnisse zugeschnittene Inhalte

Inhouse Seminare

Das Inhouse-Paket umfasst:

- die Durchführung als Live Online, Hybrid oder Präsenz Training
- die Umsetzung durch praxiserprobte und branchenerfahrene Trainer

In Abhängigkeit von Teilnehmerzahl, Akkreditierung oder Lizenzgebühren können zusätzliche Kosten anfallen. Nicht im Preis enthalten sind dabei z.B. Raum- und Bewirtungskosten, ebenso Mehrkosten durch Seminarmaterialien.

Bitte sprechen Sie uns gerne dazu an und lassen Sie sich jetzt Ihr individuelles Angebot erstellen.

Recevoir le programme par email

Das Seminarprogramm wurde weiterentwickelt

Sie haben einen Termin aus dem Jahr ausgewählt, das Seminarprogramm wurde seither weiterentwickelt. Möchten Sie:

Sehen Sie sich das Programm für oder Ihre Buchung fortsetzen

Envoyer le programme à un collaborateur

Preis

Es entstehen keine zusätzlichen Liefer- & Versandkosten

Schulung - Einführung in Data Science mit Python für Anfänger