New
 
Full Digital
 
Fantom Tag

Schulung - Statistik Grundlagen und Programmieren mit R

  • Live Online Training
DURCHFÜHRUNG MIT TERMIN
Dauer
14 Stunden

Preis
1.290,00 € netto
1.535,10 € inkl. 19% MwSt.

Nr.
54400
TERMIN UND ORT NACH ABSPRACHE
On-demand Training
Sind Sie an diesem Thema interessiert?
Unsere Experten entwickeln Ihr individuell angepasstes Seminar!

Das Seminar "Grundlagen von R für Anfänger" bietet Teilnehmern einen umfassenden Einstieg in die Verwendung von R und R-Studio. Es beginnt mit einem kurzen Einblick in R und R-Studio. Anschließend wird den Teilnehmern die Bedienung von R und R-Studio nähergebracht, einschließlich der Verwendung des Editors, der Konsole und der Hilfefunktionen.
Die Teilnehmer lernen, wie sie Pakete in R installieren und einbinden können, sowie wie man Variablen zuordnet und Skripte erstellt und ausführt. Dabei werden sie mit den Hauptdatenstrukturen von R, wie Vektoren, Faktoren und Arrays, vertraut gemacht. Sie erfahren, wie sie Elemente aus diesen Datenstrukturen extrahieren, Daten mit grundlegenden Funktionen aufbereiten und Daten in verschiedene Datenstrukturen umwandeln können.
Im weiteren Verlauf des Seminars erhalten die Teilnehmer eine Einführung in das dplyr-Paket, einen Bestandteil des tidyverse. Sie lernen, wie sie mit einem Tibble arbeiten können, einer Fortentwicklung des data.frames, und wie sie die ersten dplyr-Funktionen zur Spaltenauswahl anwenden können, einschließlich select(), filter(), rename() und slice(). Sie werden auch den Einsatz logischer Operatoren kennenlernen.
In der Folge werden die Teilnehmer in die Datenmodifikation mit dplyr eingeführt. Sie lernen, wie man Zeilen mit der Funktion arrange() sortiert, neue Spalten mit mutate() berechnet und statistische Zusammenfassungen mit summarise() erstellt. Die Verwendung des Pipe Operators %>%, der Gruppierung von Analysen mit group_by() und der Behandlung von fehlenden Daten mit drop_na() und replace_na() wird ebenfalls behandelt.
In einem weiteren Abschnitt des Seminars erfahren die Teilnehmer, wie sie deskriptive Statistiken mit dplyr ermitteln können. Sie lernen, wie sie zufällige Stichproben aus vorhandenen Daten auswählen und Korrelationsuntersuchungen (Spearman, Pearson) durchführen können. Auch die Erstellung von Kontingenztabellen wird erläutert.
Das Seminar geht auch auf Kontrollabläufe ein. Die Teilnehmer lernen, wie man benutzerdefinierte Funktionen erstellt, Standardwerte in Funktionen definiert, For-Schleifen verwendet und If-Else Anweisungen implementiert.
Der Abschnitt über Datenvisualisierung wird den Teilnehmern das Konzept der Grafikgrammatik und die Anwendung der ggplot2-Ebenen zur Erstellung erster Grafiken und statistischer Darstellungen näherbringen. Sie werden auch lernen, wie man Darstellungen anpasst und mehrere Subplots erstellt und speichert.
Schließlich werden die Teilnehmer erfahren, wie sie das Arbeitsverzeichnis in R und RStudio festlegen, CSV-, Excel- oder SPSS-Dateien importieren und exportieren, und nützliche Parameter und die fread()-Funktion für umfangreiche Datensätze nutzen können.
Das Seminar schließt mit einer Wiederholungszeit und möglichen Fallstudien ab, um den Teilnehmern Gelegenheit zu geben, das Erlernte zu vertiefen, zu testen und Fragen zu stellen. Das Seminar richtet sich an Anfänger und bietet ausreichend Zeit für Fragen, Experimentieren und das Schreiben von Code.

Lesen Sie mehr
Zielgruppe

Wer sollte teilnehmen:

Zielgruppe

Dieser R-Kurs richtet sich an Teilnehmer, die Grundlagen der Programmierung und Datenanalyse mit R erlernen möchten und keine oder nur geringe Erfahrung in den Bereichen Datenanalyse, statistische Auswertung und der Nutzung der Statistik-Software R mit RStudio haben. Das Ziel des Kurses ist es, eine Einführung in die Statistik zu bieten und deren Umsetzung in R zu vermitteln. Die Teilnehmer werden entweder bereits in ihrem Unternehmen mit der statistischen Auswertung von Daten betraut oder streben eine Entwicklung in diese Richtung an.

Voraussetzungen

Diese Einführung in R erfordert keine Kenntnisse in R oder einer anderen Programmiersprache. Es ist jedoch erforderlich, dass die Teilnehmer über Vorerfahrungen im Umgang mit Daten verfügen. Sie haben bereits mit Excel oder einer BI-Software gearbeitet und verstehen beispielsweise das Konzept einer spaltenweisen Berechnung sowie einfache Statistiken wie den Mittelwert und die Varianz.

Allgemeine Computerkenntnisse und mathematische Grundkenntnisse (wie das Verständnis einer Funktion, des Summenzeichens, eines Integrals, einer Ableitung, der Grundrechenarten und eines Koordinatensystems zum Plotten) werden vorausgesetzt.

In R werden Fachbegriffe verwendet, und die Dokumentation im Internet ist auf Englisch. Daher sind die Folien in dieser Schulung auf Englisch gehalten. Die Sprache des Kurses ist jedoch Deutsch.
Trainingsprogramm

Trainingsprogramm

Grundlagen von R

  • Kurzer Einblick in R und R-Studio
  • Erläuterungen zur Nutzung von R und R-Studio (Editor, Konsole, Hilfefunktion und mehr)
  • Prozess der Paketinstallation und -einbindung
  • Zuordnung von Variablen
  • Erstellen und Durchführen von Skripten

Datenstrukturen

  • Vektor, Faktor und Array in der R-Umgebung
  • Auswahl von Elementen
  • Datenaufbereitung mit grundlegenden Funktionen
  • Umwandlung von Daten in verschiedene Datenstrukturen

Einführung in dplyr (ein Bestandteil des tidyverse)

  • Üerblick über die Tidyverse Pakete
  • Ein Tibble - Fortentwicklung des data.frames
  • Anwendung erster dplyr-Funktionen zur Spaltenauswahl
  • select(), filter(), rename(), slice()
  • Einsatz logischer Operatoren

Datenmodifikation mit dplyr

  • Sortierung von Zeilen mit arrange()
  • Berechnung neuer Spalten mittels mutate()
  • Statistische Zusammenfassung mit summarise()
  • Der Pipe Operator %>%
  • Gruppierung von Analysen mit group_by()
  • Behandlung von fehlenden Daten mit drop_na(), replace_na()

Statistikermittlung mit dplyr

  • Hauptdeskriptive Statistiken
  • Auswahl zufälliger Stichproben aus vorhandenen Daten
  • Korrelationsuntersuchung (Spearman, Pearson)
  • Erstellung von Kontingenztabellen

Kontrollabläufe

  • Erstellung benutzerdefinierter Funktionen
  • Definition von Standardwerten in Funktionen
  • Einsatz von For-Schleifen
  • If-Else Anweisungen

Datenvisualisierung über ggplot2

  • Verständnis der Grafikgrammatik
  • Anwendung der ggplot2-Ebenen zur Erstellung erster Grafiken und statistischer Darstellungen
  • Anpassen von Darstellungen (Größe der Datenpunkte, Farbgebung, Gruppierung) mit konstanten oder variablen Werten
  • Erzeugung mehrerer Subplots, Anpassung und Speicherung von Grafiken

Datenaufnahme und -export

  • Festlegung des Arbeitsverzeichnisses in R und RStudio
  • Import/Export von CSV-, Excel- oder SPSS-Dateien
  • Übersicht über hilfreiche Parameter
  • Die fread()-Funktion für umfangreiche Datensätze

Puffer und ggfalls Fallstudien

  • Vorreservierte Zeit für Anfänger zur Fragestellung, zum Testen und zum Schreiben von Code
  • Mögliche Fallstudie zur selbständigen Vertiefung des Erlernten und zur Besprechung auftretender Fragestellungen
Schulungsmethode

Schulungsmethode

Diese Schulung vermittelt die Grundlagen von R für die Programmierung und Datenanalyse mit R. Der Fokus liegt dabei auf praktischer Anwendung. Die Teilnehmer haben die Möglichkeit, eigenständig in der Entwicklungsumgebung RStudio zu programmieren und somit direkt zu üben. Der Trainer steht dabei zur Verfügung, um Fragen zu beantworten und Unklarheiten zu klären. Zudem unterstützt er bei der Lösung der Übungen.

Hinweis

Hinweis

Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.

Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Seminar online zum Download zur Verfügung gestellt. Sie erhalten vor dem Seminar per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.

Sie sollten sich in firmenfremde WLAN-Netze registrieren können.
Als Backup Lösung ist es möglich, dass der USB Port bei Ihrem Laptop freigeschalten ist, um damit verwendete Dateien oder sonstige Unterlagen übertragen zu können.
Im Seminar wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).

Weitere Seminare aus dem Bereich Data Science, Machine Learning & KI

Weitere Informationen

Weitere Informationen

Termine und Orte

  • 1.290,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.290,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
Schulung - Statistik Grundlagen und Programmieren mit R