Your SlideShare is downloading. ×
eoda R-Akademie 2014
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

eoda R-Akademie 2014

705
views

Published on

Die R-Akademie von eoda ist ein modulares Trainingsprogramm für R, das praxisorientiert und umfassend die vielfältigen Möglichkeiten der Statistiksprache R behandelt. Mit dem R-Training von eoda …

Die R-Akademie von eoda ist ein modulares Trainingsprogramm für R, das praxisorientiert und umfassend die vielfältigen Möglichkeiten der Statistiksprache R behandelt. Mit dem R-Training von eoda stellen Sie sicher, dass Sie die richtigen Kenntnisse erwerben, um den maximalen Nutzen in der Anwendung von R zu erzielen.


0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
705
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
4
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. R-Akademie 2014
  • 2. R-Akademie Die eoda R-Akademie - Wissen, was bewegt Die R-Akademie von eoda ist ein modulares Trainingsprogramm für R, das praxisorientiert und umfassend die vielfältigen Möglichkeiten der Statistiksprache R behandelt. Mit dem R-Training von eoda stellen Sie sicher, dass Sie die richtigen Kenntnisse erwerben, um den maximalen Nutzen in der Anwendung von R zu erzielen. Unsere Trainer arbeiten seit über 10 Jahre in der statistischen Datenanalyse. Unsere R-Trainings für Unternehmen, Universitäten und Graduiertenzentren werden regelmäßig evaluiert und sehr gut bewertet. Eine Auswahl unserer Referenzen:
  • 3. R-Akademie Über R R ist eine Open Source Programmiersprache für statistische Datenanalyse und -visualisierung. Mittlerweile hat sich R, neben den kommerziellen Softwarelösungen SPSS®, Stata® und SAS®, als Standardsoftware für Datenanalyse sowohl in der Wissenschaft als auch in der freien Wirtschaft etabliert. In vielen Bereichen ist R den kommerziellen Softwarelösungen bereits überlegen. Die Entwicklung deutet darauf hin, dass sich R auf absehbare Zeit zum führenden System für softwaregestützte Datenanalyse entwickeln wird. R besteht aus einer Basisumgebung und einer Vielzahl freier Zusatzpakete, mit denen sich praktisch alle Problemstellungen, die im weitesten Sinne mit Datenanalyse zu tun haben, lösen lassen. Traffic auf Email Listen Jahr TrafficaufE-MailListen Anzahl an R-Paketen Zeit AnzahlanverfügbarenR-Paketen
  • 4. R-Akademie Die Vorteile von R • Investitionssicherheit: Das Involvement der wissenschaftlichen Community in Verbindung mit dem zunehmenden Engagement großer Unternehmen wie IBM®, SAS® und Revolution Analytics® für R bestätigt die Vehemenz mit der sich R in den letzten Jahren in der Datenanalyse durchgesetzt hat und lässt eine weitere sehr positive Entwicklung für die Marktakzeptanz erwarten. • Grafik: R verfügt über eine enorm leistungsfähige Grafikengine, mit der Sie publikationsreife Grafiken automatisiert erstellen können. Größe, Format und Auflösungen der Grafiken können direkt in R eingestellt werden, so dass eine Weiterbearbeitung in anderen Programmen entfällt. Selbst Geodaten und Karten lassen sich ohne Weiteres visualisieren. • Flexibilität: R kann verschiedenste Daten und Datenquellen nutzen. Von klassischen Dateien wie .sav-, .sas-, .xls- oder .txt- Dokumenten bis hin zu Datenbanken und Internetressourcen lassen sich alle Datenquellen direkt in R einlesen und weiterverarbeiten. Mit dem gleichen Code, den gleichen Tools und dem gleichen Know-how können sowohl Big Data als auch kleinere Studien analysiert werden. • Kosten: Es fallen keinerlei Lizenzkosten an. • Analyseumfang: Mit R lassen sich alle gängigen und bekannten Analyseverfahren umsetzen. Darüber hinaus kann noch auf unzählige weitere Verfahren zurückgegriffen werden. Selbst neueste Analyseverfahren stehen zeitnah zur Verfügung. • Migration: R kann an alle gängigen Statistikprogramme, Microsoft Office® und Programmiersprachen angebunden werden. Ein kompletter Umstieg auf R ist nicht zwingend, sondern Ihre bestehende Analyseumgebung kann – um ein vielfaches an Funktionsumfang erweitert – weiterhin verwendet werden. • Qualität: Das Kernentwicklerteam rund um R setzt sich aus weltweit renommierten Experten fürDatenanalyse zusammen. Eine Auswahl an R-Usern
  • 5. R-Akademie Der Aufbau der eoda R-Akademie
  • 6. R-Akademie Kursangebot Einführung in R • Einstieg in R Das Programm R, CRAN-Mirror, verschiedene Umgebungen/Editoren von R, Nutzung der internen Hilfe-Funktionen, Hilfen im Internet • Konzept und Philosophie von R Die Programmiersprache, Objekte und Objektorientierung, Wertezuweisung, Funktionen • Variablentypen Vektoren, Dataframes, Listen,… • Einlesen von Daten .txt-, .csv-, .xls-, .sav-Dateien, Internetquellen etc. • Datenmanagement Bildung neuer Variablen, bedingtes Umkodieren, einfache Berechnungen, fehlende Werte • Auswertungen mit R Statistische Kennzahlen, einfache Tabellen und Grafiken Data Mining mit R • Einführung in das Data Mining • Modell-Evaluation Modellauswahl und Datenbasis, Fehlermatrix, Risk-Charts, ROC, Sensitivität, Präzision, Lift, Prognose und Beobachtung • Explorative Analyse tabellarische Analyse, visuelle Analyse (metrisch, kategorial), Korrelationsanalyse, Missing-Values Korrelation • Assoziationsanalyse Support, Konfidenz, Lift, Interpretation • Decision- und Regressiontrees Algorithmus, Interpretation, grafische Interpretation • Neuronale Netze Theorie, Lernprozess im KNN, nnet • Random Forest Theorie, Interpretation, erweiterte Optionen, Conditional inference trees Grafikerstellung mit R • Grafik Pakete base, grid, ggplot2, lattice, plot • ggplot Data, Mapping • High-Level Grafik Elemente Balkendiagramm, Punktdiagramm, Tortendiagramm, Mosaikdiagramm, Histo- gramme, Dichtediagramme, Scatterplots • Low-Level Grafik Elemente Pfeile, Achsen, Legenden, Gitter, Überschriften • Layer Komponenten Geoms, Stats, Coord, Facet, Opts
  • 7. R-Akademie Kursangebot Multivariate Statistik mit R • Regressionsanalyse Modell und Ausgangspunkt Interpretation und Güte Mögliche Probleme • Faktorenanalyse Theorie der Faktorenanalyse Eignungsprüfung Anzahl der Faktoren Anzahl der zu extrahierenden Dimensionen • Clusteranalyse Ausgangspunkt und Theorie Unterschiedliche Abstandsmaße Interpretation Visualisierung Statistische Testverfahren • Überblick über statistische Testverfahren • Normalverteilung Kolmogorov-Smirnov-Anpassungstest • Unabhängigkeit Chi-Quadrat-Test, Cramers V • Homogenität Kolmogorov-Smirnov-Z-Test, Kruskal-Wallis-H- Test • Korrelation Pearsons Korrelationskoeffizient, Kendall Tau- b, Spearmans Rangkorrelationskoeffitient • Varianztest t-test, ANOVA • Post-Hoc-Tests Varianzhomogenität, Multiple Vergleiche • Kontraste Qualitative Analysen mit R • Überblick über Text Mining • Einlesen von unstrukturierten Daten • Klassifikation von Dokumenten • Clustering • Assoziationsanalyse
  • 8. R-Akademie Kursangebot Programmieren mit R (I) • Einstieg Vektoren, Dataframes, Funktionen, Indizieren, Logische Operatoren • Funktionen definieren • Bedingte Anweisungen if, else, ifelse • Schleifen Indizieren, Abbrechen, Wiederholen • Apply-Funktionen lapply, sapply, tapply • S3-Klassensystem Theorie, eigene Klassen erstellen, generische Funktionen erstellen, Vererbung • Metaprogrammierung Calls, Expressions, Zeichenketten • Einbindung in Betriebssysteme • Parallelisierung Programmieren mit R (II) • Parallelverarbeitung Multicore, snow, snowfall, doParallel • Compiling Funktionen Cmpfun, just-in-time compiling • Benchmarking Microbenchmarking, autoplot • Profiling Rprof-Funktionen, trace, memory profiling • Code Optimierung Vektorisierung, Pre-allocating memory, Suche nach hilfreichen Paketen • Debugging U.a. Visual debugging Zeitreihenanalyse mit R • Einführung in Zeitreihenverfahren • Visualisieren von Zeitreihen • Dekomposition • Testverfahren • Exponentielles Glätten • ARIMA Modelle • Forecasting • Einführung in die Eventhistory-Analyse • Kaplan Meier Modell • Cox-Regression
  • 9. R-Akademie Kursangebot Angewandte Statistik im Qualitätsmanagement mit R • Grundlagen im Umgang mit R • Einführung in die Konzepte des statistischen Testens Ermittlung der optimalen Stichprobengröße Auswahl des richtigen Testverfahrens Interpretation von Kennziffern Aussage über die Sicherheit der Ergebnisse Definition von zulässigen Abweichungen AQL Normwerttabellierungen nach ISO 2859 und DIN ISO 3951 • Praxisbezogener Einsatz von R im Qualitätsmanagement Interaktive Grafiken mit R Interaktive Grafiken sind ein flexibler und effizienter Weg um Daten zu analysieren und um Analyseergebnisse zu präsentieren. Interaktive grafische Anwendungen bieten Abfragen, Selektionen, Highlighting oder die Modifikation von Grafikparametern. Im Umfeld von R gibt es verschiedene Konzepte, die die Erstellung von interaktiven Grafiken und Anwendungen direkt aus R heraus möglich machen. Erwähnt seien hier IPlots, googleVis oder shiny. Der Kurs gibt einen ersten Überblick über die Erstellung interaktiver Grafiken mit R und liefert das Rüstzeug, um selbst interaktive Visualisierungen in R zu realisieren. Reproducible ResearchReproducible Research • Einlesen von Daten aus verschiedenen Quellen Z. B. aus Excel, SPSS • Analyse der eingelesenen Daten Pan doc, knitR • Anfertigen von statischen Reportvorlagen und variablen Stylesheets Z. B. Latex, HTML, CSS • Ausgabe dynamischer Reports
  • 10. R-Akademie Kursangebot Big Data mit R Vielfältige Initiativen haben verschiedene Konzepte zum Umgang mit großen Datenmengen in R hervorgebracht. Unter anderem wurden verschiedene Parser und Pakete entwickelt, die den Umgang mit Big Data in R vereinfachen. Der Kurs gibt einen einführenden Überblick über folgende Aspekte: • Verbindungen zu Datenquellen wie Datenbanken oder File Systemen wie Hadoop, • Anbindung an Cloud Umgebungen wie WindowsAzure oder Amazon Web Services, • Chunking – Aufteilen der Daten in Teilbereiche, • Parallelisierung von Jobs zur Berechnung, • Überblick über die verschiedenen Konzepte der verschiedenen Parser (Revolution Analytics, Oracle R Enterprise, Renjin, …) • Visualisierung von Big Data. Hadoop mit R Daten in verteilten Systeme wie Hadoop- Clustern erfordern im Vergleich zu nicht verteilt vorliegenden Daten andere Verfahren zur Analyse der Daten als MapReduce. Das Prinzip von MapReduce besteht darin, ein Problem in kleine Aufgaben einzuteilen, die dann auf einem kleinen Teil der Daten gelöst werden. Ein typisches Einsatzszenario für Daten, die in einem Hadoop-System gespeichert sind, ist das Auszählen von Wörtern in Textdateien. Während bei herkömmlichen Techniken die gesamte Textmenge en bloc zeitaufwendig durchgearbeitet wird, zerlegt man mit MapReduce die Texte auf den einzelnen Knoten in kleine Blöcke. Mit dem Reduce-Teil werden dann die Ergebnisse wieder zusammengefasst. Auf diese Art lassen sich auch komplexere Such-, Vergleichs- und Analyseoperationen parallelisieren und dadurch schneller berechnen. Der Kurs vermittelt die Entwicklung von Skripten für MapReduce Jobs an konkreten Beispielen. Ort Die Kurse finden in unseren Schulungsräumen in der Ludwig-Erhard-Straße 8 in Kassel statt. Es besteht sowohl eine gute Anbindung mit dem Auto als auch mit öffentlichen Verkehrsmitteln. In der unmittelbaren Umgebung zum Veranstaltungsort sind verschiedene Übernachtungsmöglichkeiten gegeben. Wir helfen Ihnen gerne bei der Suche. Voraussetzungen Die Kurse richten sich vornehmlich an Personen, die bereits Grundlagenkenntnisse mit Statistiksoftwarepaketen bzw. Excel gemacht haben. Grundlegende R-Kenntnisse sind für alle Kurse außer „Einführung in R“ vorausgesetzt. Für die Kurse wird ein eigener Laptop mit Administrationsrechten benötigt.
  • 11. R-Akademie eoda Wir bei eoda lieben Daten und Analysen. Wir sind Data Scientists, Softwareentwickler, Unternehmensberater und Personal Trainer in einem. Auf der Basis reichhaltiger Erfahrung in Data Mining und Predictive Analytics generieren wir strategische Wettbewerbsvorteile aus Daten. Unser Team entwickelt Handlungs- empfehlungen und Lösungen, die Ihnen helfen, sich bestmöglich an kommende Trends oder anstehende Marktveränderungen anzupassen. Wir sind als erstes deutsches Unternehmen Mitglied der R-Community und gehören zu den Vorreitern in der unternehmerischen Verwendung von R im deutschsprachigen Raum. Dieses Wissen und die Begeisterung für die nahezu unbegrenzten Möglichkeiten von R teilen wir auch gerne mit Ihnen – In unserer R- Akademie bieten wir Ihnen die Möglichkeit zu erlernen, wie Sie selbst sinnvoll mit statistischen Methoden und den anfallenden Daten in Ihrem Umfeld umgehen. Anmeldung Das Anmeldeformular, eine und weitere Informationen zu Terminen und Preisen finden Sie auf unserer Homepage Ludwig-Erhard-Straße 8 34131 Kassel Tel. +49 (0)561 202 724 40 Fax. +49 (0)561 202 724 30 info@eoda.de www.eoda.de Was wir bieten • Kurse in Kleingruppen bis maximal 8 Teilnehmer • Hohe Praxisorientierung durch erfahrene Trainer aus der Praxis • Ausreichend Übungsphasen, in denen das Gelernte direkt umgesetzt werden kann • Hochwertige Kursmaterialien und einheitliche Übungsdatensätze • Überprüfung der Lernziele