Skip to main content

Erste Schritte

  • Chapter
  • First Online:
Grundlagen der Datenanalyse mit R

Part of the book series: Statistik und ihre Anwendungen ((STATIST))

  • 7548 Accesses

Zusammenfassung

R ist eine freie und kostenlose Software-Umgebung zur statistischen Datenanalyse (Ihaka und Gentleman 1996; R Core Team 2019a). R integriert eine Vielzahl von Möglichkeiten, um Daten organisieren, transformieren, auswerten und visualisieren zu können.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 44.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 59.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Genauer gesagt ist GNU R ursprünglich eine open source Implementierung der Sprache S (Becker et al. 1988). Der open source Programmen zugrundeliegende Quelltext ist frei erhältlich, zudem darf die Software frei genutzt, verbreitet und verändert werden. Genaueres erläutert der Befehl licence(). Kommerzielle Varianten von R sind u. a. Microsoft R (Microsoft 2019) und TIBCO TERR (TIBCO Software Inc 2019).

  2. 2.

    Abgesehen von der Oberfläche und abweichenden Pfadangaben bestehen nur unwesentliche Unterschiede zwischen der Arbeit mit R unter verschiedenen Betriebssystemen.

  3. 3.

    CRAN (Comprehensive R Archive Network) bezeichnet ein weltweites Netzwerk von mirror servern für R-Installationsdateien, Zusatzpakete und offizielle Dokumentation. Eine durchsuchbare und übersichtlichere Oberfläche mit weiteren Funktionen ist https://r-pkg.org/.

  4. 4.

    R Version 4.0.0 wurde im Frühjahr 2020 veröffentlicht. Neuere Versionen erscheinen ca. halbjährlich. Dabei sind leichte, für den Benutzer jedoch üblicherweise nicht merkliche Abweichungen zur in diesem Manuskript beschriebenen Arbeitsweise von Funktionen möglich.

  5. 5.

    https://www.xquartz.org/

  6. 6.

    https://www.rocker-project.org/

  7. 7.

    https://www.anaconda.com/

  8. 8.

    https://irkernel.github.io/

  9. 9.

    https://www.r-project.org/posting-guide.html

  10. 10.

    https://stackoverflow.com/q/5963269

  11. 11.

    https://stackoverflow.com/tags/Rhttps://stats.stackexchange.com/tags/R

  12. 12.

    https://www.edx.org/course/statistics-and-r

    https://www.edx.org/course/introduction-to-r-for-data-science-2

  13. 13.

    RStudio wird derzeit mit hohem Tempo weiterentwickelt. Es ist deshalb möglich, dass im Laufe der Zeit Aussehen und Funktionalität in Details von der folgenden Beschreibung abweichen.

  14. 14.

    Für automatisierte Auswertungen s. Abschn. 4.1. Um die Ausgabe ganz oder als Protokoll-Kopie aller Vorgänge in eine Datei umzuleiten s. Abschn. 2.1.4.1. Befehle des Betriebssystems sind mit   ausführbar, so können etwa die Netzwerkverbindungen mit shell("netstat") angezeigt werden.

  15. 15.

    Zudem kann jeder Benutzer eines Computers dazu die Datei  .Rprofile in seinem Heimverzeichnis anlegen. In dieser Datei können auch die Funktionen namens  .First bzw.  .Last mit beliebigen Befehlen definiert werden, die dann beim Start als erstes bzw. beim Beenden als letztes ausgeführt werden (Abschn. 17.3). R auf diesem Weg individuell zu konfigurieren, senkt jedoch die Reproduzierbarkeit der Auswertungen (Abschn. 4.4).

  16. 16.

    Sofern diese Formatierung nicht mit  options(scipen=999) ganz unterbunden wird. Allgemein kann dabei mit ganzzahlig positiven Werten für scipen (scientific penalty) die Schwelle erhöht werden, ab der R die wissenschaftliche Notation für Zahlen verwendet (vgl. ?options).

  17. 17.

    Für die zur Bestimmung der Ausführungsreihenfolge wichtige Assoziativität von Operatoren vgl. ?Syntax.

  18. 18.

    In diesem Text werden nur die wichtigsten Argumente der behandelten Funktionen vorgestellt, eine vollständige Übersicht liefert jeweils sowie die zugehörige Hilfe-Seite .

  19. 19.

    In R sind Operatoren wie +, -, * oder / Funktionen, für die lediglich eine bequemere und vertrautere Kurzschreibweise zur Verfügung steht. Operatoren lassen sich auch in der Präfix-Form benutzen, wenn sie in Anführungszeichen gesetzt werden. So ist .

  20. 20.

    Gleiches gilt für die Werte von Argumenten, sofern sie aus einer festen Liste von Zeichenketten stammen. Statt ist also auch als Funktionsaufruf möglich.

  21. 21.

    Der Lesbarkeit halber werden in diesem Buch vorgestellte Pakete nur bei ihrer ersten Verwendung auch zitiert, bei späteren Erwähnungen wird nur ihr Name genannt. Über den im Index markierten Haupteintrag für ein Paket lässt sich die Zitation finden.

  22. 22.

    Die Installation setzt voraus, dass der Benutzer ausreichende Schreibrechte auf dem Computer besitzt, weshalb es u. U. notwendig ist, R zunächst als Administrator zu starten. Mit dem Argument repos von install.packages() können temporär, mit  setRepositories() auch dauerhaft nicht-CRAN-server als Paketquelle verwendet werden. In RStudio lassen sich Paketquellen in Tools \(\rightarrow \) Global Options... \(\rightarrow \) Packages \(\rightarrow \) Secondary repositories eintragen. In diesem Kontext ist etwa das BioConductor-Projekt (Gentleman et al. 2004; Huber et al. 2015) mit Paketen vor allem zur Bioinformatik zu nennen. Für die Installation von auf GitHub gehosteten Paketen eignet sich install_github() aus dem Paket remotes (Hester et al. 2020). remove.packages() deinstalliert ein Paket wieder.

  23. 23.

    Abschn. 17.5.2 zeigt, wie sich die Installation beschleunigen lässt, indem man sie auf mehrere Rechenkerne parallel verteilt.

  24. 24.

    Dafür muss eine Textdatei Renviron.site im Unterordner etc/ des R-Programmordners existieren und eine Zeile der Form (z. B.  R_LIBS="c:/rlibs") mit dem Pfad zu den Paketen enthalten.

  25. 25.

    Bei der Installation einer neuen R-Version müssen zuvor manuell hinzugefügte Pakete erneut installiert werden, wenn es sich um einen großen Versionssprung handelt, z. B. von Version 4.0.0 zu 4.1.0 – nicht aber von Version 4.0.0 zu 4.0.1.

  26. 26.

    Wird versucht, ein nicht installiertes Paket zu laden, erzeugt  library() einen Fehler. Mit dem Argument logical.return=TRUE erzeugt library() nur eine Warnung und gibt ein später zur Fallunterscheidung verwendbares FALSE zurück (Abschn. 17.1.1). Auch  require() warnt nur, wenn ein zu ladendes Paket nicht vorhanden ist.

  27. 27.

    Besitzen verschiedene geladene Pakete Funktionen desselben Namens, maskieren die aus später geladenen Paketen jene aus früher geladenen (Abschn. 1.4.1) – library() zeigt dies mit einer Warnmeldung an. Um explizit auf eine so maskierte Funktion zuzugreifen, ist dem Funktionsnamen der Paketname mit zwei Doppelpunkten voranzustellen, etwa  base::mean(). Will man Maskierungen verhindern, um nicht versehentlich mit der falschen Funktion zu arbeiten, kann man die globale Option setzen (Abschn. 1.2.2). Bei Maskierung bricht library() dann mit einer Fehlermeldung ab.

  28. 28.

    Mit   structure() lassen sich auch mehrere Attribute gleichzeitig setzen.

  29. 29.

    Wenn ein Objektname dennoch nicht zulässige Zeichen enthält, kann man nichtsdestotrotz auf das Objekt zugreifen, indem man den Namen in rückwärts gerichtete Hochkommata setzt:

  30. 30.

    Um analog Objekte mit einem später festgelegten Namen zu erstellen, s. Abschn. 1.4.4.

  31. 31.

    Für Hilfe zu diesem Thema vgl. ?Logic sowie ?Comparison. Die Abkürzungen T und F sollten nicht verwendet werden, da sich auch normale Variablen mit diesem Namen erstellen lassen.

  32. 32.

    Die alphabetische Reihenfolge hängt dabei von den Ländereinstellungen ab, die sich mit Sys.getlocale() erfragen und mit Sys.setlocale() ändern lässt.

  33. 33.

    Tauchen sehr kleine Zahlen, die eigentlich 0 sein sollten, zusammen mit größeren Zahlen in einem Ergebnis auf, eignet sich  zapsmall(), um sie i. S. einer besseren Übersichtlichkeit auch tatsächlich als 0 ausgeben zu lassen.

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Daniel Wollschläger .

Rights and permissions

Reprints and permissions

Copyright information

© 2020 Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Wollschläger, D. (2020). Erste Schritte. In: Grundlagen der Datenanalyse mit R. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-61736-6_1

Download citation

Publish with us

Policies and ethics