Import von Daten

Die Aufnahme der Daten erfolgt am besten in einem Datenbankprogramm wie MS-Access oder, wenn es nicht ganz so umfangreich wird, auch in einem Tabellenkalkulationsprogramm wie MS-Excel. Als kostenlose Alternative zur teueren Microsoft-Ware empfiehlt sich zB. OpenOffice. Grundsätzlich wäre auch eine Eingabe direkt in R möglich, allerdings wird das schnell unübersichtlich:

fix(x)

Dieser Befehl öffnet den Dateneditor für die Variable x. Alternativ kann der Editor auch über das Menü Bearbeiten -> Dateneditor… aufgerufen werden. Bei größeren Datenmengen etwa in einem Dataframe verliert man hier schnell die Übersicht, deswegen benutze diese Funktion besser nur zur Prüfung oder für kleine Änderungen und nimm Deine Daten lieber in einem anderen Programm auf. Die Überführung der Daten in R ist der erste Schritt zu Deiner statistischen Auswertung. Hierfür gibt es verschiedene Wege:

  • Einfügen über den Zwischenspeicher / Clipboard
  • Einlesen aus einer Textdatei

Einfügen aus dem Zwischenspeicher

Markiere mehrere in einer Spalte stehende Zahlen und kopiere sie in den Zwischenspeicher – zB. mit der Tastenkombination [Steuerung]+C. Dann gib in R ein:

x<-scan(dec=",")

Das Programm wartet nun auf die Daten, lese also den Zwischenspeicher aus – am besten mit der Tastenkombination [Steuerung]+V. Die Zahlen erscheinen nun untereinander. Zum Abschluß drücke die [Enter]-Taste. Der Parameter dec="," erklärt dem Programm, das Komma als Dezimalzeichen anzusehen. Die in R übliche anglophone Zahlenschreibweise verwendet nämlich den Punkt als dezimales Trennzeichen. Ganze Tabellen lassen sich ähnlich übertragen – allerdings wird in der R-Dokumentation von dieser Methode abgeraten. Markiere wie gehabt Deine Daten, inklusive Spaltenköpfe. Kopiere sie in die Zwischenablage ([Steuerung]+C) und übergib sie an R:

tabelle<-read.delim2("clipboard")

Richtig, kein Auslesen per Tastenkombination nötig! Die “2″ im Funktionsnamen read.delim2 ist wichtig, denn damit wird aus dem Komma wieder der englische Dezimalpunkt. Sollten Deine Daten schon im angloamerikanisch formatiert sein benutze read.delim (ohne “2″). Wie gesagt, von dieser Methode raten die Programmentwickler ab! Auf Nummer sicher gehst Du über den kleinen Umweg einer Textdatei. PS: Auf manchen Rechnern heißt die [Steuerung]-Taste [Strg], [Control] oder [Ctrl].

Einlesen von Daten aus einer Textdatei

Exportiere Deine Tabelle aus Excel in eine Textdatei: Datei -> Speichern unter… und unter “Dateityp” (ziemlich weit unten) wähle “Text (Tabs getrennt) (*.txt)”. Als Dateiname bietet sich etwas Kurzes, nicht allzu Kompliziertes an, denn Du mußt ihn gleich nocheinmal eintippen. In R:

tabelle<-read.table(file="c:/Verzeichnis/Dateiname.txt",header=TRUE,dec=",",sep="\t")

Erklärung der Parameter:

  • An file werden Pfad und Name der Textdatei übergeben. Um sich etwas Tippen zu sparen, kann man den Pfadname auch über das R-Menü speichern. Klicke dazu Datei -> Verzeichnis wechseln… und suche das Verzeichnis, in dem sich Deine Datei befindet. Hast Du das befolgt, genügt die Übergabe des Dateinamens (ohne Laufwerk und Pfadangaben).
  • Mit header=TRUE wird erklärt, daß sich in der ersten Zeile der Datei die Spaltenköpfe befinden, diese werden als Variablennamen übernommen.
  • dec=",", wie oben – als Dezimalzeichen wird das Komma verwendet
  • sep="/t", die Einträge in der Datei sind durch Tabstopps getrennt

Und hat´s geklappt? Nach dem Einlesen sollte – immer – schnell geprüft werden, ob auch alles angekommen und nichts nichts verrutscht ist:

> tabelle
   Grab              Orientierung    Tiefe    Laenge     Breite
1 Gr01                          N       65         143         67
2 Gr02                          S       70       122.5         68
3 Gr03                          N       54          98         NA

Und sind die Dezimalzahlen auch als solche angekommen?


> sum(kl$Laenge)
[1] 363.5

Diesen Artikel kommentieren

You must be logged in to post a comment.