Datenimport R Problem

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

hamburg123
Beiträge: 13
Registriert: Mo Jun 03, 2019 5:07 pm

Datenimport R Problem

Beitrag von hamburg123 »

Hallo zusammen,

ich habe über soschisurvey einen Datenssatz erstellt und möchte diesen nun importieren.
Es kommt die Fehlermeldung
"Error! Is this a valid csv file? Column 1 must be named"

Ich habe vorher schon Datensätze importiert mit denen alles geklappt hat.
Ich finde den Fehler einfach nicht. Kann mir jemand helfen?

Vielen Dank vorab!!
bigben
Beiträge: 2777
Registriert: Mi Okt 12, 2016 9:09 am

Re: Datenimport R Problem

Beitrag von bigben »

Hi!

Da wäre als erstes interessant, ob es sich wirklich um eine CSV-Datei und nicht etwa um eine Excel- oder SPSS-Datei handelt. Sodann, mit welchem Kommando Du die csv-Datei einzulesen versucht hast (welcher Aufruf genau produziert diesen Fehler)? Stimmt der eingegebene Dateipfad ganz sicher? Wie lautet die Fehlermeldung ganz genau und in voller Länge? Wenn das soweit stimmt, dann muss man sich die Struktur der CSV-Daten anschauen. Gibt es Überschriften mit Leerzeichen um die keine Anführungszeichen stehen, wird Komma oder oder Strichpunkt zum Trennen der Daten verwendet und so weiter.
Wenn Du mit letzterem nicht klar kommst kann es sinnvoll sein, die ersten fünf Zeilen der Datei hier einzustellen (mit dem Editor herauskopieren).

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
hamburg123
Beiträge: 13
Registriert: Mo Jun 03, 2019 5:07 pm

Re: Datenimport R Problem

Beitrag von hamburg123 »

Hallo Bernhard,

vielen lieben Dank für die schnelle Antwort.
Ich habe über den folgenden Befehl probiert die Datei zu importieren:

setwd("/Users/SarahMerel/Desktop/Hausarbeit")
Dataset <- read.table("Data6.csv", header=TRUE, sep=";", na.strings=c("-9", "=-1", "NA", "NaN", "", " "), dec=",", strip.white=TRUE, quote="\"", fill=TRUE)

Dann sagt R das:
> setwd("/Users/SarahMerel/Desktop/Hausarbeit")
> Dataset <- read.table("Data6.csv", header=TRUE, sep=";", na.strings=c("-9", "=-1", "NA", "NaN", "", " "), dec=",", strip.white=TRUE, quote="\"", fill=TRUE)
Warnmeldungen:
1: In read.table("Data6.csv", header = TRUE, sep = ";", na.strings = c("-9", :
line 1 appears to contain embedded nulls
2: In read.table("Data6.csv", header = TRUE, sep = ";", na.strings = c("-9", :
line 2 appears to contain embedded nulls
3: In read.table("Data6.csv", header = TRUE, sep = ";", na.strings = c("-9", :
line 3 appears to contain embedded nulls
4: In read.table("Data6.csv", header = TRUE, sep = ";", na.strings = c("-9", :
line 4 appears to contain embedded nulls
5: In read.table("Data6.csv", header = TRUE, sep = ";", na.strings = c("-9", :
line 5 appears to contain embedded nulls
6: In read.table("Data6.csv", header = TRUE, sep = ";", na.strings = c("-9", :
line 1 appears to contain embedded nulls
7: In scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :
Eingabe enth"alt nul Zeichen
>


Auf der rechten Seite oben steht "Dataset 0 obs. of 1 variabel"



Außerdem habe ich versucht über den BUtton "Import Dataset" > "From CSV" die Datei zu importieren.
Dann kommt die Fehlermeldung: "Is this a valid csv file? Column 1 must be named"


Den Datensatz habe ich von soscisurvey heruntergeladen. Es handelt sich um eine csv Datei.
Ich habe zuvor schon Datensätze auf diese Weise importiert und es hat einwandfrei funktioniert.
Es handelt sich auch auf jeden Fall um eine csv Datei.

Wenn ich diese in Excel öffne und die ersten 5 Zeilen herauskopiere sieht das so aus (weiß nicht ob das so hilft?
CASE SERIAL REF QUESTNNR MODE STARTED A001 A002 A003 B001 B002 B003 B004 B005 B006 B007 B008 B009 B010 B011 B012 B013 B013_01 B013_02 B013_03 B013_04 B013_05 B013_06 B013_07 B013_08 B013_09 B013_10 B013_11 B013_12 B013_13 B014_01 B014_02 B014_03 B014_04 B014_05 B014_06 B014_07 B014_08 B014_09 B014_10 B014_11 B014_12 B014_13 C001 C002_01 TIME001 TIME002 TIME003 TIME004 TIME_SUM MAILSENT LASTDATA FINISHED Q_VIEWER LASTPAGE MAXPAGE MISSING MISSREL TIME_RSI DEG_TIME
35 base interview 09.05.19 20:26 -2 -2 -1 -1 -1 -2 -1 -1 -2 -3 -1 -1 -3 -2 -2 5 2 1 1 2 1 2 1 2 1 1 2 1 1 6 2 9 4 10 7 11 3 8 12 13 1 5 -1 4 13 8 58 4 73 09.05.19 20:27 1 0 4 4 0 0 1,84 57
36 base interview 09.05.19 21:27 -2 -2 -1 -1 -2 -1 -1 -1 -2 -2 -1 -1 -1 -2 -2 5 1 2 1 1 1 1 2 1 1 2 1 2 2 7 2 4 10 8 9 5 11 3 1 6 13 12 -1 5 2 12 213 14 241 09.05.19 21:31 1 0 4 4 0 0 0,98 3
37 base interview 09.05.19 22:10 -2 -2 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 7 2 2 2 1 2 1 1 1 1 2 2 2 1 5 1 4 11 12 8 13 3 6 2 7 9 10 -1 5 9 16 142 8 175 09.05.19 22:13 1 0 4 4 0 0 0,94 9
42 base interview 09.05.19 23:03 -1 -2 -1 -1 -1 -1 -1 -2 -2 -2 -1 -1 -1 -1 -1 8 2 2 2 1 1 1 1 1 2 2 2 2 2 7 1 4 13 8 11 6 9 5 3 2 10 12 -1 3 9 22 317 12 360 09.05.19 23:09 1 0 4 4 0 0 0,58 0




Nochmals vielen Dank im Voraus. BIn über jeden Tipp sehr froh :-)
Hufeisen
Beiträge: 162
Registriert: Fr Aug 31, 2018 6:34 pm

Re: Datenimport R Problem

Beitrag von Hufeisen »

Also ich bin ehrlich gesagt auch etwas überfragt. Vielleicht kannst du auf die Datei verlinken? Was mir aber aufgefallen ist, dass es sich um eine kommaseparierte Datei handeln soll, du aber das Semikolon als Trennzeichen angibst:

Code: Alles auswählen

"Data6.csv", sep=";"
hamburg123
Beiträge: 13
Registriert: Mo Jun 03, 2019 5:07 pm

Re: Datenimport R Problem

Beitrag von hamburg123 »

Habe das ";" mit einem "," ersetzt.
Jetzt hat er 15 Zeilen übernommen. Datensatz aber immer noch unvollständig. Es ist wirklich zum verzeifeln
Danke trotzden :-)
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Datenimport R Problem

Beitrag von EDi »

Es ist wirklich zum verzeifeln
Ohne ein reproduzierbares Beispiel kommen wir hier wohl nicht weiter :cry:
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
bigben
Beiträge: 2777
Registriert: Mi Okt 12, 2016 9:09 am

Re: Datenimport R Problem

Beitrag von bigben »

Hallo Sarah,

drei Versuche würde ich noch unternehmen.
Nr. 1: read.table hat ein skipNul-Argument. Versuch mal den Aufruf mit skipNul = TRUE
Nr. 2: Ich wiederhole nochmal die Bitte, wenige Zeilen vom Anfang der Datei mit dem Editor hier hinein zu kopieren, nicht mit Excel. Das würde Rückfragen wie die letzte von Hufeisen überflüssig machen.
Nr. 3: Ich hatte jetzt keine Zeit für eine lange Internetrecherche, aber der Fehler scheint abhängig vom verwendeten UTF-Coding aufzutreten und andere Leute hatten Glück mit dem dezidierten Setzen von fileEncoding in read.table.
Nr. 4 wäre eine Verzweiflungstat: Wenn sich die Datei in Excel lesen lässt, dann kann man sie auch mit Excel neu abspeichern und diese neu gespeicherte vielleicht mir R besser lesen.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
hamburg123
Beiträge: 13
Registriert: Mo Jun 03, 2019 5:07 pm

Re: Datenimport R Problem

Beitrag von hamburg123 »

Guten Morgen :-)

lieben Dank. Sobald ich heute Abend zu Hause bin, werde ich das ausprobieren.
zu 1. An welcher Stelle genau baue ich skipNul = TRUE in den Befehl ein?

setwd("/Users/SarahMerel/Desktop/Hausarbeit")
Dataset <- read.table("Data6.csv", header=TRUE, sep=";", na.strings=c("-9", "=-1", "NA", "NaN", "", " "), dec=",", strip.white=TRUE, quote="\"", fill=TRUE)


zu 2. Ich weiß ehrlich gesagt nicht genau, wie du das meinst. Ansonsten würd ich es sehr gerne tun.

zu 3.wie sieht der Befehlt dann mit fileEncoding aus?

zu 4. Genau, es lässt sich in Excel öffnen. Wenn ich versuche die Datei anders abzuspeichern bekomme ich die Warnmeldung, dass evtl Teile verloren gehen. Als was genau sollte ich ncohmal probieren es zu speichern und wie liest man das dann ein?


Ihr merkt, ich bin absoluter R-Anfänger.. Danke für eure Zeit und Mühe.
Liebe Grüße!
jogo
Beiträge: 2086
Registriert: Fr Okt 07, 2016 8:25 am

Re: Datenimport R Problem

Beitrag von jogo »

Hallo Sarah,
hamburg123 hat geschrieben: Di Jun 04, 2019 8:31 am zu 1. An welcher Stelle genau baue ich skipNul = TRUE in den Befehl ein?

setwd("/Users/SarahMerel/Desktop/Hausarbeit")
Dataset <- read.table("Data6.csv", header=TRUE, sep=";", na.strings=c("-9", "=-1", "NA", "NaN", "", " "), dec=",", strip.white=TRUE, quote="\"", fill=TRUE)
das ist egal; wenn Du den Namen des Parameters angibst, wird dieser anhand des Namens identifiziert. Das könnte bei Dir so aussehen:

Code: Alles auswählen

setwd("/Users/SarahMerel/Desktop/Hausarbeit")
Dataset <- read.table("Data6.csv", header=TRUE, sep=";", na.strings=c("-9", "=-1", "NA", "NaN", "", " "), 
   dec=",", strip.white=TRUE, quote="\"", fill=TRUE, skipNul = TRUE)
zu 2. Ich weiß ehrlich gesagt nicht genau, wie du das meinst. Ansonsten würd ich es sehr gerne tun.
Das ist für uns das größte Problem. Kannst Du die Datei auf irgendeine Weise bereitstellen? (Link auf Cloudspeicher oder als Anhang an Deine nächste Nachricht
... oder wie schon genannt: die Datei in einem einfachen Editor öffnen und dann von dort die ersten Zeilen kopieren und in Deine nächste Nachricht einfügen)
zu 4. Genau, es lässt sich in Excel öffnen. Wenn ich versuche die Datei anders abzuspeichern bekomme ich die Warnmeldung, dass evtl Teile verloren gehen. Als was genau sollte ich ncohmal probieren es zu speichern und wie liest man das dann ein?
wenn nur die Werte interessieren, kann man auf alle anderen Informationen, die in Excel vorhanden sind, verzichten. Sicherheitshalber kann man in eine neue Datei abspeichern, aber ansonsten kann man bei der Warnmeldung bestätigen, dass man den Verlust an Information akzeptiert.

Gruß, Jörg
hamburg123
Beiträge: 13
Registriert: Mo Jun 03, 2019 5:07 pm

Re: Datenimport R Problem

Beitrag von hamburg123 »

Hallo Jörg,

vielen Dank. Werde den neuen Code heute Abend direkt ausprobieren und auch versuchen, die Datei rüberzuschicken.
Hoffentlich klappt es :)

Liebe Grüße
Sarah
Antworten