Seite 1 von 1

Fehlermeldung beim einlesen einer .csv datei

Verfasst: Do Mär 12, 2020 5:40 pm
von Luna11997
Hallo zusammen,
ich wollte eben eine .csv datei einlesen mithilfe des befehls read.csv(...)
Der Befehl ist auch normal durchgelaufen, allerdings wurde mir in meiner Datei "O rows" angegeben.

Zusätzlich kam es zu dieser Fehlermeldung:

line 1 appears to contain embedded nullsline 2 appears to contain embedded nullsline 3 appears to contain embedded nullsline 4 appears to contain embedded nullsline 5 appears to contain embedded nullsline 1 appears to contain embedded nullsembedded nul(s) found in input

Wenn mir jemand helfen könnte diesen fehler zu verstehen und ihn im besten auch zu beheben wäre ich sehr dankbar!

LG

Re: Fehlermeldung beim einlesen einer .csv datei

Verfasst: Do Mär 12, 2020 7:26 pm
von EDi
Wenn du uns ein reproduzierbares Beispiel geben kannst, können wir sicher helfen.
So können wir nur rumwundern wie deine Datei wohl aussehen könnte um diese Fehler zu erzeugen.

Re: Fehlermeldung beim einlesen einer .csv datei

Verfasst: Fr Mär 13, 2020 8:02 am
von Luna11997
Also es ist eine Umfrage, die ich bei Sosci Survey durchgeführt habe. Ich hatte dabei mehrere Optionen in welchem Datei format ich sie runterladen wollte.
Sosci Survey.PNG
Sosci Survey.PNG (6.55 KiB) 681 mal betrachtet
In R wollte ich sie dann, wie gesagt einlesen, was zu folgender Fehlermeldung führt:
R.PNG

Re: Fehlermeldung beim einlesen einer .csv datei

Verfasst: Fr Mär 13, 2020 8:17 am
von jogo
Hallo Luna,

willkommen im Forum!
Wenn einer schon das passende Dateiformat für das Zielsystem angeboten wird, dann sollte man es auch nutzen :!:
Die richtige Wahl lautet also GNU R.
Vielleicht steht dort auch, wie Du die generierte Datei einlesen musst (wahrscheinlich mit load(...)).

Ansonsten:
Hast Du die vermeintliche CSV-Datei mal mit einem Texteditor geöffnet, um Dir anzusehen, ob es denn auch wirklich eine CSV-Datei ist?

Gruß, Jörg

Re: Fehlermeldung beim einlesen einer .csv datei

Verfasst: Fr Mär 13, 2020 9:48 am
von student
Hallo Luna,

mit dem Download der Umfrageergebnisse aus Sosci Survey als CSV-Datei habe ich nur gute Erfahrungen gemacht und deswegen ist der Punkt
... CSV-Datei mal mit einem Texteditor geöffnet...
von Jogo interessant. Über eine Fehlermeldung wie beigefügt, bin ich auch noch nie gestolpert....

Ich weiß, es ist nicht sehr hilfreich, aber versuche es noch einmal mit aller Konzentration! ;)

Re: Fehlermeldung beim einlesen einer .csv datei

Verfasst: Fr Mär 13, 2020 10:30 am
von jogo
Ich meine natürlich einen ganz einfachen Texteditor (auch ASCII-Editor genannt).
Meine Vermutung geht dahin, dass die vermeintliche CSV-Datei keine solche ist, sondern entweder etwas ganz anderes ist (z.B. eine Excel-Datei, der versehentlich eine falsche Dateiendung gegeben wurde) oder ein Problem mit der Zeichenkodierung vorliegt (eventuell irgendwas 16-bit-iges).
Eine echte CSV-Datei sollte nur aus 8-bit-Zeichen bestehen (ASCII, evtl. noch mit länderspezifischem Zeichensatz).

Hier ein kleiner Test bezüglich der Excel-These:

Code: Alles auswählen

> read.table("Data_for_forum.xlsx")
Fehler in scan(file = file, what = what, sep = sep, quote = quote, dec = dec,  : 
  line 1 did not have 2 elements
Zusätzlich: Warnmeldungen:
1: In read.table("Data_for_forum.xlsx") :
  line 1 appears to contain embedded nulls
2: In read.table("Data_for_forum.xlsx") :
  line 4 appears to contain embedded nulls
oder

Code: Alles auswählen

> read.csv("Data_for_forum.xlsx")
Fehler in type.convert.default(data[[i]], as.is = as.is[i], dec = dec,  : 
  ungültige multibyte Zeichenkette bei '<81>4<b4><ee>'
Zusätzlich: Warnmeldungen:
1: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 1 appears to contain embedded nulls
2: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 4 appears to contain embedded nulls
3: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 5 appears to contain embedded nulls
4: In scan(file = file, what = what, sep = sep, quote = quote, dec = dec,  :
  Eingabe  enthält nul Zeichen
Gruß, Jörg

Re: Fehlermeldung beim einlesen einer .csv datei

Verfasst: Fr Mär 13, 2020 11:04 am
von ruedi_br
Ich sehe es wie Jörg,
Die richtige Wahl lautet also GNU R.
zumal der Soscisurvey ein Importskript (in R) für den Survey anbietet. HIlfedatei: https://www.soscisurvey.de/help/doku.ph ... port-gnu-r.
Ist zwar ein reichlich umfangreiches Skript, was für R-Anfänger nicht leicht nachzuvollziehen ist, aber funktioniert normalerweise gut.
Grüße
Ruedi

Re: Fehlermeldung beim einlesen einer .csv datei

Verfasst: Fr Mär 13, 2020 11:11 am
von jogo
Wenn man wirklich eine Excel-Datei bekommen kann, geht auch das.
Bei CSV kommt es ggf. zum Runden von Zahlen, d.h. man verliert Genauigkeit bei den Zahlen.
Bei Excel bekommt man die interne Zahlendarstellung ohne Verlust
- so eine Excel-Datei muss dann auch als solche eingelesen werden.

Gruß, Jörg
p.s.:
Mit der Plattform habe ich noch nicht gearbeitet. Deshalb kann ich auch nichts dazu sagen, wie toll oder wie grottig das Skript zum Einlesen der `GNU R`-Datei ist. Meine Aussage, dass man möglichst das Dateiformat des Zielsystems nutzen soll, war eher allgemeiner Natur im Sinne von Vermeidung von Dateiformaten, die weder mit der einen noch mit der anderen Seite dediziert etwas zu tun haben.
... Ausnahmen bestätigen die allgemeine Regel. ;)