Seite 1 von 2

Läd Datensatz plötzlich nicht

Verfasst: Mo Okt 07, 2019 5:07 pm
von farngarten
Tut mir leid, ich muss noch n Thema aufmachen heute.
Ich ziehe mir den Datensatz alle paar Tage vergrößert um weitere Teilnehmer runter. Bisher gings reibungslos. Seit heut bekomm ich eine Fehlermeldung. Er sagt dass eine Zeile nicht genug Variablen enthält. ich hab den Datensatz reduziert angehängt. in zwei Varianten. Datei Test4 enthält nur die Problem-Zeile und läd normal. Test3 hat aber zur Problemzeile noch eine Zeile mehr und es kommt die Fehlermeldung.

Code: Alles auswählen

k3 <- read.table("test3.csv", sep = ";", header = TRUE, na = -77) 
k4 <- read.table("test4.csv", sep = ";", header = TRUE, na = -77) 
Fehlermeldung sieht so aus:
> k3 <- read.table("test3.csv", sep = ";", header = TRUE, na = -77)
Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :
line 2 did not have 159 elements
> k4 <- read.table("test4.csv", sep = ";", header = TRUE, na = -77)
Wisst ihr Rat? Grüße Martin

Re: Läd Datensatz plötzlich nicht

Verfasst: Mo Okt 07, 2019 5:14 pm
von bigben
Kann ich nicht reproduzieren. Das hier läuft bei mir ohne Fehlermeldung

Code: Alles auswählen

test3 <- read.csv2("http://forum.r-statistik.de/download/file.php?id=712", na.strings = "-77")
test4 <- read.csv2("http://forum.r-statistik.de/download/file.php?id=711", na.strings = "-77")

Re: Läd Datensatz plötzlich nicht

Verfasst: Mo Okt 07, 2019 8:53 pm
von farngarten
es geht um R Studio. die Fehlermeldung sagt, dass Zeile 543 nicht genügend Variablen hat. Wenn ich in der Tabelle diese Zeile lösche und die Datei neu speicher und laden will, springt er eine Zeile höher und sagt 542 hätte nicht genug . :oops:
Alternativ hab ich probiert den Dateinamen beizubehalten wie er vom Unipark Server kommt, dann läd R ohne Probleme.

Es gibt aber Altersangaben, die Mist sind und ich muss die auf -77 setzen. wenn ich dann speicher. und wieder in R laden will, kommt wieder die Fehlermeldung. Mein Eingriff findet aber gar nicht in Zeile 543 statt....

Hab ihr Ideen?

Re: Läd Datensatz plötzlich nicht

Verfasst: Di Okt 08, 2019 9:46 am
von jogo
farngarten hat geschrieben: Mo Okt 07, 2019 8:53 pm Es gibt aber Altersangaben, die Mist sind und ich muss die auf -77 setzen. wenn ich dann speicher.
... (und wieder in R laden will, ...)
Womit und wie nimmst Du diese Veränderungen vor?
Wie sehen die Altersangaben aus, die "Mist" sind?

Gruß, Jörg

Re: Läd Datensatz plötzlich nicht

Verfasst: Di Okt 08, 2019 7:37 pm
von farngarten
Hallo Jörg,
ich müsste den kompletten Datensatz hier hochladen. Wenn ich die Datei auf die Problemzeile reduziere, liest R Studio es problemlos.
ich habe Dir eine Nachricht geschickt.
Gruß Martin

Re: Läd Datensatz plötzlich nicht

Verfasst: Mi Okt 09, 2019 1:56 pm
von jogo
Hallo Martin,
farngarten hat geschrieben: Di Okt 08, 2019 7:37 pm ich müsste den kompletten Datensatz hier hochladen.
Du könntest auch erstmal meine Fragen beantworten.
ich habe Dir eine Nachricht geschickt.
Dies ist ein Forum; das bedeutet, dessen Sinn ist nicht, dass sich ein Hilfesuchender einen persönlichen Lösungsberater aussucht. :?
Bitte lies viewtopic.php?f=20&t=45

Gruß, Jörg

Re: Läd Datensatz plötzlich nicht

Verfasst: Mi Okt 09, 2019 5:42 pm
von farngarten
Hallo Jörg, die Alteraangaben sind Ti und 6A (mit Tilde über dem A) und dann 1/4 (das 1/4 ist kleingesetzt). Die Änderungen mache ich in Excel ich mach die Datei auf und tippe -77 ein.
Grüße Martin

Re: Läd Datensatz plötzlich nicht

Verfasst: Mi Okt 09, 2019 6:01 pm
von bigben
Also bekommst Du vom Server Dateien, die Du problemlos in R öffnen kannst, aber statt das zu machen, gehst Du einen Umweg über Excel nach dem alles crasht? Das tust Du, um in Excel eine Markierung fehlender Daten vorzunehmen, die aber weder die Markierung fehlender Daten in Excel (eine leere Zelle) noch die MArkierung fehlender Daten in R ist (ein NA) ? Und da hätten wir jetzt von selbst drauf kommen sollen?
Alternativ hab ich probiert den Dateinamen beizubehalten wie er vom Unipark Server kommt, dann läd R ohne Probleme.
Was hälst Du davon, die nicht-Excel-verdorbene Originaldatei in R einzulesen und dort dann einfach alle Alterseinträge durch NA zu ersetzen, die sich nicht in Zahlen umwandeln lassen? Dann hättest Du viel weniger händische Arbeit damit und fehlende Daten wären anständig als NA gekennzeichnet.
Wenn ich die Datei auf die Problemzeile reduziere, liest R Studio es problemlos.
Woher weißt Du, welches die Problemzeile ist? Hast Du die Zeilennummer aus der Fehlermeldung genommen und in Excel die gleiche Zeilennummer für die "Problemzeile" gehalten?

Gruß,
Bernhard

Re: Läd Datensatz plötzlich nicht

Verfasst: Mi Okt 09, 2019 8:15 pm
von jogo
Hallo Martin,
farngarten hat geschrieben: Mi Okt 09, 2019 5:42 pm Die Änderungen mache ich in Excel ich mach die Datei auf und tippe -77 ein.
in welchem Dateiformat speicherst Du nach der Veränderung in Excel, etwa wieder als CSV?
Wenn ja, kann es sein, dass beim Speichern der Zeichensatz verändert wird. Die ursprüngliche Datei war jedenfalls keine ASCII-Datei.

Dem Lösungsvorschlag von Bernhard schließe ich mich an.

Gruß, Jörg
p.s.:
Der Name einer Datei hat mit dem Inhalt der Datei erstmal nichts zu tun
- für die den Teil Dateierweiterung gibt es bestimmte Konventionen, um das Format des Inhaltes anzudeuten.

Re: Läd Datensatz plötzlich nicht

Verfasst: Mi Okt 09, 2019 8:55 pm
von bigben
jogo hat geschrieben: Mi Okt 09, 2019 8:15 pmin welchem Dateiformat speicherst Du nach der Veränderung in Excel, etwa wieder als CSV?
Code und Anhänge im Eingangspost deutet stark auf CSV hin.

LG,
Bernhard