Läd Datensatz plötzlich nicht

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

farngarten
Beiträge: 52
Registriert: Fr Dez 08, 2017 6:42 am

Läd Datensatz plötzlich nicht

Beitrag von farngarten » Mo Okt 07, 2019 5:07 pm

Tut mir leid, ich muss noch n Thema aufmachen heute.
Ich ziehe mir den Datensatz alle paar Tage vergrößert um weitere Teilnehmer runter. Bisher gings reibungslos. Seit heut bekomm ich eine Fehlermeldung. Er sagt dass eine Zeile nicht genug Variablen enthält. ich hab den Datensatz reduziert angehängt. in zwei Varianten. Datei Test4 enthält nur die Problem-Zeile und läd normal. Test3 hat aber zur Problemzeile noch eine Zeile mehr und es kommt die Fehlermeldung.

Code: Alles auswählen

k3 <- read.table("test3.csv", sep = ";", header = TRUE, na = -77) 
k4 <- read.table("test4.csv", sep = ";", header = TRUE, na = -77) 
Fehlermeldung sieht so aus:
> k3 <- read.table("test3.csv", sep = ";", header = TRUE, na = -77)
Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :
line 2 did not have 159 elements
> k4 <- read.table("test4.csv", sep = ";", header = TRUE, na = -77)
Wisst ihr Rat? Grüße Martin
Dateianhänge
test3.csv
(2.51 KiB) 5-mal heruntergeladen
test4.csv
(1.59 KiB) 2-mal heruntergeladen

bigben
Beiträge: 1061
Registriert: Mi Okt 12, 2016 9:09 am

Re: Läd Datensatz plötzlich nicht

Beitrag von bigben » Mo Okt 07, 2019 5:14 pm

Kann ich nicht reproduzieren. Das hier läuft bei mir ohne Fehlermeldung

Code: Alles auswählen

test3 <- read.csv2("http://forum.r-statistik.de/download/file.php?id=712", na.strings = "-77")
test4 <- read.csv2("http://forum.r-statistik.de/download/file.php?id=711", na.strings = "-77")
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte

farngarten
Beiträge: 52
Registriert: Fr Dez 08, 2017 6:42 am

Re: Läd Datensatz plötzlich nicht

Beitrag von farngarten » Mo Okt 07, 2019 8:53 pm

es geht um R Studio. die Fehlermeldung sagt, dass Zeile 543 nicht genügend Variablen hat. Wenn ich in der Tabelle diese Zeile lösche und die Datei neu speicher und laden will, springt er eine Zeile höher und sagt 542 hätte nicht genug . :oops:
Alternativ hab ich probiert den Dateinamen beizubehalten wie er vom Unipark Server kommt, dann läd R ohne Probleme.

Es gibt aber Altersangaben, die Mist sind und ich muss die auf -77 setzen. wenn ich dann speicher. und wieder in R laden will, kommt wieder die Fehlermeldung. Mein Eingriff findet aber gar nicht in Zeile 543 statt....

Hab ihr Ideen?

jogo
Beiträge: 1478
Registriert: Fr Okt 07, 2016 8:25 am

Re: Läd Datensatz plötzlich nicht

Beitrag von jogo » Di Okt 08, 2019 9:46 am

farngarten hat geschrieben:
Mo Okt 07, 2019 8:53 pm
Es gibt aber Altersangaben, die Mist sind und ich muss die auf -77 setzen. wenn ich dann speicher.
... (und wieder in R laden will, ...)
Womit und wie nimmst Du diese Veränderungen vor?
Wie sehen die Altersangaben aus, die "Mist" sind?

Gruß, Jörg

farngarten
Beiträge: 52
Registriert: Fr Dez 08, 2017 6:42 am

Re: Läd Datensatz plötzlich nicht

Beitrag von farngarten » Di Okt 08, 2019 7:37 pm

Hallo Jörg,
ich müsste den kompletten Datensatz hier hochladen. Wenn ich die Datei auf die Problemzeile reduziere, liest R Studio es problemlos.
ich habe Dir eine Nachricht geschickt.
Gruß Martin

jogo
Beiträge: 1478
Registriert: Fr Okt 07, 2016 8:25 am

Re: Läd Datensatz plötzlich nicht

Beitrag von jogo » Mi Okt 09, 2019 1:56 pm

Hallo Martin,
farngarten hat geschrieben:
Di Okt 08, 2019 7:37 pm
ich müsste den kompletten Datensatz hier hochladen.
Du könntest auch erstmal meine Fragen beantworten.
ich habe Dir eine Nachricht geschickt.
Dies ist ein Forum; das bedeutet, dessen Sinn ist nicht, dass sich ein Hilfesuchender einen persönlichen Lösungsberater aussucht. :?
Bitte lies http://forum.r-statistik.de/viewtopic.php?f=20&t=45

Gruß, Jörg

farngarten
Beiträge: 52
Registriert: Fr Dez 08, 2017 6:42 am

Re: Läd Datensatz plötzlich nicht

Beitrag von farngarten » Mi Okt 09, 2019 5:42 pm

Hallo Jörg, die Alteraangaben sind Ti und 6A (mit Tilde über dem A) und dann 1/4 (das 1/4 ist kleingesetzt). Die Änderungen mache ich in Excel ich mach die Datei auf und tippe -77 ein.
Grüße Martin

bigben
Beiträge: 1061
Registriert: Mi Okt 12, 2016 9:09 am

Re: Läd Datensatz plötzlich nicht

Beitrag von bigben » Mi Okt 09, 2019 6:01 pm

Also bekommst Du vom Server Dateien, die Du problemlos in R öffnen kannst, aber statt das zu machen, gehst Du einen Umweg über Excel nach dem alles crasht? Das tust Du, um in Excel eine Markierung fehlender Daten vorzunehmen, die aber weder die Markierung fehlender Daten in Excel (eine leere Zelle) noch die MArkierung fehlender Daten in R ist (ein NA) ? Und da hätten wir jetzt von selbst drauf kommen sollen?
Alternativ hab ich probiert den Dateinamen beizubehalten wie er vom Unipark Server kommt, dann läd R ohne Probleme.
Was hälst Du davon, die nicht-Excel-verdorbene Originaldatei in R einzulesen und dort dann einfach alle Alterseinträge durch NA zu ersetzen, die sich nicht in Zahlen umwandeln lassen? Dann hättest Du viel weniger händische Arbeit damit und fehlende Daten wären anständig als NA gekennzeichnet.
Wenn ich die Datei auf die Problemzeile reduziere, liest R Studio es problemlos.
Woher weißt Du, welches die Problemzeile ist? Hast Du die Zeilennummer aus der Fehlermeldung genommen und in Excel die gleiche Zeilennummer für die "Problemzeile" gehalten?

Gruß,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte

jogo
Beiträge: 1478
Registriert: Fr Okt 07, 2016 8:25 am

Re: Läd Datensatz plötzlich nicht

Beitrag von jogo » Mi Okt 09, 2019 8:15 pm

Hallo Martin,
farngarten hat geschrieben:
Mi Okt 09, 2019 5:42 pm
Die Änderungen mache ich in Excel ich mach die Datei auf und tippe -77 ein.
in welchem Dateiformat speicherst Du nach der Veränderung in Excel, etwa wieder als CSV?
Wenn ja, kann es sein, dass beim Speichern der Zeichensatz verändert wird. Die ursprüngliche Datei war jedenfalls keine ASCII-Datei.

Dem Lösungsvorschlag von Bernhard schließe ich mich an.

Gruß, Jörg
p.s.:
Der Name einer Datei hat mit dem Inhalt der Datei erstmal nichts zu tun
- für die den Teil Dateierweiterung gibt es bestimmte Konventionen, um das Format des Inhaltes anzudeuten.

bigben
Beiträge: 1061
Registriert: Mi Okt 12, 2016 9:09 am

Re: Läd Datensatz plötzlich nicht

Beitrag von bigben » Mi Okt 09, 2019 8:55 pm

jogo hat geschrieben:
Mi Okt 09, 2019 8:15 pm
in welchem Dateiformat speicherst Du nach der Veränderung in Excel, etwa wieder als CSV?
Code und Anhänge im Eingangspost deutet stark auf CSV hin.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte

Antworten