Seite 1 von 1

Einlesen Datensatz

Verfasst: Mo Jan 13, 2025 12:27 pm
von Yanik
Hallo Leute,
ich bin auf jeden Fall kein Experte in R, aber die basics kann ich eigentlich. Nur bei diesem Datensatz habe ich Probleme beim einlesen. Ich hab alles für mich erdenkliche versucht, aber der Datensatz wird einfach nicht richtig formatiert in R überführt. Ich habe in den Anhang mal die Datei und Screenshots gepackt. Ich wäre sehr dankbar, wenn mir jemand sagen kann ob bei ihm der Datensatz richtig als Tabelle formatiert wird oder ob er weiß wo bei mir das Problem liegt. Vielen Dank im voraus Leute.
Datensatz.csv
(1.03 MiB) 286-mal heruntergeladen

Re: Einlesen Datensatz

Verfasst: Mo Jan 13, 2025 1:38 pm
von bigben
Hi,

das sind auch keine "basics", das ist ein krankes Format:

Code: Alles auswählen

"preis,""etagen"",""zustand"",""baujahr"",""qmflaeche"",""qmgrund"",""entfernung"",""zimmer"",""bezirk"",""makler"",""anfragen"""
"221900,1,3,1955,110,525,1.89,3,2,""Graf"",11"
"538000,2,3,1951,239,673,2.58,5,2,""Kaiser"",70"
"180000,1,3,1933,72,929,2.4,4,1,""Graf"",23"
"604000,1,5,1965,182,465,3.68,4,2,""Weber"",21"
"510000,1,3,1987,156,751,3.98,2,3,""Koch"",42"
Wie man sieht, sind die Anführungszeichen " völlig erratisch gesetzt. Ich vermute, man könnte einfach die ganze Datei als Zeichenkette einlesen, dann alle Anführungszeichen löschen und das dann wieder abspeichern. Dann wäre es wahrscheinlich regelkonformes CSV.

Behelfsweise liest das hier einen großen Teil der Daten sinnvoll ein:

Code: Alles auswählen

d <- read.csv(file = "http://forum.r-statistik.de/download/file.php?id=1929", quote = "")
head(d)
str(d)
Da muss man sich dann aber immernoch um die Anführungszeichen kümmern, aber man hat schonmal einen Dataframe in R als Ausgangsbasis.

LG,
Bernhard

Re: Einlesen Datensatz

Verfasst: Mo Jan 13, 2025 4:04 pm
von jogo
Hallo Yanik,

das Löschen sämtlicher Anführungszeichen kann man gut in einem Editor erledigen. (Suchen und Ersetzen -- dabei gibt es üblicherweise die Option, alle Vorkommen zu ersetzen.

Gruß, Jörg