Hallo Leute,
ich bin auf jeden Fall kein Experte in R, aber die basics kann ich eigentlich. Nur bei diesem Datensatz habe ich Probleme beim einlesen. Ich hab alles für mich erdenkliche versucht, aber der Datensatz wird einfach nicht richtig formatiert in R überführt. Ich habe in den Anhang mal die Datei und Screenshots gepackt. Ich wäre sehr dankbar, wenn mir jemand sagen kann ob bei ihm der Datensatz richtig als Tabelle formatiert wird oder ob er weiß wo bei mir das Problem liegt. Vielen Dank im voraus Leute.
Einlesen Datensatz
Re: Einlesen Datensatz
Hi,
das sind auch keine "basics", das ist ein krankes Format:
Wie man sieht, sind die Anführungszeichen " völlig erratisch gesetzt. Ich vermute, man könnte einfach die ganze Datei als Zeichenkette einlesen, dann alle Anführungszeichen löschen und das dann wieder abspeichern. Dann wäre es wahrscheinlich regelkonformes CSV.
Behelfsweise liest das hier einen großen Teil der Daten sinnvoll ein:
Da muss man sich dann aber immernoch um die Anführungszeichen kümmern, aber man hat schonmal einen Dataframe in R als Ausgangsbasis.
LG,
Bernhard
das sind auch keine "basics", das ist ein krankes Format:
Code: Alles auswählen
"preis,""etagen"",""zustand"",""baujahr"",""qmflaeche"",""qmgrund"",""entfernung"",""zimmer"",""bezirk"",""makler"",""anfragen"""
"221900,1,3,1955,110,525,1.89,3,2,""Graf"",11"
"538000,2,3,1951,239,673,2.58,5,2,""Kaiser"",70"
"180000,1,3,1933,72,929,2.4,4,1,""Graf"",23"
"604000,1,5,1965,182,465,3.68,4,2,""Weber"",21"
"510000,1,3,1987,156,751,3.98,2,3,""Koch"",42"
Behelfsweise liest das hier einen großen Teil der Daten sinnvoll ein:
Code: Alles auswählen
d <- read.csv(file = "http://forum.r-statistik.de/download/file.php?id=1929", quote = "")
head(d)
str(d)
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Einlesen Datensatz
Hallo Yanik,
das Löschen sämtlicher Anführungszeichen kann man gut in einem Editor erledigen. (Suchen und Ersetzen -- dabei gibt es üblicherweise die Option, alle Vorkommen zu ersetzen.
Gruß, Jörg
das Löschen sämtlicher Anführungszeichen kann man gut in einem Editor erledigen. (Suchen und Ersetzen -- dabei gibt es üblicherweise die Option, alle Vorkommen zu ersetzen.
Gruß, Jörg