Einlesen Datensatz

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

Antworten
Yanik
Beiträge: 1
Registriert: Mo Jan 13, 2025 12:13 pm

Einlesen Datensatz

Beitrag von Yanik »

Hallo Leute,
ich bin auf jeden Fall kein Experte in R, aber die basics kann ich eigentlich. Nur bei diesem Datensatz habe ich Probleme beim einlesen. Ich hab alles für mich erdenkliche versucht, aber der Datensatz wird einfach nicht richtig formatiert in R überführt. Ich habe in den Anhang mal die Datei und Screenshots gepackt. Ich wäre sehr dankbar, wenn mir jemand sagen kann ob bei ihm der Datensatz richtig als Tabelle formatiert wird oder ob er weiß wo bei mir das Problem liegt. Vielen Dank im voraus Leute.
Datensatz.csv
(1.03 MiB) 55-mal heruntergeladen
Dateianhänge
Screenshot (106).png
bigben
Beiträge: 2873
Registriert: Mi Okt 12, 2016 9:09 am

Re: Einlesen Datensatz

Beitrag von bigben »

Hi,

das sind auch keine "basics", das ist ein krankes Format:

Code: Alles auswählen

"preis,""etagen"",""zustand"",""baujahr"",""qmflaeche"",""qmgrund"",""entfernung"",""zimmer"",""bezirk"",""makler"",""anfragen"""
"221900,1,3,1955,110,525,1.89,3,2,""Graf"",11"
"538000,2,3,1951,239,673,2.58,5,2,""Kaiser"",70"
"180000,1,3,1933,72,929,2.4,4,1,""Graf"",23"
"604000,1,5,1965,182,465,3.68,4,2,""Weber"",21"
"510000,1,3,1987,156,751,3.98,2,3,""Koch"",42"
Wie man sieht, sind die Anführungszeichen " völlig erratisch gesetzt. Ich vermute, man könnte einfach die ganze Datei als Zeichenkette einlesen, dann alle Anführungszeichen löschen und das dann wieder abspeichern. Dann wäre es wahrscheinlich regelkonformes CSV.

Behelfsweise liest das hier einen großen Teil der Daten sinnvoll ein:

Code: Alles auswählen

d <- read.csv(file = "http://forum.r-statistik.de/download/file.php?id=1929", quote = "")
head(d)
str(d)
Da muss man sich dann aber immernoch um die Anführungszeichen kümmern, aber man hat schonmal einen Dataframe in R als Ausgangsbasis.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
jogo
Beiträge: 2092
Registriert: Fr Okt 07, 2016 8:25 am

Re: Einlesen Datensatz

Beitrag von jogo »

Hallo Yanik,

das Löschen sämtlicher Anführungszeichen kann man gut in einem Editor erledigen. (Suchen und Ersetzen -- dabei gibt es üblicherweise die Option, alle Vorkommen zu ersetzen.

Gruß, Jörg
Antworten