Lückenhaften Datensatz bereinigen
Re: Lückenhaften Datensatz bereinigen
Hallo hallo,
noch eine Frage: Wie kann ich alle NA-Werte eines bestimmten Tages zählen und prozentual ausdrücken lassen?
Danke!
noch eine Frage: Wie kann ich alle NA-Werte eines bestimmten Tages zählen und prozentual ausdrücken lassen?
Danke!
Re: Lückenhaften Datensatz bereinigen
Code: Alles auswählen
D <- read.delim("http://forum.r-statistik.de/download/file.php?id=781", header=FALSE, skip=2, na.strings = "---")
H <- read.delim("http://forum.r-statistik.de/download/file.php?id=781", nrows=1)
colnames(D) <- colnames(H)
D$Tag <- as.Date(D$X, "%d.%m.%y")
#aggregate(Temp ~ Tag, data=D, FUN=mean, na.rm=TRUE)
tapply(is.na(D$Temp), D$Tag, FUN=sum)
Re: Lückenhaften Datensatz bereinigen
Vielen Dank mal wieder, es hat funktioniert.
Wozu machst du das?
Gruß, Max
Wozu machst du das?
Code: Alles auswählen
H <- read.delim("http://forum.r-statistik.de/download/file.php?id=781", nrows=1)
colnames(D) <- colnames(H)
Re: Lückenhaften Datensatz bereinigen
um wenigstens einen Teil der Spaltenüberschriften zu nutzen.
Wie machst Du es bis jetzt? Nutzt Du die Standardnamen für die Spalten V1, V2, ...
oder setzt Du die Spaltennamen völlig neu?
Gruß, Jörg
Wie machst Du es bis jetzt? Nutzt Du die Standardnamen für die Spalten V1, V2, ...
oder setzt Du die Spaltennamen völlig neu?
Gruß, Jörg
Re: Lückenhaften Datensatz bereinigen
Ich nutze die Standardnamen.
Ich steh mal wieder vor ner Herausforderung: Ich möchte einen schönen Grafen aus dem Datensatz im Anhang erstellen. Mein Idee war, irgendwas mit Linien zu machen, weil später mehrere Linien in den Graf sollen, die die Temperatur für jeden Tag anzeigen.
Ich benutze diesen Code:
und bekommen als Dank folgende Fehlermedlung:
Error: stat_bin() must not be used with a y aesthetic.
Wenn ich das y=Freq dann weglasse
kommt ein super komischer Graf. Liegt es daran das freqpoly nicht für meine Daten geeignet ist? Wenn ich geom_line nehme geht es. Warum? Was ist der Unterschied? Ich habe doch eine stetige Variable, die Temperatur (Freq), und laut diesem sheet
https://rstudio.com/wp-content/uploads/ ... german.pdf,
müsste ich dann auch ein freqpoly machen können. Wo liegt mein Denkfehler?
Ich steh mal wieder vor ner Herausforderung: Ich möchte einen schönen Grafen aus dem Datensatz im Anhang erstellen. Mein Idee war, irgendwas mit Linien zu machen, weil später mehrere Linien in den Graf sollen, die die Temperatur für jeden Tag anzeigen.
Ich benutze diesen Code:
Code: Alles auswählen
ggplot(data = WSDede4, aes(x = Var1, y = Freq )) +
geom_freqpoly()
Error: stat_bin() must not be used with a y aesthetic.
Wenn ich das y=Freq dann weglasse
Code: Alles auswählen
ggplot(data = WSDede4, aes(x = Var1)) +
geom_freqpoly(binwidth=20)
https://rstudio.com/wp-content/uploads/ ... german.pdf,
müsste ich dann auch ein freqpoly machen können. Wo liegt mein Denkfehler?
- Dateianhänge
-
- WSDede4.txt
- (1.01 KiB) 19-mal heruntergeladen
Re: Lückenhaften Datensatz bereinigen
Hallo Effigy,
kannst Du bitte den Code angeben, mit dem Du die Datei WSDede4.txt einliest?
Das ist sonst jedes Mal ein unnötiges Ratespiel bezüglich der Parameter von read.table() o.ä., das den Hilfsbereiten aufgebürdet wird.
Gruß, Jörg
kannst Du bitte den Code angeben, mit dem Du die Datei WSDede4.txt einliest?
Das ist sonst jedes Mal ein unnötiges Ratespiel bezüglich der Parameter von read.table() o.ä., das den Hilfsbereiten aufgebürdet wird.
Gruß, Jörg
Re: Lückenhaften Datensatz bereinigen
Hallo Jörg,
die Datei WSDede4.txt ist nicht eingelesen, sondern eine Bearbeitung von der Datei WSDede, die ich so eingelesen habe:
ich hab einen Grafen mit geom_line geplottet und es klappt mit folgendem Code:
Einen Grafen mittels Geom_freqpoly konnte ich ebenfalls mit folgendem Code erstellen:
Frage mich, was der Unterschied ist und was das stat=Identity soll. Hab dazu nichts aussagekräftiges finden können. Vielen Dank für deine Hilfe!
Gruß,
Max
die Datei WSDede4.txt ist nicht eingelesen, sondern eine Bearbeitung von der Datei WSDede, die ich so eingelesen habe:
Code: Alles auswählen
WSDede <- read.delim(header=TRUE, na.strings = "---", skip=1, file.choose())
Code: Alles auswählen
ggplot(data =WSDede4, aes(x = Var1, y= Freq)) +
geom_line(color = "red") +
geom_point(color= "red")
Code: Alles auswählen
ggplot(data =WSDede4, aes (x=Var1, y =Freq)) +
geom_freqpoly(stat= "Identity")
Gruß,
Max