in meiner Wahrnehmung häufen sich die Fragen, wie eine kategoriale Variable in eine andere Codierung überführt werden kann.
Beispiele sind
viewtopic.php?p=10595#p10595Innerhalb einer Frage (Variable) zum Bildungshintergrund [...] möchte ich die Antworten 2-8 und 13 (ohne Studienabschluss) mit einer 0 und die Antworten 9-12 ( mit Studienabschluss) mit einer 1 kodieren.
oder
viewtopic.php?f=22&t=2131ich habe eine Variable ("Welche der folgenden Quellen vertrauen sie am meisten wenn es um Impfinformationen geht?") mit einer Mehrfachauswahl von 1 bis 11. [...] Nun möchte ich eine neue Variable erstellen, die lediglich die Ausprägung 5,also das Internet als Infoquelle und die Ausprägung 6, online social networks, beinhaltet.
oder
viewtopic.php?f=11&t=2077Ich würde gerne einen t-test durchführen um zu schauen, ob Frauen ein höheres Stresserleben aufweisen aus Männer. Nun habe ich aber im Geschlecht auch divers. Ich würde diese nun gerne mit NA ersetzen.
oder
viewtopic.php?f=11&t=1931wie recodiere ich eine fünfstufige Variable in eine dichotome?
oder
viewtopic.php?f=7&t=1776"5" soll zur neuen "1" werden
"1" und "2" sollen zur neuen "2" werden
und "3" und "4" sollen zur neuen "3" werden.
und es gibt viele weitere Beispiele, aber Ihr glaubt mir bestimmt, dass es eine FAQ ist. Ganz offensichtlich ist das eine grundlegende Funktion für jedes Statistikprogramm und in einem so alten und offenen System wie R gibt es dafür natürlich nicht nur eine Antwort, sondern im Laufe der Zeit sind viele Antworten gefunden worden.
Ich würde in diesem Thread gerne Posts von erfahrenen R'lern sehen, die in je einem Beitrag je eine Herangehensweise darstellen. Gerne können die Vor- und Nachteile der Methoden diskutiert werden, aber alles was nicht streng der Methodendarstellung dient, bitte ich aus diesem Thread herauszuhalten. Jeder, der sein je eigenes Problem besprechen möchte, darf das in seinem je eigenen Thread tun, aber nicht hier. Bei Zuwiderhandlung ist großzügiges Beiträgelöschen zum Wohle der später kommenden hiermit angesagt!
GLG,
Bernhard
-------------------------------------------------------------------------------------------------------------
Beispielproblem 1:
Code: Alles auswählen
bsp1 <- c(-21.91, 7.31, 49.17, 5.0, 17.29, 10.22, -20.03, 25.06, 9.82,
7.26, -32.53, 17.83, 23.65, -12.9, 13.85, -2.33, 19.19, 25.43,
34.71, -13.23, 36.13, -5.49, 25.78, 21.36, 2.95, 0.18, -15.61,
33.37, -13.47, -13.27, -14.64, 4.32, 12.68, 18.26, 7.8, -4.7,
1.96, -30.54, 6.47, -1.67, 28.63, 43.49, 18.79, 26.98, -7.52,
-2.9, -15.79, -16.06, 5.11, -24.25, -4.92, -50.87, 1.19, 4.27,
32.86, 12.74, -17.83, 9.43, -18.69, 9.32, -14.19, 5.14, -26.34,
-0.96, 36.66, 17.77, 24.13, 25.7, -12.36, 19.86, 1.01, -25.23,
-32.06, 23.12, -11.02, -38.24, 9.69, 8.44, 8.91, -12.89, 31.54,
1.27, -1.18, 31.72, -12.31, 22.48, 11.97, -4.26, 13.52, 3.81,
22.61, 17.75, 11.97, -6.43, -8.67, -30.82, 5.31, 32.27, 15.49,
-19.52)
Beispielproblem 2:
Code: Alles auswählen
bsp2 <- c("Diverse(r)", "Diverse(r)", "Diverse(r)", "unbekannt", "Mann",
"Frau", "Diverse(r)", "Mann", "Frau", "Frau", "unbekannt", "Mann",
"Mann", "unbekannt", "unbekannt", "Mann", "unbekannt", "Mann",
"Diverse(r)", "Frau", "unbekannt", "unbekannt", "unbekannt",
"Diverse(r)", "unbekannt", "unbekannt", "unbekannt", "Frau",
"Frau", "Mann")
Beispielproblem 3:
Code: Alles auswählen
bsp3 <- c(0L, 1L, 7L, 8L, 1L, 2L, 4L, 9L, 1L, 8L, 9L, 3L, 7L, 5L, 4L,
8L, 9L, 3L, 5L, 9L, 8L, 7L, 4L, 5L, 4L, 2L, 4L, 8L, 7L, 8L, 1L,
9L, 0L, 5L, 7L, 0L, 1L, 3L, 3L, 6L, 8L, 3L, 0L, 4L, 4L, 0L, 8L,
9L, 8L, 0L)