ich bin absoluter Anfänger und möchte mit dem Allbus-Datensatz 2014 arbeiten, allerdings wurden dort die neuen Bundesländer bewusst überrepräsentiert (Oversampling) - dafür wurde die Variable V870 erstellt um dies auszugleichen.
Bei nahezu jeder Berechnung des arith. Mittels etc. steht im Allbus "gewichtet" nach V870, wenn ich mit R nachrechne und auf die GG schließen möchte, bekomme ich natürlich abweichende Zahlen, da ich nicht weiß wie ich mit R nach V870 gewichte.
Gibt es einen einfachen Befehl der den gesamten Datensatz gewichtet?
Der Gewichtungswert für Ostdeutschland beträgt 0,5639131und der für Westdeutschland 1,2047504.
Im Datensatz selbst steht wie man die Gewichtung für SPSS und STATA hinbekommt - für R leider nicht
"In SPSS würde die Operation in folgenderweise vorgenommen:
Code: Alles auswählen
WEIGHT BY V870.
FREQUENCIES VARIABLES=V7.
In diesem Beispiel etwa:
Code: Alles auswählen
tabulate V7 [weight=V870]
Gewichtungen (z.B. Häufigkeitsgewichten „frequency weights“), keine Gewichtungswerte mit Nachkommastellen
akzeptiert. Ein einfaches Auf- oder Abrunden führt aber ebenfalls häufig zu falschen Ergebnissen – im vorliegenden
Fall würden bei Rundung der Gewichtungsvariablen der Gewichtungswert für ostdeutsche Befragte (0,56)
auf 1 aufgerundet, der Gewichtungswert für westdeutsche Befragte (1,2) auf den Wert 1 abgerundet. Eine mögliche
Lösung zur Korrektur dieser Problematik ist es, zunächst die Gewichtungsvariable mit 100 (oder 1000) zu
multiplizieren und anschließend auf ganze Werte zu runden:
Code: Alles auswählen
tabulate V7 [weight=round(V870*100)]
dass die zu Grunde liegende Fallzahl anschließend wieder korrigiert werden muss (also durch 100, 1000 geteilt
werden muss)."
Wäre sehr dankbar für eure Hilfe