Korrelation Pearson
Verfasst: Sa Jul 07, 2018 11:05 am
Hallo, ich möchte mich mal kurz vorstellen, da ich neu hier bin.
Ich schreibe gerade meine Masterarbeit über das Thema "assortative mating" in Österreich und arbeite dabei mit EU-SILC Daten. Leider habe ich im Studium keine R Erfahrungen machen können, nichts desto trotz hab ich es durch die vielen Tutorials im Netz jetzt mal geschafft meine Daten soweit aufzubereiten. Jetzt häng ich allerdings bei der Korrelation ein Bisschen und hoffe hier Hilfe zu finden.
Also folgendes:
Ich möchte die Korrelation zwischen Paaren und deren Bildung berechnen.
Mein Dataframe sind derzeit so aus:
Haushaltsnummer Personenidentifikationsnummer Bildungsgrad
1 101 Uni
1 102 Uni
2 201 Lehre
2 202 Matura
3 301 Matura
3 302 Matura
4 401 Lehre
4 402 Lehre
Die Haushaltsnummer bezieht sich auf die Paare, das bedeute, dass 1 (101) und 1 (102) ein Paar sind.
Meine Überlegung ist, die Zeilen nach der Haushaltsnummer zusammenzufügen, sodass ich mal die Indiviuen zu Paaren zusammengefügt habe und daraus dann die Korrelation für die Bildung berechnen kann.
Das neue Dataframe sollte dann so aussehen:
Haushaltsnummer Personenidentifikationsnummer1 Bildungsgrad1 Personenidentifikationsnummer2 Bildungsgrad2
1 101 Uni 102 Uni
2 201 Lehre 202 Maura
........
Kann mir da vielleicht jemand die Befehle sagen?
Ich hoffe ich habe mich verständlich ausgedrückt. LG
Ich schreibe gerade meine Masterarbeit über das Thema "assortative mating" in Österreich und arbeite dabei mit EU-SILC Daten. Leider habe ich im Studium keine R Erfahrungen machen können, nichts desto trotz hab ich es durch die vielen Tutorials im Netz jetzt mal geschafft meine Daten soweit aufzubereiten. Jetzt häng ich allerdings bei der Korrelation ein Bisschen und hoffe hier Hilfe zu finden.
Also folgendes:
Ich möchte die Korrelation zwischen Paaren und deren Bildung berechnen.
Mein Dataframe sind derzeit so aus:
Haushaltsnummer Personenidentifikationsnummer Bildungsgrad
1 101 Uni
1 102 Uni
2 201 Lehre
2 202 Matura
3 301 Matura
3 302 Matura
4 401 Lehre
4 402 Lehre
Die Haushaltsnummer bezieht sich auf die Paare, das bedeute, dass 1 (101) und 1 (102) ein Paar sind.
Meine Überlegung ist, die Zeilen nach der Haushaltsnummer zusammenzufügen, sodass ich mal die Indiviuen zu Paaren zusammengefügt habe und daraus dann die Korrelation für die Bildung berechnen kann.
Das neue Dataframe sollte dann so aussehen:
Haushaltsnummer Personenidentifikationsnummer1 Bildungsgrad1 Personenidentifikationsnummer2 Bildungsgrad2
1 101 Uni 102 Uni
2 201 Lehre 202 Maura
........
Kann mir da vielleicht jemand die Befehle sagen?
Ich hoffe ich habe mich verständlich ausgedrückt. LG