Nachhilfe für R gesucht
Moderator: student
-
- Beiträge: 9
- Registriert: Do Okt 22, 2020 9:19 pm
Nachhilfe für R gesucht
Hallo liebe Leute,
ich bin ein Neuling was R betrifft und brauche das Programm für die Masterarbeit. Gibt es hier vielleicht jemanden der mir bei einem Thema 2-3 Stunden für 16 Euro die Stunden helfen würde?
Vielen Dank und viele Grüße
Studentin2023
PS: Sorry wenn das off topic ist.
ich bin ein Neuling was R betrifft und brauche das Programm für die Masterarbeit. Gibt es hier vielleicht jemanden der mir bei einem Thema 2-3 Stunden für 16 Euro die Stunden helfen würde?
Vielen Dank und viele Grüße
Studentin2023
PS: Sorry wenn das off topic ist.
Re: Nachhilfe für R gesucht
Bei was bräuchtest du denn genau Hilfe?
-
- Beiträge: 9
- Registriert: Do Okt 22, 2020 9:19 pm
Re: Nachhilfe für R gesucht
Hi Ruppy,
bei einer Fixed Effect Regression Analyse. Bei mir ist das Problem, dass R die Tabelle nicht so annimt wie ich sie hochlade. Wahrscheinlich wird der Fehler sehr simpel sein, aber ich komme gerade nicht weiter.
bei einer Fixed Effect Regression Analyse. Bei mir ist das Problem, dass R die Tabelle nicht so annimt wie ich sie hochlade. Wahrscheinlich wird der Fehler sehr simpel sein, aber ich komme gerade nicht weiter.
Re: Nachhilfe für R gesucht
Hallo Studentin2023,
meiner Erinnerung nach haben wir hier im Forum solche und ähnliche Probleme schon öfter gelöst, wenn es nur entsprechend konkrete Beschreibungen des Problems gab (also z.B. auch mit der einzulesenden Datei).
... hier im Forum selbstverständlich ohne Bezahlung.
Gruß, Jörg
meiner Erinnerung nach haben wir hier im Forum solche und ähnliche Probleme schon öfter gelöst, wenn es nur entsprechend konkrete Beschreibungen des Problems gab (also z.B. auch mit der einzulesenden Datei).
... hier im Forum selbstverständlich ohne Bezahlung.
Gruß, Jörg
-
- Beiträge: 9
- Registriert: Do Okt 22, 2020 9:19 pm
Re: Nachhilfe für R gesucht
Hallo jogo,
das ist kein Problem. Die Datei die ich einlesen lassen möchte ist diese:
Ich wollte zuerst ein paar Standardsachen probieren und testen, aber R scheint mit dem Format nicht zurecht zukommen.
Weißt du woran das liegen könnte?
Jedes Land ist eine Zeile und deren Werte und jede Spalte hat einen Wert pro Jahr.
Vielen Dank!
das ist kein Problem. Die Datei die ich einlesen lassen möchte ist diese:
Code: Alles auswählen
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
Belgium 14 -72 -11 54 15 37 110 1337 2536 -342 2167 2033
Croatia 0 0 0 0 0 7 0 19 50 60 2 13
Denmark 13 11 20 12 8 34 63 74 65 57 22 196
Finland 10 7 -31 18 3 14 10 9 18 24 34 41
France 764 548 535 514 1447 1614 2087 2336 1515 994 3245 1322
Germany -1103 -52 -233 620 637 788 1172 69 430 990 953 535
Italy 42 100 29 67 101 1771 132 362 594 11 -1269 1004
Luxembourgh 0 108 -7 220 119 262 858 839 1504 71 -1658 1194
Netherlands 175 406 197 63 65 86 159 460 209 358 2520 4345
Sweden 67 15 77 194 211 164 177 219 111 88 495 52
Switzerland 45 -207 -173 -37 960 535 1115 3816 54 297 469 559
United Kingdom 853 3932 4220 7742 9881 6256 8358 6870 7378 10899 6901 17469
Canada 3 5 6 16 8 61 -21 150 9 21 30 135
United States 407 726 865 2144 4185 5169 8155 5422 3348 3996 1976 7283
China 1 5 17 56 124 175 534 4970 340 844 1360 4541
Hong Kong, China 0 0 0 0 0 3 1 2 2 6 5 0
Norway 0 2 2 0 3 8 5 6 39 74 9 88
EU 880 4794 4622 9467 13447 11568 14242 16410 14463 13507 13882 28762
NA 410 731 872 2160 4193 5229 8134 5571 3357 4017 2006 7418
China 1 5 17 56 124 178 535 4972 342 850 1365 4541
Weißt du woran das liegen könnte?
Jedes Land ist eine Zeile und deren Werte und jede Spalte hat einen Wert pro Jahr.
Vielen Dank!
Re: Nachhilfe für R gesucht
Hallo Student2020,
... das war bei mir erfolgreich.
header=TRUE hätte ich mir auch sparen können, da dieser Wert für header= Standard ist; ich hatte aber zuerst die Funktion read.table() probiert.
Darf ich fragen, was die Zahlen beinhalten?
Gruß, Jörg
Code: Alles auswählen
dat <- read.delim(header=TRUE, stringsAsFactors = FALSE, text=
" 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
Belgium 14 -72 -11 54 15 37 110 1337 2536 -342 2167 2033
Croatia 0 0 0 0 0 7 0 19 50 60 2 13
Denmark 13 11 20 12 8 34 63 74 65 57 22 196
Finland 10 7 -31 18 3 14 10 9 18 24 34 41
France 764 548 535 514 1447 1614 2087 2336 1515 994 3245 1322
Germany -1103 -52 -233 620 637 788 1172 69 430 990 953 535
Italy 42 100 29 67 101 1771 132 362 594 11 -1269 1004
Luxembourgh 0 108 -7 220 119 262 858 839 1504 71 -1658 1194
Netherlands 175 406 197 63 65 86 159 460 209 358 2520 4345
Sweden 67 15 77 194 211 164 177 219 111 88 495 52
Switzerland 45 -207 -173 -37 960 535 1115 3816 54 297 469 559
United Kingdom 853 3932 4220 7742 9881 6256 8358 6870 7378 10899 6901 17469
Canada 3 5 6 16 8 61 -21 150 9 21 30 135
United States 407 726 865 2144 4185 5169 8155 5422 3348 3996 1976 7283
China 1 5 17 56 124 175 534 4970 340 844 1360 4541
Hong Kong, China 0 0 0 0 0 3 1 2 2 6 5 0
Norway 0 2 2 0 3 8 5 6 39 74 9 88
EU 880 4794 4622 9467 13447 11568 14242 16410 14463 13507 13882 28762
NA 410 731 872 2160 4193 5229 8134 5571 3357 4017 2006 7418
China 1 5 17 56 124 178 535 4972 342 850 1365 4541")
header=TRUE hätte ich mir auch sparen können, da dieser Wert für header= Standard ist; ich hatte aber zuerst die Funktion read.table() probiert.
Darf ich fragen, was die Zahlen beinhalten?
Gruß, Jörg
-
- Beiträge: 9
- Registriert: Do Okt 22, 2020 9:19 pm
Re: Nachhilfe für R gesucht
Hi Jörg,
danke für den Code. So funktioniert es. Die Zahlen beinhalten FDI Werte in bestimmte Ländern. Ich würde gerne eine Fixed Effect Regression damit machen.
Ich habe jetzt nochmal angefangen mich mit den Basics von R auseinanderzusetzen. Hoffentlich klappt es besser wenn man 2-3 Tage damit verbringt.
danke für den Code. So funktioniert es. Die Zahlen beinhalten FDI Werte in bestimmte Ländern. Ich würde gerne eine Fixed Effect Regression damit machen.
Ich habe jetzt nochmal angefangen mich mit den Basics von R auseinanderzusetzen. Hoffentlich klappt es besser wenn man 2-3 Tage damit verbringt.
Re: Nachhilfe für R gesucht
Hallo Student2020,
ich bin da nicht so sicher -- am Anfang ist R kein Zuckerschlecken und mit Anfang meine ich mehr als 2 bis 3 Tage. Dein Atem wird etwas länger sein müssen, aber erstens lohnt es sich und zweitens sind wir ja hier und helfen.
Ich würde etwas von jogos Einleseprozedur abweichen: Du hast einen Ländernamen, der "NA" lautet und mit jogos Funktionsaufruf wird daraus ein fehlender Eintrag anstelle der Kategorie "NA". Wahrscheinlich ist es geschickter, den Ländernamen "NA" beizubehalten mit
Ich weiß natürlich nicht, was genau Du regressieren möchtest aber wahrscheinlich ist, dass Du als erstes Deinen Datensatz umstrukturieren möchtest und zwar so, dass Du eine Spalte mit Ländern und eine mit Jahreszahlen hast und genau die Klippe ist in R komisch bzw. nicht anfängerfreundlich bzw., es lohnt sich, dafür ein zusätzliches Package zu installieren, derer es mehrere gibt.
Mit dem tidyr package (download via install.packages("tidyr") ) könnte das so aussehen:
Eine fixed effects regression die FDI aus Land und JAhr vorhersagt könnte danach ganz naiv so aussehen:
Aber da Du bestimmt nicht Deutschland und die EU als Prädiktor haben willst, ist dieser Ansatz zu naiv, trotzdem hoffentlich hilfreich.
LG,
Bernhard
ich bin da nicht so sicher -- am Anfang ist R kein Zuckerschlecken und mit Anfang meine ich mehr als 2 bis 3 Tage. Dein Atem wird etwas länger sein müssen, aber erstens lohnt es sich und zweitens sind wir ja hier und helfen.
Ich würde etwas von jogos Einleseprozedur abweichen: Du hast einen Ländernamen, der "NA" lautet und mit jogos Funktionsaufruf wird daraus ein fehlender Eintrag anstelle der Kategorie "NA". Wahrscheinlich ist es geschickter, den Ländernamen "NA" beizubehalten mit
Code: Alles auswählen
dat <- read.delim(na.strings = "", stringsAsFactors = FALSE, text=
" 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
Belgium 14 -72 -11 54 15 37 110 1337 2536 -342 2167 2033
Croatia 0 0 0 0 0 7 0 19 50 60 2 13
...
Mit dem tidyr package (download via install.packages("tidyr") ) könnte das so aussehen:
Code: Alles auswählen
library(tidyr)
dat.long <- as.data.frame(pivot_longer(dat, cols=2:13))
names(dat.long) <- c("country", "year", "fpi")
head(dat.long)
Code: Alles auswählen
regr <- lm(fpi ~ country + year, data = dat.long)
summary(regr)
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Nachhilfe für R gesucht
Hallo Bernhard,
... die Lösung hätte ich auch so gemacht.
Gruß, Jörg
gut gesehen! Danke für den Hinweis.bigben hat geschrieben: ↑Fr Nov 06, 2020 8:47 am Ich würde etwas von jogos Einleseprozedur abweichen: Du hast einen Ländernamen, der "NA" lautet und mit jogos Funktionsaufruf wird daraus ein fehlender Eintrag anstelle der Kategorie "NA". Wahrscheinlich ist es geschickter, den Ländernamen "NA" beizubehalten mit
Code: Alles auswählen
dat <- read.delim(na.strings = "", stringsAsFactors = FALSE, text= " 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 Belgium 14 -72 -11 54 15 37 110 1337 2536 -342 2167 2033 Croatia 0 0 0 0 0 7 0 19 50 60 2 13 ...
... die Lösung hätte ich auch so gemacht.
Gruß, Jörg
-
- Beiträge: 9
- Registriert: Do Okt 22, 2020 9:19 pm
Re: Nachhilfe für R gesucht
Vielen Dank für die Tipps jogo und bigben.
Es gibt da noch eine weitere "challenge":
Wenn ich folgende Daten einziehe, wieso bekomme ich dann einen Fehler für die Regression?
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
A 381.26 578.32 272.07 279.62 596.21 707.22 1,180.73 910.91 868.82 0.00 0.00
B 313.92 257.48 289.75 307.76 365.42 265.02 331.77 479.44 623.13 0.00 0.00
C 5.29 2.65 27.11 49.89 92.23 36.55 87.29 64.88 126.63 0.00 0.00
Infuence A 9.59 9.09 9.75 11.71 11.59 11.42 11.00 11.75 11.93 6.67 5.98
Safety 4.00 4.00 4.67 6.42 6.76 6.00 6.60 6.00 6.00 6.00 6.00
Environment 2.00 2.00 3.98 4.50 4.50 4.50 4.41 3.03 3.50 3.50 3.50
> Test1 <- lm(A ~ Infuence A + Safety, data = Excel1)
Error in terms.formula(formula, data = data) :
invalid term in model formula
> Test1 <- lm(2002 ~ 2003 + 2004, data = Excel1)
Error in terms.formula(formula, data = data) :
invalid term in model formula
Wenn jemand eine Idee hätte wäre das super hilfreich.
Vielen Dank im Voraus!
Es gibt da noch eine weitere "challenge":
Wenn ich folgende Daten einziehe, wieso bekomme ich dann einen Fehler für die Regression?
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
A 381.26 578.32 272.07 279.62 596.21 707.22 1,180.73 910.91 868.82 0.00 0.00
B 313.92 257.48 289.75 307.76 365.42 265.02 331.77 479.44 623.13 0.00 0.00
C 5.29 2.65 27.11 49.89 92.23 36.55 87.29 64.88 126.63 0.00 0.00
Infuence A 9.59 9.09 9.75 11.71 11.59 11.42 11.00 11.75 11.93 6.67 5.98
Safety 4.00 4.00 4.67 6.42 6.76 6.00 6.60 6.00 6.00 6.00 6.00
Environment 2.00 2.00 3.98 4.50 4.50 4.50 4.41 3.03 3.50 3.50 3.50
> Test1 <- lm(A ~ Infuence A + Safety, data = Excel1)
Error in terms.formula(formula, data = data) :
invalid term in model formula
> Test1 <- lm(2002 ~ 2003 + 2004, data = Excel1)
Error in terms.formula(formula, data = data) :
invalid term in model formula
Wenn jemand eine Idee hätte wäre das super hilfreich.
Vielen Dank im Voraus!