Nachhilfe für R gesucht

Interessantes ohne bestimmtes Thema!

Moderator: student

Student2020
Beiträge: 9
Registriert: Do Okt 22, 2020 9:19 pm

Nachhilfe für R gesucht

Beitrag von Student2020 »

Hallo liebe Leute,

ich bin ein Neuling was R betrifft und brauche das Programm für die Masterarbeit. Gibt es hier vielleicht jemanden der mir bei einem Thema 2-3 Stunden für 16 Euro die Stunden helfen würde?

Vielen Dank und viele Grüße
Studentin2023

PS: Sorry wenn das off topic ist.
ruppy
Beiträge: 41
Registriert: Mo Nov 04, 2019 10:05 pm

Re: Nachhilfe für R gesucht

Beitrag von ruppy »

Bei was bräuchtest du denn genau Hilfe?
Student2020
Beiträge: 9
Registriert: Do Okt 22, 2020 9:19 pm

Re: Nachhilfe für R gesucht

Beitrag von Student2020 »

Hi Ruppy,

bei einer Fixed Effect Regression Analyse. Bei mir ist das Problem, dass R die Tabelle nicht so annimt wie ich sie hochlade. Wahrscheinlich wird der Fehler sehr simpel sein, aber ich komme gerade nicht weiter.
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Nachhilfe für R gesucht

Beitrag von jogo »

Hallo Studentin2023,

meiner Erinnerung nach haben wir hier im Forum solche und ähnliche Probleme schon öfter gelöst, wenn es nur entsprechend konkrete Beschreibungen des Problems gab (also z.B. auch mit der einzulesenden Datei).

... hier im Forum selbstverständlich ohne Bezahlung.

Gruß, Jörg
Student2020
Beiträge: 9
Registriert: Do Okt 22, 2020 9:19 pm

Re: Nachhilfe für R gesucht

Beitrag von Student2020 »

Hallo jogo,

das ist kein Problem. Die Datei die ich einlesen lassen möchte ist diese:

Code: Alles auswählen

	2001	2002	2003	2004	2005	2006	2007	2008	2009	2010	2011	2012
Belgium	14	-72	-11	54	15	37	110	1337	2536	-342	2167	2033
Croatia	0	0	0	0	0	7	0	19	50	60	2	13
Denmark	13	11	20	12	8	34	63	74	65	57	22	196
Finland	10	7	-31	18	3	14	10	9	18	24	34	41
France	764	548	535	514	1447	1614	2087	2336	1515	994	3245	1322
Germany	-1103	-52	-233	620	637	788	1172	69	430	990	953	535
Italy	42	100	29	67	101	1771	132	362	594	11	-1269	1004
Luxembourgh	0	108	-7	220	119	262	858	839	1504	71	-1658	1194
Netherlands	175	406	197	63	65	86	159	460	209	358	2520	4345
Sweden	67	15	77	194	211	164	177	219	111	88	495	52
Switzerland	45	-207	-173	-37	960	535	1115	3816	54	297	469	559
United Kingdom	853	3932	4220	7742	9881	6256	8358	6870	7378	10899	6901	17469
Canada	3	5	6	16	8	61	-21	150	9	21	30	135
United States	407	726	865	2144	4185	5169	8155	5422	3348	3996	1976	7283
China	1	5	17	56	124	175	534	4970	340	844	1360	4541
Hong Kong, China	0	0	0	0	0	3	1	2	2	6	5	0
Norway	0	2	2	0	3	8	5	6	39	74	9	88
EU	880	4794	4622	9467	13447	11568	14242	16410	14463	13507	13882	28762
NA	410	731	872	2160	4193	5229	8134	5571	3357	4017	2006	7418
China	1	5	17	56	124	178	535	4972	342	850	1365	4541
Ich wollte zuerst ein paar Standardsachen probieren und testen, aber R scheint mit dem Format nicht zurecht zukommen.
Weißt du woran das liegen könnte?

Jedes Land ist eine Zeile und deren Werte und jede Spalte hat einen Wert pro Jahr.

Vielen Dank!
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Nachhilfe für R gesucht

Beitrag von jogo »

Hallo Student2020,

Code: Alles auswählen

dat <- read.delim(header=TRUE, stringsAsFactors = FALSE, text=
"	2001	2002	2003	2004	2005	2006	2007	2008	2009	2010	2011	2012
Belgium	14	-72	-11	54	15	37	110	1337	2536	-342	2167	2033
Croatia	0	0	0	0	0	7	0	19	50	60	2	13
Denmark	13	11	20	12	8	34	63	74	65	57	22	196
Finland	10	7	-31	18	3	14	10	9	18	24	34	41
France	764	548	535	514	1447	1614	2087	2336	1515	994	3245	1322
Germany	-1103	-52	-233	620	637	788	1172	69	430	990	953	535
Italy	42	100	29	67	101	1771	132	362	594	11	-1269	1004
Luxembourgh	0	108	-7	220	119	262	858	839	1504	71	-1658	1194
Netherlands	175	406	197	63	65	86	159	460	209	358	2520	4345
Sweden	67	15	77	194	211	164	177	219	111	88	495	52
Switzerland	45	-207	-173	-37	960	535	1115	3816	54	297	469	559
United Kingdom	853	3932	4220	7742	9881	6256	8358	6870	7378	10899	6901	17469
Canada	3	5	6	16	8	61	-21	150	9	21	30	135
United States	407	726	865	2144	4185	5169	8155	5422	3348	3996	1976	7283
China	1	5	17	56	124	175	534	4970	340	844	1360	4541
Hong Kong, China	0	0	0	0	0	3	1	2	2	6	5	0
Norway	0	2	2	0	3	8	5	6	39	74	9	88
EU	880	4794	4622	9467	13447	11568	14242	16410	14463	13507	13882	28762
NA	410	731	872	2160	4193	5229	8134	5571	3357	4017	2006	7418
China	1	5	17	56	124	178	535	4972	342	850	1365	4541")
... das war bei mir erfolgreich.

header=TRUE hätte ich mir auch sparen können, da dieser Wert für header= Standard ist; ich hatte aber zuerst die Funktion read.table() probiert.

Darf ich fragen, was die Zahlen beinhalten?

Gruß, Jörg
Student2020
Beiträge: 9
Registriert: Do Okt 22, 2020 9:19 pm

Re: Nachhilfe für R gesucht

Beitrag von Student2020 »

Hi Jörg,

danke für den Code. So funktioniert es. Die Zahlen beinhalten FDI Werte in bestimmte Ländern. Ich würde gerne eine Fixed Effect Regression damit machen.

Ich habe jetzt nochmal angefangen mich mit den Basics von R auseinanderzusetzen. Hoffentlich klappt es besser wenn man 2-3 Tage damit verbringt.
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Nachhilfe für R gesucht

Beitrag von bigben »

Hallo Student2020,

ich bin da nicht so sicher -- am Anfang ist R kein Zuckerschlecken und mit Anfang meine ich mehr als 2 bis 3 Tage. Dein Atem wird etwas länger sein müssen, aber erstens lohnt es sich und zweitens sind wir ja hier und helfen.

Ich würde etwas von jogos Einleseprozedur abweichen: Du hast einen Ländernamen, der "NA" lautet und mit jogos Funktionsaufruf wird daraus ein fehlender Eintrag anstelle der Kategorie "NA". Wahrscheinlich ist es geschickter, den Ländernamen "NA" beizubehalten mit

Code: Alles auswählen

dat <- read.delim(na.strings = "", stringsAsFactors = FALSE, text=
                    "	2001	2002	2003	2004	2005	2006	2007	2008	2009	2010	2011	2012
Belgium	14	-72	-11	54	15	37	110	1337	2536	-342	2167	2033
Croatia	0	0	0	0	0	7	0	19	50	60	2	13
...
Ich weiß natürlich nicht, was genau Du regressieren möchtest aber wahrscheinlich ist, dass Du als erstes Deinen Datensatz umstrukturieren möchtest und zwar so, dass Du eine Spalte mit Ländern und eine mit Jahreszahlen hast und genau die Klippe ist in R komisch bzw. nicht anfängerfreundlich bzw., es lohnt sich, dafür ein zusätzliches Package zu installieren, derer es mehrere gibt.

Mit dem tidyr package (download via install.packages("tidyr") ) könnte das so aussehen:

Code: Alles auswählen

library(tidyr)
dat.long <-  as.data.frame(pivot_longer(dat, cols=2:13))
names(dat.long) <- c("country", "year", "fpi")
head(dat.long)
Eine fixed effects regression die FDI aus Land und JAhr vorhersagt könnte danach ganz naiv so aussehen:

Code: Alles auswählen

regr <- lm(fpi ~ country + year, data = dat.long)
summary(regr)
Aber da Du bestimmt nicht Deutschland und die EU als Prädiktor haben willst, ist dieser Ansatz zu naiv, trotzdem hoffentlich hilfreich.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Nachhilfe für R gesucht

Beitrag von jogo »

Hallo Bernhard,
bigben hat geschrieben: Fr Nov 06, 2020 8:47 am Ich würde etwas von jogos Einleseprozedur abweichen: Du hast einen Ländernamen, der "NA" lautet und mit jogos Funktionsaufruf wird daraus ein fehlender Eintrag anstelle der Kategorie "NA". Wahrscheinlich ist es geschickter, den Ländernamen "NA" beizubehalten mit

Code: Alles auswählen

dat <- read.delim(na.strings = "", stringsAsFactors = FALSE, text=
                    "	2001	2002	2003	2004	2005	2006	2007	2008	2009	2010	2011	2012
Belgium	14	-72	-11	54	15	37	110	1337	2536	-342	2167	2033
Croatia	0	0	0	0	0	7	0	19	50	60	2	13
...
gut gesehen! Danke für den Hinweis.

... die Lösung hätte ich auch so gemacht.

Gruß, Jörg
Student2020
Beiträge: 9
Registriert: Do Okt 22, 2020 9:19 pm

Re: Nachhilfe für R gesucht

Beitrag von Student2020 »

Vielen Dank für die Tipps jogo und bigben.

Es gibt da noch eine weitere "challenge":

Wenn ich folgende Daten einziehe, wieso bekomme ich dann einen Fehler für die Regression?
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
A 381.26 578.32 272.07 279.62 596.21 707.22 1,180.73 910.91 868.82 0.00 0.00
B 313.92 257.48 289.75 307.76 365.42 265.02 331.77 479.44 623.13 0.00 0.00
C 5.29 2.65 27.11 49.89 92.23 36.55 87.29 64.88 126.63 0.00 0.00
Infuence A 9.59 9.09 9.75 11.71 11.59 11.42 11.00 11.75 11.93 6.67 5.98
Safety 4.00 4.00 4.67 6.42 6.76 6.00 6.60 6.00 6.00 6.00 6.00
Environment 2.00 2.00 3.98 4.50 4.50 4.50 4.41 3.03 3.50 3.50 3.50

> Test1 <- lm(A ~ Infuence A + Safety, data = Excel1)
Error in terms.formula(formula, data = data) :
invalid term in model formula
> Test1 <- lm(2002 ~ 2003 + 2004, data = Excel1)
Error in terms.formula(formula, data = data) :
invalid term in model formula

Wenn jemand eine Idee hätte wäre das super hilfreich. :)

Vielen Dank im Voraus!
Antworten