Brauche dringend Hilfe bei Hypothesentest

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

Antworten
momo_off
Beiträge: 6
Registriert: So Aug 30, 2020 3:11 pm

Brauche dringend Hilfe bei Hypothesentest

Beitrag von momo_off »

Hallo,

ich schreibe derzeit eine Hausarbeit und habe einen Datensatz erstellt, welcher überwiegend numerische Daten beinhaltet.
Der Datensatz beinhaltet die Jahre 2016-2019 und die Gesamtanzahl der Verkehrsunfälle aufgrund des Fehlverhalten des Fahrzeugführers, alle weiteren Variablen sind die Ursachen, wie beispielsweise unter Alkoholeinfluss, falsche Geschwindigkeit etc.
Die deskriptive Datenanalyse hat soweit mit RStudio funktioniert, jedoch habe ich nun folgende 4 Hypothesen aufgestellt:

H1 Wenden, Rückwärts fahren ist das Hauptfehlverhalten von Fahrzeugführern

H2 Die Geschwindigkeit hat sich als Ursache der Verkehrsunfälle in den letzten Jahren reduziert.

H3 Die durchschnittliche Zahl von Fußgängern als Ursache für Verkehrsunfälle ist kleiner als 16000.

H4 Es gibt einen Zusammenhang zu den ausgewerteten Jahren und der Unfallursache "Alkoholeinfluss".


Jegliche Tests, welche ich versuche anzuwenden (Chip.test, prop.test, t.test etc) enthalten alle lediglich Fehlermeldungen.
Zudem fehlt es mir an dem Hintergrundverständnis, dementsprechend habe ich das Gefühl, dass meine numerischen Daten sich nicht als irgendeinen Test auswerten lassen. Sollte jemand den Fehler erkennen oder eine Idee haben, welcher Test sich auf meine Hypothesen anwenden lässt wäre ich unglaublich dankbar.
Dateianhänge
siha1.xlsx
(10.47 KiB) 26-mal heruntergeladen
bigben
Beiträge: 2777
Registriert: Mi Okt 12, 2016 9:09 am

Re: Brauche dringend Hilfe bei Hypothesentest

Beitrag von bigben »

Hallo momo,
momo_off hat geschrieben: So Aug 30, 2020 3:24 pmH1 Wenden, Rückwärts fahren ist das Hauptfehlverhalten von Fahrzeugführern
Das ist keine Hypothese im statistischen Sinn. Das kann man nicht testen.
H2 Die Geschwindigkeit hat sich als Ursache der Verkehrsunfälle in den letzten Jahren reduziert.

Code: Alles auswählen

verkehr <-  read.table(text="year	total	alcohol	wrongstreet	speed	distance	pass	rightofway	turn	pedestrian
2019	355084	13475	23805	41173	49470	13155	51287	56471	15552
2018	368559	13447	25526	42146	51086	13853	52709	59083	16032
2017	360736	12873	24203	45058	50267	13163	52332	56642	15877
2016	369242	12875	25187	47023	51221	13504	53510	58034	16477",
                       header = TRUE)

with(verkehr, plot(speed/total ~ year, type = "b"))
Von 2018 nach 2019 ist der Anteil der speed an den total angestiegen. Von 2016 nach 2019 ist der Wert erheblich gesunken. Beides käme als Antwort auf Deine Hypothese infrage. Die muss also präziser gefasst werden. Vielleicht irgendwas mit "durchschnittlich" oder irgendwas mit "lineares Modell"?

Code: Alles auswählen

H3 Die durchschnittliche Zahl von Fußgängern als Ursache für Verkehrsunfälle ist kleiner als 16000.

Code: Alles auswählen

> mean(verkehr$pedestrian)
[1] 15984.5
Stimmt, 15984.5 ist kleiner als 16000.

Da einen Test draus zu machen, muss man halt theoretisch hinterfragen:

Code: Alles auswählen

> wilcox.test(verkehr$pedestrian, mu=16000)

	Wilcoxon signed rank exact test

data:  verkehr$pedestrian
V = 5, p-value = 1
alternative hypothesis: true location is not equal to 16000
H4 Es gibt einen Zusammenhang zu den ausgewerteten Jahren und der Unfallursache "Alkoholeinfluss".
In absoluten Zahlen oder als Anteil am total? Ich glaube man erkennt den roten Faden: Die Hypothesen sind nicht wirklich signifikanztesttauglich formuliert. Da wir es vermutlich mit einer Hausaufgabe zu tun haben, ist das wichtig.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
momo_off
Beiträge: 6
Registriert: So Aug 30, 2020 3:11 pm

Re: Brauche dringend Hilfe bei Hypothesentest

Beitrag von momo_off »

Hallo,

vielen lieben Dank für die ausführliche Rückmeldung.

Die Werte von speed sind 47023,45058,42146 und zuletzt 41173. Die Hypothese soll am besten ausdrücken, dass ein stetiger Rückgang zu bemerken ist. Ob das nun linear oder als durchschnittliches Modell besser passt, weiß ich leider nicht. :?:

H4 würde ich dann lieber umschreiben und auf turn eingehen, indem ich gerne testen würde, was der höchste Anteil an Verkehrsunfällen ausmacht.
Macht es Sinn eine Hypothese aufzustellen, welche aussagt, dass es einen Zusammenhang der ausgewerteten Jahre gibt und der Unfallursache turn (in Zahlen oder Anteil wäre mir relativ egal).

Tatsächlich ist die Hausaufgabe sehr wichtig, da ich diese morgen abgeben werde und nun sehr verzweifelt an der letzten Hürde sitze.

Ich bedanke mich schon einmal recht herzlich für die erste erhaltene Hilfestellung, da diese mich bereits sehr weit bringt.

LG
momo_off
Beiträge: 6
Registriert: So Aug 30, 2020 3:11 pm

Re: Brauche dringend Hilfe bei Hypothesentest

Beitrag von momo_off »

Habe übrigens versucht den Befehl (verkehr, plot(speed/total ~ year, type = "b")) zu übernehmen bei mir erscheint daraufhin folgende Fehlermeldung :
Fehler: Unerwartete(s) ',' in "(data1,"
momo_off
Beiträge: 6
Registriert: So Aug 30, 2020 3:11 pm

Re: Brauche dringend Hilfe bei Hypothesentest

Beitrag von momo_off »

Ich arbeite mit folgender Datei
data1.xlsx
(10.47 KiB) 26-mal heruntergeladen
H3 hat super funktioniert. Vielen Dank dafür :D

H2 habe ich nun auch verstanden :D :D :D :D
Musste es ja nur kopieren. Vielen lieben Dank dafür. Das hat mir wirklich den Abend gerettet, kann nun weiter arbeiten.
Hast du evtl. eine Idee, wie ich H4 in einen Varianztest einbauen könnte oder in einen T-test?

LG
momo_off
Beiträge: 6
Registriert: So Aug 30, 2020 3:11 pm

Re: Brauche dringend Hilfe bei Hypothesentest

Beitrag von momo_off »

Ein letztes Mal für heute :)

Habe nun H4 aufgestellt. Diese Hypothese lautet:

H0 Es gibt keinen Zusammenhang zur Höhe der Verkehrsunfälle insgesamt(total) und der Unfallursache Wenden, Rückwärtsfahren und Abbiegen (turn).
H4 Es gibt einen Zusammenhang zur Höhe der Verkehrsunfälle insgesamt(total) und der Unfallursache Wenden, Rückwärtsfahren und Abbiegen (turn).

Ich habe diesbezüglich einen Pearson Test durchgeführt und wollte fragen, ob ich diesen so verwenden kann, oder ob sich ein Fehler eingeschlichen hat.

>cor.test(data1$total,data1$turn,method = "pearson")

Pearson's product-moment correlation

data: data1$total and data1$turn
t = 2.6754, df = 2, p-value = 0.1159
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.5122610 0.9975614
sample estimates:
cor
0.8840858


Der P-Wert übersteigt 0,05 somit kann ich H4 verwerfen, jedoch frage ich mich weshalb der Korrelationskoeffizient bei 0,884 liegt, müsste dieser nicht deutlich niedriger sein?

Freue mich über eine Rückmeldung.

LG
bigben
Beiträge: 2777
Registriert: Mi Okt 12, 2016 9:09 am

Re: Brauche dringend Hilfe bei Hypothesentest

Beitrag von bigben »

momo_off hat geschrieben: So Aug 30, 2020 6:32 pmTatsächlich ist die Hausaufgabe sehr wichtig, da ich diese morgen abgeben werde
Das war am Sonntag um Viertel nach drei an einem herrlichen Sommernachmittag. Dürfte inzwischen zu spät sein, noch was zu schreiben.

Wünsche Dir viel Glück,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
momo_off
Beiträge: 6
Registriert: So Aug 30, 2020 3:11 pm

Re: Brauche dringend Hilfe bei Hypothesentest

Beitrag von momo_off »

Hallo,

vielen Dank für die Rückmeldungen. Ich habe tatsächlich Zeit bis 23.00 Uhr meine Hausarbeit hochzuladen. Sollte es zeitlich passen, würde ich mich natürlich über eine Rückmeldung freuen, ob ich den eigenen Test korrekt dargestellt habe.
Möchte ich mich aber vorab schon mal unglaublich für die Hilfestellungen bedanken, da ich ohne diese total aufgeschmissen wäre.

Liebe Grüße
bigben
Beiträge: 2777
Registriert: Mi Okt 12, 2016 9:09 am

Re: Brauche dringend Hilfe bei Hypothesentest

Beitrag von bigben »

Na dann versuchen wir es mal:
momo_off hat geschrieben: So Aug 30, 2020 6:32 pmDie Werte von speed sind 47023,45058,42146 und zuletzt 41173.
Yep, ich habe auch nur für den Anteil von speed am total behauptet, dass die Richtung nicht immer nach unten geht.

Die Hypothese soll am besten ausdrücken, dass ein stetiger Rückgang zu bemerken ist. Ob das nun linear oder als durchschnittliches Modell besser passt, weiß ich leider nicht. :?:
Du hast die Pearson-Korrelation in Deinem Werkzeugkasten. Man kann auch prüfen, ob die Jahreszahl mit einem Wert korreliert.
H4 würde ich dann lieber umschreiben und auf turn eingehen, indem ich gerne testen würde, was der höchste Anteil an Verkehrsunfällen ausmacht.
Macht es Sinn eine Hypothese aufzustellen, welche aussagt, dass es einen Zusammenhang der ausgewerteten Jahre gibt und der Unfallursache turn (in Zahlen oder Anteil wäre mir relativ egal).
Wie gesagt, nachdem wir wissen, dass Korrelationen unterrichtet worden sind, würden die sich anbieten.
Habe übrigens versucht den Befehl (verkehr, plot(speed/total ~ year, type = "b")) zu übernehmen bei mir erscheint daraufhin folgende Fehlermeldung :
Fehler: Unerwartete(s) ',' in "(data1,"
Meine Befehlszeile begann mit einem "with" das hier zu fehlen scheint. Ansonsten macht es viel mehr Sinn, Fehlermeldung vollständig zu posten.
Der P-Wert übersteigt 0,05 somit kann ich H4 verwerfen, jedoch frage ich mich weshalb der Korrelationskoeffizient bei 0,884 liegt, müsste dieser nicht deutlich niedriger sein?
Nein, bei geringer Zahl von Beobachtungen muss auch ein hoher Korrelationskoeffizient nicht signifikant werden.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten