Brauche dringend Hilfe bei Hypothesentest
Brauche dringend Hilfe bei Hypothesentest
Hallo,
ich schreibe derzeit eine Hausarbeit und habe einen Datensatz erstellt, welcher überwiegend numerische Daten beinhaltet.
Der Datensatz beinhaltet die Jahre 2016-2019 und die Gesamtanzahl der Verkehrsunfälle aufgrund des Fehlverhalten des Fahrzeugführers, alle weiteren Variablen sind die Ursachen, wie beispielsweise unter Alkoholeinfluss, falsche Geschwindigkeit etc.
Die deskriptive Datenanalyse hat soweit mit RStudio funktioniert, jedoch habe ich nun folgende 4 Hypothesen aufgestellt:
H1 Wenden, Rückwärts fahren ist das Hauptfehlverhalten von Fahrzeugführern
H2 Die Geschwindigkeit hat sich als Ursache der Verkehrsunfälle in den letzten Jahren reduziert.
H3 Die durchschnittliche Zahl von Fußgängern als Ursache für Verkehrsunfälle ist kleiner als 16000.
H4 Es gibt einen Zusammenhang zu den ausgewerteten Jahren und der Unfallursache "Alkoholeinfluss".
Jegliche Tests, welche ich versuche anzuwenden (Chip.test, prop.test, t.test etc) enthalten alle lediglich Fehlermeldungen.
Zudem fehlt es mir an dem Hintergrundverständnis, dementsprechend habe ich das Gefühl, dass meine numerischen Daten sich nicht als irgendeinen Test auswerten lassen. Sollte jemand den Fehler erkennen oder eine Idee haben, welcher Test sich auf meine Hypothesen anwenden lässt wäre ich unglaublich dankbar.
ich schreibe derzeit eine Hausarbeit und habe einen Datensatz erstellt, welcher überwiegend numerische Daten beinhaltet.
Der Datensatz beinhaltet die Jahre 2016-2019 und die Gesamtanzahl der Verkehrsunfälle aufgrund des Fehlverhalten des Fahrzeugführers, alle weiteren Variablen sind die Ursachen, wie beispielsweise unter Alkoholeinfluss, falsche Geschwindigkeit etc.
Die deskriptive Datenanalyse hat soweit mit RStudio funktioniert, jedoch habe ich nun folgende 4 Hypothesen aufgestellt:
H1 Wenden, Rückwärts fahren ist das Hauptfehlverhalten von Fahrzeugführern
H2 Die Geschwindigkeit hat sich als Ursache der Verkehrsunfälle in den letzten Jahren reduziert.
H3 Die durchschnittliche Zahl von Fußgängern als Ursache für Verkehrsunfälle ist kleiner als 16000.
H4 Es gibt einen Zusammenhang zu den ausgewerteten Jahren und der Unfallursache "Alkoholeinfluss".
Jegliche Tests, welche ich versuche anzuwenden (Chip.test, prop.test, t.test etc) enthalten alle lediglich Fehlermeldungen.
Zudem fehlt es mir an dem Hintergrundverständnis, dementsprechend habe ich das Gefühl, dass meine numerischen Daten sich nicht als irgendeinen Test auswerten lassen. Sollte jemand den Fehler erkennen oder eine Idee haben, welcher Test sich auf meine Hypothesen anwenden lässt wäre ich unglaublich dankbar.
- Dateianhänge
-
- siha1.xlsx
- (10.47 KiB) 26-mal heruntergeladen
Re: Brauche dringend Hilfe bei Hypothesentest
Hallo momo,
Von 2018 nach 2019 ist der Anteil der speed an den total angestiegen. Von 2016 nach 2019 ist der Wert erheblich gesunken. Beides käme als Antwort auf Deine Hypothese infrage. Die muss also präziser gefasst werden. Vielleicht irgendwas mit "durchschnittlich" oder irgendwas mit "lineares Modell"?
Stimmt, 15984.5 ist kleiner als 16000.
Da einen Test draus zu machen, muss man halt theoretisch hinterfragen:
LG,
Bernhard
Das ist keine Hypothese im statistischen Sinn. Das kann man nicht testen.
H2 Die Geschwindigkeit hat sich als Ursache der Verkehrsunfälle in den letzten Jahren reduziert.
Code: Alles auswählen
verkehr <- read.table(text="year total alcohol wrongstreet speed distance pass rightofway turn pedestrian
2019 355084 13475 23805 41173 49470 13155 51287 56471 15552
2018 368559 13447 25526 42146 51086 13853 52709 59083 16032
2017 360736 12873 24203 45058 50267 13163 52332 56642 15877
2016 369242 12875 25187 47023 51221 13504 53510 58034 16477",
header = TRUE)
with(verkehr, plot(speed/total ~ year, type = "b"))
Code: Alles auswählen
H3 Die durchschnittliche Zahl von Fußgängern als Ursache für Verkehrsunfälle ist kleiner als 16000.
Code: Alles auswählen
> mean(verkehr$pedestrian)
[1] 15984.5
Da einen Test draus zu machen, muss man halt theoretisch hinterfragen:
Code: Alles auswählen
> wilcox.test(verkehr$pedestrian, mu=16000)
Wilcoxon signed rank exact test
data: verkehr$pedestrian
V = 5, p-value = 1
alternative hypothesis: true location is not equal to 16000
In absoluten Zahlen oder als Anteil am total? Ich glaube man erkennt den roten Faden: Die Hypothesen sind nicht wirklich signifikanztesttauglich formuliert. Da wir es vermutlich mit einer Hausaufgabe zu tun haben, ist das wichtig.H4 Es gibt einen Zusammenhang zu den ausgewerteten Jahren und der Unfallursache "Alkoholeinfluss".
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Brauche dringend Hilfe bei Hypothesentest
Hallo,
vielen lieben Dank für die ausführliche Rückmeldung.
Die Werte von speed sind 47023,45058,42146 und zuletzt 41173. Die Hypothese soll am besten ausdrücken, dass ein stetiger Rückgang zu bemerken ist. Ob das nun linear oder als durchschnittliches Modell besser passt, weiß ich leider nicht.
H4 würde ich dann lieber umschreiben und auf turn eingehen, indem ich gerne testen würde, was der höchste Anteil an Verkehrsunfällen ausmacht.
Macht es Sinn eine Hypothese aufzustellen, welche aussagt, dass es einen Zusammenhang der ausgewerteten Jahre gibt und der Unfallursache turn (in Zahlen oder Anteil wäre mir relativ egal).
Tatsächlich ist die Hausaufgabe sehr wichtig, da ich diese morgen abgeben werde und nun sehr verzweifelt an der letzten Hürde sitze.
Ich bedanke mich schon einmal recht herzlich für die erste erhaltene Hilfestellung, da diese mich bereits sehr weit bringt.
LG
vielen lieben Dank für die ausführliche Rückmeldung.
Die Werte von speed sind 47023,45058,42146 und zuletzt 41173. Die Hypothese soll am besten ausdrücken, dass ein stetiger Rückgang zu bemerken ist. Ob das nun linear oder als durchschnittliches Modell besser passt, weiß ich leider nicht.
H4 würde ich dann lieber umschreiben und auf turn eingehen, indem ich gerne testen würde, was der höchste Anteil an Verkehrsunfällen ausmacht.
Macht es Sinn eine Hypothese aufzustellen, welche aussagt, dass es einen Zusammenhang der ausgewerteten Jahre gibt und der Unfallursache turn (in Zahlen oder Anteil wäre mir relativ egal).
Tatsächlich ist die Hausaufgabe sehr wichtig, da ich diese morgen abgeben werde und nun sehr verzweifelt an der letzten Hürde sitze.
Ich bedanke mich schon einmal recht herzlich für die erste erhaltene Hilfestellung, da diese mich bereits sehr weit bringt.
LG
Re: Brauche dringend Hilfe bei Hypothesentest
Habe übrigens versucht den Befehl (verkehr, plot(speed/total ~ year, type = "b")) zu übernehmen bei mir erscheint daraufhin folgende Fehlermeldung :
Fehler: Unerwartete(s) ',' in "(data1,"
Fehler: Unerwartete(s) ',' in "(data1,"
Re: Brauche dringend Hilfe bei Hypothesentest
Ich arbeite mit folgender Datei
H2 habe ich nun auch verstanden
Musste es ja nur kopieren. Vielen lieben Dank dafür. Das hat mir wirklich den Abend gerettet, kann nun weiter arbeiten.
Hast du evtl. eine Idee, wie ich H4 in einen Varianztest einbauen könnte oder in einen T-test?
LG
H3 hat super funktioniert. Vielen Dank dafür H2 habe ich nun auch verstanden
Musste es ja nur kopieren. Vielen lieben Dank dafür. Das hat mir wirklich den Abend gerettet, kann nun weiter arbeiten.
Hast du evtl. eine Idee, wie ich H4 in einen Varianztest einbauen könnte oder in einen T-test?
LG
Re: Brauche dringend Hilfe bei Hypothesentest
Ein letztes Mal für heute
Habe nun H4 aufgestellt. Diese Hypothese lautet:
H0 Es gibt keinen Zusammenhang zur Höhe der Verkehrsunfälle insgesamt(total) und der Unfallursache Wenden, Rückwärtsfahren und Abbiegen (turn).
H4 Es gibt einen Zusammenhang zur Höhe der Verkehrsunfälle insgesamt(total) und der Unfallursache Wenden, Rückwärtsfahren und Abbiegen (turn).
Ich habe diesbezüglich einen Pearson Test durchgeführt und wollte fragen, ob ich diesen so verwenden kann, oder ob sich ein Fehler eingeschlichen hat.
>cor.test(data1$total,data1$turn,method = "pearson")
Pearson's product-moment correlation
data: data1$total and data1$turn
t = 2.6754, df = 2, p-value = 0.1159
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.5122610 0.9975614
sample estimates:
cor
0.8840858
Der P-Wert übersteigt 0,05 somit kann ich H4 verwerfen, jedoch frage ich mich weshalb der Korrelationskoeffizient bei 0,884 liegt, müsste dieser nicht deutlich niedriger sein?
Freue mich über eine Rückmeldung.
LG
Habe nun H4 aufgestellt. Diese Hypothese lautet:
H0 Es gibt keinen Zusammenhang zur Höhe der Verkehrsunfälle insgesamt(total) und der Unfallursache Wenden, Rückwärtsfahren und Abbiegen (turn).
H4 Es gibt einen Zusammenhang zur Höhe der Verkehrsunfälle insgesamt(total) und der Unfallursache Wenden, Rückwärtsfahren und Abbiegen (turn).
Ich habe diesbezüglich einen Pearson Test durchgeführt und wollte fragen, ob ich diesen so verwenden kann, oder ob sich ein Fehler eingeschlichen hat.
>cor.test(data1$total,data1$turn,method = "pearson")
Pearson's product-moment correlation
data: data1$total and data1$turn
t = 2.6754, df = 2, p-value = 0.1159
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.5122610 0.9975614
sample estimates:
cor
0.8840858
Der P-Wert übersteigt 0,05 somit kann ich H4 verwerfen, jedoch frage ich mich weshalb der Korrelationskoeffizient bei 0,884 liegt, müsste dieser nicht deutlich niedriger sein?
Freue mich über eine Rückmeldung.
LG
Re: Brauche dringend Hilfe bei Hypothesentest
Das war am Sonntag um Viertel nach drei an einem herrlichen Sommernachmittag. Dürfte inzwischen zu spät sein, noch was zu schreiben.
Wünsche Dir viel Glück,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Brauche dringend Hilfe bei Hypothesentest
Hallo,
vielen Dank für die Rückmeldungen. Ich habe tatsächlich Zeit bis 23.00 Uhr meine Hausarbeit hochzuladen. Sollte es zeitlich passen, würde ich mich natürlich über eine Rückmeldung freuen, ob ich den eigenen Test korrekt dargestellt habe.
Möchte ich mich aber vorab schon mal unglaublich für die Hilfestellungen bedanken, da ich ohne diese total aufgeschmissen wäre.
Liebe Grüße
vielen Dank für die Rückmeldungen. Ich habe tatsächlich Zeit bis 23.00 Uhr meine Hausarbeit hochzuladen. Sollte es zeitlich passen, würde ich mich natürlich über eine Rückmeldung freuen, ob ich den eigenen Test korrekt dargestellt habe.
Möchte ich mich aber vorab schon mal unglaublich für die Hilfestellungen bedanken, da ich ohne diese total aufgeschmissen wäre.
Liebe Grüße
Re: Brauche dringend Hilfe bei Hypothesentest
Na dann versuchen wir es mal:
LG,
Bernhard
Yep, ich habe auch nur für den Anteil von speed am total behauptet, dass die Richtung nicht immer nach unten geht.
Du hast die Pearson-Korrelation in Deinem Werkzeugkasten. Man kann auch prüfen, ob die Jahreszahl mit einem Wert korreliert.Die Hypothese soll am besten ausdrücken, dass ein stetiger Rückgang zu bemerken ist. Ob das nun linear oder als durchschnittliches Modell besser passt, weiß ich leider nicht.
Wie gesagt, nachdem wir wissen, dass Korrelationen unterrichtet worden sind, würden die sich anbieten.H4 würde ich dann lieber umschreiben und auf turn eingehen, indem ich gerne testen würde, was der höchste Anteil an Verkehrsunfällen ausmacht.
Macht es Sinn eine Hypothese aufzustellen, welche aussagt, dass es einen Zusammenhang der ausgewerteten Jahre gibt und der Unfallursache turn (in Zahlen oder Anteil wäre mir relativ egal).
Meine Befehlszeile begann mit einem "with" das hier zu fehlen scheint. Ansonsten macht es viel mehr Sinn, Fehlermeldung vollständig zu posten.Habe übrigens versucht den Befehl (verkehr, plot(speed/total ~ year, type = "b")) zu übernehmen bei mir erscheint daraufhin folgende Fehlermeldung :
Fehler: Unerwartete(s) ',' in "(data1,"
Nein, bei geringer Zahl von Beobachtungen muss auch ein hoher Korrelationskoeffizient nicht signifikant werden.Der P-Wert übersteigt 0,05 somit kann ich H4 verwerfen, jedoch frage ich mich weshalb der Korrelationskoeffizient bei 0,884 liegt, müsste dieser nicht deutlich niedriger sein?
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte