Lösungsansätze für Datensatz amis
Verfasst: So Dez 10, 2017 10:00 pm
Guten Abend,
zur Zeit beschäftigen wir uns in der Uni mit der Statistiksoftware R. Wir müssen zur Zeit Aufgaben zu einem Datensatz namens "amis" lösen.
Der amis-Datensatz beinhaltet 8437 Geschwindigkeitsmessungen zu verschiedenen Zeitpunkten um zu
untersuchen, ob Warnschilder einen Effekt auf die Geschwindigkeit von Autos haben.
Aktiviert/installiert wird dieser mit:
data(amis, package="boot")
install.packages("boot", dependencies=TRUE)
Folgende Variablen tauchen auf:
speed
Geschwindigkeit des Autos, in Meilen pro Stunde
period
Messzeitpunkt
1 – Messung vor dem Aufstellen des Warnschilds
2 – Messung direkt nach dem Aufstellen des Warnschilds
3 – Messung einige Zeit nach dem Aufstellen des
Warnschilds
warning
Die insgesamt 28 Messstellen wurden in zwei 14er
Gruppen aufgeteilt. In den Gruppen mit warning = 1
wurde ein Warnschild aufgestellt (Zielgruppe), in den
Gruppen mit warning = 2 wurde kein Warnschild
aufgestellt (Kontrollgruppe).
pair
Jeder Messstelle, an der ein Warnschild aufgestellt
wurde, wurde eine strukturgleiche Messstelle
gegenübergestellt, an der kein Warnschild aufgestellt
wurde. Insgesamt gibt es 14 Paare.
So, kommen wir nun zu den Aufgaben, wo ich nicht weiterkomme... Faul bin ich nicht, ich schätze die richtigen Gedankenansätze habe ich aber es scheitert an der "Übersetzung" in R zur Aufgabenlösung.
Kommen wir zu den Aufgaben sowie den Lösungsansätzen von mir:
1.)Untersuchen Sie mit einem geeigneten statistischen Testverfahren den Zusammenhang zwischen der
Geschwindigkeit (speed) und dem Messzeitpunkt (period) nur für die Messstellen, an denen Warnschilder
aufgestellt worden sind (warning = 1), und beantworten Sie die Frage: Hat das Aufstellen von
Verkehrsschildern einen Effekt? Stellen Sie den gefundenen Effekt in einem Mittelwertplot dar.
Mein Lösungsansatz, bzw. bisher geleistetes:
Es wurde der Chi2-Test ausgewählt (als geeignetes statistisches Testverfahren)
#Erstellung der Kreuztabelle für den Chi-Quadrat-Test
Filter <- subset(amis, warning=='1')
Filter2.df <- as.data.frame(Filter)
Filter3 <- xtabs(~ speed + period, data=Filter2.df)
Filter3
# Durchführung des Chi-Quadrat-Test
# 1. Nullhypothese
# H0: Es gibt keinen Zusammenhang zwischen der Aufstellung der Verkehrsschilder und der Geschwindigkeit.
# 2. Testniveau
# alpha=5%
# 3. p-Wert
chisq.test(Filter3)
# p=0,0006473
# 4. Testentscheidung
# p<alpha --> H0 verwerfen, es gibt einen Zusammenhang zwischen der Aufstellung Verkehrsschilder
# und der Geschwindigkeit.
Nun komme ich an dem Punkt nicht weiter, dass der Zusammenhang unter anderem als Mittelwertplot dargestellt werden muss, da wir drei verschiedene Variablen haben: speed, period, warning...
Ich komme einfach nicht weiter, geschweige denn weiß ich nicht einmal ob der bisher geleistete Lösungsansatz richtig ist.
2.)Untersuchen Sie mit einem geeigneten statistischen Testverfahren den Zusammenhang zwischen der
Geschwindigkeit (speed) und dem Messzeitpunkt (period) für alle Messstellen. Berücksichtigen Sie dieses
Mal die weiteren Variablen (warning und pair) in Ihrem Modell, um deren Haupteffekte und deren
kombinierten Effekte herauszurechnen. Hat der Messzeitpunkt einen signifikanten Effekt?
Als statistisches Testverfahren würde ich die Varianzanalyse auswählen, jedoch weiß ich nicht wie ich hier überhaupt anfangen soll...
Ich hoffe man kann mir hier weiterhelfen. Ich sitze schon seit über zehn Stunden an den Aufgaben und langsam aber sicher kommt die Verzweiflung.
Über viele einleuchtende Lösungsansätze würde ich mich sehr freuen!
Vielen Dank und einen schönen Abend!
zur Zeit beschäftigen wir uns in der Uni mit der Statistiksoftware R. Wir müssen zur Zeit Aufgaben zu einem Datensatz namens "amis" lösen.
Der amis-Datensatz beinhaltet 8437 Geschwindigkeitsmessungen zu verschiedenen Zeitpunkten um zu
untersuchen, ob Warnschilder einen Effekt auf die Geschwindigkeit von Autos haben.
Aktiviert/installiert wird dieser mit:
data(amis, package="boot")
install.packages("boot", dependencies=TRUE)
Folgende Variablen tauchen auf:
speed
Geschwindigkeit des Autos, in Meilen pro Stunde
period
Messzeitpunkt
1 – Messung vor dem Aufstellen des Warnschilds
2 – Messung direkt nach dem Aufstellen des Warnschilds
3 – Messung einige Zeit nach dem Aufstellen des
Warnschilds
warning
Die insgesamt 28 Messstellen wurden in zwei 14er
Gruppen aufgeteilt. In den Gruppen mit warning = 1
wurde ein Warnschild aufgestellt (Zielgruppe), in den
Gruppen mit warning = 2 wurde kein Warnschild
aufgestellt (Kontrollgruppe).
pair
Jeder Messstelle, an der ein Warnschild aufgestellt
wurde, wurde eine strukturgleiche Messstelle
gegenübergestellt, an der kein Warnschild aufgestellt
wurde. Insgesamt gibt es 14 Paare.
So, kommen wir nun zu den Aufgaben, wo ich nicht weiterkomme... Faul bin ich nicht, ich schätze die richtigen Gedankenansätze habe ich aber es scheitert an der "Übersetzung" in R zur Aufgabenlösung.
Kommen wir zu den Aufgaben sowie den Lösungsansätzen von mir:
1.)Untersuchen Sie mit einem geeigneten statistischen Testverfahren den Zusammenhang zwischen der
Geschwindigkeit (speed) und dem Messzeitpunkt (period) nur für die Messstellen, an denen Warnschilder
aufgestellt worden sind (warning = 1), und beantworten Sie die Frage: Hat das Aufstellen von
Verkehrsschildern einen Effekt? Stellen Sie den gefundenen Effekt in einem Mittelwertplot dar.
Mein Lösungsansatz, bzw. bisher geleistetes:
Es wurde der Chi2-Test ausgewählt (als geeignetes statistisches Testverfahren)
#Erstellung der Kreuztabelle für den Chi-Quadrat-Test
Filter <- subset(amis, warning=='1')
Filter2.df <- as.data.frame(Filter)
Filter3 <- xtabs(~ speed + period, data=Filter2.df)
Filter3
# Durchführung des Chi-Quadrat-Test
# 1. Nullhypothese
# H0: Es gibt keinen Zusammenhang zwischen der Aufstellung der Verkehrsschilder und der Geschwindigkeit.
# 2. Testniveau
# alpha=5%
# 3. p-Wert
chisq.test(Filter3)
# p=0,0006473
# 4. Testentscheidung
# p<alpha --> H0 verwerfen, es gibt einen Zusammenhang zwischen der Aufstellung Verkehrsschilder
# und der Geschwindigkeit.
Nun komme ich an dem Punkt nicht weiter, dass der Zusammenhang unter anderem als Mittelwertplot dargestellt werden muss, da wir drei verschiedene Variablen haben: speed, period, warning...
Ich komme einfach nicht weiter, geschweige denn weiß ich nicht einmal ob der bisher geleistete Lösungsansatz richtig ist.
2.)Untersuchen Sie mit einem geeigneten statistischen Testverfahren den Zusammenhang zwischen der
Geschwindigkeit (speed) und dem Messzeitpunkt (period) für alle Messstellen. Berücksichtigen Sie dieses
Mal die weiteren Variablen (warning und pair) in Ihrem Modell, um deren Haupteffekte und deren
kombinierten Effekte herauszurechnen. Hat der Messzeitpunkt einen signifikanten Effekt?
Als statistisches Testverfahren würde ich die Varianzanalyse auswählen, jedoch weiß ich nicht wie ich hier überhaupt anfangen soll...
Ich hoffe man kann mir hier weiterhelfen. Ich sitze schon seit über zehn Stunden an den Aufgaben und langsam aber sicher kommt die Verzweiflung.
Über viele einleuchtende Lösungsansätze würde ich mich sehr freuen!
Vielen Dank und einen schönen Abend!