Fahrsimulatordatenauswertung
Verfasst: Di Apr 06, 2021 4:29 pm
Hallo liebe Community,
ich studiere Psychologie und soll im Rahmen eines interdisziplinären Seminars Fahrsimulator-Daten auswerten. Nun bin ich mit den Daten extrem überfordert, 50.000 Zeilen x 50 Spalten (Variablen, nicht alle werden benötigt) pro Versuchsperson. Die 50.000 ergeben sich, da das Experiment in 10 Millisekundeneinheiten mitgeschnitten wurde und es im Mittel ca. 8 Minuten pro Versuchperson dauerte. Bisher habe ich auch nur mit Excel und SPSS gearbeitet, diese Programme stoßen allerdings beim gegebenen Beispiel an ihre Grenzen. Um den Versuch wie gewohnt auszuwerten (Mittelwertsvergleiche; T-Test zwischen Experimentalgruppen) müssten die Daten erst mit R-Stutio aufbereitet werden, so dass am Ende eine Tabelle existiert in der jedem der Versuchspersonen (insgesamt 24) ein einzelner Wert pro abhängige Variable zugeordnet ist. Diese abhängigen Variablen wären Geschwindigkeitsdifferenz, Abstand und die Minimum-Time-to-Collision (zwischen zwei Fahrzeugen) und errechnen sich relativ einfach anhand der Variablen (z.B. Geschwindigkeitsdifferenz: GeschwindigkeitFahrzeug1 – GeschwindigkeitFahrzeug2,3,4,5,6). Da es sich um ein Fahrsimulatorexperiment handelt gibt es eine Definierte Strecke in Metern (ist die Variable, die als Orientierung dient) auf welcher die Versuchsperson (Fahrzeug1) fährt. Auf dieser Strecke gibt es genau 5 Ampeln, an welchen es jeweils zu einer Interaktion mit Fahrzeug2,3,4,5,6 (jedes dieser Fahrzeuge kommt nur einmal vor und zwar jeweils an einer Ampel und ist simuliert/programmiert) kommt. Da wir nur die Interaktion zwischen Fahrzeug1 und den anderen simulierten Fahrzeugen untersuchen sind nur die 5 Ampelabschnitte +/- 100 Meter für die Auswertung relevant, die Ampeln sind feste Punkte auf der Strecke definiert in Metern (jede Versuchsperson ist die gleiche, vorgefertigte Strecke gefahren). Der Minimalwert der Abhängigen Variablen soll in diesem Streckenintervall +/- 100 Meter pro Ampel, pro Versuchsperson ausfindig gemacht werden. Jede Versuchsperson hat eine einzelne CSV-Datei, ich habe mich bereits damit abgefunden, dass ganze einfach 24-mal mit einem Skript durchzuführen, anstatt es in eine einzelne Datei zu schreiben, um es nicht komplizierter zu machen.
Meine Fragen wären jetzt:
Wie kann man ein Skript schreiben, welches:
1. Die Daten auf +/- 100 Meter pro Ampel reduziert
2. Bestimmten Variablen innerhalb dieser Abschnitte einen Definierten Betrag hinzuaddieren, damit die Variablen untereinander vergleichbar sind
3. Pro Ampelabschnitt eine oder mehrere abhängige Variablen berechnet (z.B. Geschwindigkeit: GeschwindigkeitFahrzeug1 – GeschwindigkeitFahrzeug2,3,4,5,6) zwischen zwei oder mehreren unabhängigen Variablen welche sich pro Ampelabschnitt unterscheiden (da immer ein anderes simuliertes Fahrzeug pro neuen Ampelabschnitt folgt)
4. Den Minimalwert bzw. Maximalwert dieser Abhängigen Variablen bestimmt (pro Abschnitt)
5. Diese 5 Werte pro Abhängige Variable, pro Versuchsperson in Ampelreihenfolge in eine neue Datei schreibt und die neue Variable benennt
Ich weiß wirklich nicht, wie ich dabei vorgehen soll und habe noch nie mit solchen Datenstrukturen gearbeitet und habe auch keine Ahnung von Programmieren. Falls mir da jemand ein paar Tipps geben könnte, wäre ich sehr dankbar.
Viele Grüße
ich studiere Psychologie und soll im Rahmen eines interdisziplinären Seminars Fahrsimulator-Daten auswerten. Nun bin ich mit den Daten extrem überfordert, 50.000 Zeilen x 50 Spalten (Variablen, nicht alle werden benötigt) pro Versuchsperson. Die 50.000 ergeben sich, da das Experiment in 10 Millisekundeneinheiten mitgeschnitten wurde und es im Mittel ca. 8 Minuten pro Versuchperson dauerte. Bisher habe ich auch nur mit Excel und SPSS gearbeitet, diese Programme stoßen allerdings beim gegebenen Beispiel an ihre Grenzen. Um den Versuch wie gewohnt auszuwerten (Mittelwertsvergleiche; T-Test zwischen Experimentalgruppen) müssten die Daten erst mit R-Stutio aufbereitet werden, so dass am Ende eine Tabelle existiert in der jedem der Versuchspersonen (insgesamt 24) ein einzelner Wert pro abhängige Variable zugeordnet ist. Diese abhängigen Variablen wären Geschwindigkeitsdifferenz, Abstand und die Minimum-Time-to-Collision (zwischen zwei Fahrzeugen) und errechnen sich relativ einfach anhand der Variablen (z.B. Geschwindigkeitsdifferenz: GeschwindigkeitFahrzeug1 – GeschwindigkeitFahrzeug2,3,4,5,6). Da es sich um ein Fahrsimulatorexperiment handelt gibt es eine Definierte Strecke in Metern (ist die Variable, die als Orientierung dient) auf welcher die Versuchsperson (Fahrzeug1) fährt. Auf dieser Strecke gibt es genau 5 Ampeln, an welchen es jeweils zu einer Interaktion mit Fahrzeug2,3,4,5,6 (jedes dieser Fahrzeuge kommt nur einmal vor und zwar jeweils an einer Ampel und ist simuliert/programmiert) kommt. Da wir nur die Interaktion zwischen Fahrzeug1 und den anderen simulierten Fahrzeugen untersuchen sind nur die 5 Ampelabschnitte +/- 100 Meter für die Auswertung relevant, die Ampeln sind feste Punkte auf der Strecke definiert in Metern (jede Versuchsperson ist die gleiche, vorgefertigte Strecke gefahren). Der Minimalwert der Abhängigen Variablen soll in diesem Streckenintervall +/- 100 Meter pro Ampel, pro Versuchsperson ausfindig gemacht werden. Jede Versuchsperson hat eine einzelne CSV-Datei, ich habe mich bereits damit abgefunden, dass ganze einfach 24-mal mit einem Skript durchzuführen, anstatt es in eine einzelne Datei zu schreiben, um es nicht komplizierter zu machen.
Meine Fragen wären jetzt:
Wie kann man ein Skript schreiben, welches:
1. Die Daten auf +/- 100 Meter pro Ampel reduziert
2. Bestimmten Variablen innerhalb dieser Abschnitte einen Definierten Betrag hinzuaddieren, damit die Variablen untereinander vergleichbar sind
3. Pro Ampelabschnitt eine oder mehrere abhängige Variablen berechnet (z.B. Geschwindigkeit: GeschwindigkeitFahrzeug1 – GeschwindigkeitFahrzeug2,3,4,5,6) zwischen zwei oder mehreren unabhängigen Variablen welche sich pro Ampelabschnitt unterscheiden (da immer ein anderes simuliertes Fahrzeug pro neuen Ampelabschnitt folgt)
4. Den Minimalwert bzw. Maximalwert dieser Abhängigen Variablen bestimmt (pro Abschnitt)
5. Diese 5 Werte pro Abhängige Variable, pro Versuchsperson in Ampelreihenfolge in eine neue Datei schreibt und die neue Variable benennt
Ich weiß wirklich nicht, wie ich dabei vorgehen soll und habe noch nie mit solchen Datenstrukturen gearbeitet und habe auch keine Ahnung von Programmieren. Falls mir da jemand ein paar Tipps geben könnte, wäre ich sehr dankbar.
Viele Grüße