Hallo liebe Community,
ich studiere Psychologie und soll im Rahmen eines interdisziplinären Seminars Fahrsimulator-Daten auswerten. Nun bin ich mit den Daten extrem überfordert, 50.000 Zeilen x 50 Spalten (Variablen, nicht alle werden benötigt) pro Versuchsperson. Die 50.000 ergeben sich, da das Experiment in 10 Millisekundeneinheiten mitgeschnitten wurde und es im Mittel ca. 8 Minuten pro Versuchperson dauerte. Bisher habe ich auch nur mit Excel und SPSS gearbeitet, diese Programme stoßen allerdings beim gegebenen Beispiel an ihre Grenzen. Um den Versuch wie gewohnt auszuwerten (Mittelwertsvergleiche; T-Test zwischen Experimentalgruppen) müssten die Daten erst mit R-Stutio aufbereitet werden, so dass am Ende eine Tabelle existiert in der jedem der Versuchspersonen (insgesamt 24) ein einzelner Wert pro abhängige Variable zugeordnet ist. Diese abhängigen Variablen wären Geschwindigkeitsdifferenz, Abstand und die Minimum-Time-to-Collision (zwischen zwei Fahrzeugen) und errechnen sich relativ einfach anhand der Variablen (z.B. Geschwindigkeitsdifferenz: GeschwindigkeitFahrzeug1 – GeschwindigkeitFahrzeug2,3,4,5,6). Da es sich um ein Fahrsimulatorexperiment handelt gibt es eine Definierte Strecke in Metern (ist die Variable, die als Orientierung dient) auf welcher die Versuchsperson (Fahrzeug1) fährt. Auf dieser Strecke gibt es genau 5 Ampeln, an welchen es jeweils zu einer Interaktion mit Fahrzeug2,3,4,5,6 (jedes dieser Fahrzeuge kommt nur einmal vor und zwar jeweils an einer Ampel und ist simuliert/programmiert) kommt. Da wir nur die Interaktion zwischen Fahrzeug1 und den anderen simulierten Fahrzeugen untersuchen sind nur die 5 Ampelabschnitte +/- 100 Meter für die Auswertung relevant, die Ampeln sind feste Punkte auf der Strecke definiert in Metern (jede Versuchsperson ist die gleiche, vorgefertigte Strecke gefahren). Der Minimalwert der Abhängigen Variablen soll in diesem Streckenintervall +/- 100 Meter pro Ampel, pro Versuchsperson ausfindig gemacht werden. Jede Versuchsperson hat eine einzelne CSV-Datei, ich habe mich bereits damit abgefunden, dass ganze einfach 24-mal mit einem Skript durchzuführen, anstatt es in eine einzelne Datei zu schreiben, um es nicht komplizierter zu machen.
Meine Fragen wären jetzt:
Wie kann man ein Skript schreiben, welches:
1. Die Daten auf +/- 100 Meter pro Ampel reduziert
2. Bestimmten Variablen innerhalb dieser Abschnitte einen Definierten Betrag hinzuaddieren, damit die Variablen untereinander vergleichbar sind
3. Pro Ampelabschnitt eine oder mehrere abhängige Variablen berechnet (z.B. Geschwindigkeit: GeschwindigkeitFahrzeug1 – GeschwindigkeitFahrzeug2,3,4,5,6) zwischen zwei oder mehreren unabhängigen Variablen welche sich pro Ampelabschnitt unterscheiden (da immer ein anderes simuliertes Fahrzeug pro neuen Ampelabschnitt folgt)
4. Den Minimalwert bzw. Maximalwert dieser Abhängigen Variablen bestimmt (pro Abschnitt)
5. Diese 5 Werte pro Abhängige Variable, pro Versuchsperson in Ampelreihenfolge in eine neue Datei schreibt und die neue Variable benennt
Ich weiß wirklich nicht, wie ich dabei vorgehen soll und habe noch nie mit solchen Datenstrukturen gearbeitet und habe auch keine Ahnung von Programmieren. Falls mir da jemand ein paar Tipps geben könnte, wäre ich sehr dankbar.
Viele Grüße
Fahrsimulatordatenauswertung
-
- Beiträge: 13
- Registriert: Di Apr 06, 2021 4:07 pm
Re: Fahrsimulatordatenauswertung
was nicht klar ist: ist die Strecke in Metern ebenfalls eine Variable? Dann könnte man die Aufzeichnungen in den Intervallen rund um die Ampeln erstmal identifizieren unddann wegfiltern.
VG Ruedi
warum doppelt gepostet viewtopic.php?f=11&t=3137
VG Ruedi
warum doppelt gepostet viewtopic.php?f=11&t=3137
fortune(111)
Re: Fahrsimulatordatenauswertung
Hallo Ruedi,
LG,
Bernhard
Das hatte ich angenommen aufgrund von
Aber auch das würde erst ein reproduzierbares Minimalbeispiel abschließend beantworten. Eigentlich hätte ich gern den Standard-Link auf EDis Post im FAQ-Forum gesetzt, aber der erfordert ja schon auch R-Kenntnisse, von denen wir nicht wissen, ob sie da sind oder erarbeitet werden sollen.Da es sich um ein Fahrsimulatorexperiment handelt gibt es eine Definierte Strecke in Metern (ist die Variable, die als Orientierung dient)...
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Fahrsimulatordatenauswertung
Da Studentpsych sich entschieden hat, in seinem anderen Thread zuerst zu antworten, mache ich jetzt diesen Thread zu und bitte, in dem anderen weiter zu diskutieren: viewtopic.php?f=11&t=3137
LG,
Bernhard
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte