Stickoxidwerte: Eine Versuchsprobe

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
Jayzon01

Stickoxidwerte: Eine Versuchsprobe

Beitrag von Jayzon01 »

Hi Zusammen,

bin nach längerer Recherche in den Foren zu der Erkenntnis gekommen, dass meine Frage in dieser Art hier wohl noch niemand gestellt hat (oder ich schaff den Transfer nicht). Wie dem auch sei: Ich hoffe, dass ihr mir helfen könnt.

Ausgangssituation:

Vorhanden ist ein Datensatz, der in einer Studie zu den Stickoxidwerten bei Dieselfahrzeugen erhoben wurde. Verbaut wurde ein neuer Filter in der einen Gruppe (Filter = 1) und es gibt eine Kontrollgruppe von Fahrzeugen, in der keine Filter verbaut wurden (Filter = 2).

Gemessen wurde zu drei verschiedenen Zeitpunkten in beiden Gruppen. In t=1 ist in beiden Gruppen kein Filter vorhanden. Bei t=2 sind in Gruppe F=1 die Filter verbaut und aktiv, in t=3 wird der Ausstoß nach einem Jahr nochmals gemessen.

Das Ganze ist bei 12 verschiedenen Dieselmotor-Modellen gemessen worden (1,4l VW, 2,0l VW, 1,6l BMW...). Hier wird jeweils ein Wert zur Vergleichbarkeit bzgl. der Wirksamkeit des verbauten Filters in den jeweiligen Modellen vergeben.

Der letzte Wert ist die abhängige Variable, der NOx-Wert angegeben in mg/km.

Es bildet sich also ein Datensatz mit den folgenden exemplarischen Dimensionen:
  • Filter
1, 2
  • Zeitpunkt
1, 2, 3
  • Modell
1 .. 12
  • NOX
28 .. 140

Nun die spannende Frage, bei deren Beantwortung ich für jede Hilfe dankbar bin:

Ich suche ein statistisches Testverfahren, dass den Zusammenhang zwischen NOx-Werten und Messzeitpunkt für alle Modelle untersuchen kann. Eliminieren müsste ich die Haupteffekte und die kombinierten Effekte von Filter und Modell, um beurteilen zu können, ob der Messzeitpunkt einen signifikanten Effekt hat.

Gibt es dazu Ideen/ Anregungen o.ä. welche Tests ich hier anwenden sollte? Varianzanalyse, lineare Regression?

Vielen Dank im Voraus und liebe Grüße,
Jay
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Stickoxidwerte: Eine Versuchsprobe

Beitrag von EDi »

Gibt es dazu Ideen/ Anregungen o.ä. welche Tests ich hier anwenden sollte? Varianzanalyse, lineare Regression?
Hört sich nach einem linearen Model an, vielleicht mit einer Interaktion von Filter und Zeitpunkt.

Hat man das Modell kann man Hypothesen testen (z. B. mit lsmeans).
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Jayzon01

Re: Stickoxidwerte: Eine Versuchsprobe

Beitrag von Jayzon01 »

Hi EDi,

danke für deine Antwort!

Meine Nullhypothese wäre an der Stelle, dass der Messzeitpunkt keinen signifikanten Effekt hat - um dann zeigen zu können dass meine Gegenhypothese, Messzeitpunkt hat einen signifikanten Effekt, die bessere ist.

Wie genau kann ich die anderen Effekte Filter und Modell aus der Berechnung herausrechnen? Rein logisch führt der Filter (aufgrund der Datenlage) zu einer kurzfristigen Senkung des NOX-Wertes, langfristig ist der Wert aber ähnlich hoch wie der der Kontrollgruppe (kein Filter).

€dit:
Nach weiteren Stunden mit meinem schönen Datensatz habe ich nun folgendes erarbeitet:
-> Der Messzeitpunkt hat aus meiner Sicht keinen signifikanten Effekt. Datentechnisch belegen kann ich das noch nicht - rein logisch muss es aber so sein. Die einzigen signifikanten Einflussfaktoren sind m.M.n. die Modelle und ob Filter verbaut wurden oder nicht. Hier streut der Messwert NOX eben sehr stark bzw. die Durchschnittswerte sind extrem unterschiedlich.
-> Mit einer anova und darauf folgender step() Analyse bekomme ich AIC-Werte um die 29.000. Leider ist mir das Kapitel entfallen und mit den Informationen, die mir Google liefert (Wert möglichst gering für passendes Modell), bekomme ich den Messzeitpunkt leider nicht raus. Hat hier jemand eine Idee, wie ich nachweisen kann, dass der Messzeitpunkt keinen signifikanten Effekt hat? Ich würde das eigentlich gerne an einem p-Wert festmachen.

Lt. meines Kollegen solle ich mich noch mit der Hauptkomponentenanalyse auseinander setzen, da diese für meinen vorliegenden Datensatz relevant sein könnte. Ich muss ehrlich zugeben, dass ich neu in der Arbeit mit R und nicht so bewandert in der Statistik bin. Ich habe das Gefühl, dass mein Kollege mich ein wenig auf's Glatteis führt, weil er weiß, dass ich noch nicht so fit bin. Hat jemand eine Idee für einen Lösungsansatz für mich?

Viele Grüße,
Jay
Jayzon01

Re: Stickoxidwerte: Eine Versuchsprobe

Beitrag von Jayzon01 »

Wenn jemand noch eine Idee hat: Ich wär sehr dankbar :lol:
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Stickoxidwerte: Eine Versuchsprobe

Beitrag von EDi »

sind m.M.n. die Modelle und ob Filter verbaut wurden oder nicht.
Die Modelle erzeugen doch den (zufälligen) Fehler? Oder wurden die Messugen pro Modell wiederholt?
Alles unklar, ohne dass du uns die Daten oder ein reproduzierbares Beispiel (z.b. mit fake daten) zeigst.

So wie ich das im Moment sehe, würde ich ein Modell machen:

Code: Alles auswählen

mod <- lm(NOX ~ Zeit + Filter + Zeit:Filter, data = x)
Mit drop1() kannst du testen ob die Interaktion statistisch signifikant ist. Falls dies nicht der Fall ist könnest du sie rauswerfen und dann nochmal mit drop1() die Haupteffekte testen.
Danach könnten man aber auch z.b. mit lsmeans spezifische hypothesen testen (z.b. Filter hat zu jedem Zeitpunkt keinen Effekt).

Von automatischer model-selection (step()) würde ich die Finger von lassen.
Sehe derzeit (aber siehe erster Punkt) nicht wie eine Hauptkomponentenanalyse dir hier weiter helfen könnte.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten