Datenanalyse eines Versuchs

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
vincington
Beiträge: 4
Registriert: Sa Nov 18, 2017 2:04 pm

Datenanalyse eines Versuchs

Beitrag von vincington »

Hallo zusammen,

Ich habe einen Pflanzversuch gemacht bei dem es voll gedüngte, halb gedüngte und nicht gedüngte Varianten gab. Ich möchte ermitteln, ob die Düngevariante signifikant für den Ertrag war. Ich versuche mich zum ersten Mal mit R. Ich vrstehe nicht wie ich das jetzt in Bezug zueinander bringe, da ich ja nicht einfach numerische Daten miteinander korreliere?!

freue mich über Hilfe.
Danke und Grüße
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Datenanalyse eines Versuchs

Beitrag von bigben »

Hallo!

Ist das eine Hausaufgabe? Klingt ein wenig danach. Wenn ja, wäre es schön, wenn Du das erwähnst. Es gibt zwei naheliegende Vorgehensweisen, je nach Betrachtungsweise. Wenn man von einer ansteigenden Düngermenge in den drei Gruppen ausgeht, und davon, dass mehr Dünger auch zu mehr Ergebnis im Pflanzversuch führt, dann kann man das mit einer Korrelationsanalyse angehen. Wenn man einfach sagt, dass sind drei verschiedene Gruppen und es könnte auch sein, dass die mittlere Düngergruppe zum besten oder schlechtesten Ergebnissen führt, dann würde eine andere Art von Analyse nahe liegen.
Falls das eine Hausaufgabe ist, dann wäre es wichtig zu wissen, was Du bisher schon an Verfahren gelernt hast. Wenn das eine Aufgabe aus dem echten Leben ist, dann solltest Du die genauen Umstände, Anzahl der Versuche und die Fragestellung viel genauer darstellen, damit man mitdenken kann.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
vincington
Beiträge: 4
Registriert: Sa Nov 18, 2017 2:04 pm

Re: Datenanalyse eines Versuchs

Beitrag von vincington »

Hallo Bernhard,

Ich habe einen Pflanzversuch im Studium durchgeführt. Ich habe mich dazu entschieden diesen Versuch mit R auszuwerten. Ich habe vor ein paar Jahren mal eine Statistik Vorlesung besucht, d.h. mein Wissensstand endet nach ein paar Basics recht schnell. Ich hatte einen Crashkurs in R und kenne ein paar Grundoperationen. Ich skizziere hier mal wie der Versuch aufgebaut war.

Pflanzversuch in Töpfen mit 6 verschiedenen Düngevarianten plus einer Nullprobe. Die Düngevarianten jeweils in Voll- und Halbdüngung. Das alles in vier Wiederholungen. Also 6 mal 2 (voll, halb) + 1 Nullprobe mal 4 Wiederholungen (24 Volldüngungen, 24 Halbdüngungen, 4 Nullproben) -> 52 Töpfe.

Es wurde in allen Töpfen zuerst Mais angebaut, dieser nach 8 Wochen geerntet und Gras ausgesät. Das Gras wurde im Abstand von 4 Wochen 3 mal geschnitten. Also gab es ein Maisschnitt mit Ernteergebnis und drei Grasschnitte mit Ernteergebnis.

Wenn ich das bischen Statistik dass ich in meinem Leben hatte richtig verstanden habe, geht es für mich darum Hypothesen aufzustellen und diese anhand stat. Methoden zu prüfen.

Meine Thesen wären:

-> Volldüngung führt zu mehr Ertrag als Halbdüngung, Halbdüngung führt zu mehr Ertrag als Nullprobe
(darauf bezog sich meine Frage zu Anfang, da ich hier ja etwas faktorielles mit etwas nummerischem korrelieren möchte)
Wenn ich das mit R plotte, erhalte ich einen Boxplot. Bekomme ich hier auch irgendwie einen Wert für die Signifikanz?

-> hoher Maisertrag bedeutet hoher Grasertrag
Mein Ansatz wäre gewesen, einfach beide Erträge zu plotten, und mir dann über cor.test oder einfache lineare regression einen Wert für die Signifikanz anzeigen zu lassen

-> hoher Grasertrag Schnitt 1 bedeutet hoher Grasertrag Schnitt 2 (selbe These mit Schnitt 1 und 3 bzw. 2 und 3)
selbes wie oben



Danke für deine Hilfe.
Vinzent
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Datenanalyse eines Versuchs

Beitrag von bigben »

Hallo Vinzent!

Es ist irgendwie verwirrend, dass Du 6 verschiedene Düngevarianten einsetzt, diese aber bei der Auswertung keine Rolle zu spielen scheinen. Wozu dann die verschiedenen Varianten? Ich denke, dass Du wegen der verschiedene Düngevarianten die von Dir vorgeschlagene Korrelation und einfache Regression nicht mehr nutzen kannst, sondern ins Multivariate gehen musst.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
vincington
Beiträge: 4
Registriert: Sa Nov 18, 2017 2:04 pm

Re: Datenanalyse eines Versuchs

Beitrag von vincington »

Hallo Bernhard,

Ich stehe ein wenig auf dem Schlauch und je mehr ich mich damit befasse, desto komplizierter wird es für mich. Ich habe 6 verschiedene Düngeprodukte. Es ging im speziellen um Phosphordünger. Ich habe so gedüngt, dass in 24 Töpfen Volldüngung und 24 Töpfen Halbdüngung jeweils die selbe Menge Phosphor gedüngt wurde (Umrechnung der Phosphoranteile des jeweiligen Düngeproduktes). Deshalb leitete ich daraus die Frage ab, ob es bezüglich des Ertrages relevant war voll oder halb zu düngen (oder eben garnicht).

Gruß
Vinzent
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Datenanalyse eines Versuchs

Beitrag von EDi »

Was wurde gemessen? - Das gibt Hinweise ob in lineares model (lm) oder ein generalisiertes lineares model (glm) sinnvoller wären. (z.b. ist Biomasse oft sehr schief und zeigt auch eine deutlichen Mittelwert-Varianz abhängigkeit).

Wie war das Versuchsdesign (genau beschreiben, am besten als Bild vom Aufbau)? Completely Randomized oder irgendwie gruppiert/ in Blöcken? Könnte es einen räumlichen / nachbarschaftseffekt geben?
- Das beantwortet schonmal ob man in Lineares Model oder ein Gemischtes Lineares Model oder ein Gemischtes Generalisiertes Model braucht.

Was sind die Fragen die mit dem Versuch beantwortet werden sollen? - Das bestimmt was man danach mit dem Model anstellt.


Ich würde sagen wir haben hier mindestens 2 erklärende Variablen:

Dünger (6 Varianten + Kontrolle) und Aufwandmenge (voll, halb, kontroll).
Wobei Aufwandmenge vermutlich in Dünger genested ist? (so wie ich es derzeit verstehe. Ist Voll & Halb für alle Düngervarianten gleich, d.h. vergleichbar zwischen den Düngern oder nur innerhalb eines Düngers?).

Zeit könnte auch noch mit reinkommen?? Und dazu kommt noch die Variable Schnitt??


Du siehst, du hast hier einen relativ komplexen Versuch. Dementsprechend musst du auch die Statistik anpassen (die statistische Auswertung sollte aber idealerweise schon vor dem Versuch feststehen).

Anhand der vielen Fragezeichen in diesem Posts, siehst du, dass derzeit sind mir noch nicht alle Einzeilheiten des Versuchs klar.
Demetntsprechend kann ich leider nicht mehr sagen.
Ich bin mir aber sicher, dass es in die Richtung lm, ?glm, glmm, sowie lsmeans geht

-> Volldüngung führt zu mehr Ertrag als Halbdüngung, Halbdüngung führt zu mehr Ertrag als Nullprobe
Konzentriere dich zunächst mal nur da drauf.
Die Hypothese erscheint mir etwas einfach, gemessen an der Komplexität des Versuches...
Was ist mit den verschiedenen Düngern? Gilt diese innerhalb einen Düngers ? Wie ist der Verglcieh zwischen den Düngeren`
Gibt es womöglich einen Interaktion zwischen Dünger und Aufwandmenge? (D.h. ein Dünger funktioniert besser bei der hohen als ein anderer, aber gleich bei halber menge).

-> hoher Maisertrag bedeutet hoher Grasertrag
Mein Ansatz wäre gewesen, einfach beide Erträge zu plotten, und mir dann über cor.test oder einfache lineare regression einen Wert für die Signifikanz anzeigen zu lassen
Hierbei unbedingt die Treatments beachten! Siehe Simpson's Paradox: https://en.wikipedia.org/wiki/Simpson%27s_paradox

Literaturempfehlungen (Auswahl):
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
vincington
Beiträge: 4
Registriert: Sa Nov 18, 2017 2:04 pm

Re: Datenanalyse eines Versuchs

Beitrag von vincington »

Hi,
Mir ist klar, dass man sich vor dem Anlegen eines Versuchs Gedanken über statistische Auswertung machen muss. Ich bin in diesen Versuch mehr oder weniger „reingerutscht“ und versuche zu retten was zu retten ist. Die Auswertung mit R wird nicht von mir verlangt, aber ich möchte an diesem Fall üben mit R umzugehen.
Das Versuchsdesign war komplett randomisiert, also kein Blockedesign/Block Effekt. Es standen 52 Töpfe in einer Gruppe im Raum, die regelmäßig durchgetauscht wurden.
Für mich sind zwei Dinge relevant:

1) Ertragsdaten und deren Bezug zueinander
Frage die beantwortet werden soll: Wie relevant ist es ob ich voll, halb oder garnicht gedüngt habe?
Dabei ist voll und halb von der Menge an Phosphor pro Topf immer jeweils gleich, egal welche Düngevariante. Die Düngemengen sind auf dem elementaren Anteil an Phosphor umgerechnet, so dass voll und halb jeweils dieselbe Menge elementarem P enthalten.
Der Vergleich zwischen den Düngern untereinander (obwohl in selber Menge appliziert) bekomme ich da nicht rein. Ich verstehe nicht wie.
Deshalb ist die oben genannte Frage die ich mir stelle zwar einfach, aber wenigstens kann ich damit eine Aussage treffen.

2) Korrelation der Ertragsdaten mit einer Messung des mobilen Phosphors im Boden
Ich habe zusätzlich ein paar Daten über die Menge an mobilem Phosphor nach der Maisernte. Ich erhoffe mir davon, dass ich eine Korrelation zwischen mobilem Phosphor und Maisertrag machen kann (ergo: bei x mobilem Phosphor erhalte ich y Maisertrag. These „x bedingt y“) Hier sollte doch aber der einfach cor.test reichen oder? Hier könnte man jetzt aber auch wieder mit reinbringen, wie relevant die Düngevariante ist, dass der Phosphor in die mobile Phase geht.

Gruß
Vinzent
Antworten