Liebe Statistik-Profis
Ich habe einen in Laubholzanteil stratifizierten Wald (Kategorien 1: 0-10% Laubholzanteil, 2: 10-50%, 3: 50-90%, 4: 90-100%)
In diesem Wald gibt es mir bekannte Gebiete, wo sich Wildtiere aufhalten. Ich habe eruiert, welche Laubholzanteile dort vorkommen (Anzahl)
Nun möchte ich wissen, ob gewisse Laubholz-Kategorien mehr genutzt werden als vorhanden.
Ich habe folgende Daten
Gesamter Wald: Anzahl vorhandene Wälder der Kategorien 1-4 (Kat. 1 2153; Kat. 2 3237; Kat. 3 3000; Kat. 4 4532)
Aufenthaltsgebiete Wildtiere: Anzahl vorhandener Wälder der Kategorien 1-4 (Kat. 1 398; Kat. 2 251; Kat. 3 500; Kat. 4 457). Es sind hier natürlich weniger, weil ja nur Teile der Wälder von Wildtieren genutzt werden.
Kann mir jemand helfen, wie ich dies statistisch prüfen kann? Ich komme zu einem Chi-Quadrat Test, bin aber nicht sicher. und ich will ja schlussendlich wissen, welche Kategorien allenfalls signifikant häufiger als vorhanden bzw. als zu erwarten genutzt werden.
Besten Dank für die Inputs!
Vergleich: Wird ein Lebensraumtyp mehr genutzt als zu erwarten?
Re: Vergleich: Wird ein Lebensraumtyp mehr genutzt als zu erwarten?
Ich würde einen barplot machen:
x-Achse die Kategorien, y-Achsen den Anteil der Wälder ja Kategorien, Farbe wildtier & gesamt.
Oder als stacked barplot, mit nur 2 Balken. Farbe wäre die Kategorie.
x-Achse die Kategorien, y-Achsen den Anteil der Wälder ja Kategorien, Farbe wildtier & gesamt.
Oder als stacked barplot, mit nur 2 Balken. Farbe wäre die Kategorie.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Re: Vergleich: Wird ein Lebensraumtyp mehr genutzt als zu erwarten?
Die Frage ist, ob man sowas überhaupt testen sollte, oder nicht. Wenn ja, ist der Chi-Quadrat-Unabhängigkeitstest ist sicher kein ganz falscher Ansatz:
Code: Alles auswählen
> prop.test(x = c(398, 251, 500, 457), n = c(2153, 3237, 3000, 4532))
4-sample test for equality of proportions without continuity
correction
data: c(398, 251, 500, 457) out of c(2153, 3237, 3000, 4532)
X-squared = 209.97, df = 3, p-value < 2.2e-16
alternative hypothesis: two.sided
sample estimates:
prop 1 prop 2 prop 3 prop 4
0.18485834 0.07754093 0.16666667 0.10083848
Ein p-Wert im Bereich von zehn hoch minus 16 bedeutet in der Regel, dass man viel zu viele untersuchte Einheiten betrachtet, um Häufigkeitsunterschiede wie 18% vs 7% zu testen. Mit Deinen hunderten aus tausenden Beobachtungen wird sowieso jeder Test signifikant (außer es handelt sich um simulierte Daten oder ganz komische Daten), ganz egal wie klein die Effekte sind. Für Deine wissenschaftliche Fragestellung ist es aber ganz und gar nicht egal, wie klein die Effekte sind.
Sehr wahrscheinlich solltest Du die Frage diskutieren, ob 18,5% - 7,7% - 16,7% - 10,0% unterschiede von Belang sind als die Frage, ob sie statistisch signifikant sind.
JMTC,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Vergleich: Wird ein Lebensraumtyp mehr genutzt als zu erwarten?
Herzlichen Dank für eure Feedbacks und Hilfe!!! Es sind offenbar zu viele Unklarheiten, ich lasse das mit dem statistischen Test und beschreibe deskriptiv. Nochmals vielen Dank!