Variable A für Variable B normalisieren

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
eimichae
Beiträge: 36
Registriert: Mo Okt 10, 2016 8:48 pm

Variable A für Variable B normalisieren

Beitrag von eimichae »

Hallo zusammen,
In einem Experiment habe ich verschiedene Duftstoffe (chemische Stoffe) von Baumästen gesammelt.
Dazu habe ich Aststücklein in Plasticksäcke gegeben und darin die Duftstoffe "gesammelt".
Nun haben aber alle Aststücklein eine leicht andere Biomasse. Je grösser die Biomasse, desto mehr Duftstoffe werden abgegeben. Untenstehend eine Tabelle um die ganze Datenlage etwas klarer zu machen:


Capture.JPG
Ich möcht nun also meine verschiedenen Dufstoffkonzentration für die jeweilige Biomassenwerte normalisieren.
Wie mache ich das? Nach der Formel?:

(Duftstoffkonzentration eines einzelnen Astes-Durchschnitt Biomasse) / Varianz Biomasse?

Gibt es in R eine Lösung die mir die Normalisierung für all meine Duftstoffe ermöglicht (ich habe ca. 200 Duftstoffe)

Danke
Michi
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Variable A für Variable B normalisieren

Beitrag von bigben »

Duftstoffkonzentration eines einzelnen Astes-Durchschnitt Biomasse) / Varianz Biomasse?
Welche Einheit soll denn die Differenz aus einer Konzentration und einer Masse haben? Ich kann mir kaum vorstellen, dass da eine sinnvolle Größe herauskommt.

Ja, das kann man in R leicht auch für hunderte oder tausende Reihen oder Spalten rechnen, aber erstmal klar kriegen, was gerechnet werden soll.

Vielleicht erzählst Du erstmal, was Du damit erreichen willst. Sind die Tüten alle gleich groß, sodass Duftstoffkonzentration auch Duftstoffmenge ist?

LG, Bernhard ernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
eimichae
Beiträge: 36
Registriert: Mo Okt 10, 2016 8:48 pm

Re: Variable A für Variable B normalisieren

Beitrag von eimichae »

hallo Bernhard.
Danke für deine Antwort und Gegenfragen.

Mein Ziel ist es eine PCA durchzuführen um zu sehen ob sich die Dufstoffprofile (beinhaltet alle Stoffe) aufgrund von Behandlungen (habe ich hier weggelassen) unterscheiden. Dazu möchte ich aber die Konzentration der einzelnen Stoffe für die Biomasse korrigieren.
In einem linearen Modell würde man dazu ja einfach die Biomasse als Variable ins Modell mitaufnehmen. Bei Multivariaten Ansätzen (PCA, PLS-DA etc.) geht das aber meines Wissens nicht.

Zu deinen Fragen:
Ja die Tüten waren alle gleichgross.

Gruss
Michi
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Variable A für Variable B normalisieren

Beitrag von bigben »

Hallo Michi,

über die Antwort zu Deiner Frage denke ich später noch nach. Wenn Du am Ende nachweisen möchtest, ob die Behandlung zu unterschieden geführt hat, wäre es dann nicht von vorneherein sinnvoll, eine Regression zu rechnen, bei der die Konzentrationen/Mengen als Prädiktoren die Behandlung vorhersagt?
Oder geht es hier primär um die Datenreduktion, um das Verhältnis aus Anzahl der Proben pro Anzahl der Duftstoffe zu verbessern?

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Variable A für Variable B normalisieren

Beitrag von bigben »

So, folgenden Gedankengang bitte mitdenken und selbst prüfen, ob das alles so passt.

Wir haben unterschiedliche Konzentrationen in gleichen Volumina. Wen wir die ungleichen Konzentrationen immer mit dem gleichen Volumen multiplizieren, dann kommen Duftstoffemengen heraus. Duftstoffmengen sind also proportional zu den Konzentrationen. Doppel soviel Biomasse soll etwa doppelt soviel Duftstoffmenge freigeben. Dann macht es Sinn, die Duftstoffmenge an der Biomasse zu standardisieren, indem wir zunächst alle Duftstoffkonzentrationen durch die Biomasse teilen. Von da an spielt die Biomasse dann keine Rolle mehr.

Nun wird die Hauptkomponentenanalyse (PCA) diejenigen Duftstoffe bevorzugen, die eine große Varianz haben und das sind wahrscheinlich die mit einer großen Menge pro Biomasse. Das kann man wollen oder auch nicht wollen. Anscheinend willst Du es nicht, sonderns willst gering vorhandenen Duftstoffen die gleiche Macht beim Differenzieren zwischen Behandlung und Nicht-Behandlung wie reichlich vorhandenen Duftstoffen geben. Dann kannst Du Deine Duftstoffe in z-Werte überführen, also von jedem Duftstoff die durchschnittliche Menge abziehen und dann durch die Standardabweichung innerhalb dieses Duftstoffes teilen. Die sich so ergebenden z-Werte haben gleiche Varianzen und werden von der PCA dann auch gleichgewichtet.

Ist es das, was Du tun willst?

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
eimichae
Beiträge: 36
Registriert: Mo Okt 10, 2016 8:48 pm

Re: Variable A für Variable B normalisieren

Beitrag von eimichae »

Vielen Dank Bernhard.
Das mit dem der Proportionalität (Duftstoffmenge/Biomasse) war so naheliegend, dass ich nicht draufgestossen bin. Vielen Dank!

Das mit den Z-Werten ist eine elegante Lösung. Allerdings ist es ok das dominante Duftstoffe stärker gewichtet werden. Ich werde also keine Z-Skalierung vornehmen.

Danke für deine Hilfe
Michi
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Variable A für Variable B normalisieren

Beitrag von bigben »

Gerne. Brauchst Du noch Hilfe mit der Umsetzung des Bezugs auf die Biomasse in R oder kommst Du damit allein klar?

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
eimichae
Beiträge: 36
Registriert: Mo Okt 10, 2016 8:48 pm

Re: Variable A für Variable B normalisieren

Beitrag von eimichae »

Ich glaube ich sollte das hinkriegen (vermutlich mit dem dplyr package)

Danke
Michi
Antworten