Hallo zusammen,
In einem Experiment habe ich verschiedene Duftstoffe (chemische Stoffe) von Baumästen gesammelt.
Dazu habe ich Aststücklein in Plasticksäcke gegeben und darin die Duftstoffe "gesammelt".
Nun haben aber alle Aststücklein eine leicht andere Biomasse. Je grösser die Biomasse, desto mehr Duftstoffe werden abgegeben. Untenstehend eine Tabelle um die ganze Datenlage etwas klarer zu machen:
Ich möcht nun also meine verschiedenen Dufstoffkonzentration für die jeweilige Biomassenwerte normalisieren.
Wie mache ich das? Nach der Formel?:
(Duftstoffkonzentration eines einzelnen Astes-Durchschnitt Biomasse) / Varianz Biomasse?
Gibt es in R eine Lösung die mir die Normalisierung für all meine Duftstoffe ermöglicht (ich habe ca. 200 Duftstoffe)
Danke
Michi
Variable A für Variable B normalisieren
Re: Variable A für Variable B normalisieren
Welche Einheit soll denn die Differenz aus einer Konzentration und einer Masse haben? Ich kann mir kaum vorstellen, dass da eine sinnvolle Größe herauskommt.Duftstoffkonzentration eines einzelnen Astes-Durchschnitt Biomasse) / Varianz Biomasse?
Ja, das kann man in R leicht auch für hunderte oder tausende Reihen oder Spalten rechnen, aber erstmal klar kriegen, was gerechnet werden soll.
Vielleicht erzählst Du erstmal, was Du damit erreichen willst. Sind die Tüten alle gleich groß, sodass Duftstoffkonzentration auch Duftstoffmenge ist?
LG, Bernhard ernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Variable A für Variable B normalisieren
hallo Bernhard.
Danke für deine Antwort und Gegenfragen.
Mein Ziel ist es eine PCA durchzuführen um zu sehen ob sich die Dufstoffprofile (beinhaltet alle Stoffe) aufgrund von Behandlungen (habe ich hier weggelassen) unterscheiden. Dazu möchte ich aber die Konzentration der einzelnen Stoffe für die Biomasse korrigieren.
In einem linearen Modell würde man dazu ja einfach die Biomasse als Variable ins Modell mitaufnehmen. Bei Multivariaten Ansätzen (PCA, PLS-DA etc.) geht das aber meines Wissens nicht.
Zu deinen Fragen:
Ja die Tüten waren alle gleichgross.
Gruss
Michi
Danke für deine Antwort und Gegenfragen.
Mein Ziel ist es eine PCA durchzuführen um zu sehen ob sich die Dufstoffprofile (beinhaltet alle Stoffe) aufgrund von Behandlungen (habe ich hier weggelassen) unterscheiden. Dazu möchte ich aber die Konzentration der einzelnen Stoffe für die Biomasse korrigieren.
In einem linearen Modell würde man dazu ja einfach die Biomasse als Variable ins Modell mitaufnehmen. Bei Multivariaten Ansätzen (PCA, PLS-DA etc.) geht das aber meines Wissens nicht.
Zu deinen Fragen:
Ja die Tüten waren alle gleichgross.
Gruss
Michi
Re: Variable A für Variable B normalisieren
Hallo Michi,
über die Antwort zu Deiner Frage denke ich später noch nach. Wenn Du am Ende nachweisen möchtest, ob die Behandlung zu unterschieden geführt hat, wäre es dann nicht von vorneherein sinnvoll, eine Regression zu rechnen, bei der die Konzentrationen/Mengen als Prädiktoren die Behandlung vorhersagt?
Oder geht es hier primär um die Datenreduktion, um das Verhältnis aus Anzahl der Proben pro Anzahl der Duftstoffe zu verbessern?
LG,
Bernhard
über die Antwort zu Deiner Frage denke ich später noch nach. Wenn Du am Ende nachweisen möchtest, ob die Behandlung zu unterschieden geführt hat, wäre es dann nicht von vorneherein sinnvoll, eine Regression zu rechnen, bei der die Konzentrationen/Mengen als Prädiktoren die Behandlung vorhersagt?
Oder geht es hier primär um die Datenreduktion, um das Verhältnis aus Anzahl der Proben pro Anzahl der Duftstoffe zu verbessern?
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Variable A für Variable B normalisieren
So, folgenden Gedankengang bitte mitdenken und selbst prüfen, ob das alles so passt.
Wir haben unterschiedliche Konzentrationen in gleichen Volumina. Wen wir die ungleichen Konzentrationen immer mit dem gleichen Volumen multiplizieren, dann kommen Duftstoffemengen heraus. Duftstoffmengen sind also proportional zu den Konzentrationen. Doppel soviel Biomasse soll etwa doppelt soviel Duftstoffmenge freigeben. Dann macht es Sinn, die Duftstoffmenge an der Biomasse zu standardisieren, indem wir zunächst alle Duftstoffkonzentrationen durch die Biomasse teilen. Von da an spielt die Biomasse dann keine Rolle mehr.
Nun wird die Hauptkomponentenanalyse (PCA) diejenigen Duftstoffe bevorzugen, die eine große Varianz haben und das sind wahrscheinlich die mit einer großen Menge pro Biomasse. Das kann man wollen oder auch nicht wollen. Anscheinend willst Du es nicht, sonderns willst gering vorhandenen Duftstoffen die gleiche Macht beim Differenzieren zwischen Behandlung und Nicht-Behandlung wie reichlich vorhandenen Duftstoffen geben. Dann kannst Du Deine Duftstoffe in z-Werte überführen, also von jedem Duftstoff die durchschnittliche Menge abziehen und dann durch die Standardabweichung innerhalb dieses Duftstoffes teilen. Die sich so ergebenden z-Werte haben gleiche Varianzen und werden von der PCA dann auch gleichgewichtet.
Ist es das, was Du tun willst?
LG,
Bernhard
Wir haben unterschiedliche Konzentrationen in gleichen Volumina. Wen wir die ungleichen Konzentrationen immer mit dem gleichen Volumen multiplizieren, dann kommen Duftstoffemengen heraus. Duftstoffmengen sind also proportional zu den Konzentrationen. Doppel soviel Biomasse soll etwa doppelt soviel Duftstoffmenge freigeben. Dann macht es Sinn, die Duftstoffmenge an der Biomasse zu standardisieren, indem wir zunächst alle Duftstoffkonzentrationen durch die Biomasse teilen. Von da an spielt die Biomasse dann keine Rolle mehr.
Nun wird die Hauptkomponentenanalyse (PCA) diejenigen Duftstoffe bevorzugen, die eine große Varianz haben und das sind wahrscheinlich die mit einer großen Menge pro Biomasse. Das kann man wollen oder auch nicht wollen. Anscheinend willst Du es nicht, sonderns willst gering vorhandenen Duftstoffen die gleiche Macht beim Differenzieren zwischen Behandlung und Nicht-Behandlung wie reichlich vorhandenen Duftstoffen geben. Dann kannst Du Deine Duftstoffe in z-Werte überführen, also von jedem Duftstoff die durchschnittliche Menge abziehen und dann durch die Standardabweichung innerhalb dieses Duftstoffes teilen. Die sich so ergebenden z-Werte haben gleiche Varianzen und werden von der PCA dann auch gleichgewichtet.
Ist es das, was Du tun willst?
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Variable A für Variable B normalisieren
Vielen Dank Bernhard.
Das mit dem der Proportionalität (Duftstoffmenge/Biomasse) war so naheliegend, dass ich nicht draufgestossen bin. Vielen Dank!
Das mit den Z-Werten ist eine elegante Lösung. Allerdings ist es ok das dominante Duftstoffe stärker gewichtet werden. Ich werde also keine Z-Skalierung vornehmen.
Danke für deine Hilfe
Michi
Das mit dem der Proportionalität (Duftstoffmenge/Biomasse) war so naheliegend, dass ich nicht draufgestossen bin. Vielen Dank!
Das mit den Z-Werten ist eine elegante Lösung. Allerdings ist es ok das dominante Duftstoffe stärker gewichtet werden. Ich werde also keine Z-Skalierung vornehmen.
Danke für deine Hilfe
Michi
Re: Variable A für Variable B normalisieren
Gerne. Brauchst Du noch Hilfe mit der Umsetzung des Bezugs auf die Biomasse in R oder kommst Du damit allein klar?
LG,
Bernhard
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Variable A für Variable B normalisieren
Ich glaube ich sollte das hinkriegen (vermutlich mit dem dplyr package)
Danke
Michi
Danke
Michi