Seite 1 von 1

PLS Package "gasoline" - Datenstruktur

Verfasst: Mi Feb 15, 2017 7:54 pm
von studentin_09
Hallo,

ich habe nochmal eine Frage. Kennt ihr das package PLS mit dem Beispiel „gasoline“? Im PLS-Beispiel „gasoline“ erhält man mit dem Befehl

Code: Alles auswählen

 str (gasoline) 
folgende Ausgabe:

Code: Alles auswählen

'data.frame':	60 obs. of  2 variables:
$ octane: num  85.3 85.2 88.5 83.4 87.9 ...
$ NIR   : AsIs [1:60, 1:401] -0.0502 -0.0442 -0.0469 -0.0467 -0.0509 ...
..- attr(*, "dimnames")=List of 2
.. ..$ : chr  "1" "2" "3" "4" ...
.. ..$ : chr  "900 nm" "902 nm" "904 nm" "906 nm" ...
Wenn ich allerdings den Datensatz „gasoline“ im Workspace anklicke und mir anschaue, steht in der oberen rechten Ecke:

Code: Alles auswählen

24.060 observations of 2 variables
Der Datensatz besteht eigentlich aus 60 Proben und das data.frame soll die Oktanzahl als numerische Variable und die Matrix, bestehend aus den NIR-Spektren (gemessen bei 401 Wellenlängen), beinhalten. Wieso wird die Matrix jetzt untereinander stehend angezeigt („24060 observations“), obwohl die Datenstruktur passt (s.o.)? Ist das „nur“ ein Anzeigefehler? Muss ich mein data.frame irgendwie „umdefinieren“?

Danke vorab! :)

Viele Grüße
studentin_09

Re: PLS Package "gasoline" - Datenstruktur

Verfasst: Mi Feb 15, 2017 8:26 pm
von jogo
Hallo studentin_09,

das muss nicht unbedingt etwas mit R zu tun haben. R ist nur der Teil, der in dem Fenster mit der Kommandozeile angezeigt wird - und dort bringt Rumklicken gar nichts. Wenn Du Dir die Struktur des Dataframes genauer ansehen möchtest, solltest Du das mit R angehen, also z.B. so:

Code: Alles auswählen

str(gasoline$NIR[1])
gasoline$NIR[1]
gasoline$NIR[2]
Alles andere drumrum ist eine Entwicklungsumgebung (ein GUI) für R, davon gibt es verschiedene. Welche Umgebung ist bei Dir, etwa RStudio?

Gruß, Jörg

Re: PLS Package "gasoline" - Datenstruktur

Verfasst: Do Feb 16, 2017 9:50 am
von EDi
Die Datenstruktur ist etwas komplexer (siehe den output von str()).
Da hat man soetwas:

Code: Alles auswählen

 NIR   : AsIs [1:60, 1:401]
Also als Spalte eine Matrix (mit vielen anderen Spalten). [das geht weil ein data.frame nicht anderes als eine Liste ist].
Dann weißt du auch wie man auf die 24060 kommt...

Re: PLS Package "gasoline" - Datenstruktur

Verfasst: Do Feb 16, 2017 1:23 pm
von studentin_09
Hallo Jörg, hallo Edi,

danke für Eure Antworten! :)

Ja, ich arbeite mit R-Studio. Die Befehle, die du geschrieben hattest Jörg, habe ich mir ausgeben lassen. Prinzipiell passt das auch alles und mir ist auch klar, dass das data.frame aus einer numerischen Variable und der Matrix besteht.

Meine Frage ist eher: "24060 observations of 2 variables" bedeutet doch, dass es im Datensatz 24060 Beobachtungen/Proben (Reihen) und 2 Variablen (Spalten) gibt. Das stimmt ja aber nicht, da diese 24060 ja nur dadurch zustande kommt, dass die Matrix untereinander angezeigt wird. Eigentlich sind es ja 60 Proben. Das ist mein Problem bzw. ich frage mich, ob das nur ein Anzeigefehler ist?! Müsste das data.frame nicht eigentlich nach 60 Zeilen/Proben aufhören und nur bei dem Befehl

Code: Alles auswählen

 str (gasoline)
die komplexe Matrix mit allen gemessenen NIR-Werten sichtbar sein?

Danke und viele Grüße
studentin_09

Re: PLS Package "gasoline" - Datenstruktur

Verfasst: Do Feb 16, 2017 1:27 pm
von EDi
Sag ich ja, vermutlich ein bug in RStudio...

Re: PLS Package "gasoline" - Datenstruktur

Verfasst: Fr Feb 17, 2017 1:30 pm
von studentin_09
Ok, danke! :)