Datenauswertung

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

consuli
Beiträge: 479
Registriert: Mo Okt 10, 2016 8:18 pm

Re: Datenauswertung

Beitrag von consuli »

Um das ganze nicht eine Statistiktheoriediskussion abgleiten zu lassen (und wohlmöglich noch eine echt-lineare Korrelation herleiten zu müssen):

Statt des Pearson- Kern-Terms (in R Code Notation)

sum{(x - mean(x))* (y- mean(y))}

könnte man auch anschaulicher

sum{abs(x - mean(x))* abs(y- mean(y))* sign(x - mean(x)) * sign(y - mean(y))}

schreiben.

@Angel
Wichtig zu wissen ist, dass die Pearson-Produktmoment-Korrelation im Prinzip das Produkt der Vorzeichen mit dem Produkt der Abweichungen gewichtet und aufaddiert. Deshalb wird das Gesamtergebnis der Pearson-Korrelation hauptäschlich von den großen Abweichungen getrieben, wenn Deine Befragungsskala von "1" (sehr gut) bis "10" (sehr schlecht) wäre, also im Wesentlichen von den Ausprägungen "1", "2" , "9", "10".

Nehmen wir den Worst-Case an, und Du befragst Patienten mit Konzentrationsstörungen mit dieser Skala, die 3 Wochen vorher eine ähnliche Befragung mit einer konträren Bewertungsskala von "1" (sehr schlecht) bis "10" (sehr gut) gemacht hätten und die 20% der Patienten mit starken Konzentrationsstörungen würden - aufgrund ihrer Krankheit - Deine Bewertungsskalen mit den vorherigen verwechseln, dann würde diese 20% Falscherfassungen mit ihren Ausreißermerkmalen den Pearson bzw. Spearman-Rangkorrelationstest komplett verhauen. U.U. könnte sich insgesamt ein rho = 0 ergeben, obwohl bei der Mehrheit der Patienten (Anteil 80%) der Zusammenhang vorhanden ist.

Um so etwas zu überprüfen, müsstest Du separate Spearman-rhos für Datensätze mit Außreißermerkmalen ("1", "2" , "9", "10" ) und normale Merkmale ("3", "4", "5", "6", "7", "8") berechnen. Wenn sich diese sehr stark voneinander unterscheiden, hast Du ein Problem.

Ansonsten ist da einfach kein "linearer" Zusammenhang, ohne eine Aussage über die Unabhängigkeit zu machen (worauf Athomas anspielte). So ist das "Wording" bei den angewandten Statistikern halt. :)
Irmgard.
Antworten