Fehler bei der Berechnung der empirischen Varianz?

teichbader · Beitrag von **teichbader** » So Okt 20, 2019 10:13 pm

Hallo zusammen,

so unglaublich das auch klingen mag, aber beim Nachrechnen eines sehr einfachen Übungsbeispiels zur Ermittlung der empirischen Varianz mit R bin ich zu größeren Abweichungen gekommen, die ich mir durch Rundungsfehler nicht erklären kann. Neben dem Taschenrechner habe ich auch mit Excel nachgerechnet. Meine Ergebnisse entsprechen dabei der Übung, die Ergebnisse von R kann ich mir nicht erklären. Was mache ich falsch?

Hier das Beispiel, folgende Datenreihe (6 Elemente):
39 43.88 37.05 40.95 44.85 39.98

Als Mittelwert bekomme ich heraus: 40,95166667, ebenso auch R mit 40,95167, das ist also OK.

Aber als empirische Varianz bekomme ich unterschiedliche Werte:
7,291380556 (mit Taschenrechner und auch mit Excel berechnet)
8.749657 (mit R berechnet)

Diese Abweichung kann ich mir nicht erklären.

Dies habe ich in R eingegeben:

Code: Alles auswählen

> a<-c(39,43.88,37.05,40.95,44.85,39.98)
> a
[1] 39.00 43.88 37.05 40.95 44.85 39.98
> mean(a)
[1] 40.95167
> var(a)
[1] 8.749657

Benutzt habe ich (Taschenrechner und Excel) die bekannte Formel für die empirische Varianz:
https://de.wikipedia.org/wiki/Empirische_Varianz#Empirische_Varianz_f%C3%BCr_H%C3%A4ufigkeitsdaten
(erste Formel ganz oben im Link).

Und hier meine Excel-Berechnungen:

Code: Alles auswählen

id;Messwerte; Mean-Value; (Messwert-Mittelwert)^2
1;	39;		40,95166667;		3,809002791
2;	43,88;		40,95166667;		8,575136092
3;	37,05;		40,95166667;		15,2230028
4;	40,95;		40,95166667;		2,77779E-06
5;	44,85;		40,95166667;		15,19700275
6;	39,98;		40,95166667;		0,944136118
			
		Summe der letzten Spalte: 	43,74828333
		geteilt durch n=6 ergibt 	7,291380556  als empirische Varianz.

Wo liegt der Fehler? Vielen Dank schonmal,

Viele Grüße
Teichbader

Beitrag von **jogo** » Mo Okt 21, 2019 8:56 am

Hallo Teichbader,

willkommen im Forum!
Bitte teile doch mal durch die Anzahl der Freiheitsgrade (df=5) statt durch n=6.
Darin unterscheidet sich die Berechnung der Stichprobenvarianz von Deiner Berechnung in Excel.

Code: Alles auswählen

a <- c(39,43.88,37.05,40.95,44.85,39.98)
sum((a - mean(a))^2) / length(a)
sum((a - mean(a))^2) / (length(a)-1)
var(a)

Gruß, Jörg

Athomas · Beitrag von **Athomas** » Mo Okt 21, 2019 8:57 am

Die Antwort findet sich auf der von Dir verlinkten Seite, bitte selbst durchlesen!

teichbader · Beitrag von **teichbader** » Mo Okt 21, 2019 10:46 pm

Danke für die Hinweise! In der Tat, bei Wikipedia findet sich die Erklärung. Da hätte ich mal bis zum Ende alles genauer Lesen sollen.

Deutsches R-Forum

Fehler bei der Berechnung der empirischen Varianz?

Fehler bei der Berechnung der empirischen Varianz?

Re: Fehler bei der Berechnung der empirischen Varianz?

Re: Fehler bei der Berechnung der empirischen Varianz?

Re: Fehler bei der Berechnung der empirischen Varianz?