Seite 1 von 1

Fehler bei der Berechnung der empirischen Varianz?

Verfasst: So Okt 20, 2019 10:13 pm
von teichbader
Hallo zusammen,

so unglaublich das auch klingen mag, aber beim Nachrechnen eines sehr einfachen Übungsbeispiels zur Ermittlung der empirischen Varianz mit R bin ich zu größeren Abweichungen gekommen, die ich mir durch Rundungsfehler nicht erklären kann. Neben dem Taschenrechner habe ich auch mit Excel nachgerechnet. Meine Ergebnisse entsprechen dabei der Übung, die Ergebnisse von R kann ich mir nicht erklären. Was mache ich falsch?

Hier das Beispiel, folgende Datenreihe (6 Elemente):
39 43.88 37.05 40.95 44.85 39.98

Als Mittelwert bekomme ich heraus: 40,95166667, ebenso auch R mit 40,95167, das ist also OK.

Aber als empirische Varianz bekomme ich unterschiedliche Werte:
7,291380556 (mit Taschenrechner und auch mit Excel berechnet)
8.749657 (mit R berechnet)


Diese Abweichung kann ich mir nicht erklären.

Dies habe ich in R eingegeben:

Code: Alles auswählen

> a<-c(39,43.88,37.05,40.95,44.85,39.98)
> a
[1] 39.00 43.88 37.05 40.95 44.85 39.98
> mean(a)
[1] 40.95167
> var(a)
[1] 8.749657

Benutzt habe ich (Taschenrechner und Excel) die bekannte Formel für die empirische Varianz:
https://de.wikipedia.org/wiki/Empirische_Varianz#Empirische_Varianz_f%C3%BCr_H%C3%A4ufigkeitsdaten
(erste Formel ganz oben im Link).

Und hier meine Excel-Berechnungen:

Code: Alles auswählen

id;Messwerte; Mean-Value; (Messwert-Mittelwert)^2
1;	39;		40,95166667;		3,809002791
2;	43,88;		40,95166667;		8,575136092
3;	37,05;		40,95166667;		15,2230028
4;	40,95;		40,95166667;		2,77779E-06
5;	44,85;		40,95166667;		15,19700275
6;	39,98;		40,95166667;		0,944136118
			
		Summe der letzten Spalte: 	43,74828333
		geteilt durch n=6 ergibt 	7,291380556  als empirische Varianz.


Wo liegt der Fehler? Vielen Dank schonmal,

Viele Grüße
Teichbader

Re: Fehler bei der Berechnung der empirischen Varianz?

Verfasst: Mo Okt 21, 2019 8:56 am
von jogo
Hallo Teichbader,

willkommen im Forum!
Bitte teile doch mal durch die Anzahl der Freiheitsgrade (df=5) statt durch n=6.
Darin unterscheidet sich die Berechnung der Stichprobenvarianz von Deiner Berechnung in Excel.

Code: Alles auswählen

a <- c(39,43.88,37.05,40.95,44.85,39.98)
sum((a - mean(a))^2) / length(a)
sum((a - mean(a))^2) / (length(a)-1)
var(a)
Gruß, Jörg

Re: Fehler bei der Berechnung der empirischen Varianz?

Verfasst: Mo Okt 21, 2019 8:57 am
von Athomas
Die Antwort findet sich auf der von Dir verlinkten Seite, bitte selbst durchlesen!

Re: Fehler bei der Berechnung der empirischen Varianz?

Verfasst: Mo Okt 21, 2019 10:46 pm
von teichbader
Danke für die Hinweise! In der Tat, bei Wikipedia findet sich die Erklärung. Da hätte ich mal bis zum Ende alles genauer Lesen sollen.