Fehler bei der Berechnung der empirischen Varianz?

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
teichbader
Beiträge: 5
Registriert: So Okt 20, 2019 9:30 pm

Fehler bei der Berechnung der empirischen Varianz?

Beitrag von teichbader »

Hallo zusammen,

so unglaublich das auch klingen mag, aber beim Nachrechnen eines sehr einfachen Übungsbeispiels zur Ermittlung der empirischen Varianz mit R bin ich zu größeren Abweichungen gekommen, die ich mir durch Rundungsfehler nicht erklären kann. Neben dem Taschenrechner habe ich auch mit Excel nachgerechnet. Meine Ergebnisse entsprechen dabei der Übung, die Ergebnisse von R kann ich mir nicht erklären. Was mache ich falsch?

Hier das Beispiel, folgende Datenreihe (6 Elemente):
39 43.88 37.05 40.95 44.85 39.98

Als Mittelwert bekomme ich heraus: 40,95166667, ebenso auch R mit 40,95167, das ist also OK.

Aber als empirische Varianz bekomme ich unterschiedliche Werte:
7,291380556 (mit Taschenrechner und auch mit Excel berechnet)
8.749657 (mit R berechnet)


Diese Abweichung kann ich mir nicht erklären.

Dies habe ich in R eingegeben:

Code: Alles auswählen

> a<-c(39,43.88,37.05,40.95,44.85,39.98)
> a
[1] 39.00 43.88 37.05 40.95 44.85 39.98
> mean(a)
[1] 40.95167
> var(a)
[1] 8.749657

Benutzt habe ich (Taschenrechner und Excel) die bekannte Formel für die empirische Varianz:
https://de.wikipedia.org/wiki/Empirische_Varianz#Empirische_Varianz_f%C3%BCr_H%C3%A4ufigkeitsdaten
(erste Formel ganz oben im Link).

Und hier meine Excel-Berechnungen:

Code: Alles auswählen

id;Messwerte; Mean-Value; (Messwert-Mittelwert)^2
1;	39;		40,95166667;		3,809002791
2;	43,88;		40,95166667;		8,575136092
3;	37,05;		40,95166667;		15,2230028
4;	40,95;		40,95166667;		2,77779E-06
5;	44,85;		40,95166667;		15,19700275
6;	39,98;		40,95166667;		0,944136118
			
		Summe der letzten Spalte: 	43,74828333
		geteilt durch n=6 ergibt 	7,291380556  als empirische Varianz.


Wo liegt der Fehler? Vielen Dank schonmal,

Viele Grüße
Teichbader
jogo
Beiträge: 2086
Registriert: Fr Okt 07, 2016 8:25 am

Re: Fehler bei der Berechnung der empirischen Varianz?

Beitrag von jogo »

Hallo Teichbader,

willkommen im Forum!
Bitte teile doch mal durch die Anzahl der Freiheitsgrade (df=5) statt durch n=6.
Darin unterscheidet sich die Berechnung der Stichprobenvarianz von Deiner Berechnung in Excel.

Code: Alles auswählen

a <- c(39,43.88,37.05,40.95,44.85,39.98)
sum((a - mean(a))^2) / length(a)
sum((a - mean(a))^2) / (length(a)-1)
var(a)
Gruß, Jörg
Athomas
Beiträge: 769
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Fehler bei der Berechnung der empirischen Varianz?

Beitrag von Athomas »

Die Antwort findet sich auf der von Dir verlinkten Seite, bitte selbst durchlesen!
teichbader
Beiträge: 5
Registriert: So Okt 20, 2019 9:30 pm

Re: Fehler bei der Berechnung der empirischen Varianz?

Beitrag von teichbader »

Danke für die Hinweise! In der Tat, bei Wikipedia findet sich die Erklärung. Da hätte ich mal bis zum Ende alles genauer Lesen sollen.
Antworten