so unglaublich das auch klingen mag, aber beim Nachrechnen eines sehr einfachen Übungsbeispiels zur Ermittlung der empirischen Varianz mit R bin ich zu größeren Abweichungen gekommen, die ich mir durch Rundungsfehler nicht erklären kann. Neben dem Taschenrechner habe ich auch mit Excel nachgerechnet. Meine Ergebnisse entsprechen dabei der Übung, die Ergebnisse von R kann ich mir nicht erklären. Was mache ich falsch?
Hier das Beispiel, folgende Datenreihe (6 Elemente):
39 43.88 37.05 40.95 44.85 39.98
Als Mittelwert bekomme ich heraus: 40,95166667, ebenso auch R mit 40,95167, das ist also OK.
Aber als empirische Varianz bekomme ich unterschiedliche Werte:
7,291380556 (mit Taschenrechner und auch mit Excel berechnet)
8.749657 (mit R berechnet)
Diese Abweichung kann ich mir nicht erklären.
Dies habe ich in R eingegeben:
Code: Alles auswählen
> a<-c(39,43.88,37.05,40.95,44.85,39.98)
> a
[1] 39.00 43.88 37.05 40.95 44.85 39.98
> mean(a)
[1] 40.95167
> var(a)
[1] 8.749657
Benutzt habe ich (Taschenrechner und Excel) die bekannte Formel für die empirische Varianz:
https://de.wikipedia.org/wiki/Empirische_Varianz#Empirische_Varianz_f%C3%BCr_H%C3%A4ufigkeitsdaten
(erste Formel ganz oben im Link).
Und hier meine Excel-Berechnungen:
Code: Alles auswählen
id;Messwerte; Mean-Value; (Messwert-Mittelwert)^2
1; 39; 40,95166667; 3,809002791
2; 43,88; 40,95166667; 8,575136092
3; 37,05; 40,95166667; 15,2230028
4; 40,95; 40,95166667; 2,77779E-06
5; 44,85; 40,95166667; 15,19700275
6; 39,98; 40,95166667; 0,944136118
Summe der letzten Spalte: 43,74828333
geteilt durch n=6 ergibt 7,291380556 als empirische Varianz.
Wo liegt der Fehler? Vielen Dank schonmal,
Viele Grüße
Teichbader