Jahresdurchschnitt - Verwirrung

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
Anfaenger123
Beiträge: 3
Registriert: Fr Jan 15, 2021 9:41 pm

Jahresdurchschnitt - Verwirrung

Beitrag von Anfaenger123 »

Hallo zusammen,

Ich stehe gerade auf dem Schlauch und hoffe ihr könnt mir weiterhelfen.
In meinen Datensatz habe ich Artikel und welche Medien diese zitieren + das Jahr.

Nun möchte ich den Durschnitt (mean) errechnen, und zwar pro Jahr pro Artikel. Also, wie viele Medien zitiert jeder Artikel pro Jahr und im Anschluss zusammenfassend zu einem Wert pro Jahr: was ist der durchnittliche Jahreswert (der Nenner soll die gesamte Menge aller Artikel sein).

Und genau hier stehe ich, wie gesagt, gewaltig auf dem Schlauch. Für den Jahresdurchschnitt, benutze ich nun die mean() Funktion, nehme also den Mean aller „Teildurchschnitte“ oder summiere ich die zahl der zitierten Artikel auf und teile es durch die Menge aller Artikel?

Beides gibt unterschiedliche Ergebnisse, aber ich verstehe gerade einfach nicht a) warum und b) was die richtige Vorgehensweise ist.

Danke vorba fuer eure Hilfe.
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Jahresdurchschnitt - Verwirrung

Beitrag von EDi »

Verstehe ich nicht :? Bitte ein reproduzierbares Beispiel posten.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Anfaenger123
Beiträge: 3
Registriert: Fr Jan 15, 2021 9:41 pm

Re: Jahresdurchschnitt - Verwirrung

Beitrag von Anfaenger123 »

EDi hat geschrieben: Sa Jan 16, 2021 6:37 am Verstehe ich nicht :? Bitte ein reproduzierbares Beispiel posten.
Entschuldige falls es nicht klar war und danke für deine Antwort.
Es geht genau genommen um dieses Problem:
https://stats.stackexchange.com/questio ... d-from-the
(englisch)

Also, ich weiß dass es einen Unterschied macht ob ich die mean() aller Elemente in der Gruppe nehme und daraus dann den gesamten Durschnitt bilde oder ob ich die Gruppe aufsummiere und daraus den Durschnitt bilde. WIe in folgendem Codeschnipzel zu sehen ist:

Code: Alles auswählen

group1 = c(1,2,3)
group2 = c(4,5,6,7,8,9)
mean(group1)
#  2
mean(group2)
#  6.5
mean(c(group1, group2))
#  5
mean(c(mean(group1), mean(group2)))
#  4.25
Meine Frage ist: Ja es gibt einen Unterschied, aber warum? Bzw. wie lassen sich die beiden Ergebnisse unterschiedlich interpretieren?
Athomas
Beiträge: 769
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Jahresdurchschnitt - Verwirrung

Beitrag von Athomas »

Lilli, das einzige Mädchen der Klasse, wiegt 45kg.
Ihre 19 Klassenkameraden sind alle ziemliche (natürlich männliche) Honks und wiegen im Durchschnitt 85kg.

Würdest Du jetzt sagen, das durchschnittliche Gewicht der Klasse ist (45 + 85)/2, also 65kg?
Wenn nein, wie würdest Du denn diesen Durchschnitt nennen?
jogo
Beiträge: 2086
Registriert: Fr Okt 07, 2016 8:25 am

Re: Jahresdurchschnitt - Verwirrung

Beitrag von jogo »

Um aus den arithmetischen Mitteln von zwei Gruppen sachlogisch richtig den Gesamtdurchschnitt zu berechnen, musst Du die beiden Mittelwerte mit der Anzahl der Elemente der Gruppe wichten. Das ist die Aggregationseigenschaft des arithmetischen Mittels.

Code: Alles auswählen

(n1*mean1 + n2*mean2)/(n1 + n2)
Für Dich also:

Code: Alles auswählen

group1 <- c(1,2,3)
group2 <- c(4,5,6,7,8,9)
m <- c(mean(group1), mean(group2))
weighted.mean(m, lengths(list(group1, group2)))
mean(c(group1, group2))
Gruß, Jörg
Anfaenger123
Beiträge: 3
Registriert: Fr Jan 15, 2021 9:41 pm

Re: Jahresdurchschnitt - Verwirrung

Beitrag von Anfaenger123 »

Vielen Dank euch beiden für die Veranschaulichung und die hilfe.
V.a. der Hinweis mit der Gewichtung hat mir sehr geholfen.
Antworten