Hallo zusammen,
Ich stehe gerade auf dem Schlauch und hoffe ihr könnt mir weiterhelfen.
In meinen Datensatz habe ich Artikel und welche Medien diese zitieren + das Jahr.
Nun möchte ich den Durschnitt (mean) errechnen, und zwar pro Jahr pro Artikel. Also, wie viele Medien zitiert jeder Artikel pro Jahr und im Anschluss zusammenfassend zu einem Wert pro Jahr: was ist der durchnittliche Jahreswert (der Nenner soll die gesamte Menge aller Artikel sein).
Und genau hier stehe ich, wie gesagt, gewaltig auf dem Schlauch. Für den Jahresdurchschnitt, benutze ich nun die mean() Funktion, nehme also den Mean aller „Teildurchschnitte“ oder summiere ich die zahl der zitierten Artikel auf und teile es durch die Menge aller Artikel?
Beides gibt unterschiedliche Ergebnisse, aber ich verstehe gerade einfach nicht a) warum und b) was die richtige Vorgehensweise ist.
Danke vorba fuer eure Hilfe.
Jahresdurchschnitt - Verwirrung
-
- Beiträge: 3
- Registriert: Fr Jan 15, 2021 9:41 pm
Re: Jahresdurchschnitt - Verwirrung
Verstehe ich nicht Bitte ein reproduzierbares Beispiel posten.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
-
- Beiträge: 3
- Registriert: Fr Jan 15, 2021 9:41 pm
Re: Jahresdurchschnitt - Verwirrung
Entschuldige falls es nicht klar war und danke für deine Antwort.
Es geht genau genommen um dieses Problem:
https://stats.stackexchange.com/questio ... d-from-the
(englisch)
Also, ich weiß dass es einen Unterschied macht ob ich die mean() aller Elemente in der Gruppe nehme und daraus dann den gesamten Durschnitt bilde oder ob ich die Gruppe aufsummiere und daraus den Durschnitt bilde. WIe in folgendem Codeschnipzel zu sehen ist:
Code: Alles auswählen
group1 = c(1,2,3)
group2 = c(4,5,6,7,8,9)
mean(group1)
# 2
mean(group2)
# 6.5
mean(c(group1, group2))
# 5
mean(c(mean(group1), mean(group2)))
# 4.25
Re: Jahresdurchschnitt - Verwirrung
Lilli, das einzige Mädchen der Klasse, wiegt 45kg.
Ihre 19 Klassenkameraden sind alle ziemliche (natürlich männliche) Honks und wiegen im Durchschnitt 85kg.
Würdest Du jetzt sagen, das durchschnittliche Gewicht der Klasse ist (45 + 85)/2, also 65kg?
Wenn nein, wie würdest Du denn diesen Durchschnitt nennen?
Ihre 19 Klassenkameraden sind alle ziemliche (natürlich männliche) Honks und wiegen im Durchschnitt 85kg.
Würdest Du jetzt sagen, das durchschnittliche Gewicht der Klasse ist (45 + 85)/2, also 65kg?
Wenn nein, wie würdest Du denn diesen Durchschnitt nennen?
Re: Jahresdurchschnitt - Verwirrung
Um aus den arithmetischen Mitteln von zwei Gruppen sachlogisch richtig den Gesamtdurchschnitt zu berechnen, musst Du die beiden Mittelwerte mit der Anzahl der Elemente der Gruppe wichten. Das ist die Aggregationseigenschaft des arithmetischen Mittels.
Für Dich also:
Gruß, Jörg
Code: Alles auswählen
(n1*mean1 + n2*mean2)/(n1 + n2)
Code: Alles auswählen
group1 <- c(1,2,3)
group2 <- c(4,5,6,7,8,9)
m <- c(mean(group1), mean(group2))
weighted.mean(m, lengths(list(group1, group2)))
mean(c(group1, group2))
-
- Beiträge: 3
- Registriert: Fr Jan 15, 2021 9:41 pm
Re: Jahresdurchschnitt - Verwirrung
Vielen Dank euch beiden für die Veranschaulichung und die hilfe.
V.a. der Hinweis mit der Gewichtung hat mir sehr geholfen.
V.a. der Hinweis mit der Gewichtung hat mir sehr geholfen.