Ich bin blutiger Anfänger in "R" und hangele mich derzeit mit Tutorials und Videos aus dem Internet durch. Derzeit mache ich noch alle Aufgaben in Statistik mit Excel (oder Libreoffice) ... aber das ist mir - schon aus Lizenzgründen - auf die Dauer zu doof, zumal ich seit Jahrzehnten Linuxer bin.

Zu meinem Problem:
Ich erzeuge aus einer Datenbank eine csv-Datei mit berechneten Mittelwerten einer Abfrage ( ). Diese Datei wird für ein Kalenderjahr gezogen und enthält daher in einige Zeilen komplett Nullwerte. (Ereignis hat noch nicht stattgefunden).
(Ich habe aus der Beispieldatei alle unwichtigen Spalten entfernt, die Anzahl der Zeilen gekürzt (es sind sonst 10x so viel und ändert sich ... wie oben erwähnt) und die Spalten umbenannt (aus Datenschutzgründen). Das "Merkmal" hat normalerweise noch eine individuelle Kennung, aber ich habe es hier schon geschafft, das mit der Funktion:
Code: Alles auswählen
beispiel$merkmal <- substr(beispiel$merkmal, 1, 3)

Ich möchte nun - abhängig vom Merkmal in Spalte 1 - den Mittelwert für jedes Kriterium abhängig von jedem Merkmal bilden. Prinzipiell bedeutet das, dass eine Funktion alle Zeilen die in allen Kriterien einen Nullwert haben, löscht, da sie bei der Mittelwertberechnung den Wert verfälschen würden.
Danach möchte ich den Mittelwert - z.B. des Merkmals "320" - für jedes der vier Kriterien über die gesamte Tabelle hinweg ermitteln und in einen neuen Dataframe schreiben.
Das heißt, es soll ein Dataframe entstehen, der in der ersten Spalte jeweils nur einmal das Merkmal enthält und in den nachfolgenden 4 Spalten jeweils die Mittelwerte für die 4 Merkmale.
Dieser Dataframe soll dann der Ausgang für einen Barplot sein ... eher 4 Barplots.
--------------------------
Ich würde jetzt gerne ein Minimalbeispiel anfügen, aber ich weiß noch nicht mal, wie ich anfangen soll. Ich möchte nun nicht, dass jemand von Euch mir das Skript schreibt, sondern mir einen Schubs in die richtige Richtung zeigt.
Ich möchte - soweit das möglich ist - alle Schritte in R machen und die Tabelle nicht vorher in Libreoffice erst "aufbereiten".
1. Wie schaffe ich es, die Zeilen zu löschen, die in allen Spalten (Kriterium 1 - 4) Nullwerte enthalten?
2. Wie kann ich (Meine Vorstellung wäre mit einer "For-Schleife") die einzelnen Mittelwerte berechnen?
Schon mal Danke im Voraus
Stefan