Daten sind alle als Character statt Numeric
-
- Beiträge: 5
- Registriert: So Dez 06, 2020 9:43 pm
Daten sind alle als Character statt Numeric
Hallo zusammen,
ich habe mich gerade in R eingearbeitet und versuche eine erste Auswertung.
Ich habe es mitlerweile soweit geschafft, dass die Daten in R eingelesen wurden und auch richtig in der Tabelle angezeigt werden.
Allerdings kann ich keine einzige Funktion verwenden, weil die Daten anscheiendn nicht als numeric konvertiert sind, sondern als characters.
Ich habe alles versucht und auch neu eingelesen usw. Die Daten stammen aus einer CSV Datei aus dem Sosci Survey.
Beim importieren im RStudio sagt er auch, dass die Daten dieser Spalte als numeric formatiert sind, aber wenn ich dann mit der Funktion "mean" oder "typeof" den Datentyp abfrage oder den Mittelwert bilden möchte, kommt die Fehlermeldung:
Argument ist weder numerisch noch boolesch: gebe NA zurück
Ich weiß nicht, was ich da machen soll. Das kann ja nicht so schwer sein, auch aus Sosci Survey Daten zu importieren, damit alles funktioniert.
Hat einer einen Tipp ?
ich habe mich gerade in R eingearbeitet und versuche eine erste Auswertung.
Ich habe es mitlerweile soweit geschafft, dass die Daten in R eingelesen wurden und auch richtig in der Tabelle angezeigt werden.
Allerdings kann ich keine einzige Funktion verwenden, weil die Daten anscheiendn nicht als numeric konvertiert sind, sondern als characters.
Ich habe alles versucht und auch neu eingelesen usw. Die Daten stammen aus einer CSV Datei aus dem Sosci Survey.
Beim importieren im RStudio sagt er auch, dass die Daten dieser Spalte als numeric formatiert sind, aber wenn ich dann mit der Funktion "mean" oder "typeof" den Datentyp abfrage oder den Mittelwert bilden möchte, kommt die Fehlermeldung:
Argument ist weder numerisch noch boolesch: gebe NA zurück
Ich weiß nicht, was ich da machen soll. Das kann ja nicht so schwer sein, auch aus Sosci Survey Daten zu importieren, damit alles funktioniert.
Hat einer einen Tipp ?
Re: Daten sind alle als Character statt Numeric
Zeig uns mal die Ausgabe von ?str auf deinen Datensatz angewendet...
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
-
- Beiträge: 5
- Registriert: So Dez 06, 2020 9:43 pm
Re: Daten sind alle als Character statt Numeric
Hier die Ausgabe, wenn das so reicht.
Dort sieht man rechts, dass die Daten bei "Alter" zB als Numeric eingelesen sind. Aber wenn ich die Abfrage mache wird character angezeigt, wodurch wahrscheinlich dann auch die Mittelwertfunktion zB nicht funktioniert.
Oder kennt er die Spaltennamen nicht, sodass deshalb die Funktion nicht auf "Alter" angewandt wird. Wie realisiere ich denn, dass er die Spaltennamen bzw. Variablen den Datenzuordnet.
Dort sieht man rechts, dass die Daten bei "Alter" zB als Numeric eingelesen sind. Aber wenn ich die Abfrage mache wird character angezeigt, wodurch wahrscheinlich dann auch die Mittelwertfunktion zB nicht funktioniert.
Oder kennt er die Spaltennamen nicht, sodass deshalb die Funktion nicht auf "Alter" angewandt wird. Wie realisiere ich denn, dass er die Spaltennamen bzw. Variablen den Datenzuordnet.
Re: Daten sind alle als Character statt Numeric
Was meinst Du mit "wenn ich die Abfrage mache"TheMikka123 hat geschrieben: ↑Mo Dez 07, 2020 7:24 am Dort sieht man rechts, dass die Daten bei "Alter" zB als Numeric eingelesen sind. Aber wenn ich die Abfrage mache wird character angezeigt, wodurch wahrscheinlich dann auch die Mittelwertfunktion zB nicht funktioniert.
Die Spalte heißt auch nicht Alter sondern Alter : ... Jahre (oder so ähnlich)
Vielleicht möchtest Du die Spalte umbenennen.
Es ist jedenfalls die dritte Spalte; insofern sollte
Code: Alles auswählen
mean(data_final[[3]])
Code: Alles auswählen
mean(data_final[, 3])
Re: Daten sind alle als Character statt Numeric
Mit "die Abfrage machen" ist bestimmt der Aufruf von typeof(Alter) gemeint, der im ersten der beiden Screenshots steht.
Bestimmt gibt es da noch neben dem Dataframe data_final eine Variable "Alter" die nicht in diesem Dataframe steckt und die die Verwirrung erklärt. Mach mal ein
Dann wird diese Variable Alter gelöscht und erweckt nicht mehr den Eindruck, dass Du auf eine Spalte im Dataframe zugreifst, während Du wirklich auf etwas ganz anderes zugreifst.
LG,
Bernhard
Bestimmt gibt es da noch neben dem Dataframe data_final eine Variable "Alter" die nicht in diesem Dataframe steckt und die die Verwirrung erklärt. Mach mal ein
Code: Alles auswählen
rm(Alter)
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
-
- Beiträge: 5
- Registriert: So Dez 06, 2020 9:43 pm
Re: Daten sind alle als Character statt Numeric
Ah super vielen Dank euch beiden.
Dann werde ich das nochmal testen und mich dann nochmal melden.
Ja genau mit der "Abfrage" war die FUnktion typeof gemeint, womit ich testen sollte in welcher Formatierung die Daten denn nun eingelesen sind (Numeric usw.).
Aber wenn ich es mit den anderen Spalten versuche, die ja wirklich dann "Sprache" oder "Geschlecht" heißen kommt die gleiche Meldung. Da dürfte ja eigentlich keine andere Variable existieren, die so benannt ist. Muss in den Klammern bei der variable eigl. der Name in Anführungszeichen oder nicht. Wenn ich es ohne mache findet er nichts und wenn ich es mit " " mache dann kommt es zu diesem Fehler. Wobei in allen Tutorials immer in der Klammer ohne " " gearbeitet wird.
Vielleicht hat noch jemand ein Code oder den kurzen Tipps, wie ich alle Data Frames und alles komplett nochmal löschen kann und von neu anfangen, damit es nicht mehr zu den Verwirrungen kommen kann...
Danke vielmals.
Dann werde ich das nochmal testen und mich dann nochmal melden.
Ja genau mit der "Abfrage" war die FUnktion typeof gemeint, womit ich testen sollte in welcher Formatierung die Daten denn nun eingelesen sind (Numeric usw.).
Aber wenn ich es mit den anderen Spalten versuche, die ja wirklich dann "Sprache" oder "Geschlecht" heißen kommt die gleiche Meldung. Da dürfte ja eigentlich keine andere Variable existieren, die so benannt ist. Muss in den Klammern bei der variable eigl. der Name in Anführungszeichen oder nicht. Wenn ich es ohne mache findet er nichts und wenn ich es mit " " mache dann kommt es zu diesem Fehler. Wobei in allen Tutorials immer in der Klammer ohne " " gearbeitet wird.
Vielleicht hat noch jemand ein Code oder den kurzen Tipps, wie ich alle Data Frames und alles komplett nochmal löschen kann und von neu anfangen, damit es nicht mehr zu den Verwirrungen kommen kann...
Danke vielmals.
Re: Daten sind alle als Character statt Numeric
Du machst wahrscheinlich nichtTheMikka123 hat geschrieben: ↑Mo Dez 07, 2020 9:51 am Ah super vielen Dank euch beiden.
Dann werde ich das nochmal testen und mich dann nochmal melden.
Ja genau mit der "Abfrage" war die FUnktion typeof gemeint, womit ich testen sollte in welcher Formatierung die Daten denn nun eingelesen sind (Numeric usw.).
Aber wenn ich es mit den anderen Spalten versuche, die ja wirklich dann "Sprache" oder "Geschlecht" heißen kommt die gleiche Meldung.
Code: Alles auswählen
typeof(data_final$Sprache)
Bitte zeige uns hier erstmal Deinen Code.Da dürfte ja eigentlich keine andere Variable existieren, die so benannt ist. Muss in den Klammern bei der variable eigl. der Name in Anführungszeichen oder nicht. Wenn ich es ohne mache findet er nichts und wenn ich es mit " " mache dann kommt es zu diesem Fehler. Wobei in allen Tutorials immer in der Klammer ohne " " gearbeitet wird.
Es gibt verschiedene Möglichkeiten, auf eine Spalte eines Dataframes zuzugreifen. Mindestens eine Variante benötigt "..." - andere nicht.
in RStudion gibt es den Feger für die Enviroment, um alle Objekte zu Löschen.Vielleicht hat noch jemand ein Code oder den kurzen Tipps, wie ich alle Data Frames und alles komplett nochmal löschen kann und von neu anfangen, damit es nicht mehr zu den Verwirrungen kommen kann...
Wenn man schon mal dabei ist, kann man auch gleich eine neue R-Session starten (Menüpunkt irgendwo).
Gruß, Jörg
Re: Daten sind alle als Character statt Numeric
Gegenfrage: Hast Du im nicht-sichtbaren Teil des Codes die Funktion attach() verwendet? Alternativ, wenn Du Dir nicht sicher bist, was sagtTheMikka123 hat geschrieben: ↑Mo Dez 07, 2020 9:51 amAber wenn ich es mit den anderen Spalten versuche, die ja wirklich dann "Sprache" oder "Geschlecht" heißen kommt die gleiche Meldung.
Code: Alles auswählen
search()
Das Löschen aller Variablen geht mitVielleicht hat noch jemand ein Code oder den kurzen Tipps, wie ich alle Data Frames und alles komplett nochmal löschen kann und von neu anfangen, damit es nicht mehr zu den Verwirrungen kommen kann...
Code: Alles auswählen
rm(list = ls())
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Daten sind alle als Character statt Numeric
Zum Glück generiert RStudio immer schön brav den passenden Funktionsaufruf in der R-Console.
So ist man immer informiert, welche Funktion die Aufgabe erledigt.
Gruß, Jörg
Re: Daten sind alle als Character statt Numeric
Wirklich Dann ist das bestimmt konfigurierbar, denn der Fegebutton schreibt bei mir nichts in die Console und auch nichts in die History (Version 1.2.1335).
LG,
Bernhard
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte