Das Problem liegt an meinen Daten selbst. Es liegt ein Fehler vor beim Herunterladen des Datensatzes.
Ich habe etwas Probleme beim Einlesen meiner Daten.
Bei den Daten handelt es sich um "zahlen". D.h. deren Formatierung sollte eigentlich identisch sein. In der Excel-Datei sieht man ja schon, dass es dort Unterschiede in der Darstellung gibt. Das Komma ist das Tsd. Trennzeichen, nicht Dezimaltrennzeichen
Wenn ich die Daten in R importiere, werden die als "Character" angezeigt.
Einkommen
<chr>
1 10
2 5,75
3 5125
4 1,75
5 2125
6 4375
7 5,75
8 9,25
9 9375
10 7,25
11 3,75
12 10125
13 14
14 NA
Das 1. Problem ist hier schon, dass einige Zahlen nicht richtig übernommen werden (das Komma fehlt). Wenn ich jetzt die Spalte als numeric umwandeln will:
Code: Alles auswählen
Beispiel$Einkommen <- as.numeric(as.character(Beispiel$Einkommen))
Einkommen
<dbl>
1 10
2 NA
3 5125
4 NA
5 2125
6 4375
7 NA
8 NA
9 9375
10 NA
11 NA
12 10125
13 14
14 NA
Kann man das Problem irgendwie beheben? Mein eigentlicher Datensatz ist relativ groß und besteht aus einigen Spalten.