Problem bei Import Excel Datumsfelder

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

Antworten
Jörg
Beiträge: 16
Registriert: Mi Nov 09, 2016 2:58 pm

Problem bei Import Excel Datumsfelder

Beitrag von Jörg » Mo Jul 01, 2019 6:22 pm

Hallo Zusammen,

ich habe ein richtig schräges Problem beim Einlesen von Datumsfeldern aus einer Exceltabelle. Eine kleine Demodatei mit nur zwei Variablen (Datum1 und Datum2) liegt bei.
Beispiel.xlsx
(8.75 KiB) 13-mal heruntergeladen
Wenn ich die Tabelle einlese (aus Rstudio, siehe Screenshot), dann wird die 2. Spalte korrekt als Datum einkannt und die 1. Spalte als Character.
Screen.png
Wie kann das sein? Ich finde nicht den Unterschied. Hat da jemand eine Idee? Es spielt auch keine Rolle, wenn ich die Tabelle in Excel im CSV-Format abspeichere und dann importiere.

Ich glaube nicht, dass das Problem an R liegt, sondern an Excel, aber vielleicht hatte ja schon mal jemand ein ähnliches Problem.

Herzliche Grüße

Jörg

jogo
Beiträge: 1539
Registriert: Fr Okt 07, 2016 8:25 am

Re: Problem bei Import Excel Datumsfelder

Beitrag von jogo » Di Jul 02, 2019 8:42 am

Hallo Jörg,

ich habe Deine Excel-Datei in LibreOffice geöffnet und kann einen Unterschied zwischen den beiden Spalten sehen.
Offensichtlich haben die beiden Spalten unterschiedliche Formatierung in der Excel-Datei.
Wie sieht denn Deine CSV-Datei aus?

Gruß, Jörg

Benutzeravatar
student
Beiträge: 346
Registriert: Fr Okt 07, 2016 9:52 am

Re: Problem bei Import Excel Datumsfelder

Beitrag von student » Di Jul 02, 2019 11:54 am

Hallo Jörg,

das Problem liegt sicher nicht auf der Excel-Seite, sondern höchsten an dem Gebietsschema oder wie die Zellen formatiert sind. Oder aber vielleicht an R-Studio? Hast Du die Daten schon mal als CSV-Date (read.csv bei Gebietsschema EN, read.csv2 bei DE) über die R-Konsole eingelesen?
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)

bigben
Beiträge: 1129
Registriert: Mi Okt 12, 2016 9:09 am

Re: Problem bei Import Excel Datumsfelder

Beitrag von bigben » Mi Jul 24, 2019 1:15 pm

Ich habe die Datei in Excel eingelesen und finde da nichts besonderes. In beiden Spalten sind die Datumsangaben als Datum formatiert. Und wenn ich das in Excel als csv exportiere passiert in R folgendes:

Code: Alles auswählen

> bsp <- read.csv2(choose.files())
> str(bsp)
'data.frame':	8 obs. of  7 variables:
 $ Datum1: Factor w/ 8 levels "01.06.2018","01.07.2018",..: 7 5 8 3 6 1 4 2
 $ Datum2: Factor w/ 6 levels "01.02.2017","01.03.2016",..: 6 1 2 3 3 3 4 5
 $ X     : logi  NA NA NA NA NA NA ...
 $ X.1   : logi  NA NA NA NA NA NA ...
 $ X.2   : logi  NA NA NA NA NA NA ...
 $ X.3   : logi  NA NA NA NA NA NA ...
 $ X.4   : logi  NA NA NA NA NA NA ...
 > head(bsp, 10)
      Datum1     Datum2  X X.1 X.2 X.3 X.4
1 24.12.2018 24.12.2018 NA  NA  NA  NA  NA
2 13.09.2018 01.02.2017 NA  NA  NA  NA  NA
3 25.10.2018 01.03.2016 NA  NA  NA  NA  NA
4 04.09.2018 01.06.2018 NA  NA  NA  NA  NA
5 24.07.2018 01.06.2018 NA  NA  NA  NA  NA
6 01.06.2018 01.06.2018 NA  NA  NA  NA  NA
7 13.08.2018 01.07.2017 NA  NA  NA  NA  NA
8 01.07.2018 01.07.2018 NA  NA  NA  NA  NA
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte

Benutzeravatar
student
Beiträge: 346
Registriert: Fr Okt 07, 2016 9:52 am

Re: Problem bei Import Excel Datumsfelder

Beitrag von student » Mi Jul 24, 2019 2:10 pm

Ich kenne das Problem und muss sagen "typisch Excel"! ;) Das sind verdeckte Formatanweisungen, die zurückbleiben, wenn Zellen gelöscht werden! Hier kann ich nur empfehlen, die gewünschten Daten in ein neues Tabellenblatt zu laden und dieses dann als csv zu exportieren.

Aber eigentlich sollten diese Formatanweisungen als csv-Export verschwinden...
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)

Jörg
Beiträge: 16
Registriert: Mi Nov 09, 2016 2:58 pm

Re: Problem bei Import Excel Datumsfelder

Beitrag von Jörg » Fr Sep 06, 2019 10:35 am

Liebe alle,

vielen Dank für Eure Hinweise. Verzeiht wenn ich mich erst so spät melde.

Jörg, du hast Recht. Da sind im Hintergrund in Excl Formatierungszeichen, die man erst mit libre office erkennen kann und da auch nur, wenn man direkt eine einzelnen Zelle anwählt. Auch hier ist es nicht möglich, dass Zeichen zu kopieren und dann über suchen überall zu entfernen.
Siehe Screen-Shot:
screen1.png
screen1.png (16.41 KiB) 92 mal betrachtet
Speichern und anschließendes Importieren der .xlsx als .csv Datei hat aber geklappt, da war meine urspründliche Information falsch.

Die Lehre für mich: Finger weg von Dateien im .xlsx-Format, sondern immer .csv Dateien verwenden.

Fals es für jemand anderes hilfreich ist: Ich stand jetzt vor dem Problem, dass ich ca 100 Excel-Workbooks mit jeweils mehreren Sheets als .csv speichern musste. Extrem hilfreich war hier eine Stappeldatei: http://cwestblog.com/2013/04/12/batch-excel-to-csv-converter-application/

Vielen Dank für die wie immer kompetente Hilfe.

Jörg

Antworten