Seite 1 von 1

gz-Datei mit iotools einlesen

Verfasst: Di Mär 07, 2017 11:40 am
von Lauji
Hallo zusammen,

kennt sich jemand mit dem Paket iotools aus?
Ich suche eine Möglichkeit gezippte Dateien direkt einzulesen. Es handelt sich um eine sehr große Datei mit fixem Format.
Für den Datentransfer wird immer alles gezipped.
Mit read.table gibt es die Möglichkeit, direkt gezippte Dateien einzulesen.

Gibt es so etwas auch für iotools?

Viele Grüße
Lauji

Re: gz-Datei mit iotools einlesen

Verfasst: Di Mär 07, 2017 12:53 pm
von jogo
Hallo Lauji,

willkommen im Forum. Laut Dokumentation kann read.fwf() bei dem Parameter file= eine connection annehmen (genau wie bei read.table()), dort z.B. auch gzfile()
Wie soll das Ganze am Ende aussehen? Kannst Du Beispieldaten liefern?

Gruß, Jörg
p.s.: hier noch ein Link: http://stackoverflow.com/questions/1872 ... ixed-width

Re: gz-Datei mit iotools einlesen

Verfasst: Di Mär 07, 2017 1:06 pm
von Lauji
Hallo Jörg,

die Datei ist leider sehr groß und das Einlesen mit read.fwf() dauert ewig. Daher bin ich auf das Paket iotools gestoßen und lese nun mit input.file() ein.
Versuche ich gzfile() allerdings dort, bekomme ich folgende Fehlermeldung:
'file_name' must be a character string to a file path.

Trotzdem danke für die Antwort. Ich werde mal weiter recherchieren :-)

Gruß,
Lauji

Re: gz-Datei mit iotools einlesen

Verfasst: Di Mär 07, 2017 7:12 pm
von student
Hallo Lauji,

was hältst Du von dem ff-Paket? Mit diesem kannst große Dateien blockweise einlesen....

Re: gz-Datei mit iotools einlesen

Verfasst: Di Mär 07, 2017 9:19 pm
von EDi
die Datei ist leider sehr groß und das Einlesen mit read.fwf() dauert ewig
Ich habe da mit readr::read_fwf() gute Erfahrungen gemacht - wesentlich schneller als read.fwf.
Vielleicht auch was für dich?

Re: gz-Datei mit iotools einlesen

Verfasst: Mi Mär 08, 2017 1:40 pm
von Lauji
Vielen Dank für die Tipps.
Ich werde mich mal in das Paket readr einlesen, das scheint ganz nützlich zu sein.