Re: Net Squared Displacement
Verfasst: Di Sep 06, 2022 5:26 pm
von Arthemisia
Hallo Bernhard,
das waren keine "selbstausgedachten Datumsformate", sondern das, was Excel daraus gemacht hat, und genau da liegt ja mein Problem, an dem ich jetzt seit Tagen herumexperimentiere und nicht weiter komme. Es ging mir darum, zu zeigen, dass ein Teil der Zeitstempel im Datum "/" als Trennstriche hat und in der Reihenfolge Jahr, Monat, Tag, und der andere Teil "." als Trennzeichen und die Reihenfolge Tag, Monat, Jahr hat. Die Uhrzeiten danach erkennt Excel auch als Uhrzeit (im üblichen Format HH:MM:SS), aber R kennt ja keine Uhrzeit als Format, sondern nur in der Kombination mit Datum und Zeit.
Und einen lauffähigen R Code habe ich nicht, deswegen ja meine Frage, was ich machen kann.
Ich habe so ziemlich alles ausprobiert, was mir eingefallen ist. Ich habe versucht, die Spalten in Excel in eine Spalte mit Datum und eine Spalte mit Uhrzeit zu teilen, und dann in R mit "paste(duemmer$date, duemmer$time)" wieder zusammengeführt, was auch zuerst so aussah, als ob das funktioniert hätte, aber dann musste ich feststellen, dass R dann die Zeitstempel für reinen Text hält. Ich habe versucht, die Zeitstempel erst als "factor" zu bezeichnen, und dann wieder zurück zum Datumsformat, aber dann bekomme ich zerschossene Daten, mit denen das Skript dann überhaupt nichts mehr anfangen kann.
Muss ich in Excel etwas anders einstellen? Und wenn ja, wie? Oder gibt es einen lauffähigen R Code, wie man die verschiedenen Datumsformate vereinheitlichen kann?
Schöne Grüße zurück,
Arthemisia
Re: Net Squared Displacement
Verfasst: Mi Sep 07, 2022 6:32 am
von Arthemisia
Hallo zurück,
die Rohdaten sehen so aus:
trackId,site,timestamp,location.long,location.lat,tag.id,sensor.type.id,algorithm.marked.outlier,gps.fix.type,gps.maximum.signal.strength,gps.satellite.count,gps.time.to.fix,ground.speed,heading,height.above.msl,import.marked.outlier,location.error.numerical,manually.marked.outlier,update.ts,visible,deployment.id,event.id,sensor.type,tag.local.identifier,coords.x1,coords.x2,optional,sensor,timestamps,comments,death.comments,individual.id,local.identifier,ring.id,sex,taxon.canonical.name,timestamp.start,timestamp.end,number.of.events,number.of.deployments,sensor.type.ids
GG_2016_D055,Dümmer,4/15/2020 0:02,8.3572871,52.5062228,137649807,653,,1,-149,0,151,0,0,23.6,FALSE,999.9,,36:18.6,TRUE,171568817,14780739283,GPS,3805,8.3572871,52.5062228,TRUE,GPS,4/15/2020 0:02,rigned as adult female in family catch at Lake Dümmer,NA,171568710,GG_2016_D05,DEW_278013,f,Anser anser,00:30.0,01:11.0,101136,1,"GPS,Acceleration,Accessory Measurements,Magnetometer"
GG_2016_D055,Dümmer,4/15/2020 1:02,8.3572871,52.5062228,137649807,653,,1,-148,0,151,0,0,23.6,FALSE,999.9,,36:18.6,TRUE,171568817,14780739284,GPS,3805,8.3572871,52.5062228,TRUE,GPS,4/15/2020 1:02,rigned as adult female in family catch at Lake Dümmer,NA,171568710,GG_2016_D05,DEW_278013,f,Anser anser,00:30.0,01:11.0,101136,1,"GPS,Acceleration,Accessory Measurements,Magnetometer"
GG_2016_D076,Dümmer,5/1/2021 0:30,8.3322451,52.4789916,168738356,653,,3,-136,7,15,0.07,357,40.4,FALSE,6.2,,40:07.6,TRUE,171569493,18642415365,GPS,3807,8.3322451,52.4789916,TRUE,GPS,5/1/2021 0:30,caught as adult female in family catch at Lake Dümmer,NA,171569482,GG_2016_D07,DEW_278020,f,Anser anser,00:21.0,30:22.0,181924,1,"GPS,Acceleration,Accessory Measurements,Magnetometer"
GG_2016_D076,Dümmer,5/1/2021 1:30,8.3322818,52.4789651,168738356,653,,3,-130,8,14,0.03,0,29.6,FALSE,1.8,,40:07.6,TRUE,171569493,18642415369,GPS,3807,8.3322818,52.4789651,TRUE,GPS,5/1/2021 1:30,caught as adult female in family catch at Lake Dümmer,NA,171569482,GG_2016_D07,DEW_278020,f,Anser anser,00:21.0,30:22.0,181924,1,"GPS,Acceleration,Accessory Measurements,Magnetometer"
... ich wundere mich gerade darüber, warum Excel die Datumsangaben (obwohl sie ja hier im selben Format stehen) beim Konvertieren einmal als Datum erkennt und einmal nicht ... es gibt auch mehrere Spalten, die mit "timestamp" beschriftet sind, k.a. warum ...
Unter "site" gibt es zwei verschiedene Populationen, die kann ich mit subset herausfiltern. Für die weitere Verarbeitung der Daten benötige ich einen Data Frame mit den Spalten "trackId", "timestamp", "location.long" (wird zu "coords_x1") und "location.lat" (wird zu "coords_x2).
Bei der NSD Grafik geht es darum, wie sich Wanderungsbewegungen im Jahresverlauf verändern. Das heißt, das Skript fasst die Zeitstempel in Untersets für Jahre und Monate zusammen. Folglich müssen die Zeitstempel so dargestellt werden, dass R die Jahres- und Monatsangaben auch als solche erkennt (also in diesem Format: as.POSIXct( duemmer$timestamp, format = "%Y-%m-%d %H:%M:%S")).
Schöne Grüße,
Arthemisia