Tägliche Berechnungen von 30-minütigen Messungen mehrerer Plots

Alles zum Thema der beschreibenden Statistik

Moderator: jogo

Athomas
Beiträge: 768
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Tägliche Berechnungen von 30-minütigen Messungen mehrerer Plots

Beitrag von Athomas »

und tendenziell scheint mir das tidyverse besser für Menschen, die Verständnis dafür haben, dass Sprache sich weiter entwickelt und base und data.table besser für Menschen, die erwarten, dass Code von vor 10 Jahren auch heute noch unverändert läuft
Tidyverse für die Dynamischen, Flexiblen und data.table für die Betonköpfe von gestern :lol: ?

Es ist ja bekannt, dass data.table genausoviel (oder wenig) mit base R zu tun hat wie das Tidyverse!?
Innerhalb der Packages können sich die Autoren (fast) nach Belieben austoben, aber ich bin den "Gralshütern" dankbar, dass nicht jede Package-Variante auf die gemeinsame Basis durchschlägt!

BTW: was "stringsAsFactors" angeht, war data.table ja ein echter Trendsetter: die default-Einstellung von "fread" ist (mindestens seit 2015) "FALSE".

Und noch etwas: was mich massiv am Tidyverse stört, ist sein Umgang mit "Eingemeindungen"!

Ich bin Anfang 2019 von EDi darauf aufmerksam gemacht worden, dass das (von mir sehr geschätzte) ggplot2 massiv auf das von Paul Murrell geschriebene "grid" aufsetzt (viewtopic.php?f=8&t=1205&p=5961&hilit=ggplot+grid#p5961)!
Diese Information wird den Nutzern aber - um es mal freundlich auszudrücken - nicht aufgedrängt!

Ebenso bin ich fast aus allen Wolken gefallen, als ich erfahren habe, dass das von mir gerne und viel benutzte Tidyverse-Paket "stringr" lediglich ein Exzerpt von "stringi" ist
stringr is built on top of stringi, which uses the ICU C library to provide fast, correct implementations of common string manipulations. stringr focusses on the most important and commonly used string manipulation functions whereas stringi provides a comprehensive set covering almost anything you can imagine.

Die "ungewöhnlichen" Funktionen weglassen und den Rest unter dem eigenen Label verbreiten - diese Art der Landnahme ist mir etwas unheimlich...
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Tägliche Berechnungen von 30-minütigen Messungen mehrerer Plots

Beitrag von bigben »

Athomas hat geschrieben: Mo Feb 22, 2021 1:28 pmTidyverse für die Dynamischen, Flexiblen und data.table für die Betonköpfe von gestern :lol: ?
Wenn Du Dich so sehen möchtest, dann bleibt Dir das natürlich unbenommen. Aber die Ente bleibt draußen :!:
diese Art der Landnahme ist mir etwas unheimlich...
Ich ahne, was Du meinst. Etwas ähnlich geht es mir mit dem Überschreiben von base Funktionsnamen und dem Begriff tidy data. Wer versetzt denn bitte jemanden in die Position zu bestimmen, wann Daten aufgeräumt sind, und dass sie nur im langen Format ordentlich sind?

https://bildungswissenschaftler.de/5000-jahre-kritik-an-jugendlichen-eine-sichere-konstante-in-der-gesellschaft-und-arbeitswelt/ hat geschrieben:„Die Jugend achtet das Alter nicht mehr, zeigt bewusst ein ungepflegtes Aussehen, sinnt auf Umsturz, zeigt keine Lernbereitschaft und ist ablehnend gegen übernommene Werte“ (Keller, 1989, ca. 3000 v. Chr., Tontafel der Sumerer).

„Unsere Jugend ist heruntergekommen und zuchtlos. Die jungen Leute hören nicht mehr auf ihre Eltern. Das Ende der Welt ist nahe“ (Keilschrifttext, Chaldäa, um 2000 v. Chr.)

Das sind aber nicht wirklich Argumente, von denen ich mich in SchroedingersCats Position leiten lassen würde.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Athomas
Beiträge: 768
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Tägliche Berechnungen von 30-minütigen Messungen mehrerer Plots

Beitrag von Athomas »

Ebenso bin ich fast aus allen Wolken gefallen, als ich erfahren habe, dass das von mir gerne und viel benutzte Tidyverse-Paket "stringr" lediglich ein Exzerpt von "stringi" ist
Eine relativ neue Errungenschaft des Tidyverse ist "dtplyr":
Overview
dtplyr provides a data.table backend for dplyr. The goal of dtplyr is to allow you to write dplyr code that is automatically translated to the equivalent, but usually much faster, data.table code.
(https://github.com/tidyverse/dtplyr)

Ich fass' es echt nicht: da wurde data.table eingemeindet, weil es viel schneller (andere würden sagen: besser :twisted: ) ist.

Aber zumindest ist jetzt amtlich bestätigt, dass data.table üblicherweise viel schneller als dplyr ist...
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Tägliche Berechnungen von 30-minütigen Messungen mehrerer Plots

Beitrag von bigben »

...gleichzeitig ist data.table damit nicht mehr schneller als "das tidyverse". 8-) :D Bald schon wird man mit tidyRCpp aufgeräumte C++ Funktionen einfach mitten im R Code einbetten können.
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Athomas
Beiträge: 768
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Tägliche Berechnungen von 30-minütigen Messungen mehrerer Plots

Beitrag von Athomas »

Bald schon wird man mit tidyRCpp aufgeräumte C++ Funktionen einfach mitten im R Code einbetten können.
Dann ist es nur noch eine Frage der Zeit, bis sich das Ganze "H" nennt (oder vielleicht "T") :) ...

Ich habe heute gelernt, warum ein Seelöwe auf dem Logo von data.table zu sehen ist - ist das bekannt?
data.table.png
data.table.png (36.78 KiB) 2053 mal betrachtet
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Tägliche Berechnungen von 30-minütigen Messungen mehrerer Plots

Beitrag von bigben »

"Nope", wie der Engländer sagt (oder war es der Walliser?). Ich melde Interesse an.
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Athomas
Beiträge: 768
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Tägliche Berechnungen von 30-minütigen Messungen mehrerer Plots

Beitrag von Athomas »

Matt Dowle wirkt ja immer ein wenig depressiv, aber da haut er mal einen raus:

https://www.youtube.com/watch?v=fZpA_cU0SPg#t=25m00s
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Tägliche Berechnungen von 30-minütigen Messungen mehrerer Plots

Beitrag von EDi »

Athomas hat geschrieben: Mi Feb 24, 2021 8:32 pm Matt Dowle wirkt ja immer ein wenig depressiv, aber da haut er mal einen raus:

https://www.youtube.com/watch?v=fZpA_cU0SPg#t=25m00s
ROFL :lol: :lol: :lol:
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Tägliche Berechnungen von 30-minütigen Messungen mehrerer Plots

Beitrag von bigben »

Das kam in der Tat unerwartet :lol: :lol: :lol: . Ich muss auch zugeben, dass ich den Tisch vorher gar nicht als solchen erkannt hatte.

Ich glaube, das löst meinen bisherigen LIeblingscomic ab, den ich nebenher auch nicht mehr finde. Man sieht einen Piraten der seinen Kapitän fragt "What's the name of the statistics software we is using?" und der Kapitän antwortet mit einem großen "R".
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
SchroedingersCat
Beiträge: 5
Registriert: Sa Feb 20, 2021 7:57 pm

Re: Tägliche Berechnungen von 30-minütigen Messungen mehrerer Plots

Beitrag von SchroedingersCat »

Danke für die vielen ausführlichen Beiträge für die Vorzüge des jeweiligen Vorgehens. Ich für meinen Teil finde Tidyverse ganz cool, weil es einfach intuitiver ist und für Leute wie mich, die nicht so tief in der Materie stecken, ist das ein leichter zu lesen und damit auch leichter, die Bugs zu finden.

Um die Frage nach der Geschwindigkeit zu beantworten, habe ich beide Codes ein mal drüber laufen lassen und konnte von der gefühlten Geschwindigkeit keinen Unterschied feststellen, wenn das eurer Fachdiskussion irgend einen Beitrag leistet :D
Allerdings kann das auch daran liegen, dass ca. 17.500 Messwerte von 32 Plots einfach noch keine wirklich große Datenmenge ist.

LG
Antworten