Re: An opinionated view of the Tidyverse "dialect" of the R language, and its promotion by RStudio.
Verfasst: Fr Okt 04, 2019 11:50 am
Ich habe mir den Artikel auch zu Gemüt geführt und kann als ewiger Anfänger vielleicht auch meine Meinung dazu abgeben. So ganz hat er mich nicht überzeugt. Ich habe zwar ebenfalls viel genickt, denn das tidyverse steht auch meiner Ansicht nach in einem Spannungsverhältnis aus einheitlicher Syntax (das ist ein Vorteil) und einem völlig unübersichtlichen Funktionsdschungel (das ist der Nachteil). Das hat mich bisher immer abgeschreckt, redundante Befehle zu base R zu lernen. Der Aufwand steht einfach in keinem Verhältnis dazu, dass man manche Sachen sehr elegant erledigen kann. Damit sich das lohnt, muss man schon sehr viel mit R arbeiten.
Aber ehrlicherweise kann das nicht der Bezugspunkt für einen Vergleich sein und das hat mich auch im Artikel gestört. Ein fairer Vergleich würde die Lernkurven von Anfängern in base R mit denen von Anfängern im tidyverse ohne Kenntnise in base R vergleichen. Mir war der Artikel dahingehend argumentativ zu schwach. Zum Beispiel wird der Funktionsumfang von dplyr genannt (263 Funktionen), ohne eine vergleichbare Zahl für base R zu nennen. Selbst wenn eine Zahl genannt würde, muss das kein gutes Argument sein. Wie viele der Funktionen benötigt man denn wirklich, um produktiv zu arbeiten? Harte Zahlen, welcher Weg besser zu erlernen ist, gibt es anscheinend nicht.
Dass dem Autor der Umgang mit der apply-Familie leicht fällt, wundert mich nicht. Mich persönlich stören sie immer, weil ich mein Skript mit Blick auf Dritte schreibe, die keine Chance haben, zu verstehen was da passiert, weil apply spezifisch für R ist. Deshalb benutze ich gerne for-Schleifen, die versteht jeder, der Informatik in der Schule hatte. Aus diesem Blickwinkel der Lesbarkeit für Laien würde ich auch das tidyverse in der Fallstudie vorne sehen.
Aber ehrlicherweise kann das nicht der Bezugspunkt für einen Vergleich sein und das hat mich auch im Artikel gestört. Ein fairer Vergleich würde die Lernkurven von Anfängern in base R mit denen von Anfängern im tidyverse ohne Kenntnise in base R vergleichen. Mir war der Artikel dahingehend argumentativ zu schwach. Zum Beispiel wird der Funktionsumfang von dplyr genannt (263 Funktionen), ohne eine vergleichbare Zahl für base R zu nennen. Selbst wenn eine Zahl genannt würde, muss das kein gutes Argument sein. Wie viele der Funktionen benötigt man denn wirklich, um produktiv zu arbeiten? Harte Zahlen, welcher Weg besser zu erlernen ist, gibt es anscheinend nicht.
Dass dem Autor der Umgang mit der apply-Familie leicht fällt, wundert mich nicht. Mich persönlich stören sie immer, weil ich mein Skript mit Blick auf Dritte schreibe, die keine Chance haben, zu verstehen was da passiert, weil apply spezifisch für R ist. Deshalb benutze ich gerne for-Schleifen, die versteht jeder, der Informatik in der Schule hatte. Aus diesem Blickwinkel der Lesbarkeit für Laien würde ich auch das tidyverse in der Fallstudie vorne sehen.
Code: Alles auswählen
> mtcars %>%
+ group_by(cyl,gear) %>%
+ summarize(mean(mpg))
# vs.
> tapply(mtcars$mpg,list(mtcars$cyl,mtcars$gear),mean)