Warnung vor dem Tidyverse!

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

Antworten
Athomas
Beiträge: 769
Registriert: Mo Feb 26, 2018 8:19 pm

Warnung vor dem Tidyverse!

Beitrag von Athomas »

Ich habe mich ja schon mehrfach als Tidyverse-Skeptiker geoutet und möchte hier einen Artikel verlinken, der weitestgehend meine Meinung (Empfindungen?) dem Tidyverse gegenüber widerspiegelt: https://towardsdatascience.com/a-thousa ... 41d8504433

Drei Zitate als "Teaser":
Why should one person dictate what our coding style should be, especially in an open-source language, and however well intentioned? It’s also hard not to see this as a land grab by RStudio over the whole R ecosystem — all to their profit.
I said at the beginning that the tidyverse solved some incredibly annoying problems, which needed solving. That it did. But that’s no reason to adopt the whole shebang — or the coding style that comes with it. I use stringr, for instance, one member of the “verse,” and don’t feel bad about it. But I get more suspicious the more my basic methodology gets dictated to me.
For the wrangling of data frames specifically, we have a very clear alternative in data.table. Its functionality and styling are more modest extensions of the bracketing notation in base R, and also highly logical for SQL users. It has its oddities too, and is probably more of an advanced feature — but so much the better: learn base R first and data.table when ready.
Hufeisen
Beiträge: 162
Registriert: Fr Aug 31, 2018 6:34 pm

Re: Warnung vor dem Tidyverse!

Beitrag von Hufeisen »

Gut, du hast ja schon mit einem Smiley den Thread eröffnet. Es ist eine Meinung und der Autor kämpft hier (wie ja so oft) mit schmutzigen Mitteln.
Why should one person dictate what our coding style should be, especially in an open-source language, and however well intentioned? It’s also hard not to see this as a land grab by RStudio over the whole R ecosystem — all to their profit.
Rhetorische Frage, aus der Luft gegriffene Behauptung und der böse Profit. Seine folgenden Kritikpunkte bemängeln ja eigentlich nur, das dass tidyverse Dinge anders löst als er es gerne hätte. Wirklich diskutiert, ob nun tausend Werkzeuge, die jeweils nur eine Aufgabe lösen, oder ein überladenes Multifunktionswerkzeug besser ist, wird nicht diskutiert. Ein reiner Meinungsartikel halt. Gut, immerhin eine Antwort herausgekitzelt. :P
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Warnung vor dem Tidyverse!

Beitrag von EDi »

Ich verstehe das ganze nicht... Was es da zu diskutieren gibt.

Ist alles FOSS - falls es dir nicht gefällt nutze es nicht oder mach's besser!

Ich nutze das tidyverse, base-R, data.table alles gleichzeitig und fühle mich in allen 3 Dialekten wohl.

Tidyverse macht _mich_ unglaublich schnell manche Sachen runterzuschreiben und ist recht lesbar. Dafür nicht super Performant.

Data.table macht meinen _Code_ unglaublich schnell, dafür muss ich mehr Zeit zum programmieren aufwenden und kann Code schlechter warten.

Base-R brauche ich mehr Zeit zum programmieren, ist aber von jedem R Nutzer erwartbar.

Alles drei haben ihre Daseinsberechtigung und ich nutze alle 3 je nachdem wo es gerade bei mir hakt.

RStudip ist super und genau diesen professionellen vom vielleicht noch mehr Firmen braucht R um vorran zu kommen. R ist auf einem guten Weg im Business seinen festen Platz zu bekommen, nicht zuletzt dank Rstuido- sonst wäre R vermutlich immer noch eine akademische Nischensprache.

Das Rstudio damit $$$ Geld verdient stört mich nicht, dafür geben sie extrem viel zurück. Ist auch nichts ungewöhnliches, siehe z.B. canonical & das sehr beliebte Ubuntu. Universitäten verdienen auch $$$ und sind wirtschaftsbetriebe.

Ich stimme aber zu:

1) lernt base-R - ohne das bleibt euch viel verborgen
2) bleibt nicht bei einem Dialekt - mix & match how it fies to you!

Genug Senf dazu!
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: Warnung vor dem Tidyverse!

Beitrag von student »

Ich gehe mit meinen Gedanken in EDi's Richtung: Nimm das, was Du brauchst und Sinn macht. Wie der Autor des Artikels, kann ich allerdings bestätigen, dass der Einstieg in R über das Tidyverse-Universum nicht der beste Weg ist. Beispiele dazu wurden hier ja auch schon oft diskutiert und auch Hilfe geleistet. Über R-Base zum Tidyverse ist sicher der bessere Weg.

Auch muss m. E., anerkannt werden, dass RStudio an dem Erfolg von R, besonders im professionellen Einsatz, maßgeblich beteiligt ist. Und der "gemeine" Nutzer hat ja auch etwas davon. RStudio ist schon ein schönes Produkt und der Open-Source-Bereich wird auch unterstützt. Und diese Botschaft wurde auf der letzten RStudio-Konferenz für mich auch glaubwürdig herüber gebracht.

Ich hoffe allerdings, dass das Tidyverseum nicht R so dominiert, dass faktisch nichts anderes mehr gibt. :?

Meine 2 Cent... :)
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
ruppy
Beiträge: 41
Registriert: Mo Nov 04, 2019 10:05 pm

Re: Warnung vor dem Tidyverse!

Beitrag von ruppy »

Ich glaube in vielen meiner Posts erkennt man, dass ich ein bekennender tidyverse-Fan bin.
Muss aber auch sagen, dass das maßgeblich daran liegt, dass man als Anfänger in diese Richtung getrieben wird.

Bei Datacamp geht es rasch ins tidyverse, auf Google stößt man schnell auf Hadley Wickham und auf SO gehört es ja fast zum guten Ton auch eine tidyverse-Lösung bereit zu halten.

Hatte vor kurzem ein Vorstellungsgespräch da sollte ich erklären was in einem Skript basiert. War keine Rocket-Science. Es wurden Daten eingelesen, ein bisschen aufbereitet und deskriptive Statistiken berechnet. Natürlich alles tidy.

Spielte mir natürlich in die Karten, aber ich glaube meine ehemaligen Profs hätten es nicht so gut erläutern können, obwohl sie das ein oder andere Jährchen mehr Erfahrung mit R haben als ich (nutzen aber nur Base-R).

Imho ist das tidyverse genial auch die packages, die damit sympathisieren wie bspw. tidymodels und diese Forecast-Packages (fable, tsibble).

Finde aber das Bewusstsein, dass neben dem tidyverse auch andere Optionen existieren, könnte zumindest gestärkt werden.

BG ruppy
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: Warnung vor dem Tidyverse!

Beitrag von student »

Hallo ruppy,

ich denke, Du wirst - oder vielleicht ist das schon der Fall - zu den hippen (R-)Data Scientisten gehören, weil Dein Raumschiff brillant durch das Tidyiversum fliegt. Ich gehöre dann sicher zu den Ewiggestrigen, weil ich z. B. %>% gruselig finde! :D

Ist aber alles gut, siehe meine 2 Cent!
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
ruppy
Beiträge: 41
Registriert: Mo Nov 04, 2019 10:05 pm

Re: Warnung vor dem Tidyverse!

Beitrag von ruppy »

Hallo student,

tatsächlich darf ich mich nun seit gestern Data Scientist schimpfen. Wohl wissend, dass es noch seeeehr viel zu Lernen gibt.
Mal schauen, ob ich R so treu bleiben kann wie ich mir das wünsche.
Gehe davon aus, dass ich auch die Schlage beschwören muss :D

BG ruppy
bigben
Beiträge: 2780
Registriert: Mi Okt 12, 2016 9:09 am

Re: Warnung vor dem Tidyverse!

Beitrag von bigben »

Hallo ruppy,

herzlichen Glückwunsch. Darf man fragen, wer Dir den Titel gegeben hat?

Ansonsten kann ich an Python nichts schlechtes finden. Das ist eine gut ausgedachte und ausgereifte Sprache. Und während wir uns über die Rolle Wickhams hier streiten, haben die Python-Leute die Frage nach dem Guru abschließend beantwortet ( https://de.wikipedia.org/wiki/Benevolen ... r_for_Life ).

Ich habe auch schon mehrfach hier geschrieben, wie klasse ich das fand, von Python 2 auf 3 mal eben die backwards-Kompatibilität kontrolliert über Bord geworfen hat, um in der Sprache nochmal aufräumen zu können. R könnte auch gut eine charismatische Führungspersönlichkeit gebrauchen, die mal aufräumt, statt noch mehr Clutter für zukünftige Generationen anzuhäufen.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Warnung vor dem Tidyverse!

Beitrag von EDi »

ruppy hat geschrieben: Sa Mai 02, 2020 6:23 pm Hallo student,

tatsächlich darf ich mich nun seit gestern Data Scientist schimpfen. Wohl wissend, dass es noch seeeehr viel zu Lernen gibt.
Mal schauen, ob ich R so treu bleiben kann wie ich mir das wünsche.
Gehe davon aus, dass ich auch die Schlage beschwören muss :D

BG ruppy
Glückwunsch!

Ich schimpfe mich manchmal selbst fancy "Full Stack Data Scientist" 😁, manchmal aber auch nur lahm "Biostatistiker" oder witziger "Datenschubser"...

Aus meiner Erfahrung (3 Jahre in der Industrie, teilweise funktionelle Leitung von einem Data Science Team), ist es egal ob R, Python oder Javascript. Alle haben ihre Nischen und sollten für ihr bestes ausgewählt werden (gleiches wie oben...).

Ich kann sehr gut Python und JavaScript lesen (und verstehen), im programmieren darin bin ich aber super lahm (mir fehlt die Übung). Obwohl bei uns im Team alle 3 Sprachen vertreten sind, bin ich immer noch bei R und sehe mich nicht zu Python übergehen (schon x anläufe gehabt). Js erst recht nicht - das ist mir zu wild :D

Es kommt auf die Konzepte an - und die sind bei allen 3 gleich. Wobei ich sagen muss, dass man bei R vermutlich mehr investieren muss wenn man aus der Akademia kommt, wenn man R produktiv nutzen will. Quasi vom Script-kiddy hin zum Software Programmierer (unit-tests, docu, funktionen, Pakete, etcetc) - da hapert es bei R mehr als bei Python (weil die Leute einfach einen anderen Hintergrund haben).

Nichtsdestotrotz sehe ich da keine Hindernisse R zu nutzen - ist alles da man muss es nur anwenden...

Auch bin ich in R super schnell, was top für einen Proofofconcept oder Prototyp ist. Python/JS braucht gefühlt mehr Aufwand - aber das kann ich nicht belegen, nur ein Gefühl...
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
ruppy
Beiträge: 41
Registriert: Mo Nov 04, 2019 10:05 pm

Re: Warnung vor dem Tidyverse!

Beitrag von ruppy »

Hi bigben, hi EDi,

den Titel trage ich bei meinem neuen Arbeitgeber (einem der an der letztjährigen 5G-Auktion beteiligten Unternehmen).

Wie gesagt, dass es für mich noch sehr viel zu Lernen gibt, ist mir durchaus bewusst.
Auch weil ich bisher mit R eher "gerechnet" als programmiert habe.
Naja bin mal gespannt wo die Reise hingehen wird, aber einfach wird es nicht. Dafür umso spannender.

Danke für die Glückwünsche :)

BG ruppy
Antworten