[R] Stackoverflow Developer Survey

Interessantes ohne bestimmtes Thema!

Moderator: student

Antworten
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

[R] Stackoverflow Developer Survey

Beitrag von bigben »

Hallo!

Stackoverflow hat im Februar wieder ein umfangreiches "Developer Survey" durchgeführt. Dabei auch die "most loved languages" erfragt; in der Kurzform definiert als "% of developers who are developing with the language (...) and have expressed interest in continuing developing with it".

R ist auf Platz 16 mit immerhin 44,5 % Wunsch, dabeibleiben zu können. :D :!:

Soweit, so gut. Es gibt aber auch die Gegenfrage ""% of developers who are developing with the language (...) but have not expressed interest in continuing to do so".

Hier ist R auf Platz zehn mit 55,5 % :o :shock:

Sind das alles Studierende, die zu R gezwungen werden, um den Schein in Statistik zu bekommen? Oder ist R wirklich als Sprache so nervig, dass die Hälfte derer, die damit Arbeiten, davon weg wollen? Oder ist das der Trend zum Machine Learning und die wollen alle zu Python hin? Schon klar, Stackoverflow wendet sich an Programmierer und nicht an Statistiker, aber die Zahl finde ich schon erschreckend hoch.

Nebenbeobachtung: Sowohl bei den loved als auch bei den dreaded kommt Julia deutlich besser weg als R. Wiederum die Frage: Liegt das daran, dass Studierende im Rahmen ihrer Statistikausbildung zu R gezwungen werden, während man sich mit Julia nur freiwillig befasst? Oder hat eine junge, aufgeräumte, compilierte Sprache doch mehr Sexappeal?

Keine Angst, auf meiner Liste der Programmiersprachen, mit denen ich mich gerne Mal befassen würde, kommt Julia wahrscheinlich in die top-ten aber nicht in die top-five und bei Redmonk wird schnell klar, dass Julia in Sachen Nutzung R natürlich nicht das Wasser reichen kann. Trotzdem will man ja mitbekommen, wo der Zeitgeist so hinläuft.

Was geht Euch bei solchen Ergebnissen durch den Kopf?

Ach ja, es fehlt noch der Link: https://insights.stackoverflow.com/surv ... and-wanted

GLG,
Bernhard



PS: Angeblich ist auch ein csv erhältlich. Die csv der letzten Jahre sind hier verlinkt, ein aktuelles zu 2020 kann ich da (noch?) nicht entdecken:
https://insights.stackoverflow.com/survey
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: [R] Stackoverflow Developer Survey

Beitrag von student »

Hallo Bernhard!

Schön, dass Du die Diskussion hier startest! In einem Julia-Forum drehte es sich um eine ähnliche Fragestellung und Du hast einen Punkt der Diskussion schon hervorgehoben:
... während man sich mit Julia nur freiwillig befasst?
Meinem Verständnis nach, drehte sich dort die Diskussion um die "Art der Nutzung und des Users". Es wird vermutet, das Julia mehr in der akademischen/wissenschaftlichen Ecke genutzt wird und wenn es um eine produktive Anwendung geht, Python und R im Zentrum stehen. Die Frage, die in diesem Forum gestellt wurde, zielte darauf ab, wie Julia einer breiten Anwendung - auch im wirtschaftlichen Umfeld - nahe gebracht werde kann. Ich habe zur Julia-Anwendung in der iX Special - Moderne Programmiersprachen einen Artikel geschrieben.

Zu R und dem Punkt
Sind das alles Studierende, die zu R gezwungen werden, um den Schein in Statistik zu bekommen?

habe ich oft den Eindruck "Ja, sie werden gezwungen!" Viele Fragen, auch in diesem Forum, zeigen mir, dass kein Interesse sich mit R zu beschäftigen besteht, sondern auch die simpelsten Fragen hier abgeladen werden. Nach dem Motto "Ich habe keine Lust, aber ihr werdet mir schon weiterhelfen...!"

Zu R habe ich ebenfalls einen Artikel in der iX geschrieben und in ihm versuche ich aufzuzeigen, wie tief R nicht nur im akademischen sondern auch im wirtschaftlichen Umfeld integriert ist. Und das R immer noch das Werkzug der Wahl ist, wenn nicht die Datenmanipulation sondern die statistische Analyse im Vordergrund stehen. Eine Motivation für mich war, dass ich das Gefühl hatte, wenn ich mit "Datenanalysten" diskutiere, R als "old fashioned" abgetan wird und Python "hip" ist. :)

Was Julia & Datenanalyse angeht, sehe ich Julia noch nicht "über dem Berg", weil noch eine ganze Menge in Richtung Anwenderfreundlichkeit getan werden muss. Nur am Rande: Auch dazu habe ich mal etwas gemacht. ;)
Dateianhänge
iX Special
iX Special
iX13SpecialTitelbild_small.png (119.95 KiB) 5775 mal betrachtet
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: [R] Stackoverflow Developer Survey

Beitrag von bigben »

Hallo Günter,

danke für den iX-Link - mal sehen, vielleicht kauf ich mir das Heft, wenn es demnächst nochmal etwas ruhiger wird und sich Zeit zum Lesen auftut. Derzeit fehlt mir die Muße. Dein Julia-Buch hatte ich per Zufall mal auf Amazon gesehen. Grundsätzlich finde ich es ja ein gutes Zeichen für ein Softwaresystem, wenn man auch mal ein deutsches Buch kaufen kann. Für mich hat R so einen komischen Doppelcharakter. Einmal ist es eine Programmiersprache, zum anderen aber ein Statistikprogramm. Will sagen: Ein Computerprogramm erstellt man oft, um Aufgaben wiederholt, immer wieder ausführen zu lassen. Ein R Skript (oder in meinem Fall häufiger einen Code-Block in einem RMarkdownfile) schreibe ich meistens, weil mich eine bestimmte Auswertung jetzt interessiert, danach ist der Code bedeutungslos und faktisch wird nur noch das errechnete Ergebnis oder die Grafik weiter bearbeitet, der Code quasi weggeschmissen. Mit ist klar, dass das Packagesystem nur funktioniert, weil genügend andere sich die Mühe geben, wiederverwertbaren Code zu schreiben, aber das meiste in R geschriebene dürfte adhoc-/Wegwerf-Code sein.

Präsentierst Du im Buch und siehst Du Deine Zukunft mit Julia eher im Sinne des Erstellens ausgereiften Codes oder ist die Julia REPL wie die Console in R auch gut, um schnell mal zu schauen, ob es zwischen zwei Wertegruppen einen Unterschied gibt? Ich hoffe, die Frage ist so verständlich.

Wenn nicht, dann würde ich es herunterbrechen auf die Frage: Ist Julia dazu da, exe-Files zu erstellen oder taugt es für den interaktiven Einsatz so wie interpretierte Sprachen taugen?
Vielleicht ist das auch nicht ganz weit weg von meiner Eingangsfragestellung: Vielleicht befragt Stackoverflow hauptsächlich Programmierer und nur die sind zur Hälfte mit R nicht glücklich. Vielleicht sind Statistiker/Datenanalysten mit R ja viel zufriedener?

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Athomas
Beiträge: 768
Registriert: Mo Feb 26, 2018 8:19 pm

Re: [R] Stackoverflow Developer Survey

Beitrag von Athomas »

Wer an (mathematischer) Statistik ernsthaft interessiert ist, kommt meiner Meinung nach an R nicht vorbei - und wer die Zukunft im Auge hat, kommt an Julia nicht vorbei!

Glücklicherweise zwingt einen niemand zu einer Entscheidung zwischen den Sprachen! Im Gegenteil, in Julia gibt es (so hörte ich) das Package RCall, in R (unter anderem) „JuliaCall“ – um im Bedarfsfall auch die Stärken der jeweils anderen Sprache nutzen zu können!

Mein Favorit ist und bleibt (auf absehbare Zeit) R – ich versuche aber, über die Nutzung von JuliaCall auch einen Einstieg in Julia zu finden.
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: [R] Stackoverflow Developer Survey

Beitrag von EDi »

Man muss auch sehen, dass StackOverflow (SO) sich in den letzten 5 Jahren stark verändert hat. Vor allem in der R-Community auf SO hat sich einiges getan (so sind meiner Empfindung nach viele Top-R Leute weg von SO).
Mit ist klar, dass das Packagesystem nur funktioniert, weil genügend andere sich die Mühe geben, wiederverwertbaren Code zu schreiben, aber das meiste in R geschriebene dürfte adhoc-/Wegwerf-Code sein.
In der akademischen Nutzung ja, in der industriellen gefühlt eher weniger.
Das ist auch meines Erachtens die Größte Hürde die R und Leute die aus der akademia in die Industrie kommen zu nehmen haben: Vom skripten hin zu sauberen, robusten, getesteten und dokumentierten Programmcode.

Es ist alles da, es wird nur nicht genutzt bzw im R Umfeld gelehrt. Meiner Meinung nach sollte die Sprache R und die Statistik separat gelehrt werden. Oft (immer?) wird das zusammen gemacht, was auch sicherlich die lernenden vor Herausforderungen stellt..
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: [R] Stackoverflow Developer Survey

Beitrag von bigben »

Hallo!
Athomas hat geschrieben: Do Jun 18, 2020 10:25 am... - und wer die Zukunft im Auge hat, kommt an Julia nicht vorbei!
Wow, das ist eine entschlossene Aussage. Ich hatte das bisher eher in der Schublade "Interessante Sache, mal schauen, ob es genug Fahrt aufnimmt" liegen. Für Dich ist Julia offensichtlich schon viel weiter...
um im Bedarfsfall auch die Stärken der jeweils anderen Sprache nutzen zu können!
Heißt das zunächst JuliaCall anstelle von RCpp oder geht es über Geschwindigkeitsgewinne hinaus?
Man muss auch sehen, dass StackOverflow (SO) sich in den letzten 5 Jahren stark verändert hat.
Zum einen hat SO nach eigener Aussage versucht, Leute abseits von SO zur Teilnahme zu gewinnen, aber die Beobachtung bleibt davon unabhängig interessant. Ich hab das nicht so im Blick. Meinst Du, das ist eine Folge der Reinstate-Monica-Aufregung oder ist das was anderes?
Meiner Meinung nach sollte die Sprache R und die Statistik separat gelehrt werden.
Kann ich nachvollziehen, bin aber anderer Meinung. Angewandte Statistik sollte man m. E. mit Computer lernen und ich würde es schade finden, wenn man da etwas anderes zuerst lernen müsste, bevor man an R darf. Am schlimmsten finde ich es, wenn staatliche Universitäten ihre Studierenden einseitig an proprietäre Software wie SPSS heranführen. JASP finde ich noch nicht reif genug und Python ist soviel einfacher nicht.
Auf der anderen Seite: Wenn ich eine Programmiersprache lernen wollte und hätte dabei nicht einen klaren Bezug zur Statistik, warum sollte ich mich dann ausgerechnet für R entscheiden? Ich gebe gerne zu, dass ich Statistik und R gemeinsam gelernt habe und dass das nicht immer toll war.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: [R] Stackoverflow Developer Survey

Beitrag von bigben »

Athomas hat geschrieben: Do Jun 18, 2020 10:25 am... und wer die Zukunft im Auge hat, kommt an Julia nicht vorbei!
Während ich über diesen Satz nachgedacht habe, fiel mir zufällig dieser Blog auf den Monitor: Making Kotlin Ready for Data Science

Ich weiß nicht, wem Kotlin viel sagt, aber Kotlin ist einer der führenden Aspiranten auf die Java-Nachfolge. Im Redmonk-Rating auf Platz 19 sind nur Java selbst und Scala als JVM-Sprachen weiter vorne. Normalerweise auf der JVM laufend wird hart daran gearbeitet, dass es auch auf normale Betriebssysteme compilierbar ist. Ganz wichtig: Es ist eine der wenigen "first-class" Sprachen für Android!

Der Blog beschreibt nun, dass die Kotlin-Leute den Bedarf an Data-Science ernst nehmen, eine eigene Arbeitsgruppe dafür entwickelt haben und vieles spricht dafür, dass die wissen, was sie tun. Integration in Jupyter, numpy-Bindings, Libraries die beschrieben werden als Anlehnung an numpy, an pandas und an dplyr, ein Grafiksystem, das sich an ggplot2 anlehnt, das drückt schon ziemlich viele richtige Knöpfe.

Für den von EDi aufgeführten Anwendungsfall in der Industrie kann ich mir schon vorstellen, dass es genügend Leute gibt, die Data Science mit einer Code-Base in Java oder auf Android-Geräten angehen wollen und auch wenn Julia einen Vorsprung im Bereich Statistik haben sollte, was ich nicht weiß, so hat Kotlin in Sachen Anbindung an IDEs, an Java und Bekanntheit in Programmiererkreisen sicher einen riesigen Vorsprung und man weiß nicht was da mehr zählt.

Ich will jetzt gar nicht Kotlin pitchen. Ich denke, dass Kotlin pars pro toto für eine Reihe von modernen, auf den Markt drängenden Programmiersprachen steht, die um das Feld Data Science kämpfen werden. Manning Publishing will im Herbst 2020 ein Buch über "Modern Fortran" herausgeben -- selbst das ist also noch nicht tot.

Meine persönliche Glaskugel ist derzeit noch zu neblig um zu sagen, wo die Reise hingeht.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: [R] Stackoverflow Developer Survey

Beitrag von student »

@bigben,

Zuerst: Ich nutze R auch im "Skript-Modus", d.h. ich nutze die Konsole oder RStudio, um die Analyse durchzuführen und danach ist das Skript aus dokumentarischen Gründen nur noch wichtig. Und um zu lernen! ;)

Das führt mich direkt zu Deiner Frage
... Zukunft mit Julia eher im Sinne des Erstellens ausgereiften Codes oder ist die Julia REPL...
kann ich keine klare Antwort geben, weil ich noch Freude an Julia habe! ;) Ich versuche es mal: Wenn ich eine Analyse, die ich vorher mit dem unglaublichen R durchgeführt habe, mit Julia nacharbeiten möchte, haut mich immer die ärgerlich langsame erste "Ausführungsgeschwindigkeit" um. Bis alle Pakete compiliert sind und die erste Grafik erstellt wurde, habe ich mir einen Kaffee geholt (mit R konnte ich den Kaffee noch nicht einmal umrühren und die Analyse war durch). Die 2. Skriptausführung geht hingegen schnell, wenn aber Änderungen und neue Pakete eingebunden werden müssen, geht es wieder los...! Dann noch der aktuelle Mangel bezüglich Funktionen und Pakete.

Den Geschwindigkeitsvorteil den Julia bietet, nutzt der Anwender erst dann, wenn große und immer wiederkehrende Analysen durchgeführt werden. Darauf gehe ich auch in dem iX-Artikel ein. Ihr wisst, was ich mit großen Analysen meine...
Die Frage "Wie kann ich einen "Datenanalysten" überzeugen Julia zu nutzen?" diskutiere ich ab und an mit der Julia-Gemeinde und die Antworten sind - ich drücke es mal so aus - interessant. Vielleicht ist Julia nicht die Sprache für den Datenanalysten?

@Athomas, ich glaube auch noch nicht, das Julia wirklich über den "Berg" ist. Da muss noch viel passieren (Paketqualität, Dokumentation und Paketpflegezustand), damit Julia tatsächlich den Weg in ein geschäftliches Umfeld findet. Aktuell denke ich an das Paket ANOVA .... :o

Julia bietet Schnittstellen zu R, Python und Co. Wenn ich dieses Nutze, geht natürlich der Geschwindigkeitsvorteil den Bach runter...

Mein Eindruck ist, dass Julia oft "ausprobiert" und nicht selten nicht weiter verfolgt wird. Julia ist interessant und "hip" und ich würde mich freuen, wenn Julia Erfolg hat. Ich werde es begleiten, unterstützen und auch noch ein paar Videos erstellen (aktuell habe ich eins in Arbeit).
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: [R] Stackoverflow Developer Survey

Beitrag von bigben »

student hat geschrieben: Fr Jun 19, 2020 9:18 am Bis alle Pakete compiliert sind und die erste Grafik erstellt wurde, habe ich mir einen Kaffee geholt (mit R konnte ich den Kaffee noch nicht einmal umrühren und die Analyse war durch).
Hmm, im Anfang einiger Deiner Videos bezeichnest Du ja das ad oculos Projekt auch als "Kaffeetassenstatistik". Dann müsste Julia ja den Youtubevideos zugute kommen ;) In den Überschriften und Texten verwendest Du das Wort anscheinend eher nicht. Wenn man bei Youtube nach Kaffeetassenstatistik sucht, kommt nichts passendes. Denk mal drüber nach, ich finde das eigentlich schön griffig.
Die 2. Skriptausführung geht hingegen schnell, wenn aber Änderungen und neue Pakete eingebunden werden müssen, geht es wieder los...!

Nunja, das ist bei statisch compilierten (nicht JIT-compilierten) Sprachen wohl so, aber Rechner werden schneller, Compiler werden optimiert, vielleicht verwächst sich dieses Problem mit der Zeit? Ich meine, auf der anderen Seite muss man überlegen, wieviel Zeit man beim Programmieren spart. Wir sehen ja bei R, dass man viel Grips in die Frage stecken kann, wie man etwas in R schnell macht. Das kostet auch Zeit. Die spart man, wenn die erste Implementierung schon schnell ist. Aber Compilerzeit ist immer besonders nervige Zeit: Man hat etwas geschrieben und will wissen, ob alles richtig war - da werden Sekunden rasch als Zumutung empfunden.


Anlass für mein Wiederaufgreifen des Threads ist der aktuelle TIOBE-Index Juli 2020 https://www.tiobe.com/tiobe-index/ Ich finde keine URL, die über die Zeit auf denselben Content verweisen wird, deshalb zitiere ich mal von der Seite:
July Headline: All time high for the R programming language

The statistical programming language R has set a new record by moving from position 9 to position 8 this month. Some time ago it seemed like Python had won the battle of statistical programming, but R's popularity is still increasing in the slipstream of Python. There are 2 trends that might boost the R language: 1) the days of commercial statistical languages and packages such as SAS, Stata and SPSS are over. Universities and research institutes embrace Python and R for their stasticial analyses, 2) lots of statistics and data mining need to be done to find a vaccine for the COVID-19 virus.
Python ist auf dieser Liste Nummer 3 aller Sprachen aber es wundert mich -CoViD-19 hin oder her- , dass R auf Platz 8 aller Sprachen ist wenn man bedenkt, welch kleine Nische damit gefüllt wird. Es steht vor php und überholt damit eine der verbeitetsten Sprachen für das Web!

Auch ganz interessant: PYPL PopularitY of Programming Language Index http://pypl.github.io/PYPL.html
Die messen, wie oft bei Google der Name einer Sprache gemeinsam mit "tutorial" gesucht wird. Hier ist R auf Platz 7.

Immerhin, Julia kommt auf beiden Seiten auch vor.

GLG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: [R] Stackoverflow Developer Survey

Beitrag von student »

Hallo Bernhard,

danke für den Hinweis! Ich möchte schon seit langem ein YouTube-Kanal-Intro anfertigen, aber immer läuft die Zeit davon...! Darin soll so etwas vorkommen wie "... die Beschreibung soll nicht länger als eine oder höchstens 2 Tassen Kaffee dauern...". ;)

Noch eine Anmerkung zu Julia: Im Julia-Forum Discourse laufen immer wieder Diskussionen, ob Julia überhaupt zur Ausführung über ein Skript wegen der "Compiler-Herausforderung" geeignet ist. Es gibt viele Hinweise, wie Compilierungs-Sessions auf das nötigste reduziert werden, was aber oft unpraktisch ist. Hier soll die nächste Julia-Version (1.5) besser werden. Ich bin gespannt...!

Wenn ich einen Julia-Code erzeuge und ihn nicht mehr ändere, dann kann Julia mit Geschwindigkeit punkten.
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Antworten