Ich habe mich bisher aus dieser Frage dezent zurückgehalten, da ich weiß, dass das sonst etwas länger dauert. Ich weiß aber nicht recht, wo ich anfangen soll. Vielleicht mit den Programmieraufgaben zu meiner Diplomarbeit und Promotion (in der zweiten Hälfte der 1980-er Jahre). Das war zuerst in Pascal und später in C und bestand zu einem Teil aus nichtlinearer Optimierung und zum anderen aus linearer Algebra (spezielle Skalierungen mit Nichtdiagonalmatrizen). Nach meinem Studium hatte ich dann Kontakt mit
Matlab, das war eine Erleuchtung:
Hätte ich diese Programmiersprache für meine Abschlussarbeiten gehabt, wäre alles wesentlich einfacher gewesen. (Aber die damaligen Computer hätten es wahrscheinlich nicht hergegeben.) Dass die Wahl einer geeigneten Programmiersprache entscheidend die Größe der Mühen bei der Programmierung beeinflusst, hatte ich schon während des Studiums erforscht (z.B. in dem ein Kommilitone und ich den Gaußschen Algorithmus in Prolog umsetzten).
Meine Berufliche Tätigkeit hatte dann erstmal mit Datenbanken zu tun: DBase und Paradox. Zwischendurch versuchte ich noch meine alten C-Quelltexte nach
Matlab und später
octave umzusetzen.
Erst im Jahr 2001 kam ich in einen Bereich, der mit Preis- und Mengenindizes zu tun hatte, die ich auch noch selber berechnen sollte. Also ging es 2003 an die Wahl einer geeigneten Programmiersprache. Zunächst schaute ich mir wieder
octave an; jedoch stand diese Programmiersprache zu dem Zeitpunkt in einem größeren konzeptionellen Umbruch. Also schaute ich nach weiteren freien Programmiersprachen und bemerkte dabei R. Nach einigen Prüfungen stand fest:
Das ist es, was ich gesucht habe: Eine Programmiersprache der vierten Generation, die auch mit komplexeren Datenobjekten (Vektoren und Matrizen wie octave aber auch mit Datensammlungen so wie die Datenbanken) umgehen kann. Und auch für die Parameterschätzungen in der Ökonometrie war alles vorhanden. So entstanden im Sept. 2003 meine ersten Quelltexte in R. Als Lesematerial hatte ich nur die üblichen Einführungen und ich durfte jeden Fehler selber machen (und habe auch keinen der üblichen Anfängerfehler ausgelassen). Das erste wirklich gute Buch, das mir zwischen die Finger kam, war
Uwe Ligges: Programmieren in R.
Insgesamt hat es wohl drei Jahre gedauert, bis ich mich ziemlich heimisch fühlte beim Programmieren mit R. Daraus ergab sich auch die Erkenntnis, dass R im Selbststudium auch recht mühselig ist. Deshalb war ich auch sehr froh, dass ich später dieses Forum gefunden habe (damals noch bei forencity
http://r-statistik.foren-city.de/ ). Hier kann ich bewirken, dass die R-Novizen nicht alle Fehler nochmal selbst machen müssen bzw. dass sie entsprechend geleitet werden bei der Erarbeitung dieser 4G-Programmiersprache.
Auch konnte ich selbst noch einiges hier lernen:
zuerst war es, dass mir immer nur
tapply() u.ä. einfiel an Stellen, wo man ave() verwendt (Athomas konnte dann immer schön auf
ave() hinweisen).
Aber auch
RStudio und die Pakete
data.table und
plyr habe ich hier im Forum kennengelernt (dank Edi).
Dieses Forum sehe ich als erste Anlaufstelle für die R-Novizen, denn die konkreten Aufgabenstellungen bei der Programmierung können sehr verschieden sein. Hier gibt es Rat zu Literatur und Umsetzung. Als Lektüre für den fortgeschrittenen R-Programmierer würde ich unbedingt das
R-Inferno https://www.burns-stat.com/pages/Tutor/R_inferno.pdf und
Advanced R-Programming http://adv-r.had.co.nz/ und bei
StackOverflow die Themen mit hoher Wertung
https://stackoverflow.com/questions/tag ... ageSize=50 empfehlen. Für data.table gibt es sehr schönes Material hier:
http://franknarf1.github.io/r-tutorial/_book/index.html
Gruß, Jörg