Seite 1 von 1

Eure meistgenutzten Pakete

Verfasst: Mi Okt 12, 2016 9:34 am
von R007
Hallo,

im alten Forum hatte ich damals ein Thema über "eure meistgenutzten Pakete" erstellt, welches ich hier im Forum gerne wiederbeleben würde. Neben dem Namen des Pakets wäre eine kurze Beschreibung bzw. das Einsatzgebiet interessant.

Ich bin noch ein relativer R-Beginner und deswegen habe ich nur zwei meistgenutzte Pakete, da ich aktuelle viele verschiedene ausprobiere:
ggplot2 (Erstellung von grafischen Darstellungen)
dplyr (Datenmanipulationen)

Gruß
R007

Re: Eure meistgenutzten Pakete

Verfasst: Mi Okt 12, 2016 11:17 am
von jogo

Code: Alles auswählen

library("fortunes")
Für die Datenwühlerei möchte ich einen Blick auf data.table empfehlen.
Ansonsten wird bei mir öfter auch mal car oder systemfit eingebunden.
Und für das Code-Golfing unerlässlich: microbenchmark

Gruß, Jörg

Re: Eure meistgenutzten Pakete

Verfasst: Mi Okt 12, 2016 11:26 am
von bigben
Hallo,

ich weiß nicht mehr, was ich damals geantwortet habe. Was jeder brauchen kann ist Hilfe, die interessanten Daten auszusuchen und in ein geeignetes Format zu bringen. So wichtig dieser Vorgang, so intensiv die Bemühungen, das durch Packages besser zu machen. Das von Dir erwähnt dplyr ist eine Antwort darauf, eine andere ist data.table. Beide haben eine sehr unterschiedliche Herangehensweise und beide entwickeln ihre Fanblöcke. Mein Eindruck war, dass data.table im Forum beliebter ist, aber ob eines von beiden sich gegen das andere wird durchsetzen können, das steht noch in den Sternen. Auch tidyr als Kurzvariante, in die man sich schnell einarbeiten kann, sollte erwähnt werden.

Gerade weil man noch nicht weiß, ob sich dplyr oder data.table durchsetzen wird, möchte ich eine Lanze für sqldf brechen: Wer ein wenig SQL kann, kann dieses Package für viele spannende Aufgaben nutzen und Zeit zu investieren, um SQL zu lernen, ist sicher kein Fehler.

Wer sich mit Fragebögen und Tests herumschlägt, für den sei psych erwähnt und empfohlen.

rpart macht wirklich unschöne Baumdarstellungen, die aber durch party viel besser werden.

Mich stören immer die Warnings die wilcox.test macht, wenn es Bindungen in den Daten gibt. exactRankTests löst dieses Problem, auch wenn die Autoren finden, dass man eher auf coin setzen sollte.

knitr zum Erstellen von HTML-Auswertungsseiten ist super einfach zu benutzen, weil in RStudio gut integriert. Nutze ich ganz viel und empfehle ich von Herzen, auch wenn ich selbst mich nur ganz oberflächlich damit beschäftigt habe.

ggplot2 ist auf seine Weise sehr gut, dann gerne auch in Verbindung mit ggthemes. Ein vollständiger Ersatz für base-Grafiken ist es nicht.

assertthat und testit sind keine bedeutsamen packages, aber weil sie einen daran erinnern, dass man auch in R Tests einbauen sollte, so wie in anderen Programmiersprachen auch, dann sind sie sehr wertvoll!

jogo hat schon sehr zu Recht fortunes ins Feld geführt, ohne das man Teile des Forums nicht verstehen kann.

Dazu gibt es dann natürlich jede Menge Spezialpackages je nach Fragestellung. Wer Packages machen will braucht roxygen2, ... Wichtig ist einfach nochmal ein Verweis auf die TastViews von CRAN: https://cran.r-project.org/web/views/

LG,
Bernhard

Re: Eure meistgenutzten Pakete

Verfasst: Mi Okt 12, 2016 12:06 pm
von EDi
Hmm, hier meine subjektive Top 10:

Code: Alles auswählen

library(data.table)            # for data munging
library(RPostgreSQL)           # interaction with database
library(ggplot2)               # for plotting
library(vegan)                 # for multivariate stuff
library(mgcv)                  # for modelling
library(knitr)                 # for reporting
library(sp)                    # for GIS
library(devtools)              # for package development
library(caret)		           # for machine learning
library(plyr)		            # split-apply-combine for various in/outputs
Hinzukommen einige Pakete, auf welche diese beruhen / mit interagieren können.

Re: Eure meistgenutzten Pakete

Verfasst: Mi Okt 19, 2016 8:46 am
von R007
Vielen Dank für eure Antworten, das hat mir sehr geholfen. Denn gerade als R-Anfänger ist es hilfreich zu wissen, welche Pakete man sich am besten mal anguckt.

Insbesondere data.table und sqldf haben mir sehr geholfen, solche Pakete hatte ich gesucht. Da ich mich mit SQL auskenne, ist insbesondere das Paket sqldf sehr hilfreich.

Ich hoffe, andere User des Forums werden ihre Top-Pakete ebenfalls posten. :)

Re: Eure meistgenutzten Pakete

Verfasst: So Nov 06, 2016 3:20 pm
von bigben
Habe gerade gesehen, dass auch RStudio eine Liste mit empfehlenswerten Paketen unterhält:

https://support.rstudio.com/hc/en-us/ar ... R-packages

LG,
Bernhard

Re: Eure meistgenutzten Pakete

Verfasst: Sa Nov 12, 2016 1:58 pm
von EDi
Hallo,

ich hab seit dieser Woche eine neue Machine zum rechnen :D :D :D und die Tage nach meinen Wünschen eingerichtet.
Damit das alles schnell und einfach geht hab ich ein (eigentlich mehrere) shell Scripte die mir die Machine aufsetzen (wen's interessiert, ist alles auf github).

Neben vielen Programmen die ich brauche, installiert mir das Skript auch die R package die ich häufig nutze.
Hier findet ihr das Skript.
Es zeigt quasi was ich als essentiell für meine Arbeit mit R erachte (dependencies die mit installiert werden sind nicht explizit erwähnt).

Nur was ich aus aktuellem Anlass diesem Thread noch hinzufügen könnte...