Die Suche ergab 246 Treffer

von Athomas
Di Okt 01, 2019 10:44 am
Forum: Statistik mit R
Thema: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen
Antworten: 15
Zugriffe: 102

Re: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen

Deine "Nonsens"-Daten (abhängige Variable unabhängig von den unabhängigen :D ) führt dazu, dass das GLM nach wenigen (bei mir i.a. drei) Iterationen fertig wird. Ich habe deshalb eine Simulation von Zahlenmaterial geschrieben, das näher am theoretischen Erzeugungsmechanismus der logistischen Regress...
von Athomas
Mo Sep 30, 2019 11:53 pm
Forum: Statistik mit R
Thema: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen
Antworten: 15
Zugriffe: 102

Re: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen

Weil ich selbst mal ab und zu mit GLMs herumbrassele (und mit den mir bekannten R-Möglichkeiten nicht glücklich bin) habe ich mir direkt mal "fastglm" angeguckt. Das package ist sehr jung (1/2 Jahr, Version 0.0.1 :) ) und bietet noch reichlich Entwicklungsmöglichkeiten: einerseits ist es kaum schnel...
von Athomas
Mo Sep 30, 2019 6:41 pm
Forum: Statistik mit R
Thema: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen
Antworten: 15
Zugriffe: 102

Re: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen

Ich habe es bei mir mal laufen lassen (auf einem etwas schnelleren Prozessor, i7-6700K, aber 64 GB Speicher - letzteres sollte allerdings keine Rolle spielen) und habe 16,4 sec gebraucht, mit "speedglm" 10,8 sec - ein bisschen was geht also noch. Ausserdem habe ich noch Microsoft R Open (mit "eingeb...
von Athomas
Mo Sep 30, 2019 5:50 pm
Forum: Statistik mit R
Thema: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen
Antworten: 15
Zugriffe: 102

Re: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen

R ist komplettamente auf lau - wer sollte da ein Interesse an einer künstlichen Limitierung der Regressoren haben?
Für Vernunft ist aber der Benutzer selbst zuständig :) !
von Athomas
Mo Sep 30, 2019 4:48 pm
Forum: Statistik mit R
Thema: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen
Antworten: 15
Zugriffe: 102

Re: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen

Also im Laufzeittest (Vergleich R und Stata) habe ich Logit-Regressionen durchgeführt. Falls interessant: Stata13(IC) lief dabei ca. 3 mal so schnell wie R. (Windows 10Pro / Intelcore i7 6700CPU @ 3,40GHz / 8 GB RAM) Also, damit testest Du speziell die Performance einer logistischen Regression, wah...
von Athomas
Mo Sep 30, 2019 3:58 pm
Forum: Deskriptive Statistik
Thema: Kreuztabelle und Summenprozent
Antworten: 6
Zugriffe: 116

Re: Kreuztabelle und Summenprozent

Ich mache mich mal auf die Suche nach einer Alternative... Mein Vorschlag, unter Verwendung von "data.table": library(data.table) DT <- data.table(ID = c("Jonathan", "Jonathan", "Jonathan", "Jonathan", "Annika", "Annika", "Annika", "Annika", "Hans", "Hans", "Hans", "Hans"), Zeit = c("T1", "T2", "T3...
von Athomas
Mo Sep 30, 2019 3:21 pm
Forum: Statistik mit R
Thema: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen
Antworten: 15
Zugriffe: 102

Re: Großen Datensatz mit vielen Variablen(Spalten) selbst erstellen

ich möchte bei meinen Rechnern die Laufzeiten und Variablenrestriktionen von R/Stata etc. testen. Vorsicht beim Testen der Performance von "R"! Im R-Umfeld (R-base und über 14.000 Packages :shock: ) gibt es für jedes Problem eine Vielzahl von Lösungen. Die Unterschiede sind für kleine Datensätze hä...
von Athomas
Sa Sep 28, 2019 1:19 pm
Forum: Allgemeines zu R
Thema: An opinionated view of the Tidyverse "dialect" of the R language, and its promotion by RStudio.
Antworten: 31
Zugriffe: 298

Re: An opinionated view of the Tidyverse "dialect" of the R language, and its promotion by RStudio.

Einige Funktionen erwarten data.frame als Eingabe (und kein data.table oder tibble). Wenn man trotzdem ein tibble oder data.table übergibt kann das zu Nebeneffekten führen die man eventuell nicht bemerkt... Interessant, in Bezug auf data.table ist mir das neu - und ich finde es erstaunlich, weil ja...
von Athomas
Fr Sep 27, 2019 4:58 pm
Forum: Deskriptive Statistik
Thema: Kreuztabelle und Summenprozent
Antworten: 6
Zugriffe: 116

Re: Kreuztabelle und Summenprozent

Bist Du Dir sicher, dass Du Deine Daten ordentlich beschrieben hast - und dass die Funktion "table" das macht, was Du möchtest? Ich habe den Eindruck, dass das Triple (ID, Zeit, Versuch) schon eine Art H-Tabelle ist: 1, wenn die fragliche Person zu dem Zeitpunkt den Versuch durchgeführt hat, Null so...
von Athomas
Fr Sep 27, 2019 10:29 am
Forum: Allgemeines zu R
Thema: An opinionated view of the Tidyverse "dialect" of the R language, and its promotion by RStudio.
Antworten: 31
Zugriffe: 298

Re: An opinionated view of the Tidyverse "dialect" of the R language, and its promotion by RStudio.

Mein Rat: Sobald ihr aus dem tidyverse rausgeht: zu data.frame konvertieren! (Gilt aber auch für data.tables). Ich bin mir nicht sicher, ob ich den Klammerausdruck richtig verstehe - aber was könnte jemanden dazu bringen, die data.table-Eigenschaft abzuklemmen und lediglich die data.frame-Komponent...