Die Suche ergab 1675 Treffer

von bigben
Mi Apr 19, 2017 11:03 am
Forum: Allgemeines zu R
Thema: Mann-Whitney-Wilcoxon mit unterschiedlich großen Daten, Wahl des richtigen Tests zum Vergleich der Mittelwerte
Antworten: 10
Zugriffe: 3322

Re: Mann-Whitney-Wilcoxon mit unterschiedlich großen Daten, Wahl des richtigen Tests zum Vergleich der Mittelwerte

Hi! Welcher Datensatz im Mittel die höheren Werte hat sagt Dir der Vergleich der Mittelwerte, welcher den höheren Median hat, sagt Dir der Vergleich der Mediane. Ob die Verteilungen ähnlich sind oder verschieden (einer eingipfelig, der andere zweigipfelig? der eine weit streuend, der anderen weniger...
von bigben
Mi Apr 19, 2017 10:56 am
Forum: Allgemeines zu R
Thema: Der paradoxe R Performance Pfad
Antworten: 19
Zugriffe: 3614

Re: Das R Performance Paradoxon

Hi consuli, ich habe noch nicht ganz verstanden, was an der Beobachtung Deiner Lernkurve jetzt ein Paradoxon darstellt. Ich kann aber ganz unbedingt unterstreichen, dass das Erlernen verschiedener Programmiersprachen, wenn Sie denn gut gewählt sind, lehrreich auch für das Verwenden anderer, schon be...
von bigben
Di Apr 18, 2017 4:03 pm
Forum: Statistik mit R
Thema: Gruppenzuordnung von Datensätzen auf Basis von Keywords für SEO Anwendung
Antworten: 6
Zugriffe: 1447

Re: Gruppenzuordnung von Datensätzen auf Basis von Keywords für SEO Anwendung

Hi! Die Gruppen, das fehlt noch in der Beschreibung, sollen untereinander möglichst ähnlich sein. Ist Dein Plot das Ergebnis einer Hauptkomponentenanalyse? Du solltest lieber eine Clusteranalyse mit hclust() rechnen, bei der Du nicht die Zahl der Cluster vorgeben musst. Ein Dendrogramm nach Hierarch...
von bigben
Di Apr 18, 2017 1:27 pm
Forum: Statistik mit R
Thema: Gruppenzuordnung von Datensätzen auf Basis von Keywords für SEO Anwendung
Antworten: 6
Zugriffe: 1447

Re: Gruppenzuordnung von Datensätzen auf Basis von Keywords für SEO Anwendung

Hallo Mamgoo, herzlich willkommen im R-Forum. Ziel ist es, die ID`s einer von z.B. 10 Gruppen zuzuordnen. Ich habe es mit der Clusteranalyse probiert Ohne weitere Beschreibung, was die 10 Gruppen bedeuten sollen, hätte ich auch als erstes an eine Clusteranalyse gedacht. Wobei ich 300 Zeilen mit zufä...
von bigben
Di Apr 18, 2017 1:15 pm
Forum: Allgemeines zu R
Thema: Mann-Whitney-Wilcoxon mit unterschiedlich großen Daten, Wahl des richtigen Tests zum Vergleich der Mittelwerte
Antworten: 10
Zugriffe: 3322

Re: Mann-Whitney-Wilcoxon mit unterschiedlich großen Daten, Wahl des richtigen Tests zum Vergleich der Mittelwerte

Vielen, vielen Dank für die Antworten. Sehr gerne. Ich habe jetzt den T-Test (independent 2-group) durchgeführt und einen p-Wert < 2.2e-16 erhalten. Wenig überraschend, aber immer wieder schön. Ich würde nun gerne argumentieren, dass es nicht sinnvoll ist den T-Test hier anzuwenden. So war eigentli...
von bigben
Di Apr 18, 2017 12:37 pm
Forum: Allgemeines zu R
Thema: Shiny-Hype?
Antworten: 16
Zugriffe: 4053

Re: Shiny-Hype?

"Welches ist das richtige Tool für den richtigen Job?" Da musst Du Dir die nächsten Jahre überhaupt keine Gedanken machen. Die Firmen sind vor ein paar Jahren angefangen auch Soziologen und andere Sozialwissenschaftler (ohne spezielle Statistikerfahrungen) als Data Scientist einzustellen, weil sie ...
von bigben
Do Apr 13, 2017 4:05 pm
Forum: Regressionsmodelle
Thema: Fallzahl bei linerarer Regression
Antworten: 5
Zugriffe: 1560

Re: Fallzahl bei linerarer Regression

Wenn alle Datenreihen genutzt wurden, geht das so, wie Jörg sagt. Wenn nur ein Teil der Reihen genutzt wurde, dann kann man das aus den von den meisten Regressionfunktionen ausgegebenen Freiheitsgraden schließen, oder man schaut, wieviele Residuen berechnet wurden. Konkret kann man nur antworten, we...
von bigben
Do Apr 13, 2017 3:56 pm
Forum: Allgemeines zu R
Thema: Mann-Whitney-Wilcoxon mit unterschiedlich großen Daten, Wahl des richtigen Tests zum Vergleich der Mittelwerte
Antworten: 10
Zugriffe: 3322

Re: Mann-Whitney-Wilcoxon mit unterschiedlich großen Daten, Wahl des richtigen Tests zum Vergleich der Mittelwerte

wenn die Daten von A (3 Mio) und B (1,5 Mio) Werte zwischen 0 bis 50 annehmen können. Reicht es „nur“ den Mittelwert zu erheben? nein, Du brauchst für den t-Test noch die Standardabweichungen und die Freiheitsgrade: https://de.wikipedia.org/wiki/Zweistichproben-t-Test#Zweistichproben-t-Test_f.C3.BC...
von bigben
Do Apr 13, 2017 3:39 pm
Forum: Allgemeines zu R
Thema: Mann-Whitney-Wilcoxon mit unterschiedlich großen Daten, Wahl des richtigen Tests zum Vergleich der Mittelwerte
Antworten: 10
Zugriffe: 3322

Re: Mann-Whitney-Wilcoxon mit unterschiedlich großen Daten, Wahl des richtigen Tests zum Vergleich der Mittelwerte

Mit dem ordentlich meinte ich nur, ob ich zunächst einen Test durchführen muss, ob die Werte einer Normalverteilung folgen, um den T-Test durchführen zu dürfen. Da kommt es sehr darauf an, was Dein Lehrer/Professor glaubt. Ich halte das grundsätzlich für nicht sinnvoll. Wenn wir von kleinen Datensä...
von bigben
Do Apr 13, 2017 2:37 pm
Forum: Allgemeines zu R
Thema: Mann-Whitney-Wilcoxon mit unterschiedlich großen Daten, Wahl des richtigen Tests zum Vergleich der Mittelwerte
Antworten: 10
Zugriffe: 3322

Re: Mann-Whitney-Wilcoxon mit unterschiedlich großen Daten, Wahl des richtigen Tests zum Vergleich der Mittelwerte

Hallo LeaNie, die Fehlermeldung könnte darauf hindeuten, dass Du ein "~" verwendet hast, wo ein Komma richtig gewesen wäre. Was den Vergleich der Mittelwerte angeht: Je größer die zu untersuchenden Gruppen sind, umso robuster wird der t-Test. Bei 30 Mio gegen 1,5 Mio kannst Du den t-Test anwenden. D...