Mehrfachnennungen

Alles zum Thema der beschreibenden Statistik

Moderator: jogo

Deinhard
Beiträge: 6
Registriert: So Mai 24, 2020 10:24 am

Mehrfachnennungen

Beitrag von Deinhard »

Hallo Zusammen,

ich habe folgendes Problem, was ich augenblicklich gedanklich nur über aufwendige Verknüpfungen lösen kann.

Situation: Ich habe 10 Objekte. Aus diesen Objekten sollen von den Befragten 3 Objekte ausgewählt werden.
Diese 3 ausgewählten Objekte sollen von den Befragten anhand von insgesamt 35 (0,1 codiert) vorgegebenen Aussagen (Listenauswahl mit einmal 15 und einmal 20 Aussagen) beschrieben werden.

Datenstruktur:
Fall Objekt 1 Aussage 1 bis Aussage 35 Objekt 2 Aussage 1 bis Aussage 35 Objekt 3 Aussage 1 bis Aussage 35

Die Aussagen sind als numerische Werte 0/1 erfasst. Für jeden Fall unterscheidet sich die Auswahl der Objekte, die Reihenfolge der Objekte sowie die Auswahl von Aussagen.

Nun möchte ich die Objekte im Tabellenkopf und die Aussagen in der Vorspalte (Spalten-%).
Aussagen/ Objekt Objekt 1 Objekt 2 ... Objekt 10
Aussage 1
Aussage 2
:
Aussage 35

Die Spalten-% sollen auf Basis der Fälle und Nennungen erfolgen.

Hat hierfür jemand eine Idee für mich. Bin für jeden Hinweis dankbar. Vielen Dank und viele Grüße
bigben
Beiträge: 2777
Registriert: Mi Okt 12, 2016 9:09 am

Re: Mehrfachnennungen

Beitrag von bigben »

Hallo Deinhard,

ich kann leider nicht sagen, dass ich das verstanden hätte.



Deinhard hat geschrieben: So Mai 24, 2020 12:35 pm Nun möchte ich die Objekte im Tabellenkopf und die Aussagen in der Vorspalte (Spalten-%).
Aussagen/ Objekt Objekt 1 Objekt 2 ... Objekt 10
Aussage 1
Aussage 2
:
Aussage 35

Die Spalten-% sollen auf Basis der Fälle und Nennungen erfolgen.
Ist das die Form, wie die Daten vorliegen oder die, in die sie gebracht werden sollen?Wenn letzteres, wie genau liegen sie vor?

LG,Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Deinhard
Beiträge: 6
Registriert: So Mai 24, 2020 10:24 am

Re: Mehrfachnennungen

Beitrag von Deinhard »

Hallo Bernhard,

vielen Dank für Deine Antwort.

Die Daten liegen fallweise vor (Anlage). Das Ergebnis soll in einer Tabelle dargestellt werden (ebenfalls Anlage). Ich finde keine einfache Lösung, die 10 Objekte mit den Aussagen richtig zu kombinieren. Die Angaben nach den Objekten zu aggregieren wäre eine Möglichkeit (aggregate). Eine andere wäre Aussagen und Objekte miteinander zu kombinieren. Das würde jedoch mehrere Schleifen bedeuten und eine Vielzahl neuer Variablen, die dann wieder in Tabellenform gebracht werden muss. Ich denke glaube ich zu kompliziert.
R-Objekte.pdf
(174.75 KiB) 79-mal heruntergeladen



Liebe Grüße
bigben
Beiträge: 2777
Registriert: Mi Okt 12, 2016 9:09 am

Re: Mehrfachnennungen

Beitrag von bigben »

Ja, das sieht in der Tat schwer aus. Daten die in einer Tabelle in einem PDF stecken - da kommt man kaum dran.

Mal angenommen, es gibt die Daten auch in einem brauchbaren Format, dann finde ich sie immer noch nicht ausreichend beschrieben.
Ich sehe da eine Fallnummer. Ist ein Fall das gleiche wie ein Befragter??
Ich sehe da eine Spalte "Objekt 1", die in Fall 3 den Wert zehn annimmt. Was heißt das?
Und bezüglich "Die Spalten-% sollen auf Basis der Fälle und Nennungen erfolgen." bin ich mir auch noch unsicher, was das genau bedeutet.
Hat hierfür jemand eine Idee für mich.
Besorg Dir die Daten in einem Datenformat, nicht in einem Druckformat.

Gruß,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Deinhard
Beiträge: 6
Registriert: So Mai 24, 2020 10:24 am

Re: Mehrfachnennungen

Beitrag von Deinhard »

Hallo Bernhard,

scheinbar hast Du es nicht richtig interpretiert. Die Daten sind von mir eindeutig beschrieben. Jede Zeile ist ein Fall mit jeweils 3 Spalten zu den gewählten Objekten und den dazugehörigen Aussagen, die mit 0 = "trifft nicht zu" und 1 = "trifft zu" codiert sind. Die Anlage sollte die Struktur des Datensatzes nur beschreiben. Die Daten liegen als Dataframe vor. Das Objekt X kann als 1. gewähltes, 2. gewähltes oder 3. gewählte Objekt auftauchen. Das hatte ich auch bereits beschrieben:

Situation: Ich habe 10 Objekte. Aus diesen Objekten sollen von den Befragten 3 Objekte ausgewählt werden.
Diese 3 ausgewählten Objekte sollen von den Befragten anhand von insgesamt 35 (0,1 codiert) vorgegebenen Aussagen beschrieben werden.

Das Problem: Sowohl die Objekte (1 - 10 Codiert) als auch die Aussagen (35 Aussagen jeweils 0/1 codiert) sind Mehrfachnennungen. Es geht also darum, die Objekte und dazugehörigen Aussagen adäquat zu verknüpfen, so dass Spalten-% und entsprechende andere Tests (SE) durchgeführt werden können.

Das Paket (eben gefunden) MRCV: Methods for Analyzing Multiple Response Categorical Variables bietet m. E. auch keine Lösung. Eine Lösung wäre die Daten nach den Objekten sukzessive zu aggregieren. Eine andere über eine Vielzahl von neuen Variablen, die die Objekte mit den Aussagen verknüpfen (10 X 35). Alles dies scheint mir jedoch zu umständlich.

Bitte jetzt nur noch ernst gemeinte Antworten. Vielen Dank und liebe Grüße
bigben
Beiträge: 2777
Registriert: Mi Okt 12, 2016 9:09 am

Re: Mehrfachnennungen

Beitrag von bigben »

Och, das war von mir alles ernst gemeint. Ob jetzt ein "Befragter" das gleiche ist wie "ein Fall" war eine ernst gemeinte Frage. In Deinem PDF taucht die Spaltenüberschrift "Aussage 1" mehrfach auf. Ich hoffe sehr, dass Du in einem Dataframe keine mehrfach auftauchenden Spaltenüberschriften hast. Die Bitte, das vorliegende Datenformat zu beschreiben war ernst gemeint - wenn Du mit einem PDF statt mit einem Dataframe antwortest, können wir nciht wissen, wie die Spalten im Dataframe heißen. Was exemplarisch der Wert 10 in der Zeile3 in der Spalte Objekt 1 bedeutet, war eine ernst gemeinte Frage.
Bitte jetzt nur noch ernst gemeinte Antworten.
Heißt wohl, dass ich mich raushalten soll. Tue ich gerne.
Viel Erfolg noch,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Deinhard
Beiträge: 6
Registriert: So Mai 24, 2020 10:24 am

Re: Mehrfachnennungen

Beitrag von Deinhard »

bigben hat geschrieben: So Mai 24, 2020 10:20 pm Och, das war von mir alles ernst gemeint. Ob jetzt ein "Befragter" das gleiche ist wie "ein Fall" war eine ernst gemeinte Frage. In Deinem PDF taucht die Spaltenüberschrift "Aussage 1" mehrfach auf. Ich hoffe sehr, dass Du in einem Dataframe keine mehrfach auftauchenden Spaltenüberschriften hast. Die Bitte, das vorliegende Datenformat zu beschreiben war ernst gemeint - wenn Du mit einem PDF statt mit einem Dataframe antwortest, können wir nciht wissen, wie die Spalten im Dataframe heißen. Was exemplarisch der Wert 10 in der Zeile3 in der Spalte Objekt 1 bedeutet, war eine ernst gemeinte Frage.
Bitte jetzt nur noch ernst gemeinte Antworten.
Heißt wohl, dass ich mich raushalten soll. Tue ich gerne.
Viel Erfolg noch,
Bernhard
Noch einmal - die PDF-Datei dient zur Illustration der Datenstruktur.
1. Das die Daten fallweise vorliegen habe ich bereits zweimal beschrieben.
2. Aussage 1 bis Aussage 35 tauchen mehrmals aus, weil für jedes Objekt die gleiche Auswahl von Aussagen zur Verfügung steht. Das die Variablen im Dataframe anders heißen ist trivial (Aussage1_für_Objekt 1, Aussage1_für_Objekt_2 etc.).

Egal vielen Dank für Eure Unterstützung.
Athomas
Beiträge: 769
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Mehrfachnennungen

Beitrag von Athomas »

Schau Dir mal an, was zum Stichwort "reshape" in R alles angeboten wird.
Hättest Du konkrete Daten geliefert, hätten wir auch konkret antworten können.

Wenn Du noch keine Daten hast, musst Du halt was zum Ausprobieren basteln - oder soll bigben das für Dich tun :lol: ?
Egal vielen Dank für Eure Unterstützung.
Nicht dafür!
Deinhard
Beiträge: 6
Registriert: So Mai 24, 2020 10:24 am

Re: Mehrfachnennungen

Beitrag von Deinhard »

Vielen Dank Athomas,

das Problem mit Daten ist, dass es eben teilweise nicht öffentliche Daten sind. Gleichwohl habe ich jetzt einen Beispieldatensatz mit Zufallsauswahl angefügt (als .txt und .Rdata).
"reshape" werde ich mir genauer anschauen. Vielen Dank und viele Grüße

Objekt 1 bis 3: Objekte, die nach Präferenz ausgewählt werden (10 Objekte stehen zur Auswahl)
Statm1_1 bis Statm1_35 für Objekt 1
Statm2_1 bis Statm2_35 für Objekt 2 etc.

Vielen Dank und LG
Dateianhänge
Red.txt
(6.75 KiB) 71-mal heruntergeladen
Red.zip
(1.44 KiB) 54-mal heruntergeladen
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Mehrfachnennungen

Beitrag von EDi »

So hier?

Code: Alles auswählen


df <- read.table("http://forum.r-statistik.de/download/file.php?id=1001", 
                 sep = ";",
                 header = TRUE)
df

# number of columns
n_cols <- ncol(df)
# number of chunks
n_chunks <- nc / 36
# vector indicating chunk
chunks <- rep(seq_len(n_chunks), each = 36)

# split chunks into list
l <- lapply(unique(chunks), function(chunk) {
  # select j´chunk
  df <- df[ , chunks == chunk]
  # write object to separate columns
  df$obj <- chunk
  # rename Object column
  names(df)[1] <-  "Objekt"
  # rename other columns
  names(df) <- gsub(paste0("STATM", chunk), "STATM", names(df))
  df
})

# combine the clean dataset
newdf <- do.call(rbind, l)
str(newdf)
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten