Variablen zusammenführen
Verfasst: Mo Sep 10, 2018 10:08 am
Hallo ihr Lieben,
ich habe im Moment mit der Aufbereitung meiner Daten zwei Probleme. Ich habe von Patienten Vollblutproben abgenommen und dieses nun analysiert. Bei manchen Patienten hat das Serum aus der ersten Probe nicht ausgereicht, sodass ich die zweite Probe verwenden musste. Das Programm das ich verwendet habe spuckt mir dann 2 Variablen zur gleichen Versuchsperson innerhalb eines Datensatzes aus, ungefähr so: VPN0001 und VPN0002second_run. Ich würde gerne, dass alle Daten innerhalb von VPN0001 auftauchen. Das matchen gestaltet sich aber schwer, da die Variablen unterschiedlich heißen und nicht in zwei Datensätzen sind und gleich sind. Würde es eventuell Sinn machen, den Mittelwert beider Variablen zu berechnen, da ich jeweils auf der anderen Variable sowieso Missings habe?
Das zweite Problem ist, dass ich psychologische Daten der Versuchspersonen habe, in denen der Versuchscode (leider) anders benannt wurde, da ich die nicht selbst erhoben habe. Das heißt ich habe einen Datensatz mit Serumwerten, wo die Versuchspersonen z.B. als Code XY0001 haben und einen Datensatz in dem die Versuchpersonen YZ0001 heißen, wobei die Nummerendungen sich jeweils entsprechen. Jetzt bin ich auf der Suche nach einer intelligenten Lösung die Datensätze anhand der Variable "Code" zusammenzufassen, ohne, dass ich jeden Fall händisch umbenennen muss. Gibts da von euch Vorschläge?
Liebe Grüße aus der Datenaufbereitungs-Hölle
Max
ich habe im Moment mit der Aufbereitung meiner Daten zwei Probleme. Ich habe von Patienten Vollblutproben abgenommen und dieses nun analysiert. Bei manchen Patienten hat das Serum aus der ersten Probe nicht ausgereicht, sodass ich die zweite Probe verwenden musste. Das Programm das ich verwendet habe spuckt mir dann 2 Variablen zur gleichen Versuchsperson innerhalb eines Datensatzes aus, ungefähr so: VPN0001 und VPN0002second_run. Ich würde gerne, dass alle Daten innerhalb von VPN0001 auftauchen. Das matchen gestaltet sich aber schwer, da die Variablen unterschiedlich heißen und nicht in zwei Datensätzen sind und gleich sind. Würde es eventuell Sinn machen, den Mittelwert beider Variablen zu berechnen, da ich jeweils auf der anderen Variable sowieso Missings habe?
Das zweite Problem ist, dass ich psychologische Daten der Versuchspersonen habe, in denen der Versuchscode (leider) anders benannt wurde, da ich die nicht selbst erhoben habe. Das heißt ich habe einen Datensatz mit Serumwerten, wo die Versuchspersonen z.B. als Code XY0001 haben und einen Datensatz in dem die Versuchpersonen YZ0001 heißen, wobei die Nummerendungen sich jeweils entsprechen. Jetzt bin ich auf der Suche nach einer intelligenten Lösung die Datensätze anhand der Variable "Code" zusammenzufassen, ohne, dass ich jeden Fall händisch umbenennen muss. Gibts da von euch Vorschläge?
Liebe Grüße aus der Datenaufbereitungs-Hölle
Max