Hallo,
angenommen ich möchte mit Hilfe einer Regression die Determinanten der Veränderung eines Credit Ratings untersuchen. Meine unabhängigen Variablen wären bspw. Verschuldungsgrad, Größe des Unternehmen usw. Ich hätte für jede Beobachtung eine Datumsangabe vorliegen und möchte drei Datumsbereiche mit in die Regression integrieren, um zu untersuchen welchen Einfluss die Finanzkrise hat. Für diesen Zweck würde ich dann drei Dummyvariablen "VOR", "WÄHREND" und "NACH" bilden. "VOR" würde dann den Wert 1 annehmen, wenn das Datum vor Beginn der Finanzkrise war, "WÄHREND" den Wert 1 wenn es innerhalb des Zeitraums der Finanzkrise war und "NACH" den Wert 1, wenn das Datum welches der Beobachtung zugeordnet ist, nach der Finanzkrise einzuordnen ist. Ist diese Vorgehensweise mit den drei Dummyvariablen legitim oder hält sie etwaige Nachteile bereit? Bei der Durchführung der Regression erhalte ich für den Koeffizienten der Variable NACH innerhalb des Outputs nur die Ausgabe "NA", wobei ich mir nicht sicher bin wo das Problem liegt
Datumsbereich in Regression durch Dummyvariablen integrieren?
Moderator: EDi
-
- Beiträge: 15
- Registriert: Do Sep 05, 2019 5:07 pm
Re: Datumsbereich in Regression durch Dummyvariablen integrieren?
Hmmm, ja - ich auch nicht!Freddy19911 hat geschrieben: ↑Sa Okt 12, 2019 9:48 am Bei der Durchführung der Regression erhalte ich für den Koeffizienten der Variable NACH innerhalb des Outputs nur die Ausgabe "NA", wobei ich mir nicht sicher bin wo das Problem liegt
-
- Beiträge: 15
- Registriert: Do Sep 05, 2019 5:07 pm
Re: Datumsbereich in Regression durch Dummyvariablen integrieren?
Sorry, den letzten Satz hätte ich mir sparen können. Ich dachte der Fehler hängt vielleicht mit einem unpassenden Vorgehen bzgl. der Integration der Datumsbereiche zusammen
Re: Datumsbereich in Regression durch Dummyvariablen integrieren?
Du lässt natürlich viel zu wenig raus, um konkrete Hinweise geben zu können.
Ich habe mich nochmal an meine R-Anfängerzeit erinnert, da habe ich mich auch mit "Arbeitsnachweisen" zurückgehalten - weil ich mich nicht als R-Honk zu erkennen geben wollte !
Heute kann ich Dir sagen, dass Du keine Hemmungen haben musst - wir sind hier durchaus an Erstaunliches und Schreckliches gewöhnt !
Dein Vorgehen scheint mir erstmal o.k., zum konkreten Fehler lässt sich aus den bekannten Gründen nichts sagen!
Ich habe mich nochmal an meine R-Anfängerzeit erinnert, da habe ich mich auch mit "Arbeitsnachweisen" zurückgehalten - weil ich mich nicht als R-Honk zu erkennen geben wollte !
Heute kann ich Dir sagen, dass Du keine Hemmungen haben musst - wir sind hier durchaus an Erstaunliches und Schreckliches gewöhnt !
Dein Vorgehen scheint mir erstmal o.k., zum konkreten Fehler lässt sich aus den bekannten Gründen nichts sagen!
-
- Beiträge: 15
- Registriert: Do Sep 05, 2019 5:07 pm
Re: Datumsbereich in Regression durch Dummyvariablen integrieren?
Stimmt, ich hätte ruhig ein wenig mehr Details preisgeben können
Nochmal zu meinem Vorgehen: Ich möchte untersuchen, was Änderungen des Credit Ratings determiniert. Mein Modell beinhaltet also bspw. die Variablen Verschuldungsgrad, Unternehmensgröße usw. Ich habe einen Datensatz mit Beobachtungen unterschiedlicher Ratingänderungen pro Unternehmen vorliegen und für jede Beobachtung den Zeitpunkt der Ratingändergung. Nun möchte ich zusätzlich untersuchen welchen Einfluss die Perioden "Vor Finanzkrise", "Nach Finanzkrise" und "Während Finanzkrise" haben. Das Problem dabei: Definiere ich die Variablen so wie in meinem Eingangspost erwähnt, erhalte ich ein NA für die Variable NACH. Das erscheint mir auch logisch: Die Variable liefert keinerlei Informationen zur Regression, die nicht durch die anderen beiden schon geliefert werden. Wenn die anderen beiden Variablen den Wert 0 annehmen, ist die Ratingänderung weder Vor, noch während der Finanzkrise einzuordnen. Sie muss also danach geschehen sein. Demnach ist die Variable NACH doch überflüssig oder sehe ich das falsch?
Bei bedarf kann ich auch den r code integrieren, wobei der im Prinzip nur aus der Regressionsgleichung besteht
Nochmal zu meinem Vorgehen: Ich möchte untersuchen, was Änderungen des Credit Ratings determiniert. Mein Modell beinhaltet also bspw. die Variablen Verschuldungsgrad, Unternehmensgröße usw. Ich habe einen Datensatz mit Beobachtungen unterschiedlicher Ratingänderungen pro Unternehmen vorliegen und für jede Beobachtung den Zeitpunkt der Ratingändergung. Nun möchte ich zusätzlich untersuchen welchen Einfluss die Perioden "Vor Finanzkrise", "Nach Finanzkrise" und "Während Finanzkrise" haben. Das Problem dabei: Definiere ich die Variablen so wie in meinem Eingangspost erwähnt, erhalte ich ein NA für die Variable NACH. Das erscheint mir auch logisch: Die Variable liefert keinerlei Informationen zur Regression, die nicht durch die anderen beiden schon geliefert werden. Wenn die anderen beiden Variablen den Wert 0 annehmen, ist die Ratingänderung weder Vor, noch während der Finanzkrise einzuordnen. Sie muss also danach geschehen sein. Demnach ist die Variable NACH doch überflüssig oder sehe ich das falsch?
Bei bedarf kann ich auch den r code integrieren, wobei der im Prinzip nur aus der Regressionsgleichung besteht
Re: Datumsbereich in Regression durch Dummyvariablen integrieren?
Also, ich würde mir einen Faktor "Zeitabschnitt" mit den Ausprägungen "vor", "mittendrin" und "danach" definieren - daraus bastelt R dann selbst die Dummyvariablen...
Am besten wäre tatsächlich, den kompletten Code mit Daten (falls Du sie zeigen darfst) hier einzubringen.
Man kann auch bei der Regressionsgleichung einiges falsch/suboptimal machen...
Am besten wäre tatsächlich, den kompletten Code mit Daten (falls Du sie zeigen darfst) hier einzubringen.
Man kann auch bei der Regressionsgleichung einiges falsch/suboptimal machen...