Logistisches x Kennzahlen Regressionsmodell

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
michey777

Logistisches x Kennzahlen Regressionsmodell

Beitrag von michey777 »

Moin zusammen,
ich habe mal ein Thema bzgl. Logistischer x Kennzahlen Regressionsmodell und hoffe mir kann jemand helfen.
Thema meiner Untersuchung: Aufbau eines Insolvenzprognosemodells anhand mehrerer Schritte.

Folgender Schritte möchte ich durchgehen:
1. Logistisches 2 Kennzahlen- Regressionsmodell (binär ist inso=0 /1) inkl. Hinzuziehung von bUG (mod. Kennzahl zur Abb. der Unternehmensgröße)
2. Prüfung der selben Regressionsmodelle unter Einbeziehung von Dummy Variable (bran=0/1) [Ergebnis: kann emp. Schätzgüte verbessert werden?]
3. Einbeziehung einer dritten Kennzahlenvariable
4. Abgleich des "besten" Insolvenzprognosemodell mit Altman's Z''- Score (Z'' = 6,56*wcb + 3,26*ebgbi + 6,72*ebbi + 1,05*bekvb)

mein Datensatz ist folgender:

Code: Alles auswählen

'data.frame':	5574 obs. of  20 variables:
 $ Nummer: num  1 2 3 4 5 6 7 8 9 10 ...
 $ inso  : num  1 1 1 1 1 1 1 1 1 1 ...
 $ fkq   : num  NA 0.845 NA NA NA ...
 $ ebaue : num  NA 0.0198 0.0115 NA NA ...
 $ cfue  : num  NA -0.00426 -0.04935 NA NA ...
 $ dvgr  : num  NA NA NA NA NA ...
 $ ebue  : num  NA 0.0196 0.0115 NA NA ...
 $ ebzi  : num  NA NA NA NA NA ...
 $ fmb   : num  NA 0.0379 0.0997 NA NA ...
 $ fmkfb : num  NA 0.152 0.22 NA NA ...
 $ juaf  : num  NA NA NA NA NA ...
 $ liqr2 : num  NA NA NA NA NA ...
 $ liqr3 : num  NA 2.91 2.21 NA NA ...
 $ vgr   : num  NA NA NA NA NA ...
 $ bekvb : num  NA 1.24 NA NA NA ...
 $ wcb   : num  NA NA NA NA NA ...
 $ ebbi  : num  NA 0.151 NA NA NA ...
 $ ebgbi : num  NA NA NA NA NA ...
 $ bUG   : num  NA -1.82 -1.89 NA NA ...
 $ bran  : num  0 0 0 0 0 0 0 0 0 0 ...
Ich habe nach langer Recherche im Internet folgenden code benutzt:
glm(formula= inso~ liqr2 + cfue + buG,family=binomial,data= salt)
Ergebnis war leider nur:

Code: Alles auswählen

Coefficients:
(Intercept)        liqr2         cfue          bUG  
   -2.80881     -0.04198     -4.10898      0.05545  

Degrees of Freedom: 1431 Total (i.e. Null);  1428 Residual
  (4142 observations deleted due to missingness)
Null Deviance:	    459.9 
Residual Deviance: 446.4 	AIC: 454.4
Positiv an dieser Formel ist, dass er mir die observations und meines Erachtens auch den "richtigen" Schätzer für liqr2 gibt. Ich verstehe nur nicht ganz, warum nicht auch die Kennzahl cfue einen Schätzer zwischen - und +1 ausweist.. Ich dachte auch des weiteren, dass für das entsprechende Log. Regressionsmodell die Accuracy Ratio (AR) angezeigt wird, da man doch anhand dieser das log. Regressionsmodell bewertet...

Vielen Dank für eure Hilfe und Unterstützung. Ich werde mich trotz des Hilferufs weiter auf die Suche nach einer möglichen Lösung machen.
Beigefügt auch nochmal das Template, welches ich mit den log. Regressions befüllen möchte...
michey777

Re: Logistisches x Kennzahlen Regressionsmodell

Beitrag von michey777 »

Hi zusammen,

ich denke ich bin schon einen guten Schritt weiter... hope so

Folgende Formel habe ich jetzt für die log. Regression verwendet:

Code: Alles auswählen

> modell <- as.formula("inso ~ liqr2 + cfue + bUG")
> logit <- glm(modell, family = binomial, data = salt)
> summary(logit)
Nun habe ich versucht die Somer's D-Statistik für die AR zu generieren.

Code: Alles auswählen

> predit<-fitted.values(modell)
> n=length(salt$inso)
> target<-rep(0,times=n)
> rcorr.cens(predit,target)
Error in rcorr.cens(predit, target) : y must have same length as x)
Ich bekomme aber oben aufgeführteten Error :( Weiß einer wie ich den beheben kann?

VG Micha
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Logistisches x Kennzahlen Regressionsmodell

Beitrag von EDi »

Ich bekomme aber oben aufgeführteten Error :( Weiß einer wie ich den beheben kann?
Wie man oben sehen kann, hast du NAs in den predictors.
Standardmäßig werden diese zeilenweise entfernt.
Deswegen ist predit nicht gleichlang wie target (Fehlermeldung!), welches ja die NA Reihen nicht rauswirft. Lösung? n auf die länge von predit setzen.
Ich verstehe nur nicht ganz, warum nicht auch die Kennzahl cfue einen Schätzer zwischen - und +1 ausweist
Wieso erwartest du das?
Ich dachte auch des weiteren, dass für das entsprechende Log. Regressionsmodell die Accuracy Ratio (AR) angezeigt wird, da man doch anhand dieser das log. Regressionsmodell bewertet...
Noch nie von dem Begriff gehört, bin aber auch in einer anderen Fachrichtung heimisch...
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten