4. Logistische Regression

Stephanie Klupp
Flashcards by Stephanie Klupp, updated more than 1 year ago
Stephanie Klupp
Created by Stephanie Klupp over 5 years ago
19
2

Description

Statistik Statistik (Regressionsanalytische Verfahren) Flashcards on 4. Logistische Regression, created by Stephanie Klupp on 12/17/2015.

Resource summary

Question Answer
Was is Zweck/Ziel einer Logistischen Regression? Welche Skalierungen haben die Zielvariable und die Prädiktorenvariabeln? Vorhersage einer nominalen Variable durch intervallskalierte und/oder nominale Prädiktoren
Was ist der Unterschied zwischen der Diskriminanzanalyse und der Logistischen Regression? Logisitische Regression: hat eine kleine Power, ist weniger streng, hat keine Verteilungsvoraussetzung (weniger Anspruchsvoll), kann auch nominale Prädiktoren verwenden
Man muss der Verhältnis von Anzahl Fällen und Anzahl Prädiktoren beachten. Was ist das Problem? Wie kann man dieses Lösen? Problem: Overfitting Lösung: Katergorien zusammenfassen oder unwichtige Prädiktoren eleminieren
Was ist der Unterschied zwischen P(Wahrscheinlichkeit) und Odds? P = Wahrscheinlichkeit für den Prädiktor (Anzahl krank / Anzahl gesamt) = 0 < A < 1 Odds = Chance für den Prädiktor (Anzahl krank / Anzahl gesund) = 0 < A
Wie sieht die Gleichung aus? Und deren logarithmische Umformung? ln(odds) = B0 + B1*X1 + B2*X2 odds = e^B0 + e^B1*X1 + e^B2*X2
Was passiert wenn X1 um 1 zunimmt? (X1 + 1) ln(odds) ändert sich additiv um B1 Odds ändert sich multiplikativ um e^B1
Was bedeutet B? B0 = Y-Achsenabschnitt, wirkt sich auf die Höhe der Wahrscheinlichkeit aus Bi ist der Indikator wie Wichtig X1 ist, wirkt sich auf die Steigung aus
Was passiert wenn B1 = 0? Was passiert wenn B1 + 1? ln(odds) ändert sich additiv um 0 Odds ändert sich multiplikativ um e^0 = 1 => keine Veränderung B1+1 => erhöht die Steigung und Wichtigkeit von X
Was ist -2 Log likelihood? - Devianz - Wie gut die Modellanpassung ist - Wird mit Chiquadrat verglichen - Ziel: je kleiner desto besser
Was ist Nagelkerke R^2? - Pseudo R Statistik - Mass für den Anteil erklärter Varianz - Wie gut die Variable die Odds vorhersagt - Eindeutiger als Cox-Snell-R^2 - Ziel: R^2 > 0.5 (sehr gut) > 0.4 (gut) > 0.2 (akzeptable)
Tabelle Realität vs. Vorhergesagt Vorhergesagt: Realität: Krank Gesund Krank R + F- Gesund F+ R-
Was zeigt die ROC Kurve? Zusammenhang zwischen Sensitivität (Anzahl R+ / Anzahl Krank) (Ziel: möglichst gross) & 1-Spezifizität (Anzahl F+ / Anzahl Gesund) (Ziel: möglichst klein) - Ziel: Area under the curve > Zufall (0.5)
Tabelle Variables in the Equation: Interpretation der Effekte von nominalen vs. intervallskalierten Daten: Nominal: - B Unterschied zur Referenzkategorie (meistens die kleinste) - Betrachung der Referenzkategorie von Wald & Signifikanz Intervall: - Vorsichtig wegen der Skalierung - Aufnahme ins Modell -> Wichtigkeit
Show full summary Hide full summary

Similar

Statistik Theorie
Clara Vanessa
Sachversicherungen
Christine Zehnder
Haftpflichtversicherungen
Christine Zehnder
Unfallversicherung
Christine Zehnder
Statistik und Differenzialgleichungen
barbara91
Statistik
vemi1994
beschreibende Statistik
birburlue
METH STADA SS 2019
Caroline Hannah
Statistik
Lily Lightman
Erfassung von Zusammenhängen: 4-Felder Tafeln
menes
Karteikarten Quantitative Forschungsmethoden
goconqr5396