|
|
Erstellt von Jolanda Burmeister
vor fast 8 Jahre
|
|
| Frage | Antworten |
| Welche problematischen Datenkonstellationen gibt es bei mult. Regression? | - Multikollinearität - Ausreißer und einflussreiche Datenpunkte |
| Was sind Ausreißer? | Werte, die sich stark von den restlichen Werten des Datensatzes unterscheiden sowohl auf Kriteriums-, als auch Prädiktorseite |
| Was können Ausreißer beeinflussen? | Regressionskoeffizienten und Standardfehler der geschätzten Regressionskoeffizienten |
| Wie werden Ausreißer auf Seiten des Kriteriums diagnostiziert? | Residuen (ym-ydachm) inspizieren |
| Was sind Voraussetzungen der mult. Regression? | 1. korrekte Spezifikation des Modells 2. Messfehlerfreiheit der unabh. Variablen 3. Homoskedastizität 4. Unabhängigkeit der Residuen 5. Normalverteilung der Residuen |
| Was versteht man unter "Korrekte Spezifikation des Modells"? | - Ist das Zusammenhangsmuster zwischen X und Y richtig inspiziert ? (linearer Zsmh.? irrelevante Prädikoren?=Overfitting) - Effekte kausal zu interpretieren? (Richtung des Effekts eindeutig interpretierbar? keine Konfundierung oder Alternativerklärung?) |
| Was versteht man unter "Messfehlerfreiheit der unabh. Variablen (Reliabilität)"? | - bei bivariater Regressionsanalyse: Messfehler von X führen zu Unterschätzung des wahren Regressionsgewichts - bei mult. Regression: Messfehler von X führen zu Unter- oder Überschätzung des wahren Regressionsgewichts - bei starken Messfehlern sollte man eher auf Modelle mit lat. Variablen zurückgreifen (Strukturgleichungsmodelle) - Diagnostik: die Rel. einer Messung lässt sich aus den Daten schätzen |
| Was versteht man unter "Homoskedastizität"? | bedeutet, dass die bedingten Residualvarianzen von Y in der Population alle identisch verteilt sind, d.h. die Varianz der Residuen (em) bei allen vorhergesagten Y-Werten identisch ist |
| Gegenteil von Homoskedastizität? | Heteroskedastizität = führt nicht zu einer Verzerrung der Punktschätzer der Regressionskoeffizienten sondern zu einer Verzerrung der Standardfehler (und damit zu Verzerrung des alpha-Fehlers) - Diagnostik: Residuenplot (Residuen gegen vorhergesagte Werte) |
| Was versteht man unter "Unabhängigkeit der Residuen"? | - Residuen stochastisch voneinander unabhängig - ist verletzt bei abh. Daten und hier. Daten - Verletzung der Unabhängigkeit führt zur Unterschätzung der Standardfehler einer Parameterschätzung und zu liberalen Tests - Lösung: hier. lin. Modelle |
| Was versteht man unter "Normalverteilung der Residuen"? | - bedingten und unbedingten Residuen in der Population einer Normalverteilung folgen - Diagnostik: Annahme kann mit Hilfe von graphischen Tests (Histogramm, PP-Plot) überprüft werden - Annahme verletzt: dennoch unverzerrte Punktschätzer der Regressionskoeffizienten - bei hinreichend großem n: keine gravierende Auswirkung auf Standardfehler - nicht-normalverteilte Residuen kann aber auch Hinweis auf fehlerspezifizierte Modelle sein - Möglichkeit: Transformation der Variablen |
| Fasse nochmal die Voraussetzungen der mult. Regression und die Konsequenzen bei Verletzung in Bezug auf Regressionskoeffizienten und Standardfehler zusammen. | |
| Wie überprüft man in SPSS die Linearitätsannahme? |
Image:
Lowess (binary/octet-stream)
|
| Wie diagnostiziert man Ausreißer auf Prädiktorseite ? | |
| Wie diagnostiziert man Ausreißer auf Kriteriumsseite ? | |
| Wie erhält man das Ausmaß, in dem sich die Schätzung der Regressionskoeffizienten durch Ausschluss von einzelnen Fällen verändert? | -DifBeta (unstand.) bzw. DifBetaS (stand.): kann für jede Person auf jeder Prädiktorvariable berechnet werden Werte mit DifBetaS > +/- 2 sind auffällig |
| Wie erhält man das Ausmaß, in dem sich die vorhergesagten Werte durch Ausschluss von einzelnen Fällen verändert? | DifFit (unstand.) bzw. DifFitS (stand.): kann für jede Person berechnet werden Werte mit DifFitS > +/- 1 auffällig Cooks-Distanz (appr. F-verteilt mit df1=k-1 und df2= n-k-1) kritische Schwelle: 0,50-Quantil |
Möchten Sie mit GoConqr kostenlos Ihre eigenen Karteikarten erstellen? Mehr erfahren.