Statistik

Description

Flashcards on Statistik, created by Anna Stammen on 28/01/2016.
Anna Stammen
Flashcards by Anna Stammen, updated more than 1 year ago
Anna Stammen
Created by Anna Stammen about 8 years ago
38
1

Resource summary

Question Answer
Statistik im privaten Alltag, in Politik und Gesellschaft junge Wissenschaft, die alle Lebensbereiche durchdringt - Soziologie - Psychologie - Medizin -Wirtschaft - fachübergreifend
Welches Jahr wurde zum internationalen Jahr der Statistik ausgerufen? 2013
Aufgaben der Statistik - Planung der Datenerhebung - Beschreibung und Visualisierung der Befunde - Identifikation von Auffälligkeiten - Ableitung von Schlüssen
Teilbereiche der Statistik - beschreibende (deskriptive) Statistik - schließende (induktive) Statistik
beschreibende Statistik - numerische + grafische Verfahren zur Charakterisierung + Präsentation von Daten - explorative Datenanalyse geht aus ihr hervor
Was ist das Ziel der beschreibenden Statistik ? Reduktion der Informationsfülle durch Aggregation auf wenige Kenngrößen
schließende Statistik - zieht Schlussfolgerungen aus Daten - Beschreibung der Schlussfolgerungen durch Wahrscheinlichkeitsrechnung - Schätzen von Modellparametern und Hypothesentest
Welcher Teilbereich der Statistik wird am meisten verwendet? beschreibende Statistik
Was ist das angestrebte Lernziel? Methodenkompetenz (passive und aktive)
Was ist passive Methodenkompetenz? - Kenntnis alternativer Möglichkeiten der Auswertung und Präsentation - Fähigkeit, statistische Informationen zu interpretieren
Was ist aktive Methodenkompetenz? - Handlungskompetenz - Fähigkeit, im Alltag Entscheidungen empirisch zu fundieren und nachvollziehbar zu kommunizieren
Statistische Einheiten oder Merkmalsträger - an ihnen werden Daten erhoben - Objekte, auf die sich die Untersuchungen beziehen (Personen, Bauteile, Tiere)
Grundgesamtheit - klar abgegrenzt - die Menge aller für Fragestellung interessanten statistischen Einheiten - ggf. aufgeteilt in Teilmengen
Merkmale oder Variablen - Eigenschaften statistischer Einheiten - werden in Großbuchstaben angegeben
Merkmalsausprägungen - mögliche Werte, die ein Merkmal annehmen kann - in Kleinbuchstaben
Stichprobe - Teilmenge der Grundgesamtheit
Urwerte, Primärdaten, Rohdaten beobachtete Werte für ein Merkmal
Urliste alle Urwerte in Listenform
Zufallsvariable wenn Ausprägung eines Merkmals als Zufallsvorgang interpretiert wird
Realisierung Ausprägung einer Zufallsvariablen
Stichprobenvariablen die Ausprägungen aller Elemente einer Stichprobe
Welche Merkmale können auftreten? - diskrete Merkmale : endlich viele, eindeutige Abstände, z.B. Anzahl Semester, Familienstand - stetige Merkmale : Zwischenwerte sind möglich, z.B. Zeit, Länge, Gewicht
Nominalskala Merkmalsausprägungen als Namen, z.B. Studienfach, keine natürliche Rangordnung
Ordinalskala - natürliche Rangordnung, z.B. Schulnoten
Verhältnisskala hat einen Nullpunkt, z.B. Geschwindigkeit
Intervallskala ohne Nullpunkt, z.B. Temperatur in C°
Absolutskala hat Nullpunkt und eine natürliche Einheit, z.B. Anzahl der Fachsemester
Typen der Merkmalsausprägungen - qualitatives Merkmal : Ausprägungen sind Kategorien, drückt Andersartigkeit aus, Nominal- oder Ordinalskaliert - quantitatives Merkmal : echte Zahlen, drücken Intensität aus, metrisch skaliert
Operationalisierung von Merkmalen - Festlegung von Messanweisungen - Objektivität. Reliabilität, Validität müssen gewährleistet sein
manifeste Variablen - direkt beobachtbar, z.B. Alter
latente Variablen - nicht direkt beobachtbar, z.B. Intelligenz
Datenerhebung Gewinnung von Daten
Erhebungsdesign Planung der Datengewinnung
Primärerhebung Daten werden eigens für Untersuchungsziel gewonnen
Sekundärerhebung Daten existieren schon
Tertiärerhebung aus Datenaggregaten existierender Daten
Arten der Datenerhebung - Befragung (mündlich/schriftlich) - Beobachtung - Experiment - Querschnittstudien (Ausprägung eines Merkmals an verschiedenen Merkmalsträgern zu einem Zeitpunkt) - Längsschnittstudien (ein Merkmal anhand mehrerer Merkmalsträger im Zeitverlauf) - Panel Studie (Kombination aus Quer- und Längsschnitt)
Auswahlpopulation Population die aus der Stichprobe gezogen wird
undercoverage einige Elemente der Grundgesamtheit fehlen in der Auswahlpopulation
overcoverage einige Elemente in Auswahlpopulation sind zuviel, gehören nicht zur Grundgesamtheit
Zufallsstichprobe jedes Elemente hat die gleiche Chance in die Stichprobe zu kommen
Inferenzschluss Rückschuss der Eigenschaften von der Stichprobe auf die Grundgesamtheit
Auswahlbias systematische Stichprobenverzerrung
einfache Zufallsstichprobe Stichprobenauswahl zufällig und so geplant, dass jede Teilmenge der Grundgesamtheit dieselbe Auswahlwahrscheinlichkeit hat (z.B. Lottozahlen)
geschichtete Zufallsauswahl - Zerlegung der Grundgesamtheit in Teilgesamtheiten, die sich nicht überlappen - Aus jeder Schicht werden Zufallsstichproben gezogen - Kenntnis der Schichtungsvariablen erforderlich - zweistufiges Auswahlverfahren : - Schichtung festlegen - proportionale Zufallsauswahl treffen
proportional geschichtete Stichprobe fester Anteil entnommener Elemente pro Schicht, der proportional zum Schichtumfang ist
disproportional geschichtete Stichprobe wenn Schichten zu dünn besetzt sind, werden mehr Elemente gezogen
Klumpen - natürliche Aufteilung der Grundgesamtheit (z.B. Schulklassen) - Zufallsstichprobe aus Menge der Klumpen - Untersuchung aller Elemente der gewählten Klumpen
Quotenauswahl - Stichprobe mit Quotenvorgabe (z.B. Geschlecht, Alter) - Ziel: verkleinertes Abbild der Grundgesamtheit
amtliche Statistik - Statistisches Bundesamt - Statistische Landesämter - Kommunale Statistikämter
nicht amtliche Statistik - private Institute für Markt- und Meinungsforschung - Wirtschaftsforschungsinstitute
univariate Urliste - Erhebung von Merkmalsausprägungen für ein Merkmal X an n Merkmalsträgern - Werte können mehrfach auftreten - je genauer die Messung stetiger Merkmale, desto weniger häufig treten Werte mehrfach auf
gruppierte Daten Zerlegung der Datenmenge in Teilintervalle
absolute Häufigkeit - Häufigkeit einer Ausprägung oder Klassenbesetzung hi = h(ai) i = 1, 2, ...., k
relative Häufigkeit - als Prozentwerte angebbar - Absolute Häufigkeit / Anzahl Messwerte fi = f(ai) = h(ai) / n i = 1, 2, ...., k
empirische Verteilung - grafische Darstellungsformen : - Kreisdiagramm - Stabdiagramm - Säulen- oder Balkendiagramm - Histogramm
absolute kumulierte Häufigskeitsverteilung - wenn man für einen beliebigen reellen Wert x die Anzahl der Beobachtungen ermittelt, die x nicht überschreiten - H(x)
relative kumulierte Häufigkeitsverteilung wenn man H(x) durch den Umfang n des Datensatzes dividiert F(x) = H(x) / n
Lagemaße Zentrum, Schwerpunkt, Streuung, Schiefe
Modalwert Xmod - Merkmalsausprägung mit größter Häufigkeit - wenn zwei gleiche größte Ausprägungen, dann gibt es zwei Modalwerte - robust gegen Ausreißer
Median Xmed - mind. Ordinalskala - robust gegen Ausreißer - der mittlere Wert eines geordnet vorliegenden Datensatzes - bei n gerade: Mittelwert der beiden zentralen Werte
Mittelwert, arithmetisches Mittel - metrische Skala - hohe Sensitivität gegen Ausreißern - Summe aller Daten/Anzahl der Daten - alle Daten sind gleich gesichtet
geometrisches Mittel - Veränderungsraten als Datengrundlage - zur Quantifizierung von Wachstumsraten, Lernzuwächsen etc.
gewichtetes arithmetisches Mittel - jeder Wert wird mit einem Gewichtungsfaktor versehen
getrimmtes arithmetisches Mittel - Randdaten bleiben unberücksichtigt - robuster gegen Ausreißer
Streuungsmaße - Streuung innerhalb eines Datensatzes - metrische Skalierung
Spannweite R - Daten aufsteigend sortiert - größter Wert - kleinster Wert - R: x(n) - x(1) - geringe Robustheit
Varianz s^2 - einzelne Abweichungen vom Mittelwert im Quadrat summieren und durch Anzahl teilen - daraus folgt die Standardabweichung s als Wurzel der Varianz
korrigierte Varianz s^2 - durch n-1 statt durch n teilen - hat günstigere Eigenschaften - daraus resultiert die korrigierte Standardabweichung s*
p-Quantil Xp Q- Anteil p ist kleiner oder gleich - Anteil 1-p ist größer oder gleich - bei Median ist p = 0,5 - bei Quartilen : p = 0,25, 0,75
Quartilsabstand Q - Q: = X0,75 - X0,25 Dezile D1, D2, D3, ... = X0,1, X0,2, X0,3 .... Median ist also D5
asymmetrische Verteilung - über Dezime erkennbar - erstes Indiz: Nichtübereinstimmung von Median und Mittelwert
Boxplot - grafische Darstellung zur Beurteilung einer empirischen Verteilung - fünf Charakteristika: 1. 2 Extremwerte 2. Differenz = Spannweite 3. Quartile X0,25 und X0,75 4. Median X0,5
Vierfeldertafel - für zwei binäre Merkmale - lässt sich in Baumdiagramm übertragen
Was bedeutet bivariat? bivariat = zwei Merkmale
Kontingenztabellen - Darstellung der Häufigkeiten von bivariaten Merkmalen - zeigt empirische Verteilung der beiden Merkmale - Randverteilungen sind Zeilen / Spaltensummen - Randverteilungen = Häufigkeitsverteilungen der Einzelmerkmale
Bedingte Häufigkeiten - Verknüpfung von gemeinsamen Häufigkeiten mit den Randhäufigkeiten - so sind Zusammenhänge erkennbar - Einzelelement der Bedingung/Randhäufigkeit = bedingt relative Häufigkeit
Zufallsvorgang Prozess, der zu einem von mehreren Ergebnissen führt, die sich gegenseitig ausschließen
Elementarereignisse - die möglichen Ergebnisse des Prozesses - Omega ist die Ergebnismenge - nicht weiter zerlegbare Ergebnisse
Ereignis A - Teilmenge A von Omega
Sicheres Ereignis - Menge Omega definiert sicheres Ereignis - dagegen Komplementärereignis ist unmögliches Ereignis
Schnittmengen - aus Teilmenge von Omega, z.B. wenn A und B realisiert sind
Vereinigungsmenge A U B, wenn eines der Ereignisse A oder B eintritt
Venn-Diagramme zur Veranschaulichung zusammengesetzter Ereignisse
endliche Ergebnismenge - z.B. einfacher Münzwurf als Zufallsvorgang - Omega (Zahl,Kopf) -> sicheres Ereignis
unendliche Ergebnismenge - z.B. Lotto : wie viel Spiele sind erforderlich, bis 6 richtige erreicht sind? - Ergebnismenge reicht von 1 - unendlich
Zufallsexperiment - Voraussetzungen - kontrollierte Bedingungen - wiederholbar unter gleichbleibenden Bedingungen - z.B. Ziehung der Lottozahlen
Wahrscheinlichkeit - für Auftreten eines Ereignisses A - egal ob Zufallsprozess unter kontrollierten oder nicht kontrollierten Bedingungen - Maßzahl ist P (A) (probability) - objektive Quantifizierung in Statistik - Bewertung der Chance für das Eintreten eines Ereignisses
Axiome von Kolmogoroff - Bedingungen für P (A): - K1: Nicht-Negativitätsbedingung P(A)>0 -K2: Normierung der Ergebnismenge P (Omega) = 1 -K3: Additivität der Wahrscheinlichkeit disjunkter Ereignisse
Bedingungen für Laplace Experimente - L1: Ergebnismenge ist endlich - L2: Wahrscheinlichkeiten für n Elementarereignisse sind alle gleich groß - z.B. Münzwürfe, Würfeln, Roulette
Urnenmodell - zur Herleitung zentraler Ergebnisse für Zufallsvorgänge mit endlicher Ergebnismenge - N= durchnummerierte Kugeln = Grundgesamtheit - Auswahl der Kugeln entspricht Stichprobe des Umfangs n - mit Zurücklegen oder ohne
Bedingte Wahrscheinlichkeiten - es gibt Vorabinformationen (Bedingungen ) - P (AIB) ist Wahrscheinlichkeit von A unter der Bedingung B
Trägermenge alle Werte/Ausprägungen einer Zufallsvariablen X die X annehmen kann
Wahrscheinlichkeitsfunktion - ordnet jeder Ausprägung xi eine Eintrittswahrscheinlichkeit pi zu - wird auf Null gesetzt für alle x außerhalb der Trägermenge, damit ist die Funktion für alle reellen Zahlen erklärt
diskrete Gleichverteilung - wenn alle Ausprägungen gleiche Eintrittswahrscheinlichkeit p haben - z.B. fairer Würfel hat p = 1/6 für alle x
theoretische Verteilungsfunktion - monoton wachsende Treppenfunktion - Aufaddieren der pi - im Experiment nähert sich relative Häufigkeit der Funktion an
Bernoulli-Verteilung - wenn Zufallsvariable X nur zwei Ausprägungen hat - z.B. Münzwurf - dann ist p1=p und p2=1-p
Erwartungswert - Schwerpunkt der Verteilung der diskreten Zufallsvariablen - Gewichtung über Eintrittswahrscheinlichkeiten der einzelnen Ausprägungen
Show full summary Hide full summary

Similar

STADA 2019
Denis Roth
Faktoranalyse 4 - flerfaktormodeller
Una Igeland
Of Mice and Men
amyk4321
Cold War in Asia- Philippines, China and Korea
hannah_
Logic Pro X Practice Exam
Chris Redding
AP Psychology Practice Exam
Jacob Simmons
NSI Test First day
Adedipe Odunayom
2PR101 1.test - 7. část
Nikola Truong
1PR101 2.test - Část 11.
Nikola Truong