estimacion puntual: Llamaremos
Estimación puntual de un
determinado parámetro de una
población, al proceso que nos
permite, a partir de la información
suministrada por una muestra
aleatoria de la misma, determinar un
solo valor numérico que se sea un
buen indicador de dicho parámetro
poblacional. El estadístico muestral
tomado para estimar el parámetro
poblacional recibe el nombre de
estimador puntual.
ejemplo: En una ciudad se toma una muestra de 160 personas, de
las cuales 49 practican deporte. Determina y calcula un estimador
puntual para la proporción de personas que practican deporte en
la ciudad.
metodos de estimacion:
metodo de momentos: Consiste en igualar los
momentos muestrales y los poblacionales.
Prácticamente no se usa en la investigación actual
metodo de minimo de
cuadrados: Consiste en
minimizar la suma de cuadrados
de los errores
metodo de la maxima verosimilitud: Consiste en sustituir
los parámetros por aquellos valores que maximizan el
logaritmo de la función de verosimilitud de la muestra
principales estimadores puntuales:
ESTIMADOR DEL PARÁMETRO p DE UNA
DISTRIBUCIÓN BINOMIAL B(n,p)
ESTIMADOR DEL PARÁMETRO λ DE UNA DISTRIBUCIÓN
DE POISSON P(λ)
ESTIMACIÓN DE LOS PARÁMETROS µ Y σ DE
UNA DISTRIBUCIÓN NORMAL N(µ,σ)
estimacion por intervalos: Cuando
hacemos una estimación puntual del valor
de un determinado parámetro poblacional
nos encontramos con un doble problema:
por un lado el valor obtenido solamente
da una idea aproximada del verdadero
valor del parámetro a estimar, por otro, no
sabemos el grado de bondad de la
aproximación, es decir, ignoramos en qué
medida el valor obtenido se aproxima al
verdadero valor del parámetro estimado.
obtencion de los intervalos de
confianza mas utilizados:
intervalo de confianza para la medida µ de
una distribución Normal de varianza conocida
Intervalo de confianza para la media µ de una
población Normal de varianza desconocida.
Intervalo de confianza para la varianza y
la desviación típica de una población
Normal
Intervalo de confianza para el parámetro p de una
distribución Binomial B(n,p)
Intervalo de confianza para el parámetro p de una
distribución Hipergeométrica H(N,n,p)
ejemplo: La media semanal de horas de asistencia a una biblioteca de
cuatro miembros de una familia es 3, 7, 5 y 4 respectivamente. ¿Cuál
puede considerarse la media semanal de asistencia a la biblioteca de la
familia?
prueba de hipotesis
Otra manera de hacer inferencia es haciendo una afirmación acerca del valor que el
parámetro de la población bajo estudio puede tomar. Esta afirmación puede estar
basada en alguna creencia o experiencia pasada que será contrastada con la evidencia
que nosotros obtengamos a través de la información contenida en la muestra. Esto es
a lo que llamamos
La Hipótesis Nula, denotada como H0 siempre especifica un solo valor del parámetro de la
población si la hipótesis es simple o un conjunto de valores si es compuesta (es lo que queremos
desacreditar)Ho: Hipótesis nula
formulas:
H0 :µ = µ
H0 :µ " µ0
H0 :µ " µ0
La Hipótesis Alternativa, denotada como H1 es la que responde nuestra pregunta, la que
se establece en base a la evidencia que tenemos.
error tipo 1: El error de tipo I se comete cuando la hipótesis nula es
verdadera y, como consecuencia del contraste, se rechaza.
nivel de significancia: α = 0.01 → Demasiado significativo α =
0.05 → Significativo α = 0.10 → Poco significativo
error tipo 2: El error de tipo II se comete cuando la hipótesis nula es falsa y,
como consecuencia del contraste se acepta.
regresion lineal y
correlacion.
correlacion: La finalidad de la correlación es examinar la dirección y la
fuerza de la asociación entre dos variables cuantitativas. Así
conoceremos la intensidad de la relación entre ellas y si, al aumentar el
valor de una variable, aumenta o disminuye el valor de la otra variable.
regresion lineal:La regresión lineal consiste en encontrar (aproximar) los valores de una variable a partir
de los de otra, usando una relación funcional de tipo lineal, es decir, buscamos cantidades a (ordenada
en el origen) y b (pendiente de la recta lineal) tales que se pueda escribir Y a bX , con el menor
error posible entre Ŷ e Y.
diagrama de dispersion: También conocido como gráfico de dispersión, gráfico de puntos, diagrama de
XY, diagrama de dispersión o Scattergram. Los diagramas de dispersión usan una colección de puntos
colocados usando coordenadas cartesianas para mostrar valores de dos variables. Al mostrar una
variable en cada eje, se puede detectar si existe una relación o correlación entre las dos variables.
Se pueden interpretar varios tipos de correlación a través de los patrones mostrados en los diagramas
de dispersión. Estos son: positivo (los valores aumentan juntos), negativo (un valor disminuye a medida
que el otro aumenta), nulo (sin correlación), lineal, exponencial y en forma de U. La fuerza de la
correlación puede determinarse por la proximidad de los puntos entre sí en el gráfico. Los puntos que
terminan muy lejos del conjunto general de puntos se conocen como valores atípicos
El Coeficiente de correlación es una medida que permite conocer el grado
de asociación lineal entre dos variables cuantitativas (X, Y).
ecuacion de regresion: La ecuación de la recta de regresión permite pronosticar la puntuación que
alcanzará cada sujeto en una variable Y conociendo su puntuación en otra variable X. A la variable Y se
le denomina criterio y a la variable X predictor. ... Denominamos Y´ a las puntuaciones pronosticadas
usando la recta Y = 2X-8.
diseño de experimentos:
diseño de experimentos: Diseñar un experimento significa planear un experimento de modo que reúna la
información pertinente al problema bajo investigación. El diseño de un experimento es la secuencia completa de
pasos tomados de antemano para asegurar que los datos apropiados se obtendrán de modo que permitan un
análisis objetivo que conduzca a deducciones válidas con respecto al problema establecido.
analisis de la varianza anova:Un análisis de varianza (ANOVA) prueba la hipótesis de que las medias de dos o más
poblaciones son iguales. Los ANOVA evalúan la importancia de uno o más factores al comparar las medias de la
variable de respuesta en los diferentes niveles de los factores. La hipótesis nula establece que todas las medias
de la población (medias de los niveles de los factores) son iguales mientras que la hipótesis alternativa establece
que al menos una es diferente.