la prueba debe asegurar que mide, para lo que esta diseñada
sus resultados pueden variar dependiendo de estados internas o externos
estados externos: ambiente de prueba incómodo o con distracciones.
estados internos:: baja motivación o la falta de disposición.
puntuación real
Es el promedio de las puntuaciones que obtendría si presentara la prueba en un número infinito de veces
No puede calcularse de manera directa
Coeficiente test-retest
Coeficiente test-retest Ayuda a determinar si un instrumento mide de manera consistente de una
ocasión a otra.
coeficiente de equivalencia
Sucede cuando los examinados recuerdan muchas de las preguntas y respuestas de la prueba inicial, esto
afecta sus respuestas en la segunda aplicación
forma paralela del instrumento
consta de reactivos similares pero no de los mismos reactivos
puede calcularse como índice de confiabilidad
Coeficientes de consistencia interna
Es un método menos directo de tomar en cuenta los efectos de diferentes muestras de los reactivos de
una prueba sobre la confiabilidad.
Confiabilidad entre calificadores
Puede mejorar la confiabilidad de las calificaciones en las pruebas, la elaboración de las respuestas modelo
a las preguntas antes de aplicar la prueba, y el uso de calificadores múltiples
Interpretación de los coeficientes de confiabilidad
Se usa cuando una prueba va a utilizarse para determinar si las calificaciones promedio de dos grupos de
personas son significativamente diferentes
Error estándar de medición
es una estimación de la desviación estándar de una distribución normal de las calificaciones de la prueba
Dado un estimado de la confiabilidad, puede calcularse la varianza de la calificación real
validez
Validez de contenido
Es la apariencia física de una prueba, corresponde al rango de pruebas representativas de lo que debe
medir laa prueba
habilidades, entendimientos
pruebas de entendimiento
Validez con relación a criterio
relaciona las calificaciones en la prueba con el desempeño en medidas o
estándares de criterio con los cuales se compara la calificación .Es el grado en
que una prueba mide lo que está diseñada para medi
Validez concurrente.
Se emplean siempre que una prueba se aplica a personas clasificadas en varias categorías, para
determinar si las puntuaciones en la prueba varian en diferentes categorias
Validez predictiva.
Es la precisión con que las puntuaciones de una prueba predicen puntuaciones de criterio, según lo indica la
correlación entre la prueba y un criterio del desempeño futuro.
frror estándar de estimación.
describe el paso a seguir para pronosticar las calificaciones de criterio de un grupo a partir de sus
puntuaciones en pruebas o en otras variables.
Factores que afectan la validez con relación a criterios
puede ser influida por una serie de factores
Diferencias de grupo.
Si la prueba sigue siendo válida en situaciones diferentes, también puede involucrar una muestra diferente
Extensión de la prueba.
varían de manera considerable en las características a medir tienen varianzas más grandes y, en
consecuencia, mayor validez predictiva que las puntuaciones
Contaminación de criterios.
el criterio se hace menos válido, o se contamina, por el método particular de medir las calificaciones de
criterio
puede controlarse por medio de un análisis ciegopuede controlarse por medio de un análisis ciego
Validez creciente.
Se relaciona con el concepto de utilidad, tal como se aplica en los contextos de selección de personal.
Validez de constructo
Evidencia a favor de la validez de constructo. es el tipo más general de validez, no se determina de una sola
manera o por una investigación
involucra una red de investigaciones y otros procedimientos diseñados para determinar si un instmmento
de evaluación que supuestamente mide una determinada variable de personalidad en realidad lo hace.
Evidencia a favor de la validez de constructo.
Los juicios de expertos de que el contenido de la prueba corresponde al constructo de interés.
Análisis de la consistencia interna de la prueba.
Estudios, tanto en grupos formados de manera experimental como en grupos que se presentan de
manera natural, de las relaciones entre las puntuaciones de la prueba y otras variables en las cuales
difieren los grupos.
vCorrelaciones de las puntuaciones en la prueba con las puntuaciones en otras pruebas y variables con las
cuales se espera que tengan cierta relación, seguidas por un análisis factorial de esas correlaciones.
Interrogar con detalle a los examinados o a los calificadores acerca de sus respuestas a una prueba o
escala de calificación para reactivos
Validación convergente y discriminante
Es el grado en que una prueba mide lo que está diseñada para medir
una prueba puede ser confiable sin ser válida, pero no puede ser válida sin ser confiable