1
PRUEBAS PARAMÉTRICAS
Comparaciones de 2 muestras
PROF: MARÍA JOSÉ MEDINA FRITZ.
ESTADÍSTICA II (523228).
Repaso 2
Continua • Altura
Puede tomar • Peso
cualquier valor dentro • C.I.
Cuantitativas Se de un intervalo • T°
expresan mediante
valores numéricos
Discreta Escuelas
• N° de Escuelas
Números enteros, N°vehículos
• N° de Vehículos
conteo de números personas
• N° de personas
• Sexo (Femenino, Masculino)
Nominales Estado civil
• Estado civil ( Soltero,
Cualitativas Categorías y atributos divorciado…)
casado, divorciado…)
Se les llama atributos, • religión
son expresadas
mediante palabras Ordinales
• Concurso de belleza
Categorías y atributos
• Campeonatos
que presentan jerarquía
3
Pruebas para variables cuantitativas,
comparación de 2 o más grupos.
Pruebas para variables cualitativas o 4
categóricas, comparación de 2 o más
grupos.
5
Los métodos estadísticos se clasifican
en:
Métodos Paramétricos: requieren supuestos distribucionales (en general,
normalidad), aplican para variables medidas en "Escalas de razón".
Métodos No Paramétricos: no requieren supuestos distribucionales
(pueden exigir ciertos requisitos, a veces homocedasticidad o ciertos tamaños
muestrales), aplican para variables medidas en "Escalas ordinales" o "Escalas de
intervalos".
6
Supuestos Distribucionales: Para pruebas de
comparación paramétricas en 2 muestras
Normalidad:
𝐻0 : La distribución de los datos es normal
𝐻1 : Los datos no se aproximan a una distribución normal
Homogeneidad de varianzas:
𝐻0 : Las varianzas son homogéneas
𝐻1 : No existe homogeneidad de varianza
7
Supuestos distribucionales:
Prueba de normalidad
Si la prueba asume que la variable de interés tiene un comportamiento semejante a la curva de Gauss o
distribución normal (supuesto que se verifica con el estadístico Shapiro Wilks para muestras pequeñas y
Kolmogorov para muestras grandes), se usan las pruebas T.
Para verificar la normalidad, la prueba contrasta las hipótesis:
H0: distribución normal
H1: distribución distinta de la normal.
Luego, si:
valor 𝒑 < 𝜶, donde 𝜶 = 𝟎. 𝟎𝟏, 𝟎. 𝟎𝟓, 𝟎. 𝟏 dependiendo del nivel de confianza utilizado, se tiene que existe
evidencia significativa en contra del supuesto,
valor 𝒑 > 𝜶, no existe evidencia de falta significativa de normalidad (se acepta el supuesto)
8
Prueba de Normalidad
valor 𝒑 < 𝜶, se tiene que existe evidencia significativa en contra del supuesto.
valor 𝒑 > 𝜶, no existe evidencia de falta significativa de normalidad (se acepta el
supuesto).
Notar que: 𝜶 = 𝟎. 𝟎𝟏, 𝟎. 𝟎𝟓, 𝟎. 𝟏, dependiendo del nivel de confianza utilizado.
9
Contrastar el supuesto de normalidad
El test aplicado sobre la variable VD Arrojó
un valor de 0.919 y el valor de
significación es mayor que 0.05 (Z=.91,
p=.366), por lo que se acepta la hipótesis
nula y se concluye que la distribución de
los datos de la variable VD se ajusta a la
curva normal
10
Normalidad en SPSS.
11
Normalidad en SPSS.
12
Ejercicio:
1. Se tienen 15 observaciones de las calificaciones de la universidad A y 15 en la
universidad B. Plantee las hipótesis asociadas al supuesto de normalidad y
verifique si se cumple este supuesto.
2. Con el objetivo de verificar la efectividad de dos tratamientos, se estudian 2
grupos de árboles que tienen las mismas características. A cada una de estos se
les midió el tiempo en meses en que presentan una infección en la raíz. Verificar
y plantear la hipótesis de normalidad para ambas muestra.
13
Pruebas t.
Comparación de media de dos grupos
Contexto de utilización: investigación experimental.
Dos tipos de prueba:
i. Para muestras independientes (se comparan dos grupos diferentes casos),
requiere supuesto de homocedasticidad de la varianza.
ii. Para muestras relacionadas (se comparan dos medidas distintas de una misma
unidad de análisis), no requiere supuesto de homogeneidad de varianzas.
14
Supuesto de Homogeneidad.
Sí además, se asume que ambas poblaciones difieren únicamente en su
medida de centro (es decir, son semejantes en variabilidad, lo que se
conoce como supuesto de homocedasticidad o varianzas iguales), se usa el
estadístico T- Student para comparar medias de muestras independientes.
15
Supuesto de Homogeneidad.
El supuesto de homogeneidad de las varianzas es verificado en forma automática por los
software en base al estadístico de Levene.
La hipótesis que prueba Levene es:
𝑯𝟎 : σ𝟏 = σ𝟐 v/s 𝑯𝟏 :σ𝟏 ≠ σ𝟐
Luego, sí :
valor 𝒑 < 𝜶, se tiene que existe evidencia significativa de heterocedasticidad (las varianzas
difieren).
valor 𝒑 > 𝜶, no existe evidencia de heterocedasticidad (se acepta el supuesto de varianzas
iguales).
16
Pruebas paramétricas
Los supuestos de homogeneidad se pueden ejemplificar en la figura siguiente:
17
Prueba de Levene
Heterocedasticidad de la Varianza
Utilizando los mismos ejercicios en Excel, verificar el supuesto de heterocedasticidad
de las varianzas.
18
Comparación de 2 poblaciones
independientes
Los datos 2
provienen grupos T
Prueba de Datos
de una Indep
Normalidad Cuantitativos 𝝈𝟏 = 𝝈𝟐 Student
curva
normal
19
Comparación de 2 poblaciones
independientes
Verificados los supuestos de normalidad y homocedasticidad, la prueba de
comparación de medias contrasta:
Hipótesis de comparación de medias con estadístico T- Student
𝑯𝟎 : 𝝁𝟏 = 𝝁𝟐 𝒗/𝒔 𝑯𝟏 : 𝝁𝟏 ≠ 𝝁𝟐 ,
Obtención del Estadístico de Contraste t 20
de Student para muestras independientes
(estadística descriptiva)
Obtención del Estadístico de Contraste t 21
de Student para muestras independientes
(estadísticos de contraste).
22
Prueba T- student para muestras
independientes (varianzas homogéneas)
23
Supuesto de Homogeneidad en SPSS
y Prueba T.
24
Supuesto de Homogeneidad en SPSS
y Prueba T.
25
Ejercicio:
3. Desde el primer ejercicio, donde se indica que hay 15 observaciones correspondientes
a las calificaciones de la universidad A y 15 en la universidad B. verifique si existen
diferencias estadísticamente significativas en las calificaciones, dependiendo de la
universidad a la que pertenecen.
26
Comparación de 2 poblaciones
independientes 𝝈𝟏 ≠ 𝝈𝟐
Los datos 2
provienen grupos T
Prueba de Datos Indep
de una
Normalidad Cuantitativos 𝝈𝟏 ≠ 𝝈𝟐 Welch
curva
normal
27
Prueba T de Welch para muestras
independientes (varianzas heterogéneas)
28
Supuesto de Homogeneidad en SPSS
y Prueba T.
29
Supuesto de Homogeneidad en SPSS
y Prueba T.
30
Ejercicio.
En 2 plantas que fabrican un determinado repuesto para vehículos, se
registra la resistencia que tiene este repuesto. El objetivo es comparar cuál
de las 2 plantas tiene una mayor resistencia en cuanto al producto
fabricado, realice una prueba de hipótesis y verifique cuál de los dos
repuestos es de mejor calidad.
31
Pruebas paramétricas
En ambos casos, naturalmente, si:
Valor 𝒑 < 𝜶, entonces existe evidencia de que las medias difieren
significativamente (se ha probado la hipótesis de trabajo)
Valor 𝒑 > 𝜶, entonces no existe evidencia significativa de que las
medias difieran (no ha sido posible probar la hipótesis de trabajo)
Ahora bien, si no se satisface el supuesto de normalidad, se debe
optar por pruebas “no-paramétricas”.
32
Comparación de 2 poblaciones
relacionadas.
Los datos T
Prueba de Datos provienen 2 Para
de una Depend muestras
Normalidad Cuantitativos grupos
curva relacionadas
normal
33
Pruebas para muestras dependientes
o pareadas
Existe una sola población, para la cual los individuos fueron medidos dos
veces, por lo cual, se tomó una sola muestra.
Las mediciones están relacionadas entre sí para cada individuo particular.
En este contexto, si el objetivo del estudio es comparar las dos mediciones
en término de sus valores promedio, se realiza una prueba de comparación
de "muestras pareadas".
34
Pruebas para muestras dependientes o pareadas
Prueba paramétrica
Verificar supuesto de normalidad: Si la variable de interés tiene un comportamiento semejante a la
curva de Gauss ( test de Shapiro Wilks)
Entonces se usa la “prueba T para muestras pareadas”.
𝑯𝟎: 𝝁𝟏 = 𝝁𝟐
𝑯𝟏: 𝝁𝟏 ≠ 𝝁𝟐 ,
Valor 𝒑 < 𝜶, entonces existe evidencia de que las medias de ambas mediciones difieren significativamente (se
ha probado la hipótesis de trabajo)
Valor 𝒑 > 𝜶, entonces no existe evidencia significativa de que las medias de ambas mediciones difieran (no ha
sido posible probar la hipótesis de trabajo)
Recordar que: 𝜶 = 𝟎. 𝟎𝟏, 𝟎. 𝟎𝟓, 𝟎. 𝟏, dependiendo del nivel de confianza utilizado.
35
Ejemplo.
Se han introducido las calificaciones de una serie de alumnos que se han tomado
en Enero y en Mayo después de una intervención para mejorar las técnicas de
estudio que aplican. De este modo el alumno número 1 obtuvo un 6 en el parcial de
Enero y un 7 en el de Mayo. Del mismo modo se procede para el resto de los
alumnos.
36
Ejemplo.
En los estadísticos descriptivos que nos ofrece el
output podemos comprobar que las puntuaciones
obtenidas por los alumnos en el mes de Mayo son
superiores a las de Enero en más de un punto.
“Como siempre deberemos recurrir a la
prueba de contraste de medias para verificar si esta diferencia es significativa.”
Antes de utilizar la prueba para muestras relacionadas, el programa nos ofrece la correlación
existente entre las puntuaciones de ambos grupos. De este modo podemos verificar si
realmente se trata de dos grupos relacionados. Podemos comprobar que la correlación
existente entre las puntuaciones obtenidas en los dos parciales es de 0,948 y que la prueba de
inferencia asociada es significativa, todo ello implica que los grupos eran efectivamente
relacionados.
37
Ejemplo.
el output nos proporciona la prueba t para grupos relacionados:
Partiendo de estos resultados podemos rechazar la hipótesis nula de que las medias
correspondientes a los dos parciales son iguales.
38
Prueba T muestras Pareadas en SPSS.