Está en la página 1de 22

UNIVERSIDAD NACIONAL HERMILIO VALDIZÁN

FACULTAD DE MEDICINA

Unidad 8

PRUEBAS NO PARAMÉTRICAS

Mg. Joel Tucto Berríos


Pruebas no paramétricas
• Las pruebas no paramétricas se utiliza cuando no se cumple el supuesto de
normalidad.
• Son la única alternativa realista cuando el tamaño de muestra es pequeño.
• Las pruebas no paramétricas permiten analizar datos en escala nominal u
ordinal.
• Son más rápidos y fáciles de aplicar (cálculos aritméticos simples).
• Se utiliza en datos independientes y relacionadas.
• Son aplicados a los datos jerarquizados.
• Pruebas no paramétricas para una muestra
• Pruebas no paramétricas para muestras independientes.
• Pruebas no paramétricas para muestras relacionadas.
Diseño: Dos muestras independientes
Variable interés: Cualitativa
Estadística de contraste:
Para una tabla de contingencia de 2 x 2.

1 2 TOTAL

A a b a+b

B c d c+d

TOTAL a+b c+d n

Se basa en las siguientes consideraciones:


(𝑎+𝑐)(𝑎+𝑏)
1) Si 𝑓. 𝑒 = < 5 → se usa Prueba de probabilidad exacta de Fisher.
𝑛
2) 𝑆𝑖 𝑓. 𝑒 > 5 → se usa la Prueba de Chi cuadrada.
8.1 Prueba de probabilidad exacta de Fisher
Permite analizar si dos variables dicotómicas están asociados cuando la muestra a
estudiar es demasiado pequeña y no se cumplen las condiciones necesarias para la
aplicación de chi cuadrada de manera adecuada.
Estadística de contraste:
𝒂+𝒄 ! 𝒃+𝒅 ! 𝒂+𝒃 ! 𝒄+𝒅 !
𝒑=
𝒏! 𝒂! 𝒃! 𝒄! 𝒅!
Regla de decisión:
Prueba unilateral
Si 𝑝 < 0,05 → se rechaza Ho.
Prueba bilateral
0,05
Si 𝑝 < → se rechaza Ho.
2
Ejemplo 1
En un estudio acerca de los efectos secundarios de los medicamentos A y B se encontraron
los siguientes resultados:
Medicamento Efectos Secundarios TOTAL
SI NO
A 1 9 10
B 3 8 11
TOTAL 4 17 21

Se desea saber si los datos proporcionan evidencia suficiente para indicar que los
medicamentos no presentan similitud en sus efectos.
Solución:
1. Hipótesis:
𝐇𝟎 ∶ Existe similitud entre los efectos de los medicamentos A y B
𝐇𝟏 ∶ No existe similitud entre los efectos de los medicamentos A y B.
2. Nivel de significación:
Como no se conoce se asume 𝛼 = 0,05
3. Estadística de contraste:
4 ∗10
𝑓. 𝑒 = = 1,9 ≅ 2
21
Como la f.e = 2 < 5 se utiliza la prueba de probabilidad exacta de Fisher.
4! 17! 10! 11!
𝑝= = 0,27569
21! 1! 9! 3! 8!
4. Decisión estadística:
Si 𝑝 < 0,05 se rechaza Ho.
Si 𝑝 > 0,05 no se rechaza Ho.
Como 𝑝 = 0,27569 > 0,05 no de rechaza
5. Conclusión:
se concluye que los medicamentos A y B presentan similitud en sus efectos.
8.2 Prueba Chi cuadrada (𝒙𝟐 )
La prueba chi-cuadrada es una de las técnicas estadísticas más usadas en la
investigación social, se usa para hacer comparaciones entre dos o más muestras, en
tablas de contingencia de 2 x2 o en tablas de n x k (n filas y k columnas).
Esta prueba fue desarrollada en el año 1900 por Karl Pearson.
Distribución Chi-cuadrada
Al igual que la distribución t de Student tiene grados de libertad.
Características:
a) Es una distribución asimétrica
b) Sólo toma valores positivos y es asintótica con respecto al eje X positivo (0 < 𝑥 2 < ∞)
c) Se caracteriza por tener el parámetro 𝑔. 𝑙. llamado grados de libertad.
d) El área comprendida entre la curva y el eje de las “x” es 1 o 100 %.
e) El centro o mediana de la distribución es igual al número de grados de libertad.
Existen tres usos relevantes de la Prueba estadística de 𝑥 2 :
• Prueba de bondad de ajuste (una variable)
• Prueba de independencia (dos variables)
• Prueba de homogeneidad (dos variables)
Supuestos:
- Se considera que los datos provienen de una muestra aleatoria extraída de la
población de interés.
- La muestra debe ser lo suficientemente grande.
Estadística de contraste:
La prueba 𝑥 2 es una prueba de significación estadística que corresponde a la
siguiente ecuación general:
𝒌 (𝑶𝒊 −𝑬𝒊 )𝟐
𝒙𝟐 = σ𝒊=𝟏
𝑬𝒊
donde:
𝑂𝑖 = frecuencias observadas
𝐸𝑖 = frecuencias esperadas o hipotéticas
Frecuencia esperada:
(𝑡𝑜𝑡𝑎𝑙 𝑚𝑎𝑟𝑔𝑖𝑛𝑎𝑙 𝑑𝑒 𝑟𝑒𝑛𝑔𝑙ó𝑛)(𝑡𝑜𝑡𝑎𝑙 𝑚𝑎𝑟𝑔𝑖𝑛𝑎𝑙 𝑑𝑒 𝑐𝑜𝑙𝑢𝑚𝑛𝑎)
𝐸𝑖 =
𝑛
Grados de libertad:
𝑔. 𝑙 = (r-1)(c-1)
donde:
r = número de renglones en la tabla de 𝑂𝑖
c = número de columnas en la tabla de 𝑂𝑖
La prueba Chi cuadrado se usa en la mayoría de casos en que las observaciones se
pueden clasificar en categorías y se tratan como frecuencias.
Aplicaciones de la prueba Chi cuadrada
a) Prueba de bondad de ajuste.
En las aplicaciones de una sola muestra (una sola variable), la prueba 𝑥 2 se conoce
como la técnica de “bondad de ajuste” y está orientada a probar la concordancia entre
una distribución observada y una distribución esperada. De ahí el nombre de “bondad de
ajuste” de las frecuencias observadas y las esperadas. Se usa con la finalidad de comparar
si lo observado se parece a lo esperado.
Ho: La muestra proviene de la distribución XX.
H1: La muestra no proviene de la distribución XX.
a) Prueba de independencia de criterios
La prueba de independencia se usa para determinar si los atributos son
estadísticamente independientes. Se dice que dos criterios de clasificación son
independientes si la distribución de uno de los criterios es la misma sin importar cual sea
la distribución del otro criterio. Por ejemplo, si deseamos investigar si el estado
nutricional y el desempeño académico son independientes, o si deseamos probar la no
independencia (relación o asociación) entre el tabaco y la hipertensión.
c) Prueba de homogeneidad de poblaciones.
Esta es una de las aplicaciones mas frecuentas de Chi cuadrada. En este caso se tiene
dos o más poblaciones independientes las que se desean comparar respecto de una
variable categórica. En otros términos, se trata de determinar si dos o más poblaciones
son homogéneas respecto de una variable categórica.
La palabra “homogénea” se utiliza en la estadística para indicar “lo mismo o igual”.

Para determinar la homogeneidad de poblaciones se debe usar la prueba de Chi-


cuadrado. En este caso la ecuación de 𝑥 2 con (r-1)(c-1) grados de libertad.
Tabla de contingencia de 2 x 2
El uso más frecuente de la prueba de 𝑥 2 se refiere cuando cada uno de los criterios
se clasificación, puede dividirse en dos categorías o niveles. Dicha tabla suele
conocerse como tabla de 2 x 2.
Estadística de contraste:
Cuando se aplica la prueba de 𝑥 2 a los datos en las que tanto r como c son iguales a
2 debe usarse la siguiente formula:
𝑛(𝑎𝑑−𝑏𝑐)2
𝑥2 = con 1 g.l
(𝑎+𝑐)(𝑏+𝑑)(𝑎+𝑏)(𝑐+𝑑)
Donde a, b, c y d son frecuencias observadas de las celdas como se muestra en la siguiente tabla:
Segundo Primer criterio de clasificación TOTAL
Criterio de clasificación 1 2
1 a b a+b
2 c d c+d
TOTAL a+c b+d n
Corrección de Yates
Yates propuso un procedimiento para corregir esto en el caso de la tabla de 2 x 2
cuando la fe > 5.
𝒏
𝒏(│𝒂𝒅−𝒃𝒄│−𝟐)𝟐
𝒙𝟐𝒄𝒐𝒓𝒓𝒆𝒈𝒊𝒅𝒂 = .
𝒂+𝒄 𝒃+𝒅 𝒂+𝒃 𝒄+𝒅
donde a, b, c, d son las frecuencias observadas en las celdas.
Ejemplo 9.2
Se desea comparar la curabilidad de dos tipos de enfermedad neoplásica en
presencia de tratamiento con quimioterapia. Los resultados en cuanto a la
curabilidad fueron:

Enfermedad Curabilidad TOTAL


Si No
A 37 6 43
B 27 18 45
TOTAL 64 24 88
Solución:
Aplicando la prueba de homogeneidad:
1°. Hipótesis
𝐻𝑜 ∶ La efectividad de tratamiento con quimioterapia es la misma para las dos enfermedades.
𝐻1 : La efectividad de tratamiento con quimioterapia no es la misma para las dos enfermedades.
2°. Estadística de contraste:
64∗43
Como f.e = = 31,27 > 5, se usa la prueba de 𝑥 2 con corrección de yates.
88
Reemplazando los valores en la ecuación:
88
88(│37∗18−27∗6│− 2 )2
𝑥2 = = 6,265
64∗24∗43∗45

𝑥 2 = 6,265
3°. Regla de decisión:
Valor crítico.
g.l. = (r-1)(c-1) = (2-1)(2-1)= 1
se asume que 𝛼 = 0,05
2
𝑥𝛼(1) = 3,841 → Tabla de distribución de 𝑥 2 .
decisión:
Si 𝑥𝑐2 >3,841 → se rechaza Ho.
Si 𝑥𝑐2 ≤ 3,841 → no se rechaza Ho.
Atendiendo a la regla de decisión se rechaza la Ho porque el valor calculado de 𝑥 2
es mayor que el valor teórico de 𝑥 2 , por consiguiente la prueba es significativa.
4°. Conclusión:
Se concluye que la curabilidad con tratamiento de quimioterapia no es la
misma para las dos enfermedades A y B. Una es mejor que la otra.
Ejemplo 9.3
Un grupo de investigadores, al estudiar la relación entre el tipo sanguíneo y la
severidad de una afección en la población reunió los datos de 1500 personas, los
cuales se presentan en la siguiente tabla de contingencia.

Severidad de la Tipos de sangre TOTAL


afección A B AB O
Ausente 543 211 90 476 1320
Moderada 44 22 8 31 105
Severa 28 9 7 31 75
TOTAL 615 242 105 528 1500

Los investigadores desean saber si estos datos son compatibles con la hipótesis de
que el grado de afección y el tipo sanguíneo son independientes?
Solución:
1. Hipótesis:
Ho: El tipo sanguíneo y la severidad de la afección son independientes.
H1: El tipo sanguíneo y la severidad de la afección no son independientes.
2. Estadística de contraste.
𝒌 (𝑶𝒊 −𝑬𝒊 )𝟐
𝒙𝟐 = σ𝒊=𝟏
𝑬 𝒊
Cuando Ho es verdadera, 𝒙𝟐 sigue una distribución aproximadamente con (r-1)
(c-1) grados de libertad.
3. Regla de decisión:
Sea 𝛼 = 0,05
g.l = (r-1)(c-1) = (3-1)(4-1)=(2)(3) =6
De la tabla de valores de 𝒙𝟐 se tiene:
𝒙𝟐 o, o5 6 = 12.59
Decisión:
Si 𝑥 2 ≥ 12.59 , Se rechaza Ho.
Si 𝑥 2 < 12.59 , no se rechaza
4°. Cálculo de la estadística de prueba:
Severidad de la Tipos de sangre TOTAL
afección A B AB O
Ausente 543 211 90 476 1320
(541.2) (213.0) (92.4) (473.4)
Moderada 44 22 8 31 105
(43.0) (16.9) (7.4) (37.6)
Severa 28 9 7 31 75
(30.8) (12.1) (5.3) (26,9)
TOTAL 615 242 105 528 1500

Cálculo de frecuencias esperadas(𝐸𝑖 )


615∗1320
Ausente: 𝐸𝐴 = = 541.2
1500
615 ∗105
Moderada: 𝐸𝐴 = = 43.05
1500
615 ∗75
Severa: 𝐸𝐴 = = 30.8
1500
2 (543−541.2)2 (211−213)2 (31−26.9)2
𝑥 = + + …. +
541.2 213. 26.9
𝑥 2 = 0.006 + 0.019 + 0.062 + 0.014 + 0.023 + 1.539 + 0.049 + 1.158 + 0.255 + 0,794 + 0.545 + 0.625
𝑥 2 = 5,089 ≅ 0,09
Como 𝑥𝑐2 = 5,09 < 12.59, no se rechaza la Ho, por lo tanto se aprecia que la prueba no es
significativo en cualquier nivel razonable.
5. Conclusión
Se concluye que posiblemente Ho es verdadera. Los datos indican que son compatibles con
la hipótesis del grado de afección y el tipo sanguíneo son independientes.
Ejemplo 9.4
En un estudio sobre contaminación atmosférica realizado en dos comunidades se
seleccionó una muestra aleatoria de 200 familias de cada una de ellas. Se interrogó
a un miembro por familia si alguien de la familia se sentía afectado por la
contaminación atmosférica. Los resultados fueron:
CONTAMINACIÓN
COMUNIDAD ATMOSFÉRICA TOTAL
SI NO

Comunidad 1 43 157 200


Comunidad 2 81 119 200

TOTAL 124 276 400

¿Se puede, con estos datos muéstrales, concluir que la contaminación está
relacionada con la ubicación de las comunidades? Sea 𝛼 = 0,05
THE END

También podría gustarte