Está en la página 1de 7

ORIENTADORA 11

SOCIOMEDICA 3

PRUEBAS PARAMÉTRICAS
Como se estudio en la actividad orientadora anterior, el conjunto de procedimientos de inferencia
estadísticas denominados Paramétricos se caracteriza por:

La normalidad de la variable en la población muestrada.


La medición cuantitativa de las variables estudiadas.
Tener un tamaño muestral mayor que 30.
Utilizar parámetros en el planteamiento de hipótesis.
Utilizar estadígrafos muestrales en los cálculos.

Sin embargos hay situaciones a investigar en las que no se pueden cumplir las suposiciones que
requieren las pruebas paramétricas y entonces se utilizan las pruebas de hipótesis no paramétricas.
Las que se caracterizan por ser menos potentes pero muy efectivas cuando:
No es posible la normalidad de la variable en la población muestrada.
La medición se realiza en escala cualitativa.
Los tamaños muestrales sean pequeños.
No se utilizan parámetros en el planteamiento de la hipótesis.

Estas puedas también pueden utilizarse para variables cuantitativas continuas. Al igual que las
pruebas de hipótesis paramétricas, las no paramétricas ayudan al personal de salud a tomar una
decisión en torno a una población, mediante una prueba aleatoria obtenida de ella, de ahí su
importancia para la investigación clínico epidemiológico.
Al igual que las pruebas de hipótesis paramétricas, las no paramétricas ayudan al personal de salud a
tomar una decisión en torno a una población, mediante una prueba aleatoria obtenida de ella, de ahí
su importancia para la investigación clínico epidemiológico.
A continuación trataremos algunas pruebas estadísticas no paramétricas.
PRUEBAS DE INDEPENDENCIA
Para la distribución de frecuencias en las pruebas no paramétricas de independencia o asociación
estadística o variables, se utilizan las tablas de contingencias o de dos por dos, es decir dos filas por
dos columnas, como se muestra en la imagen.
En el ejemplo de tabla se quiere conocer si existe asociación entre las variables: bajo peso al nacer y
hábito de fumar de la madre durante el embarazo.
Para obtener los datos que contiene la tabla se selecciono una muestra aleatoria de 2000 gestantes
que corresponden con el tamaño de la muestra de la cual se obtienen los demás datos.
PRUEBAS DE HOMOGENEIDAD
Por otra parte, para la distribución de frecuencia de las pruebas no paramétricas de homogeneidad
utilizamos las tablas R por C o sea de R filas por C columnas.
Es frecuente el análisis de las situaciones en las que, de antemano, las poblaciones son conocidas
como diferentes, y el interés radica en tomar una decisión acerca de si el comportamiento de estas es
homogéneo al respecto a algunas características.
Radica en tomar una decisión acerca de si el comportamiento de estas es homogéneo al respecto a
algunas características.
Pongamos un ejemplo: En una población de enfermos de cáncer se seleccionan tres muestras
aleatorias de 100 personas cada una de acuerdo a su ocupación y se clasifican según tipo de cáncer
que padecen; con los resultados se puede confeccionar la tabla R por C que se presenta en la
imagen.
En este caso se quiere probar que la proporción para cada tipo de cáncer debe ser la misma no
importada la ocupación.
A diferencia de la tabla anterior en ésta, los datos se obtienen a partir de los totales de las tres
categorías ocupacionales, teniendo en cuenta el tipo de cáncer que padecen.
Si bien estas pruebas tienen muchos aspectos comunes ellas difieren en cuanto a:
Las particularidades de las tablas que sirven de soporte a cada prueba, como acaban de ver a si
como; En las hipótesis que se someten a pruebas y como es lógico a la conclusión a que se arriba
con cada una de ellas.
Las formas más conocidas de tratamiento estadístico de estas tablas son: la prueba de Chi cuadrado
de independencia y la prueba de Chi cuadrado de homogeneidad.
La prueba de Chi cuadrado resulta útil en las investigaciones clínico epidemiológicas principalmente
en las observacionales analíticas, tanto en las de cohorte como en las de casos y controles, cuando
se quiere conocer independencia u homogeneidad entre variables analíticas, tanto en las de cohorte
como en las de casos y controles, cuando se quiere conocer independencia u homogeneidad entre
variables.
Para ampliar en la prueba Chi cuadrado de homogeneidad también llamada de heterogeneidad,
ustedes la pueden revisar en el capitulo IX Análisis de frecuencias, del libro introducción a la
investigación en ciencias de la salud, que se encuentra en el CD de la asignatura.
A continuación estudiaremos la prueba Chi cuadrado de independencia o asociación.
PRUEBAS DE CONTINGENCIA
En ocasiones el investigador está interesado en el estudio de una posible asociación entre dos
variables cualitativas, como por ejemplo la asociación en el sobrepeso y la Hipertensión arterial o la
asociación entre la aparición de caries dentales y la aplicación de laca flúor. Para ello en la práctica
contamos con las pruebas de contingencias.
Veremos las características de las pruebas de contingencias, que se basan en el uso de las tablas de
contingencias las que están constituidas como ya saben, por dos filas y dos columnas donde se
clasifica la información relativa a una muestra respecto a dos variables aleatorias, mediante el uso de
escalas apropiadas a las que se les da determinado tratamiento estadístico. Un ejemplo de la tabla de
contingencia la pueden observan en la imagen. Un ejemplo de la tabla de contingencia la pueden
observan en la imagen.
PRUEBA CHI CUADRADO DE
INDEPENDENCIA O ASOCIACIÓN
La prueba Chi cuadrado de independencia o asociación, se utiliza cuando se obtiene una muestra
aleatoria de la población que se clasifica de acuerdo a dos variables, preferentemente cualitativas y
se desea conocer a partir de los datos de la muestra, si exige asociación entre estas variables a nivel
poblacional.
Esta prueba permite determinar si dos variables cualitativas están o no asociadas.
Es válido aclarar, que si bien la prueba puede utilizarse para cualquier tipo de variable, este
procedimiento se utiliza preferiblemente para variables cualitativas nominales ya que existen pruebas
de mayor especificidad para variables medidas en escala ordinal u otras escalas.
Vemos el siguiente ejemplo:
Un grupo de investigadores desea estudiar la enfermedad de Alzheimer en relación con el sexo, para
la cual diseñaron un estudio de prevalencia n una muestra aleatoria de 779 adultos del estado Sucre.
A partir de los datos que nos proporciona la muestra construimos la tabla de contingencia teniendo en
cuenta las dos variables en estudio: enfermedad de Alzheimer y sexo, cuyos resultados se exponen
en la tabla que muestra la imagen.
Estudio: enfermedad de Alzheimer y sexo, cuyos resultados se exponen en la tabla que muestra la
imagen. Note, que tanto la variable sexo como enfermedad de Alzheimer son cualitativas nominales.
La tabla de contingencia que observan en la imagen, llamada también de dos por dos, cuenta con dos
filas y dos columnas.
En este caso ambas variables de clasificación son del tipo de dicotómicas, es decir, de la clase de
variables que sólo tiene dos categorías posibles.
Para contar el número de filas y columnas que tiene una tabla de contingencia no se tienen en cuenta
la fila y la columna de los totales.
En la tabla, el único valor que se conoce de antemano, es el valor 779 que es el tamaño de la
muestra aleatoria observada. Con éste valor se construye la tabla, analizando: del número de
enfermos de Alzheimer, cuántos son del sexo masculino y cuántos son del sexo femenino y el
número de sanos de ambos sexos. Estos valores se obtienen mediante su búsqueda de la muestra y
observen que sus categorías o eventos son mutuamente excluyentes.
Los totales marginales por columnas y filas o sea 40, 739, 294 y 485, resultan de la suma de estos.
Es decir a partir del valor de la muestra (779) se hayan los demás valores que son desconocidos e
impredecibles ante de llevar a cabo la clasificación. Estas particularidades de la tabla de contingencia
es lo que los hace apropiadas para su empleo en la prueba de hipótesis para la independencia.
Estas particularidades de la tabla de contingencia es lo que los hace apropiadas para su empleo en la
prueba de hipótesis para la independencia.
En la tabla, las frecuencias observadas en nuestro estudio (7, 287, 33 y 452) se denotan por n sub
uno, uno; n sub uno, dos; n sub dos, uno y n sub dos, dos, respectivamente, en donde:
N sub uno, uno es igual a la Frecuencia observada en la fila 1 de la columna 1 o sea 7.
N sub uno, dos es igual a la Frecuencia observada en la fila 1 de la columna 2 o sea 287.
N sub dos, uno es igual a la Frecuencia observada en la fila 2 de la columna 1 o sea 33 y;
N sub dos, dos es igual a la Frecuencia observada en la fila 2 de la columna 2 o sea 452.
Se denominan frecuencias observadas por ser los valores que aparecen en la tabla de contingencia
obtenidos de la muestra.
En la tabla también podemos observar los totales de las filas, denominados totales marginales de las
filas, es decir 294 y 485 que se denotan por Tf sub uno y Tf sub dos respectivamente en donde:
Tf sub uno es igual al total marginal de la fila 1, o sea, 294 y;
Tf sub dos es igual al total marginal de la fila 2, o sea, 485. También podemos observar los totales de
las columnas denominados totales marginales de las columnas (40 y 739) que se denotan por Tc sub
uno y Tc sub dos respectivamente en donde:
También podemos observar los totales de las columnas denominados totales marginales de las
columnas (40 y 739) que se denotan por Tc sub uno y Tc sub dos respectivamente en donde:
Tc sub uno es igual al total marginal de la columna 1, o sea, 40
Tc sub dos es igual al total marginal de la columna 2, o sea, 739.
PASOS PARA REALIZAR EL
PROCEDIMIENTO DE UNA PRUEBA DE HIPÓTESIS
Apliquemos en el ejemplo anterior los pasos para realizar el procedimiento de una prueba de
hipótesis.
El primer paso es la Formulación de Hipótesis, por lo que tenemos que declarar la hipótesis nula y
la hipótesis alternativa, las que para una prueba de hipótesis de independencia, se plantean del modo
siguiente:
La hipótesis nula H sub cero es: Existe independientemente entre las variables estudiadas.
La hipótesis alternativas H sub uno es: No existe independencia.
Para el ejemplo queda de la siguiente forma:
H sub cero: estar enfermo de Alzheimer es un hecho independientemente del sexo de la persona. H
uno es: estar enfermo de Alzheimer no es un hecho independientemente o sea es un hecho asociado
al sexo de la persona.
H uno es: estar enfermo de Alzheimer no es un hecho independientemente o sea es un hecho
asociado al sexo de la persona.
El segundo paso de las pruebas de hipótesis de Chi, es la confección de la tabla de contingencia y
la elección de la prueba estadística correspondiente.
Para elaborar una tabla de contingencia de la prueba de hipótesis para la independencia se comienza
por la selección de una muestra aleatoria proveniente de la población en estudio.
Ambos márgenes de la tabla son desconocidos de antemano, así como los valores de las frecuencias
observadas de las celdas, porque hay que obtenerlos mediante la brusquedad del dato primario.
La prueba estadística seleccionada será la de Chi cuadrado para la independencia que es una prueba
no paramétrica, ya que las hipótesis no se plantean sobre parámetros poblacionales.
El tercer paso sería la selección por parte del investigador del nivel de significación, que como
ya conocen éste es el valor máximo de probabilidad que estamos dispuestos a cometer el error de
rechazar la hipótesis nula cuando esta es verdadera. Se acostumbra a denotar este valor por la letra
griega alfa. Como sabemos el nivel de significación se selecciona a priori por el investigador.
En el ejemplo el valor de alfa es igual a 0.05.
El siguiente paso sería la elección y el cálculo del estadígrafo de la prueba con su distribución
muestral asociada.
El estadígrafo que utilizaremos en este caso es el Chi- cuadrado calculado cuya fórmula con
corrección de Yates se muestra en la imagen.
Este estadígrafo sigue una distribución Chi cuadrado con (f menos1) multiplicado por (c menos 1)
grados de libertad. En donde: f es igual al número de filas y c es el número de columnas de la tabla
de contingencia.
A partir de aquí no
Las frecuencias esperadas o teóricas son aquellas que deberían ocurrir en cada celda de la tabla de
contingencia, si la hipótesis nula H sub cero de independencia fuese cierta.
Explicaremos a continuación el significado de grados de, libertad a partir de la tabla ya conocida y
que como se dijo, tiene un grado de libertad, por ser una tabla de dos por dos.
En ella se muestran 40 enfermos de Alzheimer; si tenemos el valor observado 7 del sexo masculino,
queda definido el otro valor 33 del sexo femenino viceversa, es decir, que tenemos un valor
observado en la columna, ya queda definido el otro.
GRADOS DE LIBERTAD
Esto quiere decir que en el caso de la tabla que se observa, los grados de libertad se calculan
restando, al total de celdas de las filas internas, el valor de uno y al total de celdas de las columnas
internas, el valor de uno, ya que como vimos, si del total de enfermos de Alzheimer sabemos que 7
son masculinos, la única opción es que 33 sean femeninos, por lo tanto sólo hay una opción de
libertad internas, el valor de uno y al total de celdas de las columnas internas, el valor de uno, ya que
como vimos, si del total de enfermos de Alzheimer sabemos que 7 son masculinos, la única opción es
que 33 sean femeninos, por lo tanto sólo hay una opción de libertad.
Aplicando la fórmula y sustituyendo los valores, para la tabla que el Chi cuadrado calculado es igual a
6,47

El quinto paso de este procedimiento sería definir la región de rechazo de la prueba de hipótesis.
Que es el conjunto de valores que conducen a rechazar la hipótesis nula Ho.
Se utiliza la distribución del estadígrafo Chi cuadrado y la región crítica o de rechazo queda definida
al seleccionarse por el investigador el nivel de significación alfa, como se muestra en la imagen.
El sexto paso del procedimiento de la prueba de hipótesis se debe partir del conocimiento que todos
los valores posibles que el estadígrafo de prueba puede asumir, constituyen puntos sobre el eje
horizontal del gráfico de la distribución de dicho estadígrafo, y se dividen en dos grupos: los valores
de la región de no rechazo de la hipótesis nula H sub cero y los de la región crítica o de rechazo de la
hipótesis nula H sub cero, dividen en dos grupos: los valores de la región de no rechazo de la
hipótesis nula H sub cero y los de la región crítica o de rechazo de la hipótesis nula H sub cero.
La regla de decisión señala que se debe rechazar la hipótesis nula si el valor del estadígrafo de la
prueba calculado a partir de los datos obtenidos en la muestra, que es el Chi cuadrado calculado, es
uno de los valores de la zona de rechazo, y que no se debe rechazar en caso contrario.
La regla de decisión aquí seria:
Rechazar la hipótesis nula, H sub cero, si Chi calculado es mayor o igual al Chi cuadrado crítico para
un nivel de significación alfa y un determinado grado de libertad, y ;
No rechazar la hipótesis nula, H sub cero, si Chi cuadrado calculado es menor al Chi cuadrado crítico
para un nivel de significación alfa y un determinado grado de libertad.
El valor de Chi cuadrado crítico se obtiene de la tabla de la distribución Chi cuadrado para un nivel de
significación alfa y un determinado grado de libertad.
En el caso de la tabla 1 los grados de libertad se obtienen multiplicando el número de filas menos uno
por el número de columnas menos uno, o sea, será igual a 1 como en todas las tablas de dos por
dos.
Además el nivel de significación alfa es igual a 0.05. Con estos datos buscamos el valor de Chi en la
tabla de la distribución de Chi cuadrado y se obtiene un valor de 3,84, como observan en la imagen
que muestra un fragmento de dicha tabla, para un grado de libertad y alfa igual a 0,05. Con estos
datos buscamos el valor de Chi en la tabla de la distribución de Chi cuadrado y se obtiene un valor de
3,84, como observan en la imagen que muestra un fragmento de dicha tabla, para un grado de
libertad y alfa igual a 0,05.
El Chi cuadrado calculado como ya vimos es igual a 6,47, este valor por ser mayor que el CHI
cuadrado crítico cae en la zona de rechazo de la hipótesis nula como se observa en el gráfico, por lo
que se rechazaría la hipótesis nula.
Otra forma de aplicar la Regla de Decisión es utilizando el valor de p es decir, la probabilidad
asociada al estadígrafo Chi calculado, el mismo suele usarse con mayor frecuencia que el valor del
estadígrafo y las conclusiones son equivalentes con ambas pruebas.
En este caso se compara el valor de p con el valor del nivel de significación alfa prefijado, como se
observa en el gráfico de la imagen, note además que el gráfico, p representa el área sombreada bajo
la curva, que como pueden apreciar se encuentra en la zona de rechazo.
Este valor se puede obtener de forma aproximada en las tablas de distribución Chi cuadrado, pero los
programas estadísticos de computación suelen darlo con exactitud.
Como ya se mencionó cada estadígrafo tiene asociado un valor de probabilidad p.
Ustedes pueden profundizar el estudio de estos contenidos si revisan el material complementario del
tema. REGLA DE DECISIÓN
REGLA DE DECISIÓN
La regla de decisión para una prueba de hipótesis de Chi cuadrado tomando en cuenta la
probabilidad p asociada al estadígrafo sería:
Si p menor o igual que alfa, se rechaza la hipótesis nula H sub cero a ese nivel de significación de
alfa y;
Si p es mayor que alfa, no se rechaza la hipótesis nula H sub cero a ese nivel de significación de alfa.
En el ejemplo desarrollado a lo largo de esta actividad, el Chi cuadrado calculado cuyo valor es igual
a 6,47, la probabilidad p asociada obtenida de la tabla de la distribución de Chi cuadrado es igual a
0,0115 y alfa es igual a 0,05.
Como p es menor que 0,05, se rechaza la hipótesis nula H sub cero, con un nivel de significación de
alfa de 0,05.
Esta decisión coincide con la anterior donde se comparan los resultados del estadígrafo Chi calculado
con el Chi crítico.
CONCLUSIONES DE LA PRUEBA
Las conclusiones son el séptimo y último paso del procedimiento de una prueba de hipótesis y se
expresan en términos de rechazo o no rechazo de la hipótesis nula y son avaladas por los resultados
obtenidos a partir de los estadígrafos muestrales y por los resultados de la prueba de hipótesis,
dependerán además del tipo de investigación. En el ejemplo de acuerdo a los resultados de la prueba
de Chi cuadrado se concluye que todo parece indicar que no hay independencia, es decir existe
relación entre padecer o no de Alzheimer y el sexo.
En el ejemplo de acuerdo a los resultados de la prueba de Chi cuadrado se concluye que todo parece
indicar que no hay independencia, es decir existe relación entre padecer o no de Alzheimer y el sexo.
Ahora realizaremos el mismo ejercicio de la tabla 1 que se muestra en la imagen, utilizando el
programa computarizado Medcalc para resolver el problema de la prueba de hipótesis de Chi
cuadrado de independencia.
El procedimiento inicial es el mismo que se explico anteriormente. Para obtener el Chi cuadrado
calculado y la probabilidad p asociada al mismo utilizaremos el programa Medcalc para lo cual debe
proceder de la manera siguiente.
Primero debemos abrir el programa, que se debe estar instalado en la microcomputadora
previamente.
En la imagen que observan se muestra la ventana inicial de Medcalc. En la barra de menú
seleccionamos la opción TEST que significa prueba, de inmediato se despliega un submenú del que
debe seleccionarse la opción Chi square test, que significa prueba de Chi cuadrado
Aparece la ventana de ésta prueba mostrando una tabla vacía donde se deben introducir los datos
primarios que son los valores observados en la tabla 1, de la siguiente forma:
El valor de n sub uno, uno se coloca en la celda N mayúscula 1, M mayúscula 1; El valor de n sub
uno, dos se coloca en la celda N mayúscula 1, M mayúscula 2;
El valor de n sub uno, dos se coloca en la celda N mayúscula 1, M mayúscula 2;
El valor de n sub dos, uno, se coloca en la celda N mayúscula 2, M mayúscula 1; y
El valor de n sub dos, dos se coloca en la celda N mayúscula 2, M mayúscula 2 como se muestra en
la imagen. A continuación se selecciona el botón TEST, que significa prueba, que se encuentra en la
parte inferior derecha de la ventana.
Inmediatamente se mostrara en la parte inferior el valor de Chi cuadrado calculado, los grados de
libertad y probabilidad p asociada al estadígrafo. Observen lo sencillo y la rapidez con que se
obtienen los resultados.
Después se continuara con el resto de los pasos del procedimiento de la prueba Chi cuadrado que ya
conocen.
Un aspecto que no debemos dejar de mencionar son algunos de los errores más frecuentes que se
cometen en el uso de las Pruebas de Independencia y Homogeneidad, uno de ellos la:
Utilización de la prueba cuando existen valores esperados muy pequeños. Se ha demostrado que en
las tablas de filas por columnas, cuando más del 20 % de las frecuencias esperadas es inferior a 5, o
algunas de estas es inferior a 1, no deberá realizarse la prueba. En el caso de las tablas de
contingencia de 2 filas por 2 columnas, si la menor frecuencia esperada es inferior a 5 no deberá
realizarse la prueba. Otro de los errores es el. Uso de las pruebas cuando se dispone de valores
promedios o porcentajes ya que estas pruebas de independencias u homogeneidad se utilizan a partir
de las frecuencias observadas.
Uso de las pruebas cuando se dispone de valores promedios o porcentajes ya que estas pruebas de
independencias u homogeneidad se utilizan a partir de las frecuencias observadas.
Al igual que en la actividad anterior les recordamos que es importante ser muy cuidadoso a la hora de
dar conclusiones e interpretaciones y que la decisión aportada por la prueba de hipótesis estadística
no debe interpretarse como definitiva, ella es solo parte de la evidencia que influye sobre la evidencia
del investigador.
La estadística es una ciencia que ayuda a decidir pero no decide en el campo de la investigación
clínico epidemiológica, ya que la toma de decisiones del investigador no depende solamente del
resultado de la prueba estadística, sino que debe tomar en cuenta el conjunto de evidencias
alrededor del problema científico que salen del marco de ella.
Si de forma objetiva el resultado de una investigación es evidente no necesariamente se debe utilizar
una prueba estadística.
TAREAS DOCENTES
A continuación le proponemos las siguientes tareas docentes:
1. Elabore un cuadro comparativo entre las pruebas paramétricas y no paramétricas, teniendo en
cuenta los siguientes aspectos:
 Distribución de los valores de la variable en la población.
 Tipo de variable.
 Tamaño de muestra.
 Utilización de parámetros en el planteamiento de la hipótesis.
Para su elaboración puede apoyarse, en la revisión del capítulo XIV Métodos no Paramétricos del
Libro Introducción a la Investigación en Ciencias de la Salud que se encuentra en el CD de la
asignatura.
2. Un grupo de investigadores desea estudiar la relación entre las enfermedades de deterioro psico
genético y la depresión para lo cual lo diseñaron un estudio y obtuvieron una muestra aleatoria de
100 adultos de una población rural.
A partir de los datos que nos proporciona la muestra, construimos la tabla de contingencia teniendo
en cuenta las dos variables en estudio o sea: deterioro psico genético y depresión, cuyos resultados
se exponen en la imagen. El nivel de significación alfa es 0,05.

Deterioro psicogenético
Depresión Si No Total
Si 38 31 69
No 9 22 31
Total 47 53 100

A partir de la situación anterior:


a. Realice el planteamiento de la hipótesis nula Ho y de la alternativa H1.
b. Diga los grados de libertad de la tabla.
c. Utilizando el programa Medcalc, obtenga el Chi cuadrado, halle la probabilidad asociada al mismo.
d. Plantee la regla de decisión y;
e. Llegue a una conclusión.

También podría gustarte