Está en la página 1de 5

www.medigraphic.org.

mx

Investigacin
Vol. 80, Nm. 2 Marzo-Abril 2013
pp 81-85

Cmo seleccionar una prueba estadstica


(Segunda parte)
(Choosing a statistical test. [Second part])

Manuel Gmez-Gmez,* Cecilia Danglot-Banck,* Leopoldo Vega-Franco**

La prueba t de Student, en su uso ms comn, es la prue- entre las frecuencias observadas y las esperadas son o
ba de hiptesis acerca de la media de una sola poblacin no significativas en uno o ms grupos categricos. La hi-
y tambin valoracin de si las medias de dos grupos son ptesis nula en esta prueba plantea que no existen dife-
estadsticamente diferentes entre s, lo que tiene los si- rencias entre las frecuencias esperadas y las observadas,
guientes supuestos: 1) las observaciones en cada grupo es as que la 2 se emplea tambin para conocer la bon-
siguen una distribucin normal; 2) la desviacin estndar dad de ajuste de las observaciones y resume si la discre-
en ambas muestras es igual, y 3) independencia. El valor pancia entre las frecuencias observadas y las esperadas
de las observaciones en un grupo no proporciona infor- es o no significativa; en cambio, la 2 de independencia
macin alguna sobre el otro grupo. se usa para conocer la relacin entre dos variables de
Es probablemente la prueba estadstica ms amplia- una muestra, y para saber si los dos factores estn o no
mente usada y conocida.22 Es simple, sencilla, fcil de relacionados. La 2 usa variables nominales (categricas)
usar y adaptable a una amplia gama de situaciones. o datos ordinales, en lugar de medias y varianzas.3,7,8,25
El anlisis de varianza define las diferencias en el n- En cuanto a la bondad de ajuste de la 2, sta parte de la
mero de hospitalizaciones entre tres o ms grupos; por suposicin planteada en trminos de que si se tira una
ejemplo, derechohabientes en el ISSSTE, IMSS y Seguro moneda al aire 100 veces, los resultados esperados son
Popular; medio socioeconmico alto, medio y bajo.23 que 50 veces sea guila y 50 sol; si a un lado de esta
La prueba t de Student pareada. sta se usa para suposicin se obtienen 47 guilas y 53 soles, tal diver-
comparar las diferencias con relacin a los promedios gencia ocurre porque la moneda tiene un sesgo o es
respecto de s mismos, o variaciones, relacionados con por casualidad? La hiptesis nula para tal experimento
el tiempo o circunstancias diferentes. Se emplea, por plantea que las frecuencias observadas son cercanas a las
ejemplo, para saber si hay diferencia en el nmero de frecuencias esperadas. La hiptesis alterna es que las fre-
hospitalizaciones segn el empleo de un nuevo medica- cuencias no sean prximas a lo esperado, as la frmula:
mento contra la displasia broncopulmonar en pacientes,
en una clnica ambulatoria, donde cada paciente sirve 2 = [(-E)2/E], en donde es la frecuencia obser-
como su propio control. vada y E la frecuencia esperada; en tal caso, para guila:
La hiptesis nula es que no existan diferencias en el 2 = (47-50)2/50 = 0.18 y para sol: 2 = (53-50)2/50 =
nmero de admisiones con el uso del nuevo medicamen- 0.18, por lo que la suma de estas categoras es 0.18 +
to. Por otra parte, considera la variacin de una prueba 0.18 = 0.36.
en un solo grupo (por ejemplo, antes y despus).24
La prueba estadstica conocida como chi cuadrada El significado de la bondad de ajuste se conoce cal-
www.medigraphic.org.mx
(2) es una prueba cualitativa para saber si las diferencias culando los grados de libertad y usando tabla de distri-
bucin de 2: si la chi cuadrada calculada es mayor que
el de la tabla, se rechaza la hiptesis nula, concluyendo
* Pediatra-Neonatlogo, Maestra en Ciencias con nfasis en Epide- que las predicciones eran incorrectas (en este expe-
miologa, UNAM. rimento, los grados de libertad seran [2 - 1] = 1). El
** Pediatra-Gastroenterlogo, Editor de la Revista Mexicana de Pe- valor crtico para una 2 para este ejemplo es = 0.05,
diatra.
y v = 1 es 3.84, o sea que es mayor de la 2 estimada
Este artculo puede ser consultado en versin completa en 0.36, lo que no rechaza la hiptesis nula y, por lo tanto,
http://www.medigraphic.com/rmp el sorteo fue justo.26
Gmez-Gmez M y cols. Cmo seleccionar una prueba estadstica

Es pertinente mencionar que en la prueba de 2 apli- En la comparacin de dos grupos pareados usan-
cada a tablas de contingencia de 2 x 2 no se calculan las do sus proporciones, cuando la variable es nominal, la
frecuencias esperadas: prueba indicada es la de McNemar, que se puede usar
cuando se comparan dos procedimientos para medir la
n (ad-bc)2 misma caracterstica o cuando se contrastan las opinio-
2 = nes de dos expertos.31
(a+c)(b+d)(a+c)(c+d)
La comparacin de tres o ms distribuciones inde-
pendientes usando la prueba de Kruskal-Wallis se usa
En general, cuando la frecuencia esperada es menor de cuando la variable no tiene una distribucin semejante
dos en alguna de las casillas, o stas tienen un 20% o ms a la curva normal o es de tipo discreto. Esta prueba su-
de cifras menores a cinco, no se debe usar la 2, y en las pone que hay un diseo con una variable independiente
tablas de 2 x 2 se recomienda hacer la llamada correccin o de ndole cualitativa nominal con ms de dos moda-
de continuidad (de Yates): que consiste en restar la mitad lidades: las que definen a los grupos por pertenecer a
de las diferencias entre las frecuencias observadas y las conjuntos diferentes y se denominan grupos indepen-
esperadas en el numerador de la 2, antes de elevar al dientes. Las conclusiones con esta prueba se basan en la
cuadrado, por lo que el valor de la 2 disminuye.27 comparacin de un valor H calculado versus un valor H
La prueba exacta de Fisher es, en cierta forma, semejan- crtico, de acuerdo con si los grupos son uno grande (n
te a la 2 y se usa al analizar las tablas de contingencia de dos >5) y el otro pequeo (K = 3, 4 o 5 y n < 5).32
filas y dos columnas, cuando los nmeros en cualquier casilla La prueba de Cochran evala si tres o ms conjuntos
de la tabla de contingencia, son < 5.28 con frecuencias o proporciones iguales difieren signifi-
cativamente entre ellos. La igualacin se fundamenta en
(a+b)!(c+d)!(a+c)!(b+d)! las caractersticas relevantes de los sujetos, o bien en
p= el hecho de que los mismos son usados en diferentes
a!b!c!d!n!
condiciones. Esta prueba es particularmente aplicable a
datos de tipo categrico (en escala nominal) o bien en
Se hace la comparacin de medias con la prueba de observaciones ordinales (o de intervalo) dicotmicas.33
la suma de rangos de Wilcoxon, la cual usa la magnitud El anlisis bilateral de la varianza por jerarquas de Fried-
de las diferencias entre las mediciones respecto a un su- man se usa siempre y cuando los datos sean medidos al
puesto parmetro de ubicacin; cabe agregar que esta menos en una escala ordinal y puedan ordenarse en una
prueba tiene los siguientes supuestos: 1) que la muestra clasificacin bilateral.34
sea aleatoria; 2) que la variable sea continua; 3) que la Si se pretende saber si existe una relacin entre dos
poblacin se distribuya de manera simtrica alrededor variables, se habla de una correlacin, y sta se calcu-
de la media, y 4) que la escala de medicin sea al menos la estimando su coeficiente de correlacin (r), la que
de intervalos; en esencia, esta prueba revela si las me- puede ser positiva o negativa. Cabe mencionar que la
dianas son diferentes.29 correlacin positiva ocurre cuando las puntuaciones al-
La prueba de la mediana es para probar la hiptesis tas de una variable se asocian con puntajes altos de la
nula de que dos muestras independientes fueron extra- otra, en tanto que una correlacin negativa es cuando las
das de poblaciones con medianas iguales.9 puntuaciones altas de una variable estn asociadas con
Cuando se desea comparar dos grupos en los que puntuaciones bajas en el otro extremo.2,9
se ha medido una variable cuantitativa continua, cuya Es pertinente mencionar que el anlisis de correla-
distribucin no es semejante a la curva normal, o bien cin se usa para cuantificar la magnitud o fuerza de la
cuando la variable en estudio es cuantitativa y discreta, relacin entre variables dependientes (por ejemplo, el
la prueba U de Mann-Whitney es una buena alternativa nmero de admisiones) y las variables independientes
www.medigraphic.org.mx
para comparar dos promedios independientes usando la
t de Student; esto con los siguientes supuestos: 1) que
(como el nmero de dosis de medicamentos, la edad,
visita al Servicio de Urgencias, etc.). Es pertinente men-
las dos muestras de tamao, n y m, usadas para el an- cionar que el valor de r se encuentra siempre entre 1
lisis hayan sido extradas de manera independiente y en y +1. Un valor r cerca de +1 indica una relacin lineal
forma aleatoria, de sus respectivas poblaciones; 2) que positiva fuerte, en comparacin con un valor cercano a
la escala de medicin sea por lo menos ordinal; 3) que la 1, lo que indica una fuerte relacin lineal negativa.
variable de inters sea continua, y 4) si las poblaciones La hiptesis nula es, por ejemplo, cuando no hay nin-
son diferentes, que stas varen solamente respecto de guna relacin entre el nmero de admisiones y el n-
sus medianas.30 mero de dosis de medicamentos, donde la correlacin

Rev Mex Pediatr 2013; 80(2); 81-85 82


Gmez-Gmez M y cols. Cmo seleccionar una prueba estadstica

es de p < 0.05, indica que el valor nulo de no relacin La regresin lineal se usa para predecir los cambios
es rechazado, aceptando la hiptesis alterna de que s en una variable independiente (en caso de una regre-
existe una relacin. Es conveniente mencionar que el sin lineal simple) o varias (en caso de una regresin
coeficiente de correlacin de Pearson (paramtrico) se lineal mltiple) que pueden afectar el valor de la varia-
emplea si se puede asumir que dos variables continuas ble dependiente.
se distribuyen normalmente;35 de lo contrario, se elige el Para el anlisis de la regresin lineal es necesario con-
coeficiente de correlacin de Spearman 36 siderar que la variable dependiente sea continua y con-

Cuadro 2. Flujograma para elegir la prueba estadstica adecuada.

Grupos Objetivos Distribucin normal Distribucin no normal Binomial

Uno Variables cualitativas RM = Casos y controles


Dos categoras RMP = Estudio
(tablas de 2 x 2) transversal
RR = Cohorte y ensayo
clnico

Diferentes resultados > 30 casos = 2


Diferentes categoras < 30 casos = Exacta de
de exposicin Fisher

Variables cuantitativas Prueba t de Student U de Mann-Witney


Dos categoras, de una muestra
una variable numrica

Una variable directa y una Regresin lineal simple r de Spearman


variable indirecta r de Pearson
r2 = Coeficiente
de correlacin

Una variable directa y dos r de Pearson


o ms variables indirectas r2 = Coeficiente
de correlacin
Regresin lineal mltiple

Comparar un grupo con t de Student Wilcoxon 2 o prueba binomial


un valor hipottico de una muestra

Dos No pareados Prueba de t no pareada U de Mann-Withney Prueba exacta de Fisher


(2 para muestras grandes)

Pareados Prueba de t pareada Wilcoxon McNemar

Tres o ms No pareados ANOVA unidireccional Kruskal-Wallis ANOVA Prueba de 2


en bloques

Pareados Medidas repetidas Friedman Q de Cochran


ANOVA

entre dos variables


www.medigraphic.org.mx
Cuantificar la asociacin Pearson r de Spearman Coeficiente
de contingencias

Predecir el valor de otra Regresin lineal o no lineal Regresin no paramtrica Regresin logstica simple
variable medida

Predecir el valor de varias Regresin lineal o no lineal Regresin logstica


medias o de variables mltiple mltiple
binomiales

83 Rev Mex Pediatr 2013; 80(2); 81-85


Gmez-Gmez M y cols. Cmo seleccionar una prueba estadstica

tenga una distribucin normal, en tanto que la relacin Referencias


entre una variable dependiente e independiente es li-
neal, y si tal suposicin no se cumple, los resultados pue- 22. Lowry R. Concepts and applications of inferencial statistics. t-
den ser incorrectos,2,9 mientras que para una variable test for two independent samples. In:http://faculty.vassar.edu/
lowry/ch11ptl.html(acceso_el 9 11 2012).
independiente, no es necesario que se distribuya nor- 23. Moses LE. Statistical concepts fundamental to investigations. NEJM
malmente; sin embargo, para el anlisis de correlacin, 1985; 312: 890-7.
ambas deben distribuirse de manera normal. 24. Gosset WS. The probable error of mean. Biometrika 1908; 6: 1-25.
Este documento es elaborado por Medigraphic 25. Gmez-Gmez M, Danglot-Banck C, Velsquez-Jones L. Ba-
En cuanto a la regresin lineal, sta se usa para ex-
ses para la revisin crtica de artculos mdicos. Rev Mex Pediatr
presar, en una ecuacin, la relacin que hay entre las 2001; 68: 152-159.
variables dependiente e independiente; de tal manera 26. Reynaga-Obregn J. Estadstica bsica en ciencias de la salud. Mxico:
que si estamos interesados en saber del nmero de vi- Distribuidora y Editora Mexicana; 1999. pp. 37-52.
sitas a un Servicio de Urgencias (variable independiente 27. Daniel WW. Bioestadstica. Bases para el anlisis de las ciencias de la
salud. 4 ed. Mxico: Editorial Limusa Wiley; 2002.
conocida como variable x), con relacin al nmero de 28. Meja-Arangur JM, Fajardo-Gutirrez A, Gmez-Delgado A, Cue-
admisiones al hospital (variable dependiente conocida vas-Uristegui ML, Hernndez-Hernndez DM, Garduo-Espinosa
como variable y), el anlisis de la regresin lineal se usa J et al. El tamao de muestra: un enfoque prctico en la investigacin
para saber su ecuacin. De esta forma se estima la ecua- clnica peditrica. Bol Med Hosp Infant Mex 1995; 52: 381-391.
29. Sackett DL. Bias in analytic research. J Chron Dis 1979; 32: 51-63.
cin de la lnea recta representada como y = a + bx, 30. lvarez-Martnez H, Prez-Campos E. Causalidad en medicina. Gac
donde los coeficientes a y b son el intercepto de la lnea Med Mex 2004; 140: 467-472.
estimada en el eje, ya que y es la pendiente.2,9 31. Armitage P, Berry G. Estadstica para la investigacin biomdica. 3 ed.
En lo que atae a la regresin logstica, sta es una Madrid: Harcourt Brace; 1997. pp. 145-64.
32. Dawson-Saunders B, Trapp RG. Bioestadstica mdica. 3 ed. Mxico:
variante de la regresin lineal que se usa para definir la El Manual Moderno; 2002. p. 335-52.
relacin que hay entre dos o ms variables, cuando la 33. Reynaga-Obregn J. Anlisis estadstico en ciencias de la salud.
variable dependiente es dicotmica y las independien- Mxico: Distribuidora y Editora Mexicana; 2001.
tes son datos categricos o continuos;37 a este respec- 34. Stevens SS. On the theory of scales of measurement. Science 1946;
103: 677-680.
to, en el cuadro 2 se pueden ver las pruebas estadsti- 35. Hernndez-vila M, Garrido-Latorre F, Lpez-Moreno S. Diseo de
cas aplicadas segn el tipo de variable. Es as como se estudios epidemiolgicos. Salud Pblica Mx 2000; 42: 144-154.
puede concluir que cuando se emplean variables cuan- 36. Velsquez-Jones L, Gmez-Gmez M. Valoracin de un artculo
titativas continuas, la media aritmtica y la desviacin biomdico. En: Martnez y Martnez R, editor. Cmo escribir un texto
en ciencias de la salud. Anatoma de un libro. 2 ed. Mxico: Manuel
estndar de las muestras con una distribucin normal, Moderno; 2002. p. 93-104.
se dice que existe homogeneidad de varianzas, es de- 37. Soyemi K. Choosing the right statistical test. Pediatr Rev 2012;
cir, con varianzas similares, con un tamao de muestra 33(5): e38-44.
suficiente (mayor a 30 casos); en tal caso se usan las Correspondencia:
pruebas estadsticas paramtricas; pero cuando no se Dr. Manuel Gmez Gmez
cumplen estos requisitos, si la distribucin es anormal Parque Zoquiapan Nm. 25,
y el tamao de muestra es menor a 11 casos, lo que Col. Lomas del Parque, 53398,
Naucalpan, Estado de Mxico.
est indicado es emplear pruebas no paramtricas o de Telfono: 55 76 56 06
libre distribucin. E-mail: mangomez@prodigy.net.mx

www.medigraphic.org.mx

Rev Mex Pediatr 2013; 80(2); 81-85 84


Gmez-Gmez M y cols. Cmo seleccionar una prueba estadstica

Diferencia por litro de leche


entre vacas mexicanas y francesas en 1932

Leche de vaca Protenas (g) Grasas (g) Lactosa (g)

Mxico 22 34 45
Francia 36 40 47

Como se ver, la leche de vaca de nuestro pas es inferior a la leche de vaca de Francia, porque en un litro de
leche existen 14 gramos menos de protenas, 6 gramos menos de grasas y 2 gramos menos de lactosa; y si valora-
mos las caloras tenemos que un litro de leche de vaca en Francia produce
712.3 caloras

y un litro de leche de vaca en Mxico produce 590.0 caloras

restando se obtiene: 122.3 caloras

ser que una de ellas estaba bautizada?

Es decir, que un litro de leche de vaca en Francia posee 122.3 caloras ms que el mismo volumen de leche de
vaca en Mxico; por otra parte, la diferencia por onza es la siguiente:
Una onza de leche de vaca en Mxico, 16 caloras, y una onza de leche de vaca en Francia, 20.5 caloras.

Resultando la mexicana en 4.5 caloras inferior a la onza de leche de vaca de Francia.


Me propuse hacer el estudio comparativo anterior, porque es fundamental conocer esto para administrar el ali-
mento adecuado a las necesidades del nio mexicano. Como veremos posteriormente, y lo tendr muy presente
al comentar el mtodo de alimentacin que an en los actuales momentos se est empleando para hacer el clculo
del alimento del nio en nuestra patria, si tenerse en cuenta la pobreza alimenticia de la leche de nuestras vacas,
como continuar demostrndolo terica y prcticamente en los captulos siguientes.

[Nota extrada de una de las pginas de la Rev Mex de Pediatra, en el volumen 2 de 1932].

www.medigraphic.org.mx

85 Rev Mex Pediatr 2013; 80(2); 81-85

También podría gustarte