Está en la página 1de 7

Criterios para seleccionar una prueba estadstica

Una investigacin bien planificada debe incluir en su diseo referencias precisas acerca de las tcnicas
estadsticas que se utilizan en el anlisis de los datos.

El anlisis estadstico es el procedimiento objetivo por medio del cual se puede aceptar o rechazar un conjunto
de datos como confirmatorios de una hiptesis, conocido el riesgo que se corre -en funcin de la probabilidad-
al tomar tal decisin. En las ltimas dcadas, el desarrollo de las pruebas estadsticas se ha incrementado a tal
grado que en la actualidad se cuenta con varias pruebas alternativas, las cuales se pueden usar para casi todo
diseo experimental, de modo que el investigador se encuentra ante el dilema de seleccionar la ms apropiada y
econmica, para las preguntas que, mediante la investigacin, desea contestar.

Ante esa situacin, es necesario tener una base racional, por medio de la cual se seleccione la prueba ms
apropiada. Esta seleccin constituye el punto crtico del anlisis estadstico.

En la seleccin de una prueba estadstica, se deben aplicar los criterios siguientes:

1. Tipo de escala.
2. Hiptesis.
3. Potencia y eficiencia de la prueba.
4. Caractersticas muestrales.
5. Tendencia rectilnea o curvilnea del fenmeno.

Tipo de escala
En las observaciones de una investigacin se puede dar una medicin que en este campo consiste en asignar
nmeros a objetos y eventos de acuerdo con reglas de la lgica aceptables.

El sistema numrico es una creacin altamente lgica, que ofrece mltiples posibilidades, para manifestaciones
tambin de carcter lgico. Si se puede, de manera legtima, asignar nmeros al describir caractersticas, objetos
y eventos, ser factible operar con ellos en todos sus modos permisibles y, de esas operaciones, derivar
conclusiones aplicables a los fenmenos observados y medidos. Entonces, se justifica describir cosas reales por
medio de nmeros, siempre y cuando exista un grado de isomorfismo (semejanza de propiedades) entre las
cosas reales y el sistema numrico, es decir, ciertas propiedades de los nmeros deben tener paralelismo con los
fenmenos observados, para que confiadamente se pueda asignar los nmeros.

Tres propiedades fundamentales de los nmeros permiten su aplicacin en el campo de la investigacin


cientfica: identidad, ordinalidad y aditividad.

Identidad: Cada nmero slo es igual a s mismo, de manera que ningn otro es igual a l, es decir,
posee identidad y, por lo tanto, a cualquier objeto o evento diferenciable de los dems, que tenga
identidad, se le podr aplicar un nmero. Este carcter de identidad de los nmeros de origen a la escala
nominal, que es un mtodo para identificar cualitativamente los distintos objetos y eventos, y resulta
obvio que no se le puede dar ningn significado cuantitativo, por ejemplo: si en un modelo experimental
se cuenta una serie de clases, en las cuales se consignan sus frecuencias, stas revelan un conjunto de
cada clase.
Grupo de 200 nios con y sin estrabismo.

Bajo el contexto de la tabla anterior, una muestra de 200 individuos en edad infantil se ha clasificado en
dos grupos por sexo (masculino y femenino) y por la presencia o ausencia de estrabismo. Como punto
de partida, la operacin de escalamiento consiste en que, a partir de una clase dada, se forman subclases
que se excluyen mutuamente. La nica relacin implicada es la de equivalencia, esto es, los miembros
de cualquier subclase deben ser equivalentes en la propiedad de medida. A su vez, la relacin de
equivalencia es reflexiva, simtrica y transitiva.

Por otro lado, las frecuencias informan de conjuntos de nios o serie de clases con una categora e
identidad, que dan una medida de las observaciones y son los valores sujetos a operaciones aritmticas.
En estas condiciones, se puede contrastar hiptesis de la distribucin de los casos, mediante la
aplicacin de pruebas estadsticas no paramtricas del tipo de prueba binomial, ji cuadrada y McNemar.
Todas estas pruebas son apropiadas para datos nominales, pues revelan las frecuencias en las categoras,
es decir, en datos enumerativos.

Ordinalidad: Adems de contar con la propiedad de identidad, las pruebas tambin tienen un orden o
rango siempre mayor que otro, el cual le precede en un continuum ascendente. Los objetos y eventos
susceptibles de un ordenamiento a lo largo de un continuum tienen una escala ordinal.

Las escalas ordinales se emplean frecuentemente en la investigacin clnica, en la que el refinamiento


cuantitativo a veces no es posible; por ejemplo: cuando se clasifica una respuesta en pacientes bajo los
trminos sin cambio, mejorado, curado, esto indica un rango de orden y clasificacin.

En conclusin, cabe establecer que mientras las escalas nominales slo clasifican, las ordinales
clasifican y ordenan, de manera que dan como resultado una serie de clases y categoras mutuamente
exclusivas, llamadas rangos.

Aditividad: Es importante comprender que los nmeros tienen propiedad aditiva, lo cual quiere decir
que la suma de un nmero con otro debe dar un tercer nmero nico. Esta propiedad de los nmeros no
slo identifica y ordena, sino adems puede sujetarse a todas las operaciones aritmticas de los nmeros.
Las conclusiones de tales operaciones son vlidas para las observaciones y dan lugar a la denominada
escala de intervalo.

De las mediciones que en el terreno de la investigacin se hayan realizado, puede inferirse que el tipo de
escala (nominal, ordinal e intervalo), de modo que ste es el primer paso para elegir un procedimiento
estadstico: la prueba paramtrica y la no paramtrica.

Mediciones, variables y escala para la eleccin de la prueba estadstica.


Hiptesis
La declaracin de la hiptesis alterna (Ha) que se desea analizar debe ser precisa, tan completa como resulte
posible, pues se trata de la aseveracin operacional de la hiptesis de investigacin por el experimentador. Debe
precisar la direccin que se espera o la ausencia de direccin. Este ltimo punto es fundamental para decidir si
la prueba estadstica por elegir ser de una o dos colas.

Conjuntamente al proceso anterior, se declara la hiptesis nula (Ho), en la cual simplemente se establece la
ausencia de diferencia y se declara, pare percibir con claridad, que la hiptesis se ajusta a la prueba estadstica.
Esto significa que al analizar un conjunto de observaciones, stas deben sujetarse a un ensayo de hiptesis nula,
condicin en la que se basan todas las pruebas estadsticas.

El investigador, al contrastar hiptesis de diferencias y/o correlacin, lo establece en funcin de una hiptesis
alterna (Ha) -punto fundamental de la experimentacin-, en contra de la hiptesis nula (Ho). Para decidirse por
una o por la otra, debe proponerse un razonable nivel de significancia, desde antes de aplicar la prueba
estadstica.

El nivel de significancia o significacin corresponde al lmite de confianza, del riesgo de error, que enjuicia el
investigador para aceptar su Ha como verdadera. De manera universal y arbitraria, dicho nivel se ha fijado en
0.05 y 0.01 de error y en 0.95 y 0.99 de certeza para aceptar hiptesis en el rea psicolgica, por que se espera
un 5% de variacin en las mediciones.

En la teora contempornea de la decisin estadstica, se han tratado de rechazar los procedimientos que
implican adhesin al nivel de significancia comentados, y se favorece el uso de procedimientos en los que las
decisiones se toman en trminos de funcin de prdida, utilizando principios de minimax; sin embargo, aunque
parece conveniente esta tcnica, las posibilidades de aplicacin prctica son dudosas en gran parte, en la
investigacin psicolgica.

Contrariamente a lo anterior, tambin se debe establecer la zona de rechazo, la cual corresponde al lmite de
confianza, en que el investigador rechaza la hiptesis alterna y acepta la hiptesis nula.

Bajo los trminos expresados, el investigador debe ser meticuloso al elegir la prueba estadstica y al plantear la
hiptesis, el nivel de significancia y la zona de rechazo, en virtud de que es factible cometer dos errores graves
en la decisin estadstica:

1. Error del tipo I. Rechazar la hiptesis nula (Ho), siendo verdadera.


2. Error del tipo II. Aceptar la hiptesis nula (Ho), siendo falsa.

Debe quedar claro que en cualquier inferencia estadstica existe el peligro de cometer cualquiera de los errores
mencionados y que el investigador equilibre en un nivel ptimo las propiedades de incurrir en uno u otro tipo de
error.

La probabilidad de cometer un error del tipo I est dada por (alfa), de manera que cuanto mayor sea alfa, ms
probable ser que Ho se rechace, siendo verdadera; a su vez, el error de tipo II est representado por (beta). La
siguiente figura muestra una escala de falso a verdadero, donde cero es falso y el valor uno verdadero.
Escala de probabilidad.

Entre el 0 y el 1 existen valores intermedios,


mientras que donde marca 0.95 existe una
diferencia de 0.05 con respecto a 1. Este lmite
corresponde al nivel de significancia o error alfa,
donde todo valor igual o menor que 0.05 se acepta
Ha. Por lo tanto, 1 - alfa = beta. Se dice que en esta
circunstancia, el investigador elige una cola en la
decisin estadstica. Por otra parte, cuando adems
de imponer un valor de alfa razonablemente
pequeo para aceptar Ha, tambin define un valor
de beta para aceptar Ho, elige dos colas.

De no decidir entre una u otra hiptesis, el


investigador se plantea la alternativa de aumentar
el tamao de la muestra, para que el fenmeno se
define con ms claridad y la decisin en el
contraste de la hiptesis sea ms consistente.

Eficiencia de la prueba
La validez del anlisis estadstico depende mucho de la eficacia de la prueba estadstica empleada. Se acepta
que una prueba estadstica es eficaz cuando tiene una probabilidad muy pequea de rechazar una hiptesis
verdadera, y una alta probabilidad de rechazar la hiptesis cuando sta es falsa. En presencia de dos pruebas
estadsticas, cuya probabilidad de rechazar hiptesis falsas sea igual, la seleccin en principio debe inclinarse
hacia la prueba que tenga la mayor probabilidad de aceptar la hiptesis cuando es verdadera.

La pruebas estadsticas se dividen en dos grandes grupos: paramtricas y no paramtricas. Las primeras son
aquellas cuyo modelo especifica ciertas condiciones o premisas que debe tener la poblacin, de la cual se ha
derivado la muestra bajo anlisis; adems se requiere expresar las observaciones en escala de intervalo o tasa.
Por otra parte, las pruebas no paramtricas, como su nombre lo indica, no requieren satisfacer esas condiciones
o premisas.

Las pruebas paramtricas son las ms eficaces y de uso comn en la investigacin, como las de comparacin de
promedios o prueba t de Student y la de anlisis de varianza de Fischer. Ambos procedimientos deben cumplir
las premisas siguientes:
1. Las observaciones deben ser independientes. Al seleccionar un caso, para incluirlo en la muestra, no se
deben prejuiciar las probabilidades de seleccin de ningn otro caso de la poblacin, asimismo, la
puntuacin que se d a una observacin no debe prejuiciar a ninguna otra.
2. Las poblaciones deben provenir de universos cuya distribucin siga una curva normal.
3. Las poblaciones deben tener la misma varianza, aunque en casos especiales es suficiente con saber la
tasa de sus varianzas.
4. Las variables consideradas en el estudio deben ser medidas por lo menos en escala de intervalo, para que
sea posible hacer operaciones aritmticas.

Cuando por cualquier razn no se puedan cumplir los requisitos de las pruebas paramtricas, el investigador
podr recurrir a las llamadas pruebas alternas, como la prueba t de Student-Welch, la F asimilada de Cochran y
la F de Tukey. En ellas no hay exigencia de homogeneidad de varianzas y, auxiliadas por un modelo
matemtico de ajuste, se puede obtener una eficacia que es muy cercana a la de las pruebas t de Student y de
anlisis de varianza.

Cabe sealar que, conforme menos condiciones o presunciones exige una prueba estadstica, en que se basa su
modelo matemtico, ms generales son sus conclusiones derivadas de su aplicacin; sin embargo, tambin es
menos eficaz para rechazar la influencia del azar, cuando ste no desempea un papel importante.

Cuando las observaciones en escala de intervalo no se ajustan a las premisas de las pruebas paramtricas, el
investigador debe estimar la prdida de eficacia para decidir utilizar los procedimientos no paramtricos, y
transformar aquellas en escalas nominales u ordinales.

Caractersticas muestrales
La manera en que influye la muestra para elegir una prueba estadstica est en funcin de su tamao, seleccin y
distribucin en el diseo experimental.

Tamao de la muestra: Anteriormente se habl de que la eficacia de una prueba estadstica disminuye
cuando se reducen las condiciones o premisas del modelo; sin embargo, a medida que aumenta el
tamao de la muestra, se incrementa tambin la eficacia. Dicha aseveracin generalmente es verdadera
para muestras de tamao definido, pero pueden carecer de veracidad al compararse dos pruebas
estadsticas con muestras de tamaos diferentes, es decir, si con un tamao de 30 por cada grupo, una
prueba A puede ser ms eficaz que la prueba B; en cambio, la prueba B es ms eficaz que A cuando sta
slo cuenta con un tamao de muestra igual a 20. En otras palabras, se puede evitar escoger entre
potencias y generalizacin, para lo cual se selecciona una prueba estadstica que tenga amplia
generalizacin, y luego aumentar su eficacia, comparable a la prueba ms til, incrementando el tamao
de la muestra.
Seleccin de la muestra: Las muestras por analizar pueden ser independientes y dependientes o
relacionadas.
o Muestras independientes. Son aquellas cuyo universo de poblacin resulta diferente, lo cual no
quiere decir que provengan de reas desconocidas, sino que, en trminos de estadstica, la
fenomenologa estudiada puede ser consecuencia de variables distintas y que, por cada variable
existente, hay un universo finito o infinito; por ejemplo, en la Tierra hay un nmero finito de
seres humanos, pero la variable sexo divide en dos universos diferentes: hombres y mujeres. En
el mismo sentido, el estado civil define otros universos distintos, solteros, casados, divorciados,
viudos, etc. De esta manera, se pueden enumerar mltiples variables, que dan lugar a una
infinidad de universos muestrales, de donde es factible elegir muestras independientes.
o Muestras dependientes o relacionadas. Se refieren a las provenientes de un universo muestral, a
las que se aplicar un plan experimental, mediante el cual se espera un cambio, que
obligadamente exige un punto de referencia de no cambio. Para esta condicin, el mismo grupo
experimental sirve como control o testigo, en el momento previo al tratamiento. De esta manera,
en el anlisis de las observaciones existen dos perodos: antes y despus del tratamiento.

Distribucin de la muestra en el diseo experimental: En los diseos experimentales, el nmero de


muestras con que est elaborado el modelo de investigacin tiene singular valor para elegir la prueba
estadstica, pues las conclusiones a que se llegue al no aplicar la prueba adecuada darn lugar a falsas
interpretaciones del experimento.

En los modelos de investigacin, se puede contar con una, dos o muchas muestras. Asimismo, puede
tratarse de muestras independientes o dependientes o relacionadas. Estas caractersticas dan un atributo
al diseo experimental, que obliga a analizar los datos de manera diferente, acorde con el modelo
estadstico que mejor se ajuste a contestar las preguntas planteadas por la hiptesis. Para saber si los
pacientes han alcanzado una total remisin de la enfermedad, se atiende a los hallazgos de tiempo de
sobrevida y a las alteraciones clnicas de la patologa. Si cuenta con varios tratamientos, se plantea la
pregunta de cul de ellos ha sido ms efectivo. As, se puede decir que una investigacin cuanta con
subclases diferentes. Para analizar sus observaciones y tomar una decisin de la efectividad de los
tratamientos, se pueden elegir las pruebas estadsticas diseadas para contrastar una hiptesis y para una
muestra.

Un ejemplo vlido es el de un investigador que trabaja con roedores, para estudiar las caractersticas
conductuales de agresividad y la concentracin de neurotransmisores en el sistema nervioso central. El
conjunto de la muestra est constituido por cobayos, ratas y ratones, que representan grupos con tres
gradientes de agresividad. En estas condiciones, el diseo experimental tiene tres muestras
independientes. La eleccin de la prueba estadstica se basar en las dos caractersticas y en el tipo de
escala de las mediciones. En el supuesto de que las concentraciones de neurotransmisores tengan una
medicin cuantitativa, una variable continua, una escala de intervalo y una distribucin normal, con
varianzas homogneas, la eleccin ms adecuada ser el anlisis de varianzas de Fischer de una entrada.
Si la decisin del investigador fuera utilizar la prueba t de Student, diseada para dos muestras,
cometera tres errores graves: a) prdida de tiempo, b) las comparaciones seran mltiples, tantas como
combinaciones existan (cobayos con ratas, cobayos con ratones y ratas con ratones), c) el ms
trascendente, desde el punto de vista de la decisin estadstica: las conclusiones a que se llegue no sern
consecuencia de comparaciones independientes, sino resultarn aisladas y en pequeos pares de grupos
de contraste. Es decir, si el investigador supone de antemano que entre los grupos existe variacin en el
grado de agresividad, perder la informacin que la variacin entre y dentro de grupos le demuestre la
existencia de una diferencia verdadera, al no incluir simultneamente a los tres grupos.

El ejemplo descrito permite comprender que cuando se analizan simultneamente diversos grupos de
muestras, las variaciones manifestadas entre los grupos de estudio dan lugar a una diferenciacin falsa o
verdadera. Los contrastes parciales que se verifiquen llevan el ttulo de independientes, porque se
supone una simultnea variacin o discordancia entre los grupos. As, se dice que, en estas condiciones,
el modelo experimental conserva ortogonalidad.

A veces, debido al diseo creado por el investigador, se proponen comparaciones con un modelo de
referencia, en el cual se supone la no existencia de modificaciones con respecto a la aplicacin de
tratamientos o variables. Estos grupos, tambin denominados control o testigo, servirn de lnea base
para medir los cambios que pudieran presentarse en los otros grupos. De esta manera, la magnitud del
cambio ser dependiente de lo que suceda en el control. Este tipo de diseo experimental, debido a las
comparaciones dependientes, ha perdido ortogonalidad. (Con mediciones de intervalo, se tiene la prueba
de Tukey.)

Tendencia rectilnea o curvilnea del fenmeno


Cuando la hiptesis resulta probar la asociacin o correlacin de variables, es importante conocer la linealidad
del fenmeno. Si es rectilneo y tiene una escala de intervalo, la aplicacin del coeficiente de correlacin de
Pearson parece adecuada; pero si este mismo procedimiento se aplica a un fenmeno curvilneo -an cuando
exista una verdadera asociacin-, dar lugar a aceptar hiptesis de no asociacin.

Un fenmeno curvilneo puede tornarse en rectilneo, mediante transformaciones matemticas (logaritmos,


funcin recproca, seno, coseno, etc.) y as aplicar la correlacin de Pearson.

Si se desconoce la linealidad, se deber utilizar la prueba de anlisis de covarianza para determinar la funcin
matemtica ms acorde con el fenmeno estudiado.

También podría gustarte