Está en la página 1de 5

Anlisis Descriptivo Inferencial

Comparacin de muestras
La comparacin de valores en dos o ms subgrupos de una poblacin total es
relativamente fcil, bastara con comparar directamente los dos valores. El
mismo procedimiento se utilizara si se tratase de proporciones o porcentajes
calculados.
La situacin cambia cuando la comparacin se hace con una muestra
probabilstica. En tal caso el investigador debe realizar pruebas especiales que
permitan pronunciarse sobre la significacin estadstica que pueda tener la
diferencia encontrada entre los valores comparados.
As si un grupo tiene una media de 24 en una variable y otro grupo una media
de 26 en la misma variable debemos preguntarnos si esa diferencia tambin
se da en la poblacin de la cual extrajimos la muestra, o la diferencia podra
deberse al error de muestreo al cual estn sometidas, probabilisticamente,
todas las muestras que se toman de una poblacin o universo.
Para resolver problemas como el anterior se usan de pruebas de
significacin estadstica, que son propias para cada medida que se va a
comparar.
La secuencia del clculo necesaria para su realizacin se expone a
continuacin:
1 Formulacin de una hiptesis nula y de una hiptesis alternativa. Como
lo sugiere su nombre, la hiptesis nula plantea que en la poblacin de la cual
se extrajo la muestra no existe diferencia entre los valores de los subgrupos
que se desean comparar (proporcin, media aritmtica). Sin embargo, como el
investigador supone que existe una diferencia ( y pudo haberlo expresado as
en una de las hiptesis de su estudio), formula una hiptesis alternativa que
exprese que existe tal diferencia, que la misma es estadsticamente
significativa, y que ella se da en la poblacin de la cual se extrajo la muestra.
2 Eleccin de una distribucin de muestreo.
La mayora de las medidas estadsticas utilizadas en el anlisis de datos
cuantitativos tienen distribuciones de probabilidad conocidas, como tambin
algunas de ellas tienen ese tipo de distribuciones para diferencias entre dos
medidas.
En cada caso, esas distribuciones indican la probabilidad de que un cierto valor
encontrado en una muestra se pueda dar en su correspondiente poblacin, o la
probabilidad de que una diferencia de una cierta magnitud pueda darse entre
subgrupos tomados muestralmente de una misma poblacin
Digamos que si se toman muchas muestras y en cada una de ellas se calcula
una misma proporcin (como podra ser el caso de personas que estn de
acuerdo con el control de la natalidad), entonces, el total de las proporciones
de esas muestras se distribuye en la forma de la curva normal.

Por esta propiedad de la distribucin de frecuencias - que tambin tienen otras


distribuciones muestrales, como la que corresponde a la diferencia entre
proporciones - sabemos que un 5% de todas las proporciones, convertidas en
puntuaciones Z, quedan ms all de 1,96 unidades z; 2,5% son mayores y
2,5% son menores.
Es decir, la probabilidad de encontrar en una muestra una proporcin cuyo
valor z sea superior o inferior a 1,96 z, es del 0,05.
En otras palabras, existe una probabilidad del 0,95 (o un nivel de confianza del
95%) que la proporcin encontrada se aleje menos de 1,96 z de la media de la
distribucin, que la verdadera media aritmtica de la poblacin. Dicho en forma
aproximada, que la diferencia encontrada sea la que corresponda,
probabilisticamente, al error de muestreo.
No todas las medidas de las muestras de una poblacin se distribuyen segn la
curva normal. Algunas de ellas lo hacen segn la distribucin t de Student, la
distribucin F, o la Chi cuadrado
3. Eleccin de un nivel de significacin.
De acuerdo con lo expuesto anteriormente las pruebas de significacin
estadstica se basan en la teora de las probabilidades. Cuando el investigador
realizar una de estas pruebas se pregunta. Cual es la probabilidad de que un
valor como el encontrado en mi estudio se d al azar? Frente a esta pregunta
hace una eleccin que define el riesgo probabilstico que tiene el aceptar su
resultado. Podr decir, por ejemplo, que ese valor transformado a valores z o (T
o F segn la estadstica apropiada) puede darse al azar en un 5% de las
veces. Tal porcentaje recibe el nombre de nivel de significacin que
convencionalmente se designa con la letra alpha.
Los siguientes valores de z definen reas de la curva normal que comprenden
proporciones o porcentajes de casos valores de muestras- en ambos o en
uno u otro lado de la curva normal, a partir de la media aritmtica:
a) % de casos a ambos lados del rea de la curva a partir de la media
aritmtica
Z
1,64

%
90

1,96

95

2,55

99

Casos en los extremos


El 10% restante queda
en los dos extremos o
zona de rechazo
El 5% restante queda en
los dos extremos o zona
de rechazo
El 1% restante queda en
los dos extremos o zona
de rechazo

Las terminaciones de la curva normal se denominan colas de la distribucin.


Cuando tenemos base para suponer que una de las medidas de las muestras
por comparar es mayor o menor que la otra, entonces las hiptesis alternativa
se plantea como x1>x2; o x2>x1. En casos como este se utiliza una prueba de
significacin de una cola. Si no existe esa base se utiliza una prueba de
significacin de dos colas. , lo cual quiere decir que la diferencia en el universo
podra se mayor o menor, en trminos probabilsticas, que la encontrada en el
estudio.
Respecto al nivel de significacin, queremos recordar que un valor de z igual o
inferior a 1,64 unidades z puede darse al azar un 5%, a la inversa, un valor
superior a 1,64 significa que la probabilidad de darse al azar en las muestras
de un universo es menor de 5%.
Ese valor calculado, decide la aceptacin o no de la hiptesis nula. Como se
trabaja en base a probabilidades, existe el riesgo de rechazar la hiptesis nula
cuando es correcta, con lo que se comete un error de tipo I. Este error se
reduce cuando se baja el nivel de significacin. Pero al hacer eso se corre el
riesgo de cometer un error de tipo II, es decir aceptar la hiptesis nula cuando
existe diferencia entre los grupos comparados.
4 Clculo del estadstico de la prueba. Calcular el valor de z, o T, o f.
5 Aceptacin o rechazo de la hiptesis nula.
Los valores de z, t, o F que puedan encontrarse en los clculos anteriores se
comparan con valores que estn en tablas de los textos de estadstica con las
correspondientes o con probabilidades para el nivel de significacin elegido por
el investigador.
Cuando el valor calculado es mayor que el de la tabla se rechaza la hiptesis
nula y se acepta la hiptesis alternativa. Es decir, se acepta en trminos
probabilsticos, que existe una diferencia estadsticamente significativa. Si el
valor encontrado es menor que el de la tabla se acepta la hiptesis nula, pues
el valor encontrado puede darse al azar ms veces de lo que nos lo permite el
nivel de significacin., en otras palabras no existe significacin estadstica entre
los grupos comparados.
Comparacin de dos medias
En un grupo de 25 nios de 3 aos de edad sometidos a un procedimiento de
estimulacin temprana, se encuentra despus de cierto grado de aplicacin, un
aumento de 7,5 puntos en su promedio del nivel de desarrollo psicomotor, con
una desviacin estndar de 6,5. A su vez en un grupo de control equivalente de
otros 25 nios, no sometidos al programa de estimulacin temprana la
diferencia entre sus mediciones antes y despus es de 6 puntos con una
desviacin de 5,90.
Podramos afirmar que existen diferencias significativas entre dichos
promedios?

Pasos a seguir:
a) Proponer las hiptesis nula y alternativa
b) Obtener el estadstico T que es el estadstico que compara medias en
poblaciones pequeas independiente menores de 30 casos
c) Se compara el valor T obtenido con el T de la tabla o se comparan las
probabilidades obtenidas por el programa estadstico correspondientes.
Si la T obtenida es mayor que t la de la tabla se rechaza la hiptesis nula de
no diferencias(o el nivel de probabilidad obtenido por el programa informtico
menor que el nivel de significatividad elegido por el investigador)
Comparacin de dos proporciones
Supongamos que en una investigacin realizada en una comunidad, de la cual
se ha tomado una muestra probabilsica, el 56% de un grupo de 150 personas
con alto nivel de escolaridad dice que su situacin econmica ser mejor en los
prximos aos. Por otro lado el 47% de otro grupo de la misma muestra de
120 personas de bajo nivel de escolaridad opina en el mismo sentido que el
otro grupo. Es la diferencia entre ambos porcentajes estadsticamente
significativa, o sea, existe diferencia con los mrgenes de error de muestreo del
caso, en la comunidad de la cual se tomo la muestra?
Pasos a seguir
a) Se plantea la hiptesis nula de no diferencias en las muestras y la
alternativa
b) Se elige el nivel de significacin en este caso un 0,05 ( 5%)
c) Se determina la diferencia encontrada entre las proporciones
d) Se contrasta el valor de z encontrado con 1,96. Si es menor cae en la
zona de aceptacin de la hiptesis nula, si es mayor que 1,96 en la de
rechazo de la hiptesis nula.
Si se aceptase la hiptesis nula podramos afirmar no existe diferencia entre
los dos subgrupos de diferente nivel de escolaridad en la percepcin de la
situacin econmica del futuro.
Comparaciones Mltiples
Comparacin de ms de 2 medias
En el caso de que las comparaciones de las medias sean mltiples hay que
realizar una prueba denominada anlisis de varianza. El anlisis de varianza
simple con una sola variable de clasificacin permite comparar tres o ms
medias aritmticas de submuestras definidas por una variable independiente
elegida por el investigador.
Los supuestos de esta prueba son parecidos a los exigidos por la prueba t:
nivel de intervalos, muestras probabilsticas independientes e igualdad de
varianzas.
Los pasos son parecidos a los anteriores:
a) Formulacin de la hiptesis nula y una hiptesis alternativa
b) Eleccin de la distribucin F

c) Eleccin del nivel de significacin (5%)


d) Calculo de la estadstica F
e) Comparacin con el nivel estadstico terico o con el nivel de
probabilidad
Ejemplo. Se desea hacer un experimento para comprobar el efecto de 3
mtodos de enseanzas en el rendimiento de una cierta asignatura. Para ello
toma tres grupos independientes de estudiantes y los somete a tres mtodos
de lectura: individual, exposicin y discusin. Al final del curso se comprueban
los rendimientos medios con una misma prueba. Como se trata de ms de 2
medias hay que realizar un anlisis de varianza, se calculara F y en funcin de
su valor se aceptara o rechazara la hiptesis nula.
Comparacin de ms de dos proporciones
La forma mas simple para determinar si existe asociacin entre varios
porcentajes es calcular el estadstico Chi cuadrado y comparar ste ,como en
los casos anteriores, con el valor terico de las tablas o si se utiliza el programa
SPSS con el nivel de probabilidad obtenido. (Menor de 0,05 para rechazar la
hiptesis nula).