Está en la página 1de 5

Análisis Descriptivo Inferencial

Comparación de muestras

La comparación de valores en dos o más subgrupos de una población total es


relativamente fácil, bastaría con comparar directamente los dos valores. El
mismo procedimiento se utilizaría si se tratase de proporciones o porcentajes
calculados.

La situación cambia cuando la comparación se hace con una muestra


probabilística. En tal caso el investigador debe realizar pruebas especiales que
permitan pronunciarse sobre la significación estadística que pueda tener la
diferencia encontrada entre los valores comparados.

Así si un grupo tiene una media de 24 en una variable y otro grupo una media
de 26 en la misma variable debemos preguntarnos si esa diferencia también
se da en la población de la cual extrajimos la muestra, o la diferencia podría
deberse al error de muestreo al cual están sometidas, probabilisticamente,
todas las muestras que se toman de una población o universo.

Para resolver problemas como el anterior se usan de pruebas de


significación estadística, que son propias para cada medida que se va a
comparar.

La secuencia del cálculo necesaria para su realización se expone a


continuación:

1º Formulación de una hipótesis nula y de una hipótesis alternativa. Como


lo sugiere su nombre, la hipótesis nula plantea que en la población de la cual
se extrajo la muestra no existe diferencia entre los valores de los subgrupos
que se desean comparar (proporción, media aritmética). Sin embargo, como el
investigador supone que existe una diferencia ( y pudo haberlo expresado así
en una de las hipótesis de su estudio), formula una hipótesis alternativa que
exprese que existe tal diferencia, que la misma es estadísticamente
significativa, y que ella se da en la población de la cual se extrajo la muestra.

2º Elección de una distribución de muestreo.


La mayoría de las medidas estadísticas utilizadas en el análisis de datos
cuantitativos tienen distribuciones de probabilidad conocidas, como también
algunas de ellas tienen ese tipo de distribuciones para diferencias entre dos
medidas.
En cada caso, esas distribuciones indican la probabilidad de que un cierto valor
encontrado en una muestra se pueda dar en su correspondiente población, o la
probabilidad de que una diferencia de una cierta magnitud pueda darse entre
subgrupos tomados muestralmente de una misma población

Digamos que si se toman muchas muestras y en cada una de ellas se calcula


una misma proporción (como podría ser el caso de personas que están de
acuerdo con el control de la natalidad), entonces, el total de las proporciones
de esas muestras se distribuye en la forma de la curva normal.
Por esta propiedad de la distribución de frecuencias - que también tienen otras
distribuciones muestrales, como la que corresponde a la diferencia entre
proporciones - sabemos que un 5% de todas las proporciones, convertidas en
puntuaciones Z, quedan más allá de 1,96 unidades z; 2,5% son mayores y
2,5% son menores.

Es decir, la probabilidad de encontrar en una muestra una proporción cuyo


valor z sea superior o inferior a 1,96 z, es del 0,05.

En otras palabras, existe una probabilidad del 0,95 (o un nivel de confianza del
95%) que la proporción encontrada se aleje menos de 1,96 z de la media de la
distribución, que la verdadera media aritmética de la población. Dicho en forma
aproximada, que la diferencia encontrada sea la que corresponda,
probabilisticamente, al error de muestreo.

No todas las medidas de las muestras de una población se distribuyen según la


curva normal. Algunas de ellas lo hacen según la distribución t de Student, la
distribución F, o la Chi cuadrado…

3. Elección de un nivel de significación.


De acuerdo con lo expuesto anteriormente las pruebas de significación
estadística se basan en la teoría de las probabilidades. Cuando el investigador
realizar una de estas pruebas se pregunta. ¿Cual es la probabilidad de que un
valor como el encontrado en mi estudio se dé al azar? Frente a esta pregunta
hace una elección que define el riesgo probabilístico que tiene el aceptar su
resultado. Podrá decir, por ejemplo, que ese valor transformado a valores z o (T
o F según la estadística apropiada) puede darse al azar en un 5% de las
veces. Tal porcentaje recibe el nombre de nivel de significación que
convencionalmente se designa con la letra alpha.

Los siguientes valores de z definen áreas de la curva normal que comprenden


proporciones o porcentajes de casos – valores de muestras- en ambos o en
uno u otro lado de la curva normal, a partir de la media aritmética:

a) % de casos a ambos lados del área de la curva a partir de la media


aritmética

Z % Casos en los extremos


1,64 90 El 10% restante queda
en los dos extremos o
zona de rechazo
1,96 95 El 5% restante queda en
los dos extremos o zona
de rechazo
2,55 99 El 1% restante queda en
los dos extremos o zona
de rechazo
Las terminaciones de la curva normal se denominan colas de la distribución.
Cuando tenemos base para suponer que una de las medidas de las muestras
por comparar es mayor o menor que la otra, entonces las hipótesis alternativa
se plantea como x1>x2; o x2>x1. En casos como este se utiliza una prueba de
significación de una cola. Si no existe esa base se utiliza una prueba de
significación de dos colas. , lo cual quiere decir que la diferencia en el universo
podría se mayor o menor, en términos probabilísticas, que la encontrada en el
estudio.

Respecto al nivel de significación, queremos recordar que un valor de z igual o


inferior a 1,64 unidades z puede darse al azar un 5%, a la inversa, un valor
superior a 1,64 significa que la probabilidad de darse al azar en las muestras
de un universo es menor de 5%.

Ese valor calculado, decide la aceptación o no de la hipótesis nula. Como se


trabaja en base a probabilidades, existe el riesgo de rechazar la hipótesis nula
cuando es correcta, con lo que se comete un error de tipo I. Este error se
reduce cuando se baja el nivel de significación. Pero al hacer eso se corre el
riesgo de cometer un error de tipo II, es decir aceptar la hipótesis nula cuando
existe diferencia entre los grupos comparados.

4º Cálculo del estadístico de la prueba. Calcular el valor de z, o T, o f.

5º Aceptación o rechazo de la hipótesis nula.


Los valores de z, t, o F que puedan encontrarse en los cálculos anteriores se
comparan con valores que están en tablas de los textos de estadística con las
correspondientes o con probabilidades para el nivel de significación elegido por
el investigador.
Cuando el valor calculado es mayor que el de la tabla se rechaza la hipótesis
nula y se acepta la hipótesis alternativa. Es decir, se acepta en términos
probabilísticos, que existe una diferencia estadísticamente significativa. Si el
valor encontrado es menor que el de la tabla se acepta la hipótesis nula, pues
el valor encontrado puede darse al azar más veces de lo que nos lo permite el
nivel de significación., en otras palabras no existe significación estadística entre
los grupos comparados.

Comparación de dos medias


En un grupo de 25 niños de 3 años de edad sometidos a un procedimiento de
estimulación temprana, se encuentra después de cierto grado de aplicación, un
aumento de 7,5 puntos en su promedio del nivel de desarrollo psicomotor, con
una desviación estándar de 6,5. A su vez en un grupo de control equivalente de
otros 25 niños, no sometidos al programa de estimulación temprana la
diferencia entre sus mediciones antes y después es de 6 puntos con una
desviación de 5,90.
¿Podríamos afirmar que existen diferencias significativas entre dichos
promedios?
Pasos a seguir:

a) Proponer las hipótesis nula y alternativa


b) Obtener el estadístico T que es el estadístico que compara medias en
poblaciones pequeñas independiente menores de 30 casos
c) Se compara el valor T obtenido con el T de la tabla o se comparan las
probabilidades obtenidas por el programa estadístico correspondientes.

Si la T obtenida es mayor que t la de la tabla se rechaza la hipótesis nula de no


diferencias(o el nivel de probabilidad obtenido por el programa informático
menor que el nivel de significatividad elegido por el investigador)

Comparación de dos proporciones

Supongamos que en una investigación realizada en una comunidad, de la cual


se ha tomado una muestra probabilísica, el 56% de un grupo de 150 personas
con alto nivel de escolaridad dice que su situación económica será mejor en los
próximos años. Por otro lado el 47% de otro grupo de la misma muestra de
120 personas de bajo nivel de escolaridad opina en el mismo sentido que el
otro grupo. ¿Es la diferencia entre ambos porcentajes estadísticamente
significativa, o sea, existe diferencia con los márgenes de error de muestreo del
caso, en la comunidad de la cual se tomo la muestra?

Pasos a seguir
a) Se plantea la hipótesis nula de no diferencias en las muestras y la
alternativa
b) Se elige el nivel de significación en este caso un 0,05 ( 5%)
c) Se determina la diferencia encontrada entre las proporciones
d) Se contrasta el valor de z encontrado con 1,96. Si es menor cae en la
zona de aceptación de la hipótesis nula, si es mayor que 1,96 en la de
rechazo de la hipótesis nula.

Si se aceptase la hipótesis nula podríamos afirmar no existe diferencia entre


los dos subgrupos de diferente nivel de escolaridad en la percepción de la
situación económica del futuro.

Comparaciones Múltiples
Comparación de más de 2 medias
En el caso de que las comparaciones de las medias sean múltiples hay que
realizar una prueba denominada análisis de varianza. El análisis de varianza
simple con una sola variable de clasificación permite comparar tres o más
medias aritméticas de submuestras definidas por una variable independiente
elegida por el investigador.
Los supuestos de esta prueba son parecidos a los exigidos por la prueba t:
nivel de intervalos, muestras probabilísticas independientes e igualdad de
varianzas.
Los pasos son parecidos a los anteriores:
a) Formulación de la hipótesis nula y una hipótesis alternativa
b) Elección de la distribución F
c) Elección del nivel de significación (5%)
d) Calculo de la estadística F
e) Comparación con el nivel estadístico teórico o con el nivel de
probabilidad

Ejemplo. Se desea hacer un experimento para comprobar el efecto de 3


métodos de enseñanzas en el rendimiento de una cierta asignatura. Para ello
toma tres grupos independientes de estudiantes y los somete a tres métodos
de lectura: individual, exposición y discusión. Al final del curso se comprueban
los rendimientos medios con una misma prueba. Como se trata de más de 2
medias hay que realizar un análisis de varianza, se calculara F y en función de
su valor se aceptara o rechazara la hipótesis nula.

Comparación de más de dos proporciones

La forma mas simple para determinar si existe asociación entre varios


porcentajes es calcular el estadístico Chi cuadrado y comparar éste ,como en
los casos anteriores, con el valor teórico de las tablas o si se utiliza el programa
SPSS con el nivel de probabilidad obtenido. (Menor de 0,05 para rechazar la
hipótesis nula).

También podría gustarte