Está en la página 1de 16

MÉTODOS ESTADÍSTICOS APLICADOS A UNA INVESTIGACIÓN

Dr. Luis Palomares Alvariño


lpalomaresalvarino@gmail.com

1. SITUACIÓN DE INVESTIGACIÓN

PROBLEMA
¿De qué manera influye el empleo de la técnica de lectura AZ en la comprensión lectora, en niños de
segundo grado de primaria de los CCEE de gestión pública de Sicuani, Cusco, en junio de 2019?

OBJETIVO
Determinar la forma cómo influye el empleo de la técnica de lectura AZ en la comprensión lectora, en niños
de segundo grado de primaria de los CCE de gestión pública de Sicuani, Cusco, en junio de 2019.

VARIABLES
• Comprensión lectora
• Aplicación de la técnica de lectura AZ

HIPÓTESIS
El empleo de la técnica de lectura AZ influye positiva y significativamente en la comprensión lectora, en
niños de segundo grado de CCEE de gestión pública de Sicuani, Cusco, en junio de 2019.

2. TIPO DE INVESTIGACIÓN
CUASI- EXPERIMENTAL
SE trabaja con dos grupos, uno experimental y el otro de control. Ambos grupos ya existen y son elegidos de
manera intencional.

GRUPOS DE CONTROL Y EXPERIMENTAL


Se eligen dos secciones de segundo grado:
El grupo experimental (GE), constituido por 28 estudiantes.
Grupo de control (GC), formado por 30 estudiantes.
Ambos grupos con características muy semejantes en cuanto a horarios de trabajo, resultados anteriores,
edades, zonas de procedencia e infraestructura de los ambientes de aprendizaje.

3. INTRUMENTOS

PRUEBA DE ENTRADA
Se elabora un instrumento de medición de la comprensión lectora tomando en consideración el nivel en que
deberían encontrarse los estudiantes en el momento de iniciar el proceso experimental.

PRUEBA DE SALIDA
Se elabora un instrumento de medición de la comprensión lectora tomando en consideración el nivel en que
deberían encontrarse los estudiantes en el momento de terminar el proceso experimental.
4. PROCEDIMIENTO DE INVESTIGACIÓN

APLICACIÓN DE LA PRUEBA DE ENTRADA


Se aplica la misma prueba de entrada a los dos grupos en condiciones lo más semejantes posible: hora y día,
instrucciones, materiales, tiempos y ambientes.
Se “califican” los resultados usando el mismo baremo y las mismas condiciones técnico-pedagógicas,
asignado un “puntaje” a cada estudiante (PnGE y PnGC).
Los resultados, considerando las edades (EdGE y EdGC), fueron los siguientes:

EdGE PnGE EdGC PnGC


9 35 8 31
8 28 8 36
9 29 7 34
7 31 9 41
7 30 7 40
8 26 7 29
8 41 9 28
8 25 9 26
9 37 8 30
8 33 9 20
9 28 8 25
8 26 7 27
9 21 8 31
8 30 7 34
7 35 8 36
9 36 9 42
8 40 9 40
9 38 8 35
8 39 8 21
8 32 7 26
7 41 7 28
8 37 7 23
7 30 8 35
9 31 7 30
8 26 8 31
9 28 9 37
7 24 7 32
9 20 9 30
8 29
7 25
Categorización de los resultados
Por comodidad de presentación y de análisis, se categorizó los resultados. Las edades están categorizadas
per-se, pero los puntajes no. Entonces se tomó la decisión de agrupar los puntajes en tres categorías,
“bajo”, “medio” y “alto”, de la siguiente manera:
Bajo de 20 a 28
Medio de 29 a 36
Alto de 37 a 42

TABLAS DE FRECUENCIAS

Tabla de frecuencias por edades (EdGE y EdGC)

EdGEContPorcent EdGCContPorcent
7 6 21.43 7 11 36.67
8 12 42.86 8 11 36.67
9 10 35.71 9 8 26.67
N= 28 N= 30

Tabla de frecuencias de resultados por categorías (CatGE y CatGC)

CatGEContPorcent CatGCContPorcent
alto 7 25.00 alto 5 16.67
medio 11 39.29 medio 15 50.00
bajo 10 35.71 bajo 10 33.33
N= 28 N= 30

5. COMPARACIÓN DE RESULTADOS

Las apreciaciones que se hacen sobre las tablas y gráficos estadísticos, en este caso, no permiten tener una
idea de que los grupos sean homogéneos entre sí. Para mayor seguridad haremos unas comparaciones
usando algunas medidas estadísticas descriptivas: media, desviación estándar, coeficiente de variación y
mediana, es decir elementos de estadística descriptiva.

Cálculo de medias, medianas, desviaciones estándar y coeficientes de variación

Estadísticas descriptivas de las edades (EdGE y EdGC)


Variable Media Desv.Est. CoefVar Mediana
EdGE 8.143 0.756 9.28 8.00
EdGC 7.900 0.803 10.16 8.00
Estadísticas descriptivas de los puntajes (PnGE y PnGC)
Variable Media Desv.Est. CoefVar Mediana
PnGE 31.32 5.90 18.84 30.50
PnGC 31.07 5.79 18.63 30.50

Interpretaciones
Estas estimaciones puntuales dejan muy claro que ambas poblaciones son bastante semejantes tanto en
edades como en puntajes obtenidos en la prueba de entrada, con una ligera diferencia a favor de la
población que contiene el grupo experimental en ambas variables.
Para estar seguros que las diferencias, especialmente a nivel de medias, constituyen o no posibilidades de
carencia de homogeneidad entre las poblaciones de estudio, se procede a realizar una comparación de
medias de ambas variables entre los dos grupos.

6. COMPARACIÓN DE MEDIAS

Las comparaciones visuales y las interpretaciones usando los estadígrafos son un primer nivel de
apreciación. Si se quiere un fundamento más convincente, en cuanto a la comparación de resultados, se
realiza una prueba de hipótesis que se denomina “Prueba de comparación de medias”, que nos permitirá
determinar si las diferencias muestrales que se observan son realmente significativas a nivel poblacional.

Esta prueba requiere la formulación de hipótesis y la validación final de las mismas, teniendo en cuenta que
una prueba de hipótesis no se usa para saber si las hipótesis eran verdaderas o falsas, sino para aceptarlas o
rechazarlas, según sea el caso que recomienda la estadística.

Comparación de las medias de edades

Hipótesis
Ho: Las medias aritméticas poblacionales de las edades son iguales Ho: µ¿ = µGC
Ha: Las medias aritméticas poblacionales de las edades son diferentes Ha: µ¿ ≠ µGC

Que las medias sean iguales es lo mismo que la diferencia de las mismas sea cero, entonces el sistema de
hipótesis con que se trabaja es:
Ho: µ¿ - µGC = 0
Ha; µ¿ - µGC ≠ 0

Se trabajó con un nivel de significación de 0.05, y aceptando los supuestos de normalidad de la población y
significatividad de las muestras.

Procedimiento
Las pruebas de hipótesis se pueden realizar utilizando procedimientos matemáticos estandarizados que
permiten obtener conclusiones basadas en las probabilidades. Los cálculos de esos procedimientos se
pueden realizar manualmente o con apoyo de un paquete estadístico. En este caso utilizaremos el paquete
estadístico Minitab.
Usando el paquete estadístico Minitab, el algoritmo es el siguiente:
• Ingresar a Estadísticas, elegir Estadísticas básicas, ingresar a t de 2 muestras
• Elegir Muestras en diferentes columnas, ingresar EdGE en Primero y EdGC en Segundo.
• Ingresar a Opciones y en Hipótesis alterna elegir mayor que
• Aceptar Aceptar
Aparece:
Estadísticas descriptivas
Error
estándar
Muestr Medi de la
a N a Desv.Est. media
EdGE 28 8.143 0.756 0.14
EdGC 30 7.900 0.803 0.15

Estimación de la diferencia
IC de 95% para la
Diferencia diferencia
0.243 (-0.167; 0.653)

Prueba
Hipótesis nula H₀: μ₁ - µ₂ = 0
Hipótesis alterna H₁: μ₁ - µ₂ ≠ 0

Valor T GL Valor p
1.19 55 0.241

Interpretación:
Hay dos posibilidades de interpretación de estos resultados.
Primero, observando el intervalo de confianza, que encierra dos números uno negativo y el otro positivo.
Entonces el hecho que la diferencia de las medias poblacionales de las edades puede ser negativo o positivo
indica que es probable que se a cero, por lo tanto, no se puede asegurar que las medias poblacionales son
diferentes.
La otra forma de interpretar estos resultados corresponde a la prueba de hipótesis. Como p es mayor que el
nivel de significación, se acepta la hipótesis nula y se rechaza la hipótesis alternativa.
Luego, las evidencias estadísticas permiten afirmar, con 5% de error, que las medias poblacionales de
edades son iguales, y que las diferencias observadas son únicamente a nivel muestral, más no poblacional.

Comparación de las medias de los puntajes de entrada

Así como se ha comparado las dos poblaciones según la variable edad, es posible hacer la comparación
mediante la variable puntaje obtenido en la prueba de entrada.

TAREA 4.1
Realizar la prueba de hipótesis completa de comparación de las medias poblacionales de los puntajes
obtenidos en la prueba de entrada, para validar la aseveración que la media poblacional de la población
experimental es mayor que la media poblacional de la población de comparación, con una significación de
0.04.
Presente todo el proceso, incluyendo las conclusiones estadísticas y los comentarios referidos a la
investigación.

7. APLICACIÓN DEL PROCEDIMIENTO EXPERIMENTAL

Ya se tiene garantizado, de diversas formas, que ambas poblaciones, la experimental y la de control, son
muy semejantes, tanto en edades cuanto en el puntaje obtenido en la prueba de entrada.
Ahora se puede iniciar el proceso experimental propiamente dicho, efectuando el tratamiento estadístico
únicamente sobre la variable puntaje.

Intervención en el grupo experimental y en el grupo control


En igual cantidad de tiempo, en condiciones lo más parecidas posible, se interviene en ambos grupos. En el
grupo experimental se emplea la técnica de lectura AZ, mientras que en el grupo de control se realizan las
lecciones de comprensión de lectura siguiendo la técnica que habitualmente se utilizaba cuando no se tenía
en cuenta la técnica AZ.
En pocas palabras, se tiene dos grupos muy parecidos en muchos aspectos, y que tienen como diferencia
fundamental el empleo de dos técnicas de aprendizaje de comprensión de lectura diferentes. El grupo
experimental usa la técnica AZ y el grupo control hace uso de la técnica habitual, que es diferente de la
técnica AZ.
El proceso se realiza en el mismo tiempo, y en condiciones semejantes para ambos grupos; de modo que la
homogeneidad sea la mejor, con excepción de la técnica de lectura.

8. APLICACIÓN DE LA PRUEBA DE SALIDA

Terminado el proceso experimental, y en igualdad de condiciones, se aplica una misma prueba de salida a
ambos grupos.
Se “califican” los resultados usando el mismo baremo y las mismas condiciones técnico-pedagógicas que la
prueba de entrada; y se asignado un “puntaje” a cada estudiante. Esos puntajes, de la prueba de salida, se
categorizan de la misma manera que los puntajes de la prueba de entrada, en tres categorías: alto, medio y
bajo.

Se presenta enseguida los resultados, de las pruebas de entrada y salida de cada uno de los grupos
considerando las edades y la categorización de los puntajes, codificados de la siguiente manera:
EdGE : Edades del grupo experimental
EntGE : Puntaje de entrada del grupo experimental
CatenGE : Categoría según la prueba de entrada del grupo experimental
SalGE : Puntaje de salida del grupo experimental
CatsalGE : Categoría según la prueba de salida del grupo experimental
EdGC : Edades del grupo de control
EntGC : Puntaje de entrada del grupo de control
CatenGC : Categoría según la prueba de entrada del grupo de control
SalGC : Puntaje de salida del grupo de control
CatsalGC : Categoría según la prueba de salida del grupo de control
EdGE EnGE CatenGE SalGE CatsalGE EdGC EnGC CatenGC SalGC CatsalGC
9 35 medio 41 medio * 8 31 medio 33 medio
8 28 bajo 32 bajo * 8 36 medio 37 medio
9 29 medio 35 medio * 7 34 medio 39 medio
7 31 medio 34 medio * 9 41 alto 43 alto
7 30 medio 31 bajo * 7 40 alto 41 medio
8 26 bajo 34 medio * 7 29 medio 38 medio
8 41 alto 46 alto * 9 28 bajo 32 bajo
8 25 bajo 28 bajo * 9 26 bajo 27 bajo
9 37 alto 40 medio * 8 30 medio 34 medio
8 33 medio 38 medio * 9 20 bajo 25 bajo
9 28 bajo 36 medio * 8 25 bajo 28 bajo
8 26 bajo 37 medio * 7 27 bajo 29 bajo
9 21 bajo 29 bajo * 8 31 medio 33 medio
8 30 medio 40 medio * 7 34 medio 32 bajo
7 35 medio 42 alto * 8 36 medio 39 medio
9 36 medio 39 medio * 9 42 alto 44 alto
8 40 alto 42 alto * 9 40 alto 43 alto
9 38 alto 39 medio * 8 35 medio 37 medio
8 39 alto 47 alto * 8 21 bajo 26 bajo
8 32 medio 40 medio * 7 26 bajo 28 bajo
7 41 alto 49 alto * 7 28 bajo 30 bajo
8 37 alto 44 alto * 7 23 bajo 26 bajo
7 30 medio 38 medio * 8 35 medio 37 medio
9 31 medio 32 bajo * 7 30 medio 38 medio
8 26 bajo 29 bajo * 8 31 medio 31 bajo
9 28 bajo 38 medio * 9 37 alto 40 medio
7 24 bajo 30 bajo * 7 32 medio 36 medio
9 20 bajo 32 bajo * 9 30 medio 32 bajo
* 8 29 medio 33 medio
7 25 bajo 28 bajo

Presentación de resultados
Igual que para el caso de la prueba de entrada, se presentan los resultados de la prueba de salida, para
ambos grupos, el experimental y control, en frecuencias absolutas y en porcentajes.

TABLAS DE FRECUENCIAS
Frecuencias de puntaje por categorías (CatsalGE, CatsalGC)

CatsalGE Cont Porcent CatsalGC Cont Porcent


alto 6 21.43 alto 3 10.00
medio 14 50.00 medio 14 46.67
bajo 8 28.57 bajo 13 43.33
N= 28 N= 30

Interpretaciones inmediatas:
Pese a que en ambos grupos el porcentaje para la categoría medio es parecido, se nota una marcada
diferencia en las otras dos categorías, con ventaja para el grupo experimental.

9. COMPARACIÓN DE RESULTADOS

La observación de las tablas y gráficos ya nos ha proporcionado una idea respecto a lo sucedido en ambos
grupos. Para mejorar esa apreciación, pasamos a utilizar los estadígrafos básicos de la estadística
descriptiva.

Cálculo de medias, medianas, desviaciones estándar y coeficientes de variación

Estadísticas descriptivas de puntajes de salida (SalGE, SalGC)


Variable Media Desv.Est. CoefVar Mediana
SalGE 37.21 5.67 15.24 38.00
SalGC 33.97 5.54 16.32 33.00

Interpretaciones
La observación de estas estimaciones puntuales, permiten hacer algunas interpretaciones primarias:
 En cuanto a las medias aritméticas y a las medianas, parece claro que el grupo experimental tiene
mejores resultados que el grupo control.
 Las desviaciones estándar son muy parecidas, lo que indica que ambas masas de datos se dispersan
de manera semejante.
 El coeficiente de variación nos señala con mayor claridad que el grupo control es ligeramente más
disperso que el grupo experimental.
 El hecho que, en este caso, las dispersiones relativas no se acerquen al 20%, nos dice que en ambos
grupos la media aritmética es el estadígrafo más representativo de la masa de datos.

10. COMPARACIÓN DE MEDIAS

Las interpretaciones que se han hecho sobre los resultados de la prueba de salida, en ambos grupos, ha sido
solo muestral, es decir considerando únicamente los 28 y 30 estudiantes respectivamente. Pero, la
investigación requiere resultados a nivel poblacional. Para eso hay que realizar las pruebas de hipótesis
correspondientes, en este caso la comparación de medias, con la intención de verificar si las diferencias a
nivel muestral observadas son realmente significativas a nivel poblacional.

Comparación de las medias de los resultados de salida

Primero, queremos constatar si esa diferencia entre las medias aritméticas de los resultados de salida de los
dos grupos, es significativa a nivel poblacional. Se plantea las hipótesis respectivas:
Ho: La media aritmética poblacional de los resultados de salida del grupo experimental es igual a la media
aritmética de los resultados de salida del grupo control.
Ha: La media aritmética poblacional de los resultados de salida del grupo experimental es mayor que la
media aritmética de los resultados de salida del grupo control

Ho: µ(SalGE) = µ(SalGC) Ho: µ(SalGE) - µ(SalGC) = 0


Ha: µ(SalGE) > µ(SalGC) Ha: µ(SalGE) - µ(SalGC) > 0

Usando el MINITAB, el procedimiento sería el siguiente:


• Ingresar a Estadísticas. Elegir Estadísticas básicas, ingresar a t de 2 muestras
• Elegir Muestras en diferentes columnas
• Ingresar SalGE en la ventana Primero y SalGC en la ventana Segundo.
• Ingresar a Opciones y en Hipótesis alternativa elegir mayor que
• Aceptar Aceptar
Aparece:

Prueba T e IC de dos muestras: SalGE, SalGC


T de dos muestras para SalGE vs SalGC

Error
estándar
N Media Desv.Est. de media
SalGE 28 37.21 5.67 1.1
SalGC 30 33.97 5.54 1.0

Diferencia = mu (SalGE) - mu (SalGC)


Estimado de la diferencia: 3.25µ
Límite inferior 95% de la diferencia: 0.78
Prueba T de diferencia = 0 (vs>): Valor T = 2.20 Valor P = 0.016 GL = 55
Interpretaciones
El hecho que Valor P sea 0.016, bastante menor que 0.05, permite rechazar la hipótesis nula y aceptar la
hipótesis alternativa. Esto es, que esa diferencia de medias muestrales de 3.25 es significativa a nivel
poblacional

Conclusión
Hay evidencias estadísticas para asegurar, con 5% de error (0.05 de significancia), que poblacionalmente el
grupo experimental tiene una media aritmética mayor que el grupo control, en lo que se refiere a los
resultados de la prueba de salida.

Comparación de resultados de entrada y salida de cada grupo

Para acrecentar la certitud de que el empleo de la técnica de lectura AZ influye de manera importante en la
comprensión lectora, se realiza una comparación de medias dentro de cada grupo, considerando sus
resultados en la prueba de entrada contra los resultados en la prueba de salida. En otras palabras, vamos a
averiguar si las diferencias entre los resultados entrada y de salida, en la muestra de cada grupo, son
realmente significativas a nivel de cada una de sus poblaciones.

Para el grupo experimental:


Ho: La media aritmética de los resultados de la prueba de entrada es igual a la media aritmética de los
resultados de la prueba de salida
Ha: La media aritmética de los resultados de la prueba de entrada es menor a la media aritmética de los
resultados de la prueba de salida

Ho: µ(EntGE) = µ(SalGE) Ho: µ(EntGE) - µ(SalGE) = 0


Ha: µ(EntGE) ≠ µ(SalGE) Ha: µ(EntGE) - µ(SalGE) ≠ 0

El algoritmo usando el MINITAB, es el siguiente:


• Ingresar a Estadísticas, elegir estadísticas básicas e ingresar a t de 2 muestras
• Elegir Muestras en diferentes columnas, ingresar EntGE en la ventana de Primero y SalGE en la ventana de
Segundo.
• Ingresar a Opciones y en Hipótesis alternativa elegir Menor que
• Aceptar Aceptar
Aparece:

Prueba T e IC de dos muestras: EntGE, SalGE


T de dos muestras para EntGE vs. SalGE
Error
estándar
N Media Desv.Est. de la media
EntGE 28 31.32 5.90 1.1
SalGE 28 37.21 5.67 1.1

Diferencia = mu (EntGE) - mu (SalGE)


Estimado de la diference: -5.89
Límite inferior 95% de la diferencia: -3.30
Prueba T de diferencia = 0 (vs<): Valor T = -3.81 Valor P = 0.000 DF = 53

Interpretaciones
El valor de P es menor que el valor de alga (la significación de la prueba), entonces, se puede rechazar la
hipótesis nula y aceptar la hipótesis alterna.

Conclusión
Hay evidencias estadísticas para asegurar, con 5% de error, que los resultados de la prueba de salida, a nivel
poblacional, son mejores que los resultados de la prueba de entrada, en la población experimental. Esto
significa que en esa población ha habido una mejora significativa durante el proceso de aprendizaje.

Para el grupo de control:


De manera semejante se puede hacer una prueba de hipótesis para el caso del grupo de control
TAREA 4.2
Realizar la prueba de hipótesis completa de comparación de los puntajes obtenidos en la prueba de entrada
con los resultaos de la prueba de salida, para validar la aseveración que la media poblacional de los
resultados de la prueba de salida es mayor que los de la prueba de entrada en la población de control, con
una significación de 0.05.
Presente todo el proceso, incluyendo las conclusiones estadísticas y los comentarios referidos a la
investigación.

11. COMPARACIÓN DE DATOS PAREADOS

Queremos saber ahora si esas variaciones de puntajes de entrada y salida tienen validez a nivel interno. En
otras palabras, si las diferencias entre los valores de entrada y salida para cada unidad de análisis
(estudiante) tiene significatividad.
La prueba para este caso es la Prueba de Datos Pareados. En cada unidad de análisis se calcula la diferencia
de los puntajes de salida y entrada, luego se calcula el promedio de esas diferencias y se realiza la prueba de
hipótesis.

Comparaciones entre resultados de entrada y salida del grupo experimental

Ho: El promedio de las diferencias de puntaje entre salida y entrada de las unidades de análisis es igual a
cero
Ha: El promedio de las diferencias de puntaje entre salida y entrada de las unidades de análisis es mayor
que cero

Usando el Minitab, el algoritmo es el siguiente:

• Ingresar a Estadísticas, elegir Estadísticas básicas y entrar a t pareada


• Ingresar a Muestras en columnas, ingresar SalGE en Primera muestra y EntGE en Segunda muestra.
• Entrar a Opciones y en Hipótesis alterna elegir mayor que
• Aceptar Aceptar
Aparece:

Para el grupo experimental

IC y Prueba T pareada: SalGE, EntGE

T Pareada para SalGE - EntGE


Error
Estándar
N Media Desv.Est. de la media
SalGE 28 37.21 5.67 1.07
EntGE 28 31.32 5.90 1.12
Diferencia 28 5.893 3.131 0.592

Límite inferior 95% para media de diferencias: 4.885


Prueba t de diferencia media = 0 (vs > 0): Valor T = 9.96 Valor P = 0.000

Como p es menor que ero, rechazamos la hipótesis nula. El promedio de las diferencias de puntaje entre
salida y entrada de las unidades de análisis es mayor que cero.

Conclusión:
Las evidencias estadísticas permiten afirmar, con 5% de error, las diferencias entre los valores de entrada y
salida para cada unidad de análisis (estudiante) tiene significatividad. En el grupo experimental, los
resultados de la prueba de salida, en general, son mejores que los puntajes de la prueba de entrada.

Para el grupo control


TAREA 4.3
Realizar la prueba de hipótesis completa de comparación entre resultados de entrada y salida del grupo de
control, para validar la aseveración que la media poblacional de las diferencias entre los puntajes de salida y
de entrada es significativa al 6%.
Presente todo el proceso, incluyendo las conclusiones estadísticas y los comentarios referidos a la
investigación.

12. COMPARACIONES DE MEDIAS ENTRE LAS DIFERENCIAS DEL GRUPO EXPERIMENTAL Y LAS DIFERENCIAS
DEL GRUPO CONTROL

En la prueba anterior se constató que el promedio de las diferencias entre los puntajes de salida y de
entrada eran 5.893 para el grupo experimental y 2.9 para el grupo control. Se quiere probar, ahora, si esa
diferencia observada a nivel muestral, entre las dos poblaciones, es realmente significativa a nivel
poblacional.
Averiguamos si el promedio de las diferencias de la población experimental puede ser igual a 2.9

Ho: El promedio de las diferencias entre la salida y entrada del grupo experimental es igual a 2.9
Ha: El promedio de las diferencias entre la salida y entrada del grupo experimental es mayor que 2.9

Usando el Minitab, el algoritmo es el siguiente:


• Ingresar a Estadísticas, elegir Estadísticas básicas e ingresar a t pareada
• Ingresar a Muestras en columnas, ingresar SalGE en Primera muestra y EntGE en Segunda muestra.
• Ingresar a Opciones, ingresar 2.9 en media de prueba y elegir mayor que en Hipótesis alternativa
• Aceptar Aceptar
Aparece:

IC y Prueba T pareada: SalGE, EntGE

T Pareada para SalGE - EntGE


Error
Estándar
N Media Desv.Est. de la media
SalGE 28 37.21 5.67 1.07
EntGE 28 31.32 5.90 1.12
Diferencia 28 5.893 3.131 0 .592

Límite inferior 95% para media de diferencias: 4.885


Prueba t de diferencia media = 2.9 (vs > 2.9): Valor T = 5.06 Valor P = 0.000

Interpretaciones
El sistema de hipótesis que se ha utilizado compara el promedio de las diferencias igual a 2.9 contra mayor
que 2. 9.
El Valor P = 0.00 nos dice que debemos rechazar la hipótesis nula y aceptar la hipótesis alternativa.

Conclusión
Hay evidencias estadísticas para aceptar, con 5% de error, que el promedio poblacional de las diferencias
entre los valores de la prueba de salida con los valores de la prueba de entrada en el grupo experimental es
mayor que 2.9. Esto significa que los resultados de la prueba de salida en el grupo experimental son
superiores a los puntajes de la misma prueba del grupo de control.

OTROS HALLAZGOS
El investigador está interesado en aprovechar los resultados obtenidos en este estudio para averiguar sobre
otros aspectos que no están señalados en el problema, ni en los objetivos e hipótesis, pero que podrían ser
de mucha utilidad para conocer mejor el problema.
1. Estudiar si la diferencia de proporciones entre las categorías de puntaje de las pruebas de salida, de
los grupos experimental y de control, son significativas.
CatsalGE Cont Porcent CatsalGC Cont Porcent
alto 6 21.43 alto 3 10.00
medio 14 50.00 medio 14 46.67
bajo 8 28.57 bajo 13 43.33
N= 28 N= 30
2. Estudiar si la influencia que tiene el empleo del método AZ en la comprensión lectora tiene o no
relación con las categorías de puntaje obtenido en la prueba de entrada, en el grupo experimental.
Prueba de comparación de proporciones
Las categorías en estudio serían los del grupo alto y bajo, dado que en el caso de la categoría medio los
resultados son muy parecidos.
Comparación de proporciones de la categoría alto.
Se desea averiguar si la diferencia entre las proporciones del nivel bajo: 0.2143 para el grupo experimental y
0.1 para el grupo control es significativo a nivel poblacional.
Ho: π ¿ = π GC Ho: π ¿ - π GC = 0
Ha: π ¿ > π GC Ha: π ¿ - π GC > 0
Nivel de significación: α = 0.05
Supuestos:
 La población se distribuye normalmente
 Las muestras son representativas
Algoritmo usando minitab
Ingresar a Estadísticas, elegir Estadísticas básicas, elegir Dos proporciones. Elegir Datos resumidos. En la
primera muestra número de eventos 6 y número de ensayos 30, y en la segunda muestra número de
eventos 3 y número de ensayos 30. Entra a opciones, verificar el nivel de confianza (95%), en diferencia
hipotetizada escribir 0, en hipótesis alterna elegir >. Aceptar, Aceptar.
Aparece:
Método
p₁: proporción donde Muestra 1 = Evento
p₂: proporción donde Muestra 2 = Evento
Diferencia: p₁ - p₂

Estadísticas descriptivas
Muestra N Evento Muestra p
Muestra 1 280 6 0.021429
Muestra 2 300 3 0.010000

Estimación de la diferencia
Límite inferior
de 95% para la
Diferencia diferencia
0.0114286 -0.005657

IC basado en la aproximación a la normal

Prueba
Hipótesis nula H₀: p₁ - p₂ = 0

Hipótesis alterna H₁: p₁ - p₂ > 0

Método Valor Z Valor p


Aproximación normal 1.10 0.136
Exacta de Fisher   0.219

La aproximación normal puede ser inexacta para muestras pequeñas.

De acuerdo con el valor de p, se debe aceptar la hipótesis nula. Que las dos proporciones son iguales. Pero,
hay una llamada de atención que dice que las muestras son pequeñas, la aproximación normal puede ser
inexacta.
Esta nota es muy importante, pues impide que tomemos los resultados como una respuesta contundente.
Para validar estas hipótesis es necesario contar con una muestra de mayor tamaño.

Prueba de independencia estadística


Abordamos el segundo punto. Lo que se desea saber es si la influencia del empleo del método AZ beneficia
a los que saben menos o los otros. Para eso tenemos que hacer primero una prueba que nos permita
reconocer si entre las dos variables: (V1) Puntaje de entrada y (V2) puntaje de salida, en el grupo
experimental, tienen alguna relación.
Para eso se realiza la prueba llamada de Independencia Estadística, para lo cual necesitamos una tabla de
contingencias que nos muestre las frecuencias de una variable bivariada, aplicada a cada unidad de análisis.
A cada unidad de análisis se le va averiguar cuál fue su categoría en la prueba de entrada y cuál su categoría
en la prueba de salida. Así se construyó la siguiente tabla:
alto medio bajo total
alto 1 6 0 7
medio 1 8 2 11
bajo 0 4 6 10
total 2 18 8 28
Las condiciones para que esta tabla sea utilizada son:
 No debe haber menos de 20 datos
 Cada celda debe tener mínimo 1 dato
 Las celdas con frecuencia esperada menor que 5 no deben ser menos del 20% del total
La segunda condición no está satisfecha por lo tanto no se puede aplicar esa prueba en este caso.

Edad vs satisfacción laboral


Una investigación está estudiando la satisfacción laboral en los empleados de una empresa.
Una de las hipótesis plantea que las variables “edad” y “satisfacción laboral” tienen alguna relación.
Se toma una muestra representativa de tamaño 100, y se indaga sobre las dos variables.
Por comodidad de procesamiento y análisis, las variables son codificadas por niveles.
Edades:
Menor de 25 años; de 25 a menos de 30; de 30 a menos de 40; de 40 a menos de 50 y de 50 a más
Satisfacción laboral:
Baja, regular y alta.
La siguiente tabla de contingencias muestra los resultados:
Baja Regular Alta
Menor de 25 9 10 5
25 – 30 6 10 6
30 – 40 5 12 6
40 – 50 6 13 10
De 50 a más 4 5 3

Por comodidad de comunicación: V1 = rangos de edad y V2 = rangos de satisfacción laboral


Ho: Las variables V1 y V2 son estadísticamente independientes.
Ha: Las variables V1 y V2 no son estadísticamente independientes, es decir que entre ellas hay
alguna relación.
Nivel de significancia: α = 0.05
Supuestos:
 La población se distribuye normalmente
 La muestra es representativa
Algoritmo usando minitab
Ingresar a Estadísticas, elegir Tablas, ingresar a Tabulación cruzada y chi-cuadrada. En la primera
ventana, elegir datos resumidos en una tabla de dos factores. Ingresar las tres columnas en la
ventana Columnas que contiene la tabla. En Mostrar elegir Conteo. Entrar a Chi-cuadrada y elegir
Prueba chi-cuadrada y Conteos de celdas esperados. Aceptar.
Aparece:
Filas: Filas de la hoja de trabajo   Columnas: Columnas de la hoja de trabajo
C12 C13 C14 Todo
         
1 9 10 5 24
  6.545 10.909 6.545  
         
2 6 10 6 22
  6.000 10.000 6.000  
         
3 5 12 6 23
  6.273 10.455 6.273  
         
4 6 13 10 29
  7.909 13.182 7.909  
         
5 4 5 3 12
  3.273 5.455 3.273  
         
Todo 30 50 30 110
Contenido de la celda
        Conteo
        Conteo esperado

Prueba de chi-cuadrada
Chi-cuadrada GL Valor p
Pearson 3.098 8 0.928
Relación de verosimilitud 3.035 8 0.932
2 celda(s) con conteos esperados menores que 5.

Dos celdas de 15 es menos del 20%, entonces el investigador decide continuar con el estudio.
Como el valor de p es mayor que el nivel de significancia, entonces se acepta la hipótesis nula.
Conclusión:
Las evidencias estadísticas permiten afirmar, con 5% de error, que las variables “edad” y “grado de
satisfacción” son estadísticamente independientes. Esto es, que entre ellas no hay relación estadística.

También podría gustarte