Está en la página 1de 35

Prueba estadística “t” de

Student y Tipificación Z
Objetivos

Los objetivos de la unidad son:


• Aplicar y analizar las pruebas estadísticas de contraste de hipótesis “t” de
Student;
• Aplicar y analizar la aplicación de la tipificación “Z”.
Contenido

En esta unidad se describe:


• T de Student,
• Distribución de medias de población con distribución normal, uso,
grados de libertad; Tabla valores “t” de Student.
• Tipificación, tipificación Z; distribución normal tipificada o tabla
normal tipificada Z; adecuados al tamaño de la muestra.
Introducción al contraste de Hipótesis

• La prueba “t” de Student fue desarrollada por el químico inglés


William Sealey Gosset, mientras trabajaba en técnicas de control de
calidad para las destilerías Guinness en Dublín.
• Publicó sus hallazgos anónimamente firmando sus artículos con el
nombre de "Student”.
• Se usa para comparar las medias de dos grupos de población.
(investigaciones epidemiológicas)
• Su selección depende del tipo de datos (cuantitativa continua) y de la forma
de su distribución (normal).
Prueba t de Student

• La prueba “t” de Student se utiliza para contrastar hipótesis en


muestra pequeñas (menor n = 30);
• para muestras grandes (n = mayor a 30) recurrimos a la tipificación Z,
ambas como pruebas paramétricas (en las cuales, su distribución no
puede ser definida a priori, pues son los datos observados los que la
determinan).
• O la prueba de rangos de Wilcoxon como prueba no paramétrica
(donde no se puede suponer la normalidad de dichas muestras).
Tipo de pruebas paramétricas

• Prueba T de Student para datos relacionados (muestras


dependientes, muestras pareadas).
• Prueba T de Student para datos no relacionados (muestras
independientes).
• Prueba T de Student-Welch para dos muestras independientes con
varianzas no homogéneas.
Cuadro Nº Identificación de tipo de análisis, prueba paramétrica y no
paramétrica a utilizar para análisis de variables cuantitativas
Análisis Paramétrico No paramétrico
Describir un grupo Media y varianza Mediana, cuartil, rango
Comparar un grupo a un
T de Student de una muestra Prueba de Wilcoxon
valor
Comparar medias en 2
T de Student de dos muestra Mann Whitney
grupos
Compara medias en dos
T de Student apareada Prueba de Wilcoxon
grupos pareados
Comparar medias en 3 o
ANOVA (análisis de varianza) Kruskal-Wallis
más grupos
Correlación entre dos Correlación línea lineal de Ro de Sperman
variables Pearson Tau de Kendall
T de Student Gráfica
• Tiene un parámetro denominado grados
de libertad.

• Cuando aumentan los grados de libertad,


más se acerca a N(0,1).

• Es simétrica con respecto al cero.

• Se consideran valores anómalos los que


se alejan de cero (positivos o negativos).

Bioestadística. U. Málaga. Tema 5: Modelos probabilísticos 8


Grados de libertad
Los grados de libertad en una variable cuantitativa son:
• En una muestra: g. l.= (n - 1)
• Cuando hay dos muestras: g. l.= (n - 1) + (m -1) = (n + m -2) =
N -2, siendo N la suma de los individuos de los dos grupos.
¿Por qué es tan especial la distribución t?
Pues porqué a diferencia de la distribución normal que depende
de la media y la varianza, la distribución t solo depende de los
grados de libertad.
En otras palabras, controlando los grados de libertad,
controlamos la distribución.
Propiedades
• Es una distribución simétrica. El valor de la media, la mediana y la moda
coinciden. Matemáticamente, media mediana y moda = 0.
• Es una distribución unimodal. Los valores que son más frecuentes o que
tienen más probabilidad de aparecer (moda) están alrededor de la media.
Cuando nos alejamos de la media, la probabilidad de aparición de los valores
y su frecuencia descienden.
• Si tenemos una muestra de tamaño n, entonces tendremos una distribución t
con (n-1) grados de libertad. En otras palabras, la distribución tendrá el
mismo número de observaciones en ambos lados del valor central.
• La función de densidad no depende de los grados de libertad para ser
simétrica
• Cuando aumentan los grados de libertad, más se acerca a N (0,1).
• Se consideran valores anómalos los que se alejan de cero (positivos o
negativos).
Formula

Donde:
• t= valor estadístico de la prueba t de Student
• X=Valor promedio del grupo
• μ = media
• S= desviación estándar (EE)
• N= tamaño se la muestra
Requisitos para aplicarla

• Las observaciones deben ser independientes.


• poblacionales con distribución normal.
• Las mediciones se deben elaborar en una escala de intervalo que
tengan la misma magnitud (puedan efectuarse todas las operaciones
aritméticas admisibles).
• Las varianzas de los grupos deben ser homogéneas.
• Poblaciones con características similares
• Muestras deben ser aleatorias
Procedimiento de aplicación
• Plantear el problema
• Formulación de la hipótesis estadística
• Ho
• Ha
• Determinar el nivel de significancia estadística (rango de aceptación de la
hipótesis alternativa).
• Evidencia muestral cálculo de la media y la desviación estándar de la
muestra.
• Se aplica la distribución T de Student para calcular la probabilidad por
medio de la fórmula general presentada al principio y se contrasta con el
valor “t” obtenido de la tabla correspondiente. Ver a continuación.
• En base a la evidencia disponible se acepta o se rechaza la hipótesis
alternativa.
• Si la probabilidad de (p) es mayor que el nivel de significancia se rechaza la
hipótesis alternativa.
• Si la probabilidad de (p) es menor que el nivel de significancia se acepta la
hipótesis alternativa.
Ejemplo
1 Formulación del problema
¿Existe suficiente evidencia para comprobar que no hay problema de autoestima
en el grupo de la casa de retiro ALFA OMEGA sabiendo que el promedio aceptable
de autoestima es a partir de 60?
2. Formulación de la hipótesis estadística
• HA = > 60 (mayor que 60); el grupo tiene no tiene problemas de autoestima (valor de autoestima
aceptable = 60 y mas).
• Ho = < 60 (menor que 60); el grupo tiene problemas de autoestima
3 Determinación de nivel de significación
• Alfa= 0,05
4. Evidencia muestral de muestra de 25 personas
Calculo y presentación de la gráfica
El valor crítico en la tabla con 24 grados de libertad es de: 1.7019
(lamina anterior)
Menos de este valor se rechaza la hipótesis nula
Dado que p valor 1.8 es menor que 1.7109 (cae en la región de
critica o de significación o de rechazo de la hipótesis nula) = se
acepta la hipótesis alterna.

Si buscamos el valor de 1.8 bajo la curva normal encontraremos


que es de 0.042 el cual es menor que 0.05.

La conclusión es que no hay problemas de autoestima en el grupo


estudiado. Esto con el diseño de la investigación presentado.
La forma de hacer uso de t de Student en el paquete SPSS:
• Búsqueda de la evidencia
• Verificación del requisito de normalidad en la distribución de las muestras
• Procedimiento Ir a:
• Analizar
• Estadísticos descriptivos
• Explorar: en el dialogo incorporar en Lista de dependientes (la variable
dependiente), en Lista de factores (variable independiente);
• Gráficos; clic – en Gráficos de normalidad con pruebas;
• Continuar – aceptar: se obtiene un recuadro
i. Se analiza según el caso normalidad; con: Kolmogorov-
Smirnov (muestras grandes) y Chapiro Wilk esta se aplica
para (muestras pequeñas = menos de 30), vemos si el nivel de
significancia: es mayor o menor que valor alfa y contrastamos
si en normal o no, en ambos casos, p valor es mayor que alfa,
los datos provienen de una distribución normal.
• Procedimiento de verificación de homogeneidad de las distribuciones
en SPSS va junto a la t de Student
Ir a:
• Analizar
• Comparar medias
• Prueba T de Student para muestras independientes, en el
dialogo en: Variables de prueba (incorporar la variable
dependiente); en Variable de agrupación (variable
independiente); en el dialogo definir grupos: Grupo 1 = 1 el
primer grupo, Grupo 2 = 2 segundo grupo, según rango
establecido
• continuar;
• aceptar: se obtiene un recuadro
a. Para corroborar la igualdad de varianzas se realiza el análisis de la Prueba
de Levene: Resultado del F y su nivel de Significación: Si este es mayor que
alfa 0,05, es el caso del ejemplo 0,147 mayor que alfa 0.05 se acepta la
hipótesis nula existe igualdad de varianza.
b. Lectura de la prueba t Prueba de muestras independientes: Resultado del t,
4,189, grados de libertad = 58, su nivel de significación 0.000 menor que
0,05, se rechaza la hipótesis nula y se acepta la hipótesis alterna. (en este
caso Sig. 0.000 < 0.05 alfa)
(siendo p < α)
Acepto la hipótesis alterna
Modelo de redacción
Tabular
Cuadro Nº Prueba de normalidad de distribución, de distribución de
varianzas y t de Student para muestras independiente
Pruebas Estadístico Grados de Significación
libertad
Shapiro Wilk
Grupo 1 .970 30 .548
Grupo2 .976 30 .723
Prueba de Levene(1)
F:2.345 .247
Prueba t para igualdad
de medias 4.189 58 .000
Literal
En lo que respecta a (la hipótesis)…., se encontraron diferencia entre los
grupos…. y… t= 4.189, gl= 58, p < α; concluimos que existe una diferencia
significativa, como puede observarse en el cuadro Nº, …. en el cual el
grupo…tuvo un promedio…. mas alto …. ; al compara con el grupo …
promedio ……al compáralo con el grupo…. Promedio…existe……; como se
observa en la presentación descriptiva de ambos grupos ver siguiente cuadro
Cuadro Nº media (promedio) del examen según el grupo de aplicación del
tipo de pedagogía
Aplicación Media Número Desviación
pedagógica Estándar
Grupo 1 14.93 30 2.49
Grupo2 11,77 30 3.31
La forma de hacer del paquete SPSS para obtener cuadro descriptivo
Procedimiento
Ir a:
• Analizar
• Comparar medias
• Dialogo lista de dependientes (variable dependiente) Capa 1 (variable
independiente)
• Aceptar se obtiene le siguiente recuadro
Gráfica
• Gráfica adicional según la investigación si solo se centra en el tema de
contraste de medias o promedios
Grafica Nº Gráfica de comparación de las medias de a y b ejemplo
Tipificación
• Dada una variable de media μ y desviación típica σ, se denomina valor
tipificado, z, de una observación x, a la distancia (con signo) con respecto a la
media, medido en desviaciones típicas, es decir

x-µ
z=
s

• En el caso de variable X normal, la interpretación es clara: Asigna a todo valor


de N(μ, σ), un valor de N(0,1) que deja exactamente la misma probabilidad
por debajo.

• Nos permite así comparar entre dos valores de dos distribuciones normales
diferentes, para saber cuál de los dos es más extremo.

Bioestadística. U. Málaga. Tema 5: Modelos probabilísticos 25


Ejemplo: Tipificación

• Se quiere dar una beca a uno de dos estudiantes de sistemas


educativos diferentes. Se asignará al que tenga mejor expediente
académico.
• El estudiante A tiene una calificación de 8 en un sistema donde la
calificación de los alumnos se comporta como N(6,1).
• El estudiante B tiene una calificación de 80 en un sistema donde la
calificación de los alumnos se comporta como N(70,10).
• Solución
• No podemos comparar directamente 8 puntos de A frente a los 80 de B,
pero como ambas poblaciones se comportan de modo normal, podemos
tipificar y observar las puntuaciones sobre una distribución de referencia
N(0,1)

Bioestadística. U. Málaga. Tema 5: Modelos probabilísticos 26


xA - µ A 8-6
zA = = =2
sA 1
xB - µ B 80 - 70
zB = = =1
sB 10

Como ZA>ZB, podemos decir que el


porcentaje de compañeros del mismo
sistema de estudios que ha superado en
calificación el estudiante A es mayor que
el que ha superado B.
Podríamos pensar en principio que A es
mejor candidato para la beca.
Tema 5: Modelos probabilísticos 27 Bioestadística. U. Málaga.
Tabla N(0,1) Z es normal tipificada.

Calcular P[Z<1,85]

Solución: 0,968 = 96,8%

Tema 5: Modelos probabilísticos 28 Bioestadística. U. Málaga.


Tabla N(0,1) Z es normal tipificada.

Calcular P[Z<-0,54]

Solución: 1-0,705 = 0,295


Bioestadística. U. Málaga. Tema 5: Modelos probabilísticos 29
Tabla N(0,1) Z es normal tipificada.

Calcular P[-0,54<Z<1,85]

Solución: 0,968-0,295= 0,673

Bioestadística. U. Málaga. Tema 5: Modelos probabilísticos 30


Ejemplo: Cálculo con probabilidades normales

• El colesterol en la población tiene distribución


normal, con media 200 y desviación 10.

• ¿Qué porcentaje de indivíduos tiene colesterol


inferior a 210?

• Qué valor del colesterol sólo es superado por el


10% de los individuos.

Bioestadística. U. Málaga. Tema 5: Modelos probabilísticos 31


• Todas las distribuciones normales son similares salvo traslación y cambio de escala:
Tipifiquemos.
x-µ 210 - 200
z = = =1
s 10

P[ Z < 1,00] = ( ver tabla) = 0,841


Tema 5: Modelos probabilísticos 32 Bioestadística. U. Málaga.
• El valor del colesterol que sólo supera el 10% de los individuos es el percentil 90. Calculemos el
percentil 90 de la N(0,1) y deshacemos la tipificación.

x-µ
z =
s
x - 200
1,28 =
10
x = 200 + 10 ´1,28 = 212,8

Tema 5: Modelos probabilísticos 33 Bioestadística. U. Málaga.


Práctica Nº 5 T de Student en SPSS
• Primera parte: Principio de práctica de aplicación aleatoriedad (se aplica en la
gestión 2021)
• Universo son las notas de estadística descriptiva SPII por grupos (17
grupos)
• Selección de dos grupos
• Muestra aleatoria: se puede aplicar por ejemplo una ruleta
(programa de internet); números aleatorios; o identificar los dos
grupos aleatoriamente al contrastar números iniciales y finales de la
serie de un billete o un tiquete de entrada de un evento (resultado
del ejemplo selección de los grupos 5 y 8); (14 - 4) u otro.

•.
• Identificación del tamaño de la muestra
• En cada grupo sorteado se elije una muestra.
• Tamaño de las muestras según los grupos según los días; (G2 =13; G6
=14), (G10 =15; G14 =16) y (G17 =9).
• La muestra de casos de los grupos sorteados es individual - la
selección aleatoria de lote se inicia en el numero que me corresponde
en la lista al autor y se completa según la secuencia.
• Anexo en Excel los datos para el ejercicio
Segunda parte:
Seguir la secuencia de contraste de hipótesis planteada en la Unidad.

También podría gustarte