Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ASIGNATURA :
ESTADÍSTICA
TEMA:
“LA PRUEBA DE HIPOTESIS; PRUEBA DE HIPOTESIS CON T-STUDENT Y PRUEBA DE
HIPOTESIS CON CHI –CUADRADA, TIPOS DE MUESTREO”
DOCENTE: Lic. CASTRO ARROLLO Ulises
ESTUDIANTE:
SALVADOR VILCHEZ Joel Iván
PIAVIZAN CHAVEZ Priscila
VARGAS PACO Karen
CICLO: III
HYO-PERU
2019
DEDICATORIA
Los Autores.
INTRODUCCION
PORTADA i
DEDICATORIA ii
INTRODUCCION iii
I. CAPITULO
1. LA PRUEBA DE HIPOTESIS
1.1. Definición de la Prueba de Hipótesis 5
1.2. Definición de Estadístico de prueba: 6
II. CAPITULO
2. PRUEBA DE HIPOTESIS CON T-STUDENT 7
2.1. Metodología de la t-Student 7
2.2. Características de la distribución t 8
III. Capitulo
3. PRUEBA DE HIPOTESIS CON CHI –CUADRADA
3.1 Definición de Hipótesis con CHI –Cuadrada 15
3.2 Características 16
IV. Capitulo
4. MUESTREO 17
4.1 El muestreo en la estadística inferencial 17
4.2 Tipos de Muestreo 18
Conclusiones 21
Referencias bibliográficas 22
LA PRUEBA DE HIPOTESIS; PRUEBA DE HIPOTESIS CON T-STUDENT Y PRUEBA DE
HIPOTESIS CON CHI –CUADRADA, TIPOS DE MUESTREO.
PRUEBA DE HIPÓTESIS
Definiciones
Hipótesis nula H0: Una afirmación acerca del valor de un parámetro de la población.
Hipótesis Alternativa H1: Una afirmación que es aceptada si la muestra provee la
evidencia de que la hipótesis nula es falsa.
Nivel de significación: La probabilidad de rechazar la hipótesis nula cuando en realidad
es verdadera.
Error tipo I: Rechazar la nula cuando en realidad es verdadera.
Error tipo II: Aceptar la hipótesis nula cuando en realidad es falsa.
Estadístico de prueba:
Es un valor, determinado a partir de la información de la muestra, usado para decidir
si rechazar o no la hipótesis nula.
Valor crítico: El punto que divide la región entre el lugar en el que la hipótesis nula es
rechazada y la región donde la hipótesis nula es no rechazada.
Metodología de la t-Student
1. Probar que cada una de las muestras tiene una distribución normal.
2. Obtener para cada una de las muestras: a) el tamaño de las muestras (n1 y n2), b) sus
respectivas medias (m1 y m2), c) sus varianzas (v1 y v2).
3. Probar que las varianzas sean homogéneas;
4. En caso de homogeneidad en esas varianzas:
a) establecer la diferencia entre las medias: m1-m2.
b) calcular la varianza común de las dos muestras.
vc = ((n1-1)v1 + (n2-1)v2)/(n1 + n2 - 2)
Es decir, la varianza común (vc) es igual a un promedio pesado de las varianzas de las
dos muestras en donde los pesos para ese promedio son iguales al tamaño, menos uno
(n-1) para cada una de las muestras, c) con esa varianza común, se calcula el error
estándar de la diferencia de las medias ESM= √ ((vc) (n1 + n2)/(n1n2)); 5. Finalmente, la
t-Student es igual al cociente de la diferencia de medias entre el ESM anterior; 6. De
acuerdo con nuestra hipótesis nula y alterna se debe demostrar que existe diferencia
entre las medias de las muestras, se consulta una tabla de t-Student con grado de
libertad igual a n1 + n2-2 y se calcula el valor de P.5
•
Caso 2: Prueba de diferencia entre medias con muestras independientes
Un investigador estaba interesado en comparar el efecto de 2 hormonas (A y B) de
crecimiento sobre la longitud total alcanzada por una leguminosa. Para ello se tomó
una muestra de 20 plantas, asignando al azar 10 a cada hormona. Los resultados en cm.
fueron los siguientes:
Hormona A: 10 10 13 12 10 8 12 11 16 15
Hormona B: 15 11 16 17 18 9 14 12 15 16
a) Determinar si hay diferencias significativas entre los crecimientos producidos por
ambas hormonas a un nivel del 5%.
b) Realizar el mismo análisis que en a), pero suponiendo que cada una de las parejas,
en el orden dado, tienen la misma ascendencia genética.
Resolución
Prueba t para dos muestras suponiendo varianzas iguales
1 335 347
2 362 359
3 338 359
4 329 334
5 333 341
6 371 391
7 356 334
8 341 341
9 334 347
10 335 314
a) ¿Qué tipo de análisis sería correcto realizar? ¿Por qué? ¿Por qué cree que el
experimento se diseñó de esa manera? ¿Cómo se debería haber hecho el experimento
para que lo correcto fuera otro análisis?
b) ¿Cuáles son las hipótesis que se postulan? ¿Qué significa cada una de ellas?
c) Utilizando un nivel de significación del 5%, ¿cuál es la región de rechazo para el
estadístico de prueba?
d) ¿A qué conclusión se llega? ¿En qué se basa dicha conclusión?
e) ¿Qué error se puede estar cometiendo al arribar a la conclusión anterior? ¿En qué
consiste dicho error en términos de este problema?
f) Construya un intervalo del 95% de confianza para estimar la diferencia promedio
entre los dos preparados.
g) ¿Era de esperar que el intervalo cubriera o no el valor 0? ¿Por qué?
Prueba t para medias de dos muestras emparejadas
1 2 3
1 12 18 3 33 3 11
2 14 12 13 39 3 13
3 19 17 21 57 3 19
4 24 30 24 78 3 26
1 3 33 11 57
2 3 39 13 1
3 3 57 19 4
4 3 78 26 12
Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La
hipótesis nula de la prueba Chi-cuadrado postula una distribución de probabilidad
totalmente especificada como el modelo matemático de la población que ha generado
la muestra.
Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada
valor o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A
continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o
intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada
(Ei=n·pi , donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o
intervalo de valores según la hipótesis nula).
Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es
suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que 5.
En la práctica se tolera un máximo del 20% de frecuencias inferiores a 5.
Chi-cuadrado
En el cuadro de diálogo Prueba chi-cuadrado se indica la variable a analizar en Contrastar
variables.
En Valores esperados se debe especificar la distribución teórica activando una de las dos
alternativas. Por defecto está activada Todas las categorías iguales que recoge la
hipótesis de que la distribución de la población es uniforme discreto. La opción Valores
requiere especificar uno a uno los valores esperados de las frecuencias relativas o
absolutas correspondientes a cada categoría, introduciéndolos en el mismo orden en el
que se han definido las categorías.
El recuadro Rango esperado presenta dos opciones: por defecto está activada Obtener
de los datos que realiza el análisis para todas las categorías o valores de la variable; la
otra alternativa, Usar rango especificado, realiza el análisis sólo para un deteminado
rango de valores cuyos límites Inferior y Superior se deben especificar en los recuadros
de texto correspondientes.
MUESTREO
Hablamos de muestreo aleatorio en los casos en que todos los sujetos que forman parte
de una población tienen la misma probabilidad de ser escogidos como parte de la
muestra. Los muestreos de esta clase son más populares y útiles que los no aleatorios,
principalmente porque tienen una elevada representatividad y permiten calcular el
error de la muestra.
2. Estratificado
3. De conglomerados
4. Sistemático
1. La t-Student es una prueba poderosa, en la que, aunque una de las muestras no tenga
distribución normal pero la otra sí y la razón de la varianza más grande a la más pequeña
sea < 2, esta prueba resulta adecuada al comparar dos medias. Es necesario mencionar
que la distribución t-test es similar a la distribución de Gauss cuando las muestras > 30.
El poder estadístico tiene mayor magnitud cuando las condiciones que se necesitan lo
cumplen ambas muestras, independientemente del tamaño. La prueba original
demostró que existe una curva que describe el comportamiento de la diferencia de
medias y permite calcular el área bajo la curva que representa la probabilidad de la
diferencia entre ellas.
3. Del mismo modo que los estadísticos “z”, con su distribución normal y “t”, con su
distribución t de Student, nos han servido para someter a prueba hipótesis que
involucran a promedios y porcentajes, el estadístico ji-cuadrado (o chi cuadrado), que
tiene distribución de probabilidad del mismo nombre, nos servirá para someter a prueba
hipótesis referidas a distribuciones de frecuencias. En primer lugar usaremos el
estadístico ji-cuadrado para probar la asociación entre dos variables, y luego lo
usaremos para evaluar en qué medida se ajusta la distribución de frecuencias obtenida
con los datos de una muestra, a una distribución teórica o esperada.
REFERENCIAS BIBLIOGRAFICAS
2. Fagerland MW. t-tests, non-parametric tests, and large studies-a paradox of statistical
practice? BMC Med Res Methodol. 2012; 12: 78-85.
4. Wayne W. Daniel. Bioestadística base para el análisis de las ciencias de la salud. 4ª ed.
México, Limusa Wiley. 2002.
5. Zar Jerrold H. Biostatistical analysis. Prentice Hall. Inc. Fifth edition. New York, USA,
Prentice Hall, 2010.