Está en la página 1de 169

INFERENCIA ESTADÍSTICA

Fase 3 - Pruebas de Hipotesis y Anova

Presentado por:
Helber Aguilar González

Grupo:
212064_13

Presentado a:
HERNANDO BLANQUICETT

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


UNAD
Abril
2020
Actividad 1

1.       ¿Cuáles son las partes por las que está conformada una prueba de hipótesis

El orden de resolucion de una hipotesis es:


1. Plantear una hipótesis nula y una hipótesis alternativa.
2.Especificar el nivel de significancia a utilizar.
3.Elegir una estadística de prueba.
Una prueba de hipotesis consiste en contrastar dos hipotesis donde se toma la decision acerca de ellas.
Una hipotesis de define con la letra H donde:
H0: hipotesis nula
H1: hipotesis alternativa
las partes por las que esta conformada una prueba de hipótesis son :
H0: hipotesis nula
H1: hipotesis alternativa
Establecer el nivel de significancia
Estadistico de prueba
Errores tipo I y II
Region de rechazo
Toma de decision

2. ¿Cómo decide el investigador si debe de rechazar o aceptar H0?

Se contrasta la hipotesis, esto significa comparar las predicciones con la realidad que observamos , si dentro del margen de er
coincidencia, aceptaremos la hipótesis y en caso contrario la rechazaremos.

3. ¿A qué se le conoce como error tipo I?

la letra alfa α

4. ¿Cómo se determinan las regiones de rechazo de una prueba de hipótesis?

Una region de rechazo es una region en la que los valores de una muestra aleatoria, se ha rechazado la hipotesis nula

5. ¿Cuáles son las condiciones que se deben presentar para realizar una prueba de hipótesis para la med

Es necesario que se pueda determinar la hipótesis nula y la alternativa.


Debe existir además un nivel de significación, esto es la probabilidad de rechazar la hipótesis nula cuando es correcta.
En el caso de la media, se debe contar con el valor de esta y en el caso de la diferencia de medias el valor de las dos medias de
En el caso de la proporción o diferencia entre estas, es necesario conocer al menos un valor porcentual.

6.   Defina y escriba las principales características del análisis de varianza - ANOVA
El análisis de la varianza (ANOVA) es una colección de modelos estadísticos en el cual prueba la hipotesis de que las medias de
Los Anova evaluan la importancia de uno o mas factores al comparar las medias de la variable de respuesta en los diferentes n
Sus caracteristicas:
mide la fuente de variacion entre los datos y compara sus tamaños
determina la variacion entre grupos
para cada valor efectua la diferencia entre las media de sus grupos y la media global
mide la variacion dentro de los grupos
para cada valor se evalúa la diferencia entre ese valor y la media de sus grupos
cada conjunto de datos debe ser independiente del resto
los resultados obtenidos para cada conjunto deben seguir una distribucion normal
las varianzas de cada conjunto de datos no debe diferir de forma significativa

7.   ¿Cuándo y cómo aplicar un análisis de varianza?

Cuando se tiene un experimiento diseñado con combinaciones de niveles y factores


Cuando se requere determinar si es necesario rechazar la hipotesis nula o aceptar la hipotesis alternativa

8.   ¿Es útil aplicar análisis de varianza a la problemática de estudio? - Explique por q

Es de bastante utilidad ya que por medio de este método disminuye la probabilidad de que algunas diferencias resulten signifi
posibilidad de afirmar que hay una diferencia (de no aceptar la hipotesis nula) cuando realmente no la hay.
En una prueba estadistica basada en todos los datos utilizados simultaneamente, es más estable que la prueba que parcializa l
ormada una prueba de hipótesis?

de ellas.

e rechazar o aceptar H0?

mos , si dentro del margen de error que nos permitimos admitir, hay

error tipo I?

o de una prueba de hipótesis?

azado la hipotesis nula

prueba de hipótesis para la media? ¿Para la proporción?

ula cuando es correcta.


ias el valor de las dos medias de ambas muestras.
orcentual.

del análisis de varianza - ANOVA


a hipotesis de que las medias de dos o mas poblaciones son iguales
de respuesta en los diferentes niveles de los factores.

álisis de varianza?

alternativa

tica de estudio? - Explique por qué

unas diferencias resulten significativas por azar y entonces cabe la


nte no la hay.
le que la prueba que parcializa los datos y no los examina todos juntos
BASE DE DATOS

Departame Densidad Crioscopia % Sólidos


Proveedor nto (g/ml) (°C) % Proteína % Grasa totales

1845 6 1.14 -0.52 3.2 3.1 11.0


1953 6 1.04 -0.51 3.3 3 11.9
1960 6 1.05 -0.53 3 3.1 11.8
2142 6 1 -0.54 3 3.1 12.0
2180 6 1.05 -0.54 3.2 3.2 11.6
2184 6 1.05 -0.52 3.3 3 12.0
2191 6 1.07 -0.51 3.2 3 11.8
2199 6 1.02 -0.53 3.1 3.1 11.9
2219 6 1.04 -0.53 3.2 3.2 11.8
2266 6 1.04 -0.49 3.3 2.9 12.0
2308 6 1.02 -0.51 3.2 2.9 11.6
2403 6 1.01 -0.53 3.3 3 12.0
2425 6 1.05 -0.54 3.2 2.9 12.2
2428 6 1.01 -0.55 3.2 3 12.2
2523 6 1.03 -0.51 3.2 3 11.7
2622 6 1.14 -0.53 3.2 3.2 11.8
2709 6 1 -0.54 3.1 2.9 11.5
2809 6 1.04 -0.54 3.2 3 11.9
2836 6 1.03 -0.52 3.1 3.2 11.6
2856 6 1.04 -0.55 3.2 3 12.1

0.04955694 0.02075092 0.102995838178 0.1027027039512 0.30911451


BASE DE DATOS

Células Temperatu
somáticas Tipo de Temperatu Prueba de
(células/ml Peroxidasa Fosfatasa leche ra Precio yodo ra de
recepción
de leche)
1901486 2 2 3 1 779 2 2
1883559 1 2 1 1 743 2 1
1911606 2 2 1 1 671 2 1
1896044 2 2 1 3 537 2 1
1897441 2 2 4 2 520 2 1
1895400 2 2 3 1 921 2 2
1916697 2 2 1 2 -30 2 1
1912208 2 2 4 2 742 2 1
1900492 2 2 2 2 667 2 1
1904358 2 2 1 3 881 2 1
1884874 2 2 4 3 776 2 1
1910478 2 2 1 2 690 2 1
1874569 2 2 1 1 487 2 1
1888687 2 2 1 1 832 2 1
1919986 2 2 1 3 697 2 2
1912525 2 2 1 2 473 2 2
1922262 1 2 1 1 342 2 1
1884526 2 2 1 2 956 2 2
1904501 1 2 1 2 873 2 1
1919891 2 2 4 2 1028 2 1

10116.7352
Satisfacció
n

3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
292
Datos

Paso 1: Describir la hipóte


H0:
H1:

Escrito en forma simbólic

H0 : µ > = 3,1
H1: µ < 3,1

Paso 2: Establecer el nive


a=

Paso 3: Estadístico de pru

𝒁_𝒑𝒓𝒖𝒆𝒃𝒂=(𝒙 ̅−
𝝁)/(𝒔/√𝒏)

Paso 4: Estadístico teórico

Paso 5: Tomar la decisión

Con una significancia de 4%


-8,47 es menor que el valor

Conclusión:
Con una significancia de 4%
ya que es menor a 3,1
Fase 3 Pruebas de Hipotesis
Datos
Tamaño de la muestra = 107
Media Muestral promedio= 3.011215
Desviación estandar= 0.1084428
Promedio de la variable X= 3.1
Paso 1: Describir la hipótesis
media del %grasa del tipo de leche esterilizada es mayor o igual a 3,1
media del %grasa del tipo de leche esterilizada es menor a 3,1

Escrito en forma simbólica:

(Prueba Unilateral izquierda)


H0 : µ > = 3,1
H1: µ < 3,1

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


0.04

Paso 3: Estadístico de prueba (o calculado)

𝒁_𝒑𝒓𝒖𝒆𝒃𝒂=(𝒙 ̅−
𝝁)/(𝒔/√𝒏)

Zprueba= -8.47 p-valor

Paso 4: Estadístico teórico


𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛:
𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐
Zteórico= -1.750 por ser 4% 𝐻_0
Paso 5: Tomar la decisión 𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐
𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0
Con una significancia de 4% se rechaza la hipotesis nula ya que el valor calculado de
8,47 es menor que el valor teorico de -1,75

Conclusión:
Con una significancia de 4% se rechaza que el % de grasa del tipo de leche esterilizada,
a que es menor a 3,1
d. Una PH para probar si la media del % de grasa del tipo de
leche esterilizada es mayor o igual a 3,1 (Prueba Unilateral
izquierda)

p-valor

𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛:
𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎
𝐻_0
𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒
𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0
Tabla de distribucion normal
Fase 3 Pruebas de Hipotesis
Datos
Tamaño de la muestra = 340
proveedores cuya temperatura sea < = 10 "1"= 292
(p) % proveedores cuya temperatura sea < = 10 "1" = 86%
(P) Proporción= 80%
Paso 1: Describir la hipótesis
H0: % de proveedores cuya temperatura sea < = 10, es menor o = al 80%
H1: % de proveedores cuya temperatura sea < = 10, es mayor al 80%

Escrito en forma simbólica:

H0 : P < = 80%
H1: P > 80 % (Prueba Unilateral derecha)

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a = 0.05

Paso 3: Estadístico de prueba (o calculado)


Proporción de la
p- P muestra 86%
Zprueba = Proporción
P(1- P) Poblacional 80%

Zprueba= 2.71

Paso 4: Estadístico teórico (tablas)

Zteórico= 1.645

Paso 5: Tomar la decisión

Se rechaza la H0 porque Zprueba es mayor que Zteorico y al realizar la grafica, se ubica


en la zona sombreada.

Conclusión:

Se acepta la H1 porque el % de proveedores cuya temperatura es < = 10 "1", es mayor


al 80%.
Se acepta la H1 porque el % de proveedores cuya temperatura es < = 10 "1", es mayor
al 80%.
d.   Una PH para la proporción, para probar si el número de
proveedores con temperatura de recepción sea inferior o igual a 10 °C
sea mayor al 80%. (Prueba Unilateral derecha)

p-valor
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛:
𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒
𝑎𝑐𝑒𝑝𝑡𝑎 𝐻_0

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒
𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0
Fase 3 Pruebas de Hipotesis

Datos
MEDIA POBLACIONAL
0
MEDIAS MUESTRALES
promedio de % de proteinas para el tipo de leche ultrapasteurizada promedio de % de proteinas para el tipo de leche esterilizada

Media muestral= 3.199023569024 Media Muestral=


Desviación muestral= 0.10311283187 Desviación Muestral =
Tamaño de muestra( n1)= 451 Tamaño de muestra(n2)=

El promedio de % de proteinas para el tipo de leche ultrapasteurizada es igual al tipo de leche


H0: esterilizada

El promedio de % de proteinas para el tipo de leche ultrapasteurizada no es igual al tipo de leche


Ha: esterilizada

Ho : 𝜇_1 = 𝜇_2
Ha : 𝜇_1 ≠ 𝜇_2

Donde
BILATERAL
𝜇_1: promedio de % de proteinas para el tipo de leche
ultrapasteurizada
𝜇_2: promedio de % proteinas para el tipo de leche
esterilizada

Paso 2: Establecer el nivel de significancia con el que se va a trabajar

a = 0.05

Paso 3: Estadístico de prueba (o calculado)

Zprueba= 0.0043

Paso 4: Estadístico teórico (tablas)


se trabaja con 1,96 por ser de dos colas
Zteórico= -1.96 1.96
Paso 5: Tomar la decisión
Se acepta H0 porque el valor de Zprueba está dentro de la zona de aceptación.

Conclusión:
El promedio de % de proteinas para el tipo de leche ultrapasteurizada es igual al tipo de leche esterilizada
d. Una PH para la diferencia de medias, para probar que el promedio del
proteínas para el tipo de leche ultrapasteurizada es igual al tipo de lec
esterilizada. (Prueba bilateral)
proteinas para el tipo de leche esterilizada

3.19899598393578
0.10320765736905
598

urizada es igual al tipo de leche

urizada no es igual al tipo de leche

ATERAL

p-valor

𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛:

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎


𝐻_0
𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒
𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0
𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎
𝐻_0

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒
𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0

tipo de leche esterilizada


ra probar que el promedio del % de
eurizada es igual al tipo de leche
ba bilateral)
Fase 3 Pruebas de Hipotesis
Datos
PROVEEDORES DEPARTAMENTO 6 PROVEEDORES DEPARTAMENTO 2 TOTAL
n1= 328 n2= 1290 1618

DEPARTAMENTO 6, PRUEBA YODO "PRESENCIA ALMIDONES" DEPARTAMENTO 2, PRUEBA YODO "PRESENCIA ALMIDONES"
X1= 31 X2= 136
P1= 9% P2= 11%
Proporción Ponderada Pc
PC= 10%
1-PC= 90%

Paso 1: Describir la hipótesis


El número de proveedores con prueba de yodo “presencia de almidones” en el
Ho: departamento 6 es mayor e igual al de proveedores con prueba de yodo
“presencia de almidones” en el departamento 2.

El número de proveedores con prueba de yodo “presencia de almidones” en el


Ha: departamento 6 es menor al de proveedores con prueba de yodo “presencia de
almidones” en el departamento 2.

Escrito en forma simbólica:


Ho : P1 >= P2
Ha: P1 < P2

Donde
(Prueba Unilateral
P1: PROVEEDORES DEPARTAMENTO 6
P2: PROVEEDORES DEPARTAMENTO 2
izquierda)

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a = 0.05

Paso 3: Estadístico de prueba (o calculado)

P1 - P2
Zprueba =
PC (1- PC ) PC (1- PC )
+
n1 n2

Zprueba= -0.01 = -0.58012217748065


0.018813556679722
Paso 4: Estadístico teórico (tablas)
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛
Zteórico= -1.645
𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥𝛼, 𝑒𝑛
Paso 5: Tomar la decisión
𝐻_0

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<𝛼, 𝑒𝑛
No se rechaza la Ha porque el valor de Zprueba està en la zona de aceptación. 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0

Conclusión:
El número de proveedores con prueba de yodo “presencia de almidones” en el
departamento 6 es menor al de proveedores con prueba de yodo “presencia de almidones”
en el departamento 2.
d. Una PH para la diferencia de proporciones, para probar que él
número de proveedores con prueba de yodo “presencia de almidones”
en el departamento 6 es menor al de proveedores con prueba de yodo
“presencia de almidones” en el departamento 2. (Prueba unilateral
izquierda)

p-valor
Zprueba=-0,580
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛:
𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟 ≥𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎
𝐻_0

𝑆𝑖 𝑝−𝑣𝑎𝑙𝑜𝑟<𝛼, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒
𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻_0
Zprueba=-0,580
d. Evaluar si el “% solidos totales” depende de “satisfacción” que se tiene del pr
datos a trabajar debe ser as

Muy satisfecho
% solidos totales proveedor 1

% solidos totales proveedor 2

% solidos totales proveedor 3

% solidos totales proveedor 4

% solidos totales proveedor 5

Paso 1: Describir la hipótesis

H0: El “% solidos totales” depende de “satisfacción” que se tiene del proveedor en el d


H1: El “% solidos totales” no depende de “satisfacción” que se tiene del proveedor en

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a = 0.05

Paso 3: Estadístico de prueba F (o calculado)

Muy satisfecho
Observación 1 11.8
Observación 2 11.9
Observación 3 11.7
Observación 4 12
Observación 5 11.7

Análisis de varianza de un factor

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta
Muy satisfecho 5
Satisfecho 5
Poco satisfecho 5
ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados
Entre grupos 0.084
Dentro de los grupos 0.796000000000001

Total 0.880000000000001
Total 315030.933333333

Paso 5: Tomar la decisión

El estadístico de prueba F es menor al valor crítico, por tanto, Se acepta la Ho. Es decir
satisface los requerimientos
nde de “satisfacción” que se tiene del proveedor en el departamento 6. La organización de l
datos a trabajar debe ser así:

Satisfecho Poco satisfecho


% solidos totales proveedor 6 % solidos totales proveedor 11

% solidos totales proveedor 7 % solidos totales proveedor 12

% solidos totales proveedor 8 % solidos totales proveedor 13

% solidos totales proveedor 9 % solidos totales proveedor 14

% solidos totales proveedor 10 % solidos totales proveedor 15

de “satisfacción” que se tiene del proveedor en el departamento 6


de de “satisfacción” que se tiene del proveedor en el departamento 6

e se va a trabajar

Satisfecho Poco satisfecho


11.5 11.7
12 11.8
12.5 11.5
11.6 11.9
11.8 11.6

Suma Promedio Varianza


59.1 11.82 0.017
59.4 11.88 0.157
58.5 11.7 0.025
Grados de libertad Promedio de los cuadrados F
2 0.042 0.633165829
12 0.066333333333333

14
14

No rechazar Ho
0.633165829145728
como F es < Vcritico: se ap

3.88529383465239 Rechazar Ho

ítico, por tanto, Se acepta la Ho. Es decir el % de solidos totales de los proveedores del departa
organización de los
Probabilidad Valor crítico para F
0.547749983972478 3.88529383465239

mo F es < Vcritico: se aprueba

dores del departamento 6


CONCLUSIONES

Se afianzo el conocimiento en pruebas de hipotesis y anova con los ejercicios propuestos

Se realizo un analisis profundo de los tipos de hipotesis que se manejan para determinar
o definir de una manera mas detallada la toma de decisiones de un sistema o problemática

Se adquieren conocimientos mas avanzados de inferencia estadistica no como una herramienta


matematica sino como una herramienta de analisis o probabilidades.
REFERENCIAS BIBLIOGRAFICAS

Sánchez, J. T. (2017). Pruebas de Hipótesis [OVI]. Colombia. Recuperado de


http://hdl.handle.net/10596/10565

Gutiérrez, H. (2013). Capítulo 4: Elementos de Inferencia Estadística Control estadístico de


la calidad y Seis Sigma. (3a. ed.) McGraw-Hill Interamericana.

Matus, R., Hernández, M., & García, E. (2010). Estadística. México, D.F., MX: Instituto
Politécnico Nacional.

Romero, R. E. (2016). Estadística para todos: análisis de datos: estadística descriptiva,


teoría de la probabilidad e inferencia. Madrid, ESPAÑA: Larousse - Ediciones Pirámide.
Pp. 313 -328.

También podría gustarte