Está en la página 1de 23

INFERENCIA ESTADÍSTICA (100403)

Fase 4 - ANOVA

Presentado por:
Jhon Alexander Muñoz Bolaños

Grupo:
100403_29

Presentado a:
LUIS ANTONIO CELY BECERRA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


UNAD
2020
TIPO DE MUESTREO: Sistemático

Muestreo en que los n elementos de la muestra se seleccionan tomando aleatoriamente un númer


primero que va a formar parte de la mue

Características:
1) Una lista completa de la población
2) La población ordenada y la muestra también estará ordenada
Esta es la forma o cada cuanto se selecciona un elemento
K= N/n
K= fracción sistemática (o cada cuanto se toma el elemento de la población)
N= Tamaño de la población
n= Tamaño de la muestra (Calculado ya anteriormente)

K= N/n
N= 2989
n= 360
K= 8.30 se redondea

K= 8 Seleccione la muestra cada 28 elementos


Alea= 8 Se escoge un número aleatorio entre 1 y K.
Fijo= 9 Copie y pegue el número aleatorio como valor para que no e

1) Rellene una columna que empiece desde 1 hasta n

2) Luego, empieze la 2da columna con el número que encontró entre 1 y K,

LISTO! Esta es la lista de personas que van a conformar su muestra, recuer

3) Copie y pegue los nombres de las variables de la población

4) Use la función =BUSCARV(C36;Población!$A$6:$Q$918;2;0) esto es par


261 elementos que va a incluir en la muestra. El número 2, corresponde a la

Crioscopia (°C) Departamento

3 39 -0.56 2
8 79 -0.54 2
17 151 -0.54 2
18 159 -0.55 2
19 167 -0.52 2
23 199 -0.5 2
36 303 -0.53 2
47 391 -0.5 2
84 687 -0.53 2
86 703 -0.53 2
100 815 -0.48 2
108 879 -0.53 2
115 935 -0.51 2
117 951 -0.54 2
124 1007 -0.53 2
131 1063 -0.54 2
142 1151 -0.55 2
143 1159 -0.49 2
149 1207 -0.54 2
151 1223 -0.51 2
173 1399 -0.55 2
179 1447 -0.51 2
181 1463 -0.53 2
182 1471 -0.51 2
196 1583 -0.57 2
199 1607 -0.56 2
200 1615 -0.56 2
201 1623 -0.52 2
209 1687 -0.48 2
212 1711 -0.53 2
220 1775 -0.52 2
223 1799 -0.54 2
229 1847 -0.51 2
234 1887 -0.48 2
235 1895 -0.54 2
248 1999 -0.54 2
259 2087 -0.49 2
TIPO DE MUESTREO: Sistemático

tomando aleatoriamente un número i, que designará, en una lista o población de N elementos, al


ero que va a formar parte de la muestra.

ento de la población)

ada 28 elementos
eatorio entre 1 y K.
o aleatorio como valor para que no este cambiando

sde 1 hasta n

l número que encontró entre 1 y K, es decir el que corresponde al valor fijo

van a conformar su muestra, recuerde que es importante mantener la constante K

iables de la población

ción!$A$6:$Q$918;2;0) esto es para que no tenga que pasar manualmente la información de los
estra. El número 2, corresponde a la columna de la variable, en este caso Municipio

% Sólidos
Densidad (g/ml) % Proteína % Grasa
totales

1.06 3 3 11.9
0.9 3.3 3 11.6
1.02 3.2 2.8 11.8
0.98 3.4 3 11.6
1.02 3.2 2.9 12
1 3.3 3 12.2
1.06 3.2 3 11.8
1.06 3.2 2.9 11.6
1.11 3.4 3.1 11.8
1.16 3.2 3 12
1.05 3.2 3.1 12
1.07 3.1 3 11.6
1.08 3.3 3 11.9
1.03 3.2 2.9 12
1.03 3.2 3.1 12.3
1.03 3.1 2.8 11.6
1.03 3.3 3.1 11.9
1 3.1 2.9 11.3
1.02 3.2 3.2 11.5
1.01 3.4 2.9 11.7
1.02 3.3 3.2 11.3
0.94 3.2 3.1 12
1.02 3.1 2.9 12
1.06 3.2 3 12.3
1.09 3.2 3 11.4
1.07 3.2 3 11.6
1 3.3 3 11.8
1.09 3.1 3 11.6
1.04 3.2 3 11.9
1.07 3.3 2.9 11.3
1.06 3.3 3 11.6
0.96 3.4 3.1 12
1.06 3.1 3 12
0.98 3.2 2.9 12.2
1.02 3.2 2.8 12
1.06 3.2 3 12
0.99 3.3 3.1 11.7
Nota: Solo se emplea este muestreo para n<50%, si n>50% se debe de
aleatorio simple.

Células somáticas (células/ml


Peroxidasa Fosfatasa
de leche)

1893214 2 2
1895128 2 2
1904994 2 2
1902162 2 2
1908316 2 2
1902867 2 2
1882459 2 1
1897680 2 2
1892157 2 2
1910707 2 2
1899070 2 2
1881539 2 2
1889643 2 2
1900223 2 2
1897720 1 2
1894227 2 2
1906169 2 2
1890624 2 2
1912397 2 2
1897015 2 2
1900579 2 2
1875545 2 2
1901939 2 1
1901847 2 2
1888732 2 2
1906127 2 2
1906368 2 2
1897188 2 1
1900071 2 2
1870555 2 2
1912042 2 2
1902172 2 2
1892361 2 1
1918427 2 2
1904617 2 2
1900466 2 2
1900114 2 2
reo para n<50%, si n>50% se debe de proceder a realizar un muestreo
aleatorio simple.

Prueba de Temperatura de
Tipo de leche Temperatura Costo
yodo recepcion

4 1 542 2 1
4 2 481 2 1
4 2 418 2 1
4 3 571 2 1
4 3 708 2 1
4 3 1172 2 1
4 2 650 1 1
4 2 636 2 1
4 1 832 2 2
4 2 745 2 2
4 2 518 2 2
4 2 903 2 1
4 3 726 2 1
4 1 958 2 1
4 2 425 2 1
4 1 870 2 1
4 2 668 2 1
4 2 1066 2 1
4 1 481 2 1
4 2 609 2 1
4 2 701 2 1
4 2 711 2 1
4 2 615 2 2
4 2 959 2 1
4 1 995 2 1
4 2 855 2 1
4 2 695 2 2
4 1 837 2 1
4 2 563 2 1
4 2 273 2 1
4 3 410 2 1
4 1 401 2 2
4 2 373 2 1
4 2 696 2 1
4 2 803 2 1
4 1 1054 2 1
4 1 772 2 2
Satisfacción

2
2
1
1
2
2
4
3
2
2
1
2
2
2
1
2
2
2
2
3
2
1
2
2
4
2
2
2
2
2
2
2
2
1
2
2
1
1. Definición y características principales del a
El Análisis de varianza (ANOVA) es una colección de modelos estadísticos y sus procedimientos asociados p
dos muestras en el mismo planteam

2. ¿Cuándo y cómo aplicar un análisis de

Usamos ANOVA de un factor cuando queremos saber si las medias de una variable son diferentes entre los
hijos entre los grupos o niveles de clase social: los que son clase baja, clase trabajadora, clase media-baja, cla
variable “número de hijos” está relacionada con la variable “clase social”. Concretamente, se analizará s
pertenece la persona.

3. Explique cada uno de los modelos de análisis de v


El anova permite distinguir dos modelos para la h

Modelo I o de efectos fijos en el que la H1 supone que las k muestras son

Modelo II o de efectos aleatorios en el que se supone que las k muestras, se han seleccio

Un ejemplo de modelo I de anova es que se asume que existen cinco poblaciones (sin tratamiento, c

Un ejemplo de modelo II sería: un investigador está interesado en determinar el contenido, y sus variaciones
al azar y les realiza, a cada una, 3 biopsias

La manera más sencilla de distinguir entre ambos modelos es pensar que, si se repitiera el estudio un tiempo
forman) es decir corresponderían a la misma situación, mientras que en un modelo II las muestras serían dis
diferentes, los cálculos y las pruebas de significación son los mismos y sólo difieren en la inte

4. ¿Es útil aplicar análisis de varianza a la problemática de


Señala si las medias entre dos o más grupos son similares o diferentes, se aplica con la finalidad de analiza
varianzas, donde una alta o baja razón implicarían la aceptación o rechazo de la hipótesis, y por otro lado
población en cuanto a su grado de predictibilidad, a mayor o menor covarianza.
Es util debido a que en nuesto caso de estudio de la "La presumida" la cual presenta dism
analisis de varianza (ANOVA) podremos analizar y comparar los experimentos realizados a las variables que e
rísticas principales del análisis de varianza
ocedimientos asociados para verificar si hay diferencias significativas entre medias cuando hay más de
ras en el mismo planteamiento.

ómo aplicar un análisis de varianza?

e son diferentes entre los niveles o grupos de otra variable. Por ejemplo, si comparamos el número de
dora, clase media-baja, clase media-alta y clase alta. Es decir, vamos a comprobar mediante ANOVA si la
cretamente, se analizará si la media del número de hijos varía según el nivel de clase social a la que
pertenece la persona.

s modelos de análisis de varianza. De ejemplos.


uir dos modelos para la hipótesis alternativa:

ne que las k muestras son muestras de k poblaciones distintas y fijas.

muestras, se han seleccionado aleatoriamente de un conjunto de m>k poblaciones.

ciones (sin tratamiento, con poca sal, sin sal, etc.) fijas, de las que se han extraído las muestras.

ntenido, y sus variaciones, de grasas en las células hepáticas de cobayas; toma del animalario 5 cobayas
iza, a cada una, 3 biopsias hepáticas.

tiera el estudio un tiempo después, en un modelo I las muestras serían iguales (no los individuos que las
o II las muestras serían distintas. Aunque las asunciones iniciales y los propósitos de ambos modelos son
s y sólo difieren en la interpretación y en algunas pruebas de hipótesis suplementarias.

anza a la problemática de estudio? - Explique por qué


con la finalidad de analizar las diferencias o semejanzas significativas tanto de las medias como de las
a hipótesis, y por otro lado se revelara el efecto que tiene una variable sobre la otra de acuerdo a su

ida" la cual presenta disminucion en sus procesos de produccion, siendo asi que cuando aplicamos un
zados a las variables que estan incumpliendo con los parametros de produccion.
b. Evaluar si el recuento de células somáticas depende del tipo de leche de “p
departamento 2. La organización de los datos

Leche pasteurizada

Recuento de células somáticas 1.

Recuento de células somáticas 2.

Recuento de células somáticas 3.

Recuento de células somáticas 4.

Recuento de células somáticas 5.

Paso 1: Describir la hipótesis

H0: El recuento de células somáticas depende del tipo de leche en el depto 2


H1: El recuento de células somáticas no depende del tipo de leche en el depto 2

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a = 0.05

Paso 3: Estadístico de prueba F (o calculado)

Leche pasteurizada

Observación 1 1896402
Observación 2 1893109
Observación 3 1897753
Observación 4 1895451
Observación 5 1913637

Análisis de varianza de un factor

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta
Leche pasteurizada 5
Leche Ultrapasteurizada 5
Leche

esterilizada 5

ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados
Entre grupos 124766326.533333
Dentro de los grupos 1771045991.2

Total 1895812317.73333

Paso 5: Tomar la decisión

El estadístico de prueba F es menor al valor crítico, por tanto, Se acepta la Ho


Conclusión

El recuento de células somáticas depende del tipo de leche en el depto 2


ticas depende del tipo de leche de “pasteurizada”, “ultrapasteurizada” y “esterilizada” en
mento 2. La organización de los datos a trabajar debe ser así:

Leche
Leche Ultrapasteurizada
esterilizada
Recuento de células somáticas
Recuento de células somáticas 11.
6.
Recuento de células somáticas
Recuento de células somáticas 12.
7.
Recuento de células somáticas
Recuento de células somáticas 13.
8.
Recuento de células somáticas
Recuento de células somáticas 14.
9.
Recuento de células somáticas
Recuento de células somáticas 15.
10.

s depende del tipo de leche en el depto 2


s no depende del tipo de leche en el depto 2

e se va a trabajar

Leche
Leche Ultrapasteurizada
esterilizada
1914520 1890624
1879658 1912397
1908824 1897015
1898944 1900579
1909409 1875545

Suma Promedio
9496352 1899270.4
9511355 1902271
9476160 1895232

Grados de libertad Promedio de los cuadrados


2 62383163.2666665
12 147587165.933333

14

No rechazar Ho
0.422686910966538

3.88529383465239 Rechazar Ho

ítico, por tanto, Se acepta la Ho

che en el depto 2
zada” y “esterilizada” en el

Varianza
67370020.8
191586888
183804589

F Probabilidad Valor crítico para F


0.42268691 0.664671399028068 3.88529383465239
Conclusiones

* La inferencia estadistica permite recolectar los resultados de un estudio


realizado a través de las diferentes técnicas, lo cual permitirá tomar decisiones
en función de solucionar el problema planteado y responder a las preguntas
propuestas durante la construcción del proyecto o el planteamiento del
problema.

* Usamos ANOVA de un factor cuando queremos saber si las medias de una


variable son diferentes entre los niveles o grupos de otra variable.

* ANOVA de un factor compara las medias de la variable dependiente entre


los grupos o categorías de la variable independiente.

* Al aplicar ANOVA de un factor se calcula un estadístico o test denominado F


y su significación.
REFERENCIAS BIBLIOGRAFICAS
* Romero, R. E. (2016). Estadística para todos: análisis de datos:
estadística descriptiva, teoría de la probabilidad e inferencia.
Madrid, ESPAÑA: Larousse - Ediciones Pirámide. (pp. 313-328).
* Gutiérrez, H. (2013). Capítulo 4: Elementos de Inferencia
Estadística Control estadístico de la calidad y Seis Sigma. (3a. ed.)
McGraw-Hill Interamericana. (pp. 72-90).
* Matus, R., Hernández, M., & García, E. (2010). Estadística.
México, D.F., MX: Instituto Politécnico Nacional. (pp. 65-84).

También podría gustarte