Está en la página 1de 18

UNIVERSIDAD ESTATAL DE

MANABÍ
FACULTAD DE CIENCIAS ECO
SEMIPRESENCIAL
TERCERO “B”

Estadística II
DOCENTE: Yomira Lilibeth Solís Barreto

TEMA:
4. Introducción
4.1. Suposiciones en que se basan las técnicas de análisis de varianza.
4.2. El diseño completamente aleatorizado de un factor.
AD ESTATAL DEL SUR DE
MANABÍ
CIENCIAS ECONÓMICAS
MIPRESENCIAL
ERCERO “B”

INTEGRANTES : PII 2023


CARLOS ALBERTO BARONA SÁNCHEZ
LUIS EDUARDO PARRAGA BRIONES
MARIA JOSE PICO MASIAS
LUISA FERNANDA BOHORQUEZ ZAMBRANO
XIOMARA MERCEDES CEVALLOS BARRE
WLADIMIR RICARDO CALAPUCHA TAPUY
Temarios
Sesión Nº 6
4. Introducción
4.1. Suposiciones en que se basan las técnicas de análisis de varianza.
4.2. El diseño completamente aleatorizado de un factor.

Introducción

La correcta aplicación de las técnicas de análisis de varianza requiere una comprensión


subyacentes a este enfoque estadístico, así como de los diseños experimentales utilizados. En
en dos aspectos fundamentales que forman la base de un análisis de varianza robusto: las su
completamente aleatorizado de un factor.

Las técnicas de análisis de varianza, como cualquier herramienta estadística, se apoyan en


cumplidas, garantizan la validez y la interpretación precisa de los resultados. Examinaremos
se incluyen la normalidad de los datos, la homogeneidad de las varianzas y la independ
Comprender estas premisas es esencial para realizar inferencias estadísticas confiables y evi
los resultados.

En el análisis de varianza, el diseño experimental desempeña un papel crucial en la rob


enfocaremos en el diseño completamente aleatorizado de un factor, una estrategia que impli
participantes a diferentes niveles del factor en estudio. Exploraremos cómo este diseño mi
sistemáticos y permite evaluar de manera efectiva las diferencias entre los grupos. Compren
de este diseño es esencial para diseñar experimentos sólidos y obtener conclusi

En conjunto, estas secciones proporcionarán una base sólida para aquellos que buscan profu
de varianza. Al comprender las suposiciones clave y el diseño experimental completamente
estarán mejor equipados para realizar análisis estadísticos rigurosos y extraer informa
requiere una comprensión profunda de las suposiciones
perimentales utilizados. En esta sección, nos sumergiremos
de varianza robusto: las suposiciones inherentes y el diseño
zado de un factor.

a estadística, se apoyan en ciertas suposiciones que, de ser


resultados. Examinaremos estas suposiciones, entre las que
las varianzas y la independencia de las observaciones.
stadísticas confiables y evitar sesgos en la interpretación de
dos.

a un papel crucial en la robustez de los resultados. Nos


or, una estrategia que implica la asignación aleatoria de los
emos cómo este diseño minimiza la posibilidad de sesgos
entre los grupos. Comprender los principios y la aplicación
sólidos y obtener conclusiones significativas.

aquellos que buscan profundizar en las técnicas de análisis


perimental completamente aleatorizado, los investigadores
rigurosos y extraer información valiosa de sus datos.
✦Diseño completamente aleatorizado de un factor
ESTE DISEÑO SE BASA EN 3 SUPOSICIONES :
1. La variable de respuesta tiene distribución normal en cada una de las poblaciones.
2. La varianza de la variable de respuesta, σ 2 , es igual en todas las poblaciones.
3. Las observaciones son independientes entre sí.

Realice el siguiente ejercicio.


Una empresa ensambla productos de línea blanca. La planta trabaja 3 turnos: el matutino, el vespertino
Los trabajadores se rotan cada uno de los turnos, por lo que, al cabo de un trimestre, todos ellos laboraro
turnos que existen. El director de gerencia de producción quisiera saber si existen diferencias entre la pr
promedio de los 3 turnos existentes, ya que la fábrica trabaja a plena capacidad desde hace más de un añ
variaciones significativas en el número de empleados, en la maquinaria, ni en los procesos productivos;
considera que con un análisis de varianza puede contestar esta pregunta; para ello, obtiene una muestra
producción de 8 días de cada turno. Los datos se muestran a continuación.

Se pide realizar:

✦ La interpretación de los resultados obtenidos.

Para la explicación de este metodo se utiliza un nivel de significación de 0.05.

TURNO
Matutino Vespertino Nocturno
107 92 93
99 101 128
121 94 111
136 112 97
114 136 126
115 114 118
141 117 133
113 123 109
PROMEDIO 118.25 111.125 114.375

1. Verificar hipótesis
2. Se obtienen las medias; tanto la media de cada tratamiento (turno) como la media general de todos los d

Media del turno matutino o promedio del turno matutino 118.25

Media del turno vespertino o promedio del turno vespertino 111.125

Media del turno nocturno o promedio del turno nocturno 114.375

Media general o Promedio Gneral 114.58333

3. Obtenemos la suma de los cuadrados totales, a la que llamamos SCT, que es la suma de los cuadrados d

TURNO
Matutino Vespertino
107 57.506944 92 510.006944444444
99 242.8403 101 184.506944444444
121 41.1736 94 423.673611111111
136 458.6736 112 6.67361111111109
114 0.340278 136 458.673611111111
115 0.173611 114 0.34027777777777
141 697.8403 117 5.8402777777778
113 2.506944 123 70.8402777777779
1501.0556 1660.555556

SCT 4641.833333

4. Se obtiene la suma de cuadrados de las variaciones entre los tratamientos. La identificamos como SCTr

MEDIA DE LOS TURNOS


118.25 111.125 114.375
107.5556 95.68056 0.347222222222

SCTr = 203.58333

5. Se obtiene la llamada suma de cuadrados del error y es la variación dentro del tratamiento, la identifica
tratamiento y elevando la diferencia al cuadrado.

TURNO SCE
Matutino Vespertino Nocturno Matutino
107 92 93 126.5625
99 101 128 370.5625
121 94 111 7.5625
136 112 97 315.0625
114 136 126 18.0625
115 114 118 10.5625
141 117 133 517.5625
113 123 109 27.5625
118.25 111.125 114.375 1393.5

6. Para obetener el PCTr. Se divide la suma de cuadrados entre tratamientos (SCTr), entre el número de t
2 grados de libertad.

PCTR: 101.79167

7. Para obtener el PCE se divide la suma de cuadrados de error (SCE) entre el número de datos menos el
grados de libertad en este caso es decir 21 grados de libertad.

4438,25
21
PCE: 211.34524

8.- Se obtiene el valor empírico de F, que es el cociente de estos 2 promedios de cuadrados:

PCTR
F EMPÍRICA = 0.481636906
PCE

La F crítica se busca en la tabla correspondiente a la distribución F, para el nivel de significación


correspondiente (en este caso, el 0.05), con 2 grados de libertad para el numerador (número de
tratamientos menos 1) y 21 grados de libertad para el denominador (número de datos menos número de
tratamientos). La F crítica es 3.47, ya que

P(Fe < 3.47•2,21) = 0.05

9. Es este caso se tomó la decisión: Se acepta la hipótesis nula si la F crítica es mayor que la F empírica, como

Para el director de gerencia de la fábrica de productos de línea blanca , la conclusión indica que no hay suficien
concluir que al menos uno de los tratamientos tiene un efecto significativo en la variable media, las diferencias
los grupos se atribuyen principalmente a la variabilidad aleatoria inherente a los datos indica (en este ejemplo
en los 3 turnos no hay suficiente evidencia para rechazar la hipótesis nula, todas las medias de los grupos son
productivos por lo tanto, no se requiere tomar medidas específicas ya que no hay suficiente evidencia.
Para el director de gerencia de la fábrica de productos de línea blanca , la conclusión indica que no hay suficien
concluir que al menos uno de los tratamientos tiene un efecto significativo en la variable media, las diferencias
los grupos se atribuyen principalmente a la variabilidad aleatoria inherente a los datos indica (en este ejemplo
en los 3 turnos no hay suficiente evidencia para rechazar la hipótesis nula, todas las medias de los grupos son
productivos por lo tanto, no se requiere tomar medidas específicas ya que no hay suficiente evidencia.

Una vez revisada la técnica, es importante hacer algunas consideraciones al


por lo mismo, las variaciones que se pueden dar son únicamente variaciones
que se obtiene entre tratamientos y el debido a la aleatoriedad, respectivam
variación que se presenta es la aleatoria, por eso no se rechaza la hipótesis n
Entonces como el resultado del PCE es mayor que el PCTr, típicamente se int
que todas las medias de los grupos son iguales.
factor

nos: el matutino, el vespertino y el nocturno.


un trimestre, todos ellos laboraron en los 3
si existen diferencias entre la producción
acidad desde hace más de un año y no hay
ni en los procesos productivos; el director
para ello, obtiene una muestra aleatoria de la
n.

05.
o la media general de todos los datos:

ue es la suma de los cuadrados de la diferencia entre cada dato y la media global.

Nocturno
93 465.840277777778
128 180.0069
111 12.84028
97 309.1736
126 130.3403
118 11.67361
133 339.1736
109 31.17361
1480.2222

os. La identificamos como SCTr;

tro del tratamiento, la identificamos como SCE. Se consigue, dentro de cada tratamiento, con cada dato menos la media del

SCE Es importante resaltar el modelo en el que se basa el


diseño completamente aleatorizado de un factor que
se ilustra con el ejemplo
SCT = SCTr + SCE
Con las sumas de cuadrados encontradas hasta aquí s
Es importante resaltar el modelo en el que se basa el
Vespertino Nocturno diseño completamente aleatorizado de un factor que
365.765625 456.890625 se ilustra con el ejemplo
SCT = SCTr + SCE
102.515625 185.640625 Con las sumas de cuadrados encontradas hasta aquí s
293.265625 11.390625 puede verificar que esta igualdad se cumple:
0.765625 301.890625 4641,83333=203,583+4438,25
618.765625 135.140625
8.265625 13.140625
34.515625 346.890625
141.015625 28.890625
1564.875 1479.875 SCE: 4438.25

tos (SCTr), entre el número de tratamientos menos 1, en este caso 3 − 1, que es el número de grados de libertad en este caso, es deci

número de tratamientos: 3 ( matutino,vespertino,nocturno) menos 1 que nos da 2

re el número de datos menos el número de tratamiento en este caso 24-3=21 que es también el número de

os de cuadrados:

NIVEL DE
0.05
SIGNIFICANCIA
el de significación NUMERADOR 2
erador (número de DENOMINADOR 21
de datos menos número de
F CRÍTICA 3.47

s mayor que la F empírica, como la F crítica=3,47 es mayor que la F empírica=0,4816 se acepta la hipótesis nula

clusión indica que no hay suficiente evidencia para


la variable media, las diferencias observadas entre
os datos indica (en este ejemplo en particular) que
das las medias de los grupos son igualmente
hay suficiente evidencia.
clusión indica que no hay suficiente evidencia para
la variable media, las diferencias observadas entre
os datos indica (en este ejemplo en particular) que
das las medias de los grupos son igualmente
hay suficiente evidencia.

hacer algunas consideraciones al respecto. La hipótesis nula implica que todas las medias son iguales y que,
n dar son únicamente variaciones aleatorias. Si los 2 promedios de cuadrados se parecen (el PCTr y el PCE, el
ido a la aleatoriedad, respectivamente), eso quiere decir que podemos esperar que, efectivamente, la única
or eso no se rechaza la hipótesis nula.
yor que el PCTr, típicamente se interpreta que no hay suficiente evidencia para rechazar la hipótesis nula de
ales.
enos la media del

delo en el que se basa el


orizado de un factor que
r + SCE
encontradas hasta aquí se
delo en el que se basa el
orizado de un factor que
r + SCE
encontradas hasta aquí se
dad se cumple:
,583+4438,25

4641.833333

ertad en este caso, es decir,


CONCLUSIONES

LUISA BOHORQUEZ: La
CARLOS BARONA: Al emplear el suposición de normalidad es
diseño completamente aleatorizado, fundamental en las técnicas de análisis
concluimos que se refuerza la de varianza. Concluimos que la validez
posibilidad de obtener resultados de los resultados depende de la
replicables, ya que la aleatorización distribución normal de los datos, lo que
disminuye la influencia de variables resalta la necesidad de explorar y, si es
externas no controladas. necesario, aplicar transformaciones
para cumplir con esta premisa.

MARIA JOSE PICO: La


homogeneidad de varianzas entre los
grupos es esencial para la validez de
los resultados de análisis de varianza.
Nuestra conclusión destaca la
importancia de verificar esta
suposición y considerar métodos
alternativos si la homogeneidad no se
cumple, para evitar interpretaciones
erróneas.
USIONES

WLADIMIR RICARDO: XIOMARA CEVALLOS: Nuestra


Concluimos que el diseño conclusión destaca la importancia de
completamente aleatorizado es una validar rigurosamente las suposiciones.
estrategia clave para minimizar El no cumplimiento de alguna de ellas
sesgos experimentales. La puede afectar la interpretación de los
aleatorización asegura una resultados, enfatizando la necesidad de
distribución equitativa de factores procedimientos adicionales o ajustes
no controlados, fortaleciendo la estadísticos.
validez interna del estudio.

LUIS EDUARDO PARRAGA:


Concluimos que, al conocer las
suposiciones subyacentes, los
investigadores deben ejercer
precaución en la interpretación de los
resultados, reconociendo las
limitaciones potenciales y abriendo la
puerta a un análisis más profundo
cuando sea necesario.
ANEXOS

También podría gustarte