Está en la página 1de 24

TAREA N°1: ANALISIS ESTADISTICO DE

DATOS EXPERIMENTALES

Emilio Araya Véliz


18.968.192-5
Índice
1. Ejercicio N°1...............................................................................................................................1
Desarrollo:....................................................................................................................................1
2. Ejercicio N°2.............................................................................................................................9
Desarrollo:....................................................................................................................................9
3. Ejercicio N°3...........................................................................................................................13
Desarrollo:..................................................................................................................................13
4. Ejercicio N°4...........................................................................................................................17
Desarrollo:..................................................................................................................................17
Índice de Figuras

Figura 1.1 Estadísticos descriptivos del proveedor A y B...................................................................2


Figura 1.2 Diagrama de caja de datos de proveedor A y B.................................................................2
Figura 1.3 Outliner en diagrama de caja de datos de proveedor A y B..............................................3
Figura 1.4 Prueba de Normalidad Kolmogorov-Smirnov para datos del proveedor A......................4
Figura 1.5 Prueba de Normalidad Kolmogorov-Smirnov para datos del proveedor B.......................4
Figura 1.6 Prueba F e intervalos de confianza para la varianza para diámetros de pieza metálica
proveedor A y B..................................................................................................................................5
Figura 1.7 Estadistica descriptiva de prueba F para diámetros de pieza metálica proveedores A y B5
Figura 1.8 Prueba de hipótesis de igualdad de medias de diámetros de piezas metálicas de
proveedor A y B..................................................................................................................................6
Figura 1.9 Pestaña para realizar el filtro de diámetros de valores indicados en los datos de
proveedor A y B..................................................................................................................................7
...........................................................................................................................................................7
Figura 1.10 Digitación de filtro de diámetros de valores indicados en los datos de proveedor A y B 7
...........................................................................................................................................................8
Figura 1.11 Resultado de filtro de diámetros de valores indicados en el datos de proveedor A y B..8
Figura 2.1 prueba de Normalidad Kolmogorov-Smirnov para datos de crecimiento de plantas sin
aditivo..............................................................................................................................................10
Figura 2.2 prueba de Normalidad Kolmogorov-Smirnov para datos de crecimiento de plantas con
aditivo..............................................................................................................................................10
Figura 2.3 Prueba F e intervalos de confianza para la varianza para crecimiento de plantas sin y con
aditivo..............................................................................................................................................11
Figura 2.4 Prueba de hipótesis de igualdad de medias de crecimiento de plantas sin y con aditivo12
Figura 3.1 Digitación de datos de porcentaje para prueba F de impurezas antes y después de la
introducción de un nuevo dispositivo de filtrado.............................................................................13
Figura 3.2 Prueba F e intervalos de confianza para la varianza de impurezas antes y después de la
introducción de un nuevo dispositivo de filtrado.............................................................................14
Figura 3.3 Digitación de datos para prueba de hipótesis de igualdad de medias de porcentaje de
impurezas antes y después de la introducción de un nuevo dispositivo de filtrado........................15
Figura 3.4 Prueba de hipótesis de igualdad de medias de porcentaje de impurezas antes y después
de la introducción de un nuevo dispositivo de filtrado....................................................................15
Figura 4.1 Prueba de normalidad Kolmogorov-Smirnov para la uniformidad de grabado con un
flujo de 125 m/seg...........................................................................................................................18
Figura 4.2 Prueba de normalidad Kolmogorov-Smirnov para la uniformidad de grabado con un
flujo de 200 m/seg...........................................................................................................................18
Figura 4.3 Prueba F e intervalos de confianza para la desviación estándar de la uniformidad de
grabado para un flujo de 125 y 200 m/seg.......................................................................................19
Figura 4.4 Diagrama de caja de la uniformidad de grabado para un flujo de 125 y 200 m/seg.......20
1. Ejercicio N°1
Una empresa metalmecánica necesita evaluar a dos proveedores de una pieza
metálica necesaria para la fabricación de una herramienta industrial. Según
especificaciones del proceso, el valor objetivo (o target) para el diámetro de la
pieza es 20.55 cm. Se toman dos muestras de 20 piezas a cada proveedor. Los
datos obtenidos son los siguientes:

Proveedor Diámetro de la pieza metálica (cm)


A 21.38 20.13 19.12 19.85 20.54 18.00 22.24 21.94 19.07 18.60
21.89 22.60 18.10 19.25 19.31 20.12 18.78 20.05 22.33 18.77
B 21.51 22.22 21.49 21.91 21.52 22.06 21.51 21.29 22.71 22.65
21.53 22.22 21.92 20.82 21.33 20.05 19.97 21.23 22.15 21.87

a) Calcule las siguientes estadísticas descriptivas (para las dos muestras),


interpretando cada resultado. Media, error estándar de la media, desviación
estándar, varianza, curtosis, asimetría, coeficiente de variación, cuartil 1, cuartil 2,
cuartil 3, rango intercuartil.
b) Haga un diagrama de caja para comparar las dos muestras y comente los
resultados. ¿Se aprecian datos atípicos (outlier)? De ser así comente la causa de
esto.
c) Aplique la prueba de normalidad de Kolmogorov Smirnov a las dos muestras y
comente los resultados.
d) Pruebe la hipótesis de igualdad de los diámetros de los dos proveedores en
cuanto a sus medias (se recomienda hacer antes la prueba de la igualdad de
varianzas). Use α=0.05.
e) Si las especificaciones para el diámetro son 20.55cm ± 2.55 cm ¿cuál proveedor
produce menos piezas defectuosas?
f) ¿Con cuál proveedor se quedaría usted? Justifique su respuesta.

Desarrollo:

a) Para calcular todos los valores pedidos se utiliza el programa MINITAB en su


pestaña de Estadística-> Estadistica Básica (previa digitación de los datos
entregados sobre cada proveedor en forma de columna cada una)

1
Luego de esto se obtiene los siguientes resultados:

Figura 1.1 Estadísticos descriptivos del proveedor A y B

Para obtener un diagrama de caja se debe utilizar los mismos pasos anteriores,
pero se debe agregar en opciones el grafico de caja, el cual entregará de manera
clara la dispersión de todos los datos de cada uno de los proveedores, como se ve
en la siguiente imagen:

2
Figura 1.2 Diagrama de caja de datos de proveedor A y B

Se denota que en el Proveedor B contiene outliner ya que vemos que existen una
especie de asteriscos fuera de lo que sería todo el rango intercuartil y sus bigotes,
los que si acercamos el mouse a ellos nos darán una mayor información de los
mismos.

Figura 1.3 Outliner en


diagrama de caja de datos de proveedor A y B

La causa de este fenómeno de debe posiblemente a la gran dispersión que


poseen los diámetros de la pieza metalica del proveedor B, sin embargo, cabe
destacar que este proveedor tiene un mayor rango intercuartil por lo que la
mayoría de sus valores se encuentran muy cercanos los unos con los otros.

b) Se aplica la prueba de normalidad de Kolmogorov-Smirnov para definir si estos


valores se distribuyen de manera normal o no, para esto tenemos la hipótesis nula
de que, en este caso, ambos grupos de datos se distribuyen de manera normal.
En el primero de los casos se realiza la prueba para el proveedor A, obteniendo
estos resultados:

3
Figura 1.4 Prueba de Normalidad Kolmogorov-Smirnov para datos del proveedor A

Al observar el valor vital dentro de esta prueba que sería el valor p ( el cual debe
ser mayor al 5% para aceptar la hipótesis nula) vemos que este es mayor al 15%
por lo que se acepta la hipótesis nula teniendo así la seguridad que los datos del
proveedor A se distribuyen de manera normal.

Luego, analizamos la tabla de datos del proveedor B para hacer el mismo análisis
hecho al proveedor A, con esta gráfica obtenida:

Figura 1.5 Prueba de Normalidad Kolmogorov-Smirnov para datos del proveedor B

La grafica del proveedor B indica que este tiene un valor p mayor al 15% por lo
que, de la misma manera que el proveedor A, aceptamos la hipótesis nula,
teniendo asi como resultado que ambos grupos de datos se distribuyen de manera
normal según la prueba de normalidad de Kolmogorov Smirnov.

c) Antes de realizar la prueba de igualdad de diámetros de los dos proveedores en


cuanto a sus medias se comienza haciendo una prueba de igualdad de varianzas,
teniendo esto a nivel numérico y a nivel gráfico:

4
Figura 1.6
Prueba F e intervalos de confianza para la varianza para diámetros de pieza metálica proveedor A y B

Figura 1.7 Estadistica descriptiva de prueba F para diámetros de pieza metálica proveedores A y B

Según los datos reportados anteriormente se puede concluir según el valor p dado
que las varianzas de ambas baterías de datos no son iguales ya que valor p = 3%,
sabiendo así que estadísticamente las varianzas de ambas son disimiles. Ahora ya
se puede realizar la prueba de igualdad de diámetro de los dos proveedores,
teniendo como resultado esto:

5
Figura 1.8 Prueba de hipótesis de
igualdad de medias de diámetros de piezas metálicas de proveedor A y B

Al observar el valor p se denota que estas medias no son iguales ya que este
entrega un valor de 0 pudiendo así decir de manera tajante que las medias son
estadísticamente distintas.
d) Para poder ver que valores están dentro del rango pedido debemos seguir los
pasos mostrados en las imágenes:

6
Figura 1.9 Pestaña para realizar el filtro de diámetros de valores indicados en los datos de proveedor A y B

Figura 1.10 Digitación de filtro de diámetros de valores indicados en los datos de proveedor A y B

7
Figura 1.11 Resultado de filtro de diámetros de valores indicados en el datos de proveedor A y B

Contando los datos que se encuentran fuera del rango expuesto notamos que el
proveedor B contiene mayor cantidad de artefactos defectuosos que el proveedor.

e) Antes de mencionar la elección se debe tener en claro que esta es una mirada
subjetiva debido a que para una elección optima de proveedor se deben tener en
cuenta bastantes variables que no son estipuladas en este problema como lo sería
el costo de cada proveedor, la necesidad de precisión que se necesita sobre cada
herramienta, el bajo número de muestras que se tiene de cada proveedor, etc.
Dicho esto, es bastante probable que mi elección sería la del proveedor B debido a
que este tiene la gran mayoría de sus datos en un rango intercuartil menor que el
proveedor A por lo que al ser piezas para la fabricación de una herramienta
industrial es necesario tener valores similares para así obtener un buen
funcionamiento de la herramienta en cuestión.

8
2. Ejercicio N°2
Se realiza un experimento para determinar si el uso de un aditivo químico y un
fertilizante estándar aceleran el crecimiento de las plantas. En cada una de las 10
localidades se estudiaron dos plantas sembradas en condiciones similares. A una
planta de cada localidad se le aplicó el fertilizante puro y a la otra el fertilizante
más el aditivo. Después de cuatro semanas el crecimiento en centímetros fue el
siguiente.

Localidad
1 2 3 4 5 6 7 8 9 10
Sin 19 33 17 22 19 32 25 18 22 19
Aditivo
Con 23 34 16 21 22 31 29 20 24 25
Aditivo

a) Aplique la prueba de normalidad de Kolmogorov Smirnov a las dos muestras y


comente los resultados.

b) Explique por qué estos datos deben analizarse de forma pareada.

c) ¿Los datos obtenidos apoyan la afirmación de que el aditivo químico acelera el


crecimiento de las plantas? Plantee las hipótesis necesarias y usando α=0.05,
responda la pregunta

Desarrollo:
a) Para comenzar el análisis, se realiza una prueba de normalidad, utilizando la
prueba de Kolmogorov-Smirnov para el crecimiento de la planta sin aditivos y con
aditivos,
llevando a
esto:

9
Figura 2.1 prueba de Normalidad Kolmogorov-Smirnov para datos de crecimiento de plantas sin aditivo

El valor p obtenido en el caso del crecimiento de las plantas sin aditivo es de 9.5%
lo que es superior al 5% con lo que se llega a la conclusión de que los datos de
este tipo se distribuyen de forma normal según K.S.

Figura 2.2 prueba de Normalidad Kolmogorov-Smirnov para datos de crecimiento de plantas con aditivo

En el caso del crecimiento de las plantas con aditivo se denota que el valor p es
mayor el 15% por lo que está al igual que los datos sin aditivo se distribuyen de
manera normal.

b) Se realizan de forma pareada debido a que este es un análisis que se realiza a un


mismo producto, pero en distintas condiciones, entonces lo que se busca a ver en
si es la evolución de lo que es en este caso el crecimiento de las plantas antes de
agregarle el aditivo y cómo afecta en sí este agente luego de su uso en la planta.
Haciendo así un estudio estadístico claro de cómo evoluciona la planta.

c) Para comenzar se debe realizar una prueba de hipótesis de varianzas iguales,


agregando dentro de las opciones que ambos se distribuyen de manera normal. Al
hacer esta prueba de hipótesis se obtiene lo siguiente:

10
Figura 2.3
Prueba F e intervalos
de confianza para la varianza para crecimiento de plantas sin y con aditivo

Con esto, se sabe que las varianzas son iguales estadísticamente debido a que el
valor p es de un 88,5%. Posteriormente, se lleva a cabo una prueba de hipótesis
sobre igual de medias ya que si estas no son iguales estadísticamente, indica que
el aditivo está haciendo efecto de manera positiva haciendo así que la planta
crezca de manera notoria en comparación al crecimiento sin aditivo, lo anterior se
observa en la gráfica siguiente:

11
Figura 2.4 Prueba de hipótesis de igualdad de medias de crecimiento de plantas sin y con aditivo

Al ver el resultado se ve que el valor p es de 45,7%, lo que lleva a la conclusión


que ambas medias son estadísticamente iguales, por consiguiente, el aditivo no
tiene un efecto óptimo para la aceleración del crecimiento de las plantas.

3. Ejercicio N°3
Se instala un nuevo dispositivo de filtrado en una unidad química. Antes de
instalarlo, de una manera aleatoria se obtuvo la siguiente información sobre el
2
porcentaje de impurezas: y 1= 12.5, S1=101.17 y n1=8. Después de instalarlo, de
una aleatoria se obtuvo la siguiente información: y 2 =10.2, S22=94.73 y n2 = 9.

a) ¿Puede concluirse que las dos varianzas son iguales? Use α=0.05.
b) ¿El dispositivo de filtrado ha reducido de manera significativa el porcentaje
de impurezas?
Use α=0.

Desarrollo:

a) Para poder concluir si estas varianzas son iguales, obviamente, se debe hacer una
prueba de igualdad de varianza, pero al no tener datos para ingresar como
normalmente se realizan este tipo de ejercicios, se debe solo trabajar con los
datos entregados, es así como llegamos al punto mostrado en la imagen

12
Figura
3.1 Digitación de datos de porcentaje para prueba F de impurezas antes y después de la introducción de un nuevo dispositivo

Figura 3.2 Prueba F e intervalos de confianza para la varianza de impurezas antes y después de la introducción de un nuevo
dispositivo de filtrado

13
Con los resultados de estos gráficos se concluye que existe igualdad de varianza
entre el
porcentaje
de
impurezas
de una
unidad
química
antes y
después
de la
instalación
de un
nuevo
dispositivo
de filtrado
ya que al
realizar la
prueba F
se arroja el
valor p de
91.8%.

b) Para poder definir si el dispositivo ha disminuido de manera significativa el


porcentaje de impurezas se debe realizar una prueba hipótesis de igualdad, en
caso de que esta hipótesis nula sea cierta se puede decir de manera tajante que el
dispositivo no tuvo un valor significativo en el producto buscado.
Para esto se realiza la misma metodología con la letra a) del ejercicio para así
poder trabajar sin una batería de datos, de la siguiente manera:

14
Figura 3.3 Digitación de datos para prueba de hipótesis de igualdad de medias de porcentaje de impurezas antes y después
de la introducción de un nuevo dispositivo de filtrado

Figura 3.4 Prueba de hipótesis de igualdad de


medias de porcentaje de impurezas antes y
después de la introducción de un nuevo dispositivo
de filtrado

Cabe destacar que la desviación estándar fue calculada al elevar en ½ las


varianzas entregadas en el enunciado.

15
Al realizar la prueba notamos que el valor p obtenido es de un 63,9%, teniendo
con esto que las medias de ambas son estadísticamente iguales, por lo que se
puede decir claramente que el efecto del nuevo dispositivo de filtrado no fue el
óptimo debido a que las impurezas no disminuyeron lo suficiente para decir que su
cambio fue significativo.

4. Ejercicio N°4

16
El artículo “Diseño ortogonal para optimización de procesos y su aplicación en el
grabado químico con plasma” de los autores G.Z. Yin y D.W.Jillie publicado en la
revista Solid State Technology, se describe un experimento para determinar el
efecto de la velocidad del flujo de C2F6 sobre la uniformidad del grabado de una
placa de silicio usada en la fabricación de circuitos integrados. Los datos de la
velocidad (m/seg) del flujo son los siguientes:

Flujo de Observación de la uniformidad


C2F6 1 2 3 4 5 6
125 2.7 4.6 2.6 3.0 3.2 3.8
200 4.6 3.4 2.9 3.5 4.1 5.1

a) ¿La velocidad del flujo de afecta la uniformidad del grabado promedio? Use
α=0.05
b) Cuál es el valor-p para la prueba de la letra a)
c) ¿La velocidad del flujo afecta a la variabilidad de una placa a otra en la
uniformidad del grabado?
d) Usando diagramas de caja interprete sus resultados.

Desarrollo:
a) Para comenzar el análisis, se realiza una prueba de normalidad, utilizando la
prueba de Kolmogorov-Smirnov para cada flujo de gas.
Tanto para el flujo de 125 como para el de 200 m/seg, el resultado del p-valor
obtenido es mayor al 15%. Según esto, se puede afirmar que los datos de
uniformidad, correspondiente a cada flujo, se pueden representar según una
distribución normal.
A continuación, se presentan los gráficos obtenidos al aplicar el método K-S a
ambas muestras.

17
Gráfica
Gráficade
deprobabilidad
probabilidadde
de125
125
Normal
Normal
99
99 Media
Media 3,317
3,317
Desv.Est.
Desv.Est. 0,7600
0,7600
NN 66
95
95 KS
KS 0,228
0,228
90 Valor p >0,150
Valor p >0,150
90

80
80
Porcentaje 70
70
Porcentaje
60
60
50
50
40
40
30
30
20
20

10
10
55

11
1,5
1,5 2,0
2,0 2,5
2,5 3,0
3,0 3,5
3,5 4,0
4,0 4,5
4,5 5,0
5,0 5,5
5,5
125
125

Figura 4.1 Prueba de normalidad Kolmogorov-Smirnov para la uniformidad de grabado con un flujo de 125 m/seg.

Gráfica
Gráficade
deprobabilidad
probabilidadde
de200
200
Normal
Normal
99
99 Media
Media 3,933
3,933
Desv.Est.
Desv.Est. 0,8214
0,8214
NN 66
95
95 KS
KS 0,201
0,201
90 Valor
Valorpp >0,150
>0,150
90

80
80
70
70
Porcentaje
Porcentaje

60
60
50
50
40
40
30
30
20
20

10
10
55

11
22 33 44 55 66
200
200

Figura 4.2 Prueba de normalidad Kolmogorov-Smirnov para la uniformidad de grabado con un flujo de 200 m/seg.

Ahora se procede a realizar una prueba de igualdad de varianzas a los datos de


uniformidad de grabado a un flujo de 125 m/seg contra la uniformidad a 200
m/seg.
Luego de aplicar el método F, suponiendo distribución normal para cada conjunto
de datos (según lo determinado anteriormente), se concluye que ambas varianzas
son estadísticamente iguales con un nivel de confianza del 95%. Esto se respalda
utilizando el p-valor como estadístico de prueba, por lo que se acepta la hipótesis
nula del método, la cual señala que el cociente entre ambas desviaciones estándar
(o varianzas) es igual a uno, por lo tanto, ambas son estadísticamente iguales.
En la figura se presenta la respuesta del método F.

18
Prueba
PruebaeeIC
ICpara
parados
dosvarianzas:
varianzas: 125;
125; 200
200
Relación
Relación==11vs.
vs.Relación
Relación≠≠11
IC
ICde
de95%
95%para
paraσ(125)
σ(125)//σ(200)
σ(200)
Prueba
PruebaFF
Valor
Valorpp 0,869
0,869

0,5
0,5 1,0
1,0 1,5
1,5 2,0
2,0 2,5
2,5

ICs
ICsde
dechi-cuadrada
chi-cuadradade
de95%
95%para
paraσσ
125
125

200
200

0,50
0,50 0,75
0,75 1,00
1,00 1,25
1,25 1,50
1,50 1,75
1,75 2,00
2,00

Gráfica
Gráficade
decaja
cajade
de125;
125;200
200
125
125

200
200

2,5
2,5 3,0
3,0 3,5
3,5 4,0
4,0 4,5
4,5 5,0
5,0

Figura 4.3 Prueba F e intervalos de confianza para la desviación estándar de la uniformidad de grabado para un flujo de 125
y 200 m/seg.

Finalmente se procede a realizar una prueba de igualdad de medias para


comparar estadísticamente las medias de los dos grupos de datos.
Utilizando un nivel de confianza del 95% y suponiendo varianzas iguales (según lo
determinado anteriormente), es que se concluye, según el estadístico de prueba
(valor p=0,207), que ambas medias son estadísticamente iguales. Donde la
hipótesis nula es que la diferencia de las medias es igual a cero, con lo que ambas
medias son iguales.
Se concluye entonces que la velocidad de flujo de gas no afecta la uniformidad
promedio del grabado.

b) Como ya se señaló, el valor p de la prueba de igualdad de medias en el


apartado a), es igual a 20.7%.

c) La velocidad del flujo no afecta a la variabilidad de una placa a otra en la


uniformidad del grabado, ya que tal como se comprobó en el apartado a), las
desviaciones estándar (o varianzas) de ambos grupos de datos, son
estadísticamente iguales.

d) A continuación se presenta el diagrama de caja asociado a cada grupo de


datos.

19
Gráfica
Gráfica de
decaja
caja de
de125;
125; 200
200

5,0
5,0

4,5
4,5

4,0
4,0
Datos
Datos

3,5
3,5

3,0
3,0

2,5
2,5
125
125 200
200

Figura 4.4 Diagrama de caja de la uniformidad de grabado para un flujo de 125 y 200 m/seg.

De este diagrama de caja se puede apreciar que;


- No hay datos atípicos.
- Los datos correspondientes al flujo de 200 m/seg están más homogéneamente
distribuidos que los datos de 150 m/seg. Estos últimos presentan datos del primer
cuartil muy agrupados o cercanos, en cambio el tercer y cuarto cuartil son mucho
más dispersos.
- En base a lo anterior, la diferencia entre media y mediana, es menor para los
datos del flujo 200 m/seg que para los datos de 150 m/seg.
- Si hubiera que escoger un flujo de gas, de acuerdo a la ilustración, el de 200
m/seg es el más recomendable, dado que la caja está posicionada más arriba que
la del otro flujo. Esto quiere decir que está asociada a datos de mayor valor de
uniformidad en el grabado.
*cabe destacar que esta conclusión se extrae sólo del diagrama de caja, dado que,
según el análisis antes realizado, no hay diferencia estadística en el efecto del flujo
de gas sobre la uniformidad del grabado.

20

También podría gustarte