Está en la página 1de 66

UNIVERSIDAD AUTONOMA DE NUEVO LEON

FACULTAD DE INGENIERIA MECANICA Y ELECTRICA


TRABAJO FINAL MEDIO CURSO

• Nombre: Eduardo Hernandez Avalos Matricula: 1953328


• Carrera: IMA Fecha: 09/11/21
• Materia: Estadística Inferencial
• Maestro: Rigoberto Américo Garza
TEMARIO

•Diagrama de flujo
•Mejor estimación de la recta
•Relación entre ŷ=𝜶+𝒃𝒙 y ŷ=𝜷+𝒃𝒙
•Error estándar en la mejor estimación de la recta
•Coeficiente de correlación de Pearson.
•Coeficiente de correlación de Spearman.
•Relación entre el coeficiente de correlación de Pearson y Spearman.
•Varianza y desviación estándar
•Relación entre desviación estándar y el error estándar en la mejor estimación de la recta.
•Coeficiente de determinación.
•Relación entre el coeficiente de determinación y el coeficiente de correlación de Pearson.
•Intervalos de confianza
•Intervalo de confianza para 𝜷
•Intervalo de confianza para 𝜶
•Intervalo de confianza para 𝜇𝑦⁄𝑥0
•Intervalo de confianza para 𝑦0
•Prueba de hipótesis para β
• prueba de hipótesis para α
• REGRESION LINEAL
• En estadística la regresión lineal o ajuste lineal es un modelo matemático usado para
aproximar la relación de dependencia entre una variable dependiente Y, las variables
independientes Xi y un término aleatorio ε.

• CORRELACION
• En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación
lineal y proporcionalidad entre dos variables estadísticas. Se considera que dos variables
cuantitativas están correlacionadas cuando los valores de una de ellas varían
sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos
variables (A y B) existe correlación entre ellas si al disminuir los valores de A lo hacen
también los de B y viceversa. La correlación entre dos variables no implica, por sí misma,
ninguna relación de causalidad.
EJERCICIO INGRESO (X)
45
SEGURO DE VIDA (Y)
70
20 50
40 60
• Una familia desea determinar 40 50
47 90
el grado de relación entre el 30 55

ingreso familia “X” y el monto 25


20
55
35
de seguro de vida “Y” del jefe 15 40

de familia. 35
40
65
75

• Con base a una muestra 55


50
105
110

aleatoria de 18 familias, se 60 120


15 30
obtuvo la siguiente 30 40

información (en miles de 35


45
65
80
dólares)
DIAGRAMA DE FLUJO
Diagrama de flujo:

Es una representación diagramática que ilustra la


secuencia de las operaciones que se realizan para
conseguir la solución de un problema.
Sirven para facilitar la comprensión de problemas
complicados y sobre todo muy largo

Aplicación en mi problema:

En este diagrama de flujo con los datos brindados


por el problema nos damos cuenta que el resultado
del diagrama es de manera ascendente.
MEJOR ESTIMACION DE LA RECTA
(X) (Y) (XY) (X2) (Y2)
45 70 3250 2025 4900
20 50 1000 400 2500
40 60 2400 1600 3600
40 50 2000 1600 2500

47 90 4230 2209 8100


30 55 1650 900 3025
25 55 1375 625 3025
20 35 700 400 1225
15 40 600 225 1600
35 65 2275 1225 4225
40 75 3000 1600 5625
55 105 5775 3025 11025
50 110 5500 2500 12100
60 120 7200 3600 14400
15 30 450 225 900
30 40 1200 900 1600
35 65 2275 1225 4225
45 80 3100 2025 6400

∑X=647 ∑Y=1195 ∑XY=47980 ∑X2=26309 ∑Y2=90975


• RELACIÓN ENTRE: ŷ=𝜶+𝒃𝒙 y ŷ=𝜷+𝒃𝒙 (X)
• Se espera que la recta ajustada esté mas cerca 45 82.15
de la verdadera línea de regresión cuando se
dispone de una gran cantidad de datos esto en 20 37.9
comparación a cada formula de la recta 40 73.3
Mejor estimación de la recta
Se define como establecer conclusiones sobre 40 85.69
características poblacionales a partir de resultados 47 55.6
muéstrales
30 46.75
Aplicación en mi problema: 25 37.9
Una vez realizados los cálculos se
20 37.9
mantiene la misma recta “ascendente”
15 29.05
35 64.45
40 73.3
55 99.85
50 91
60 108.7
15 29.05
30 55.6
35 64.45
45 82.15
ERROS ESTANDAR DE LA ESTIMACION
DE LA RECTA
• Error estándar
• El error estándar es la desviación estándar de la distribución muestral
de un estadístico muestral.​El término se refiere también a una
estimación de la desviación estándar, derivada de una muestra
particular usada para computar la estimación.

• Aplicación en mi problema:
• Indica que tanto se desvían los datos de la media, si el dato es grande
la variación o diferencia (error) puede ser proporcional a esta.
COEFICIENTE DE CORRELACION DE
PEARSON
INTERPRETACION
• Coeficiente de relación de
Pearson:
• Es una media de la relación lineal
entre dos variables aleatorias
cuantitativas. A diferencia de la
covarianza, la correlación de
Pearson es independiente de la
escala de medida de variables.

• Aplicación en mi problema:
• Por el valor obtenido, nos indica
que se tiene una correlación
positiva muy alta, esto nos indica
que hay una buena relación entre
r = 0.91 Positiva muy fuerte
las variables.
COEFICIENTE DE RELACION DE
SPEARMAN
Coeficiente de relación de Spearman:

Se define como una medida de la


correlación entre dos variables aleatorias
continuas

Aplicación en mi problema:

Por el valor obtenido, nos indica que se


tiene una correlación positiva muy alta,
esto nos indica que hay una buena
relación entre las variables.

𝑟𝑠 = 0.90 correlación
positiva muy alta
UNIVERSIDAD AUTONOMA DE NUEVO LEON
FACULTAD DE INGENIERIA MECANICA Y
ELECTRICA
ECUACION POTENCIAL

• Nombre: Eduardo Hernandez Avalos Matricula: 1953328


• Carrera: IMA Fecha: 09/11/21
• Materia: Estadística Inferencial
• Maestro: Rigoberto Américo Garza
ECUACION POTENCIAL

• Una ecuación exponencial es aquella en la que la incógnita aparece,


únicamente, en los exponentes de potencias de bases constantes.​ La
incógnita puede aparecer en el exponente de uno o más términos, en
cualquier miembro de la ecuación. Es decir, una constante está elevada a una
función de la incógnita a despejar, usualmente representada por x. Para
resolver dichas ecuaciones se recurren a las propiedades de la potenciación,
la radicación de los logaritmos y cambio de la incógnita por otra.
x 250 y

27 250 1.431364 2.39794 2.048802 5.750116 3.432324


31 265 1.491362 2.423246 2.22416 5.87212 3.613936
34 267 1.531479 2.426511 2.345428 5.8879571 3.716151
45 285 1.543213 2.454845 2.733112 6.026263 4.05838
58 295 1.763428 2.469822 3.109678 6.10021 4.355353
60 298 1.778151 2.474216 3.162822 6.121746 4.399531
72 320 1.857332 2.50515 3.44968 6.275776 4.652896
74 321 1.869232 2.506505 3.494027 6.282567 4.685239
SUMATORIAS
FORMULA SUSTITUCION

B=

27
27 252.1362
252.1362
31
31 260.1865
260.1865
34 265.7122
34 265.7122
45 283.2082
45 283.2082
58 300.0405
58 300.0405
60 302.3635
60
72 302.3635
315.1687
72
74 315.1687
317.1394
74 317.1394
COEFICIENTE DE DETERMINACION
• Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1. Cuanto más cerca
de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. De
forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por tanto, menos fiable será.

En la expresión anterior tenemos una fracción. Así pues, vayamos por partes. En primer lugar, analizaremos
el numerador, es decir, la parte de arriba.
COEFICIENTE DE DETERMINACION

250 1075.561 1259.453 1415.641


250
265 1075.561
1109.902 1259.453
752.8705 1415.641
511.8906
267
265 1133.474
1109.902 480.172
752.8705 425.3906
511.8906
285
267 1208.108
1133.474 19.50801
480.172 6.890625
425.3906
295
285 1279.911
1208.108 154.1444
19.50801 54.39063
6.890625
298 1289.821 217.2243 107.6406
295 1279.911 154.1444 54.39063
320 1344.445 758.6578 1048.141
298 1289.821 217.2243 107.6406
321 1352.852 871.1004 1113.891
320 1344.445 758.6578 1048.141
321 1352.852 871.1004 1113.891
FORMULA SUSTITUCION

Y= 287.625
•Según el calculo de R cuadrado
es de 0.9635. Lo cual quiere
decir que es un modelo cuyas
estimaciones se ajustan
demasiado bien a la variable
real. Aunque tecnicamente no
seria correcto, podríamos decir
algo así como que el modelo
explica en un 96.35% a la
variable real. Muestra que
conforme aumenta la
temperatura, aumenta la
energía.
UNIVERSIDAD AUTONOMA DE NUEVO LEON
FACULTAD DE INGENIERIA MECANICA Y
ELECTRICA
ECUACION LOGARITMICA

• Nombre: Eduardo Hernandez Avalos Matricula: 1953328


• Carrera: IMA Fecha: 09/11/21
• Materia: Estadística Inferencial
• Maestro: Rigoberto Américo Garza
ECUACION LOGARITMICA

Este modelo de regresión es una alternativa cuando el modelo lineal no logra un coeficiente de
determinación apropiado, o cuando el fenómeno en estudio tiene un comportamiento que puede
considerarse potencial o logarítmico, la forma mas simple de tratar de establecer la tendencia es a
través de un diagrama de dispersión.
X Y Ln(x) Ln(x)2 Ln(x)y
27 250 3.295837 6.591674 823.9592
31 265 3.433987 6.867974 910.0066
34 267 3.526361 7.052721 941.5383
45 285 3.806662 7.613325 1084.899
58 295 4.060443 8.120886 1197.831
60 298 4.094345 8.188689 1220.115
72 320 4.276666 8.553332 1368.533
74 321 4.304065 8.60813 1381.605
SUMATORIAS
FORMULA SUSTITUCION X

1.230605432 27 288.3065
27 288.3065
(x)+b 31 288.1365
31 288.1365
34 288.0229
34 288.0229
45 287.6779
45 287.6779
58 287.3656
58 287.3656
60 287.3239
60 287.3239
72 287.0995
72 287.0995
74 287.00658
74 287.00658
UNIVERSIDAD AUTONOMA DE NUEVO LEON
FACULTAD DE INGENIERIA MECANICA Y
ELECTRICA
COEFICIENTE DE DETERMINACION

• Nombre: Eduardo Hernandez Avalos Matricula: 1953328


• Carrera: IMA Fecha: 09/11/21
• Materia: Estadística Inferencial
• Maestro: Rigoberto Américo Garza
COEFICIENTE DE DETERMINACION
En estadística, el coeficiente de determinación, denominado R² y pronunciado R cuadrado, es un estadístico usado en el contexto de un modelo
estadístico cuyo principal propósito es predecir futuros resultados o probar una hipótesis. El coeficiente determina la calidad del modelo para
replicar los resultados, y la proporción de variación de los resultados que puede explicarse por el modelo.1

Hay varias definiciones diferentes para R² que son algunas veces equivalentes. Las más comunes se refieren a la regresión lineal. En este caso, el R²
es simplemente el cuadrado del coeficiente de correlación de Pearson, lo cual es sólo cierto para la regresión lineal simple. Si existen varios
resultados para una única variable, es decir, para una X existe una Y, Z... el coeficiente de determinación resulta del cuadrado del coeficiente de
determinación múltiple. En ambos casos el R² adquiere valores entre 0 y 1. Existen casos dentro de la definición computacional de R² donde este
valor puede tomar valores negativos

250 288.3065 0.4645 1415.641

265 288.1365 0.261667 511.8906

267 288.0229 0.158291 425.3906

285 287.6779 0.0028 6.890625

295 287.3656 0.067281 54.39063

298 287.3239 0.090665 107.6406

320 287.0995 0.27612 1048.141

321 287.0658 0.312692 1113.891


FORMULA SUSTITUCION
VALOR SIGNIFICADO
-1 Correlación significativa grande y perfecta
-0.9 a -0.99 Correlación negativa muy alta
-0.7 a -0.89 Correlación negativa alta
-0.4 a -0.69 Correlación negativa moderada
-0.2 a -0.39 Correlación negativa baja
-0.01 a -0.19 Correlación negativa muy baja
0 Correlacion nula
0.1 a 0.19 Correlacion positiva muy baja
0.2 a 0.039 Correlacion positiva baja
0.4 a 0.69 Correlacion positiva moderada
Este modelo de predicción tiene un coeficiente de 0,7 a 0.89 Correlacion positiva alta
predicción muy bajo, se podría decir que nulo lo cual 0.9 a 0.99 Correlación positiva muy alta
también indica como el modelo no es apto para este 1 Correlacion positiva grande y perfecto
tipo de problema ya que la ecuación logarítmica ni
siquiera esta cerca de predecir el efecto de la
temperatura, la energía disminuye.
UNIVERSIDAD AUTONOMA DE NUEVO LEON
FACULTAD DE INGENIERIA MECANICA Y
ELECTRICA
ANALISIS DE VARIANZA PARA UN CRITERIO

• Nombre: Eduardo Hernandez Avalos Matricula: 1953328


• Carrera: IMA Fecha: 09/11/21
• Materia: Estadística Inferencial
• Maestro: Rigoberto Américo Garza
ANALISIS DE VARIANZA PARA UN
CRITERIO
• En estadística, el análisis de la varianza (ANOVA, ANalysis Of VAriance, según terminología
inglesa) es una colección de modelos estadísticos y sus procedimientos asociados, en el cual la
varianza está particionada en ciertos componentes debidos a diferentes variables explicativas.
• Las técnicas iniciales del análisis de varianza fueron desarrolladas por el estadístico y genetista R.
A. Fisher en los años 1920 y 1930 y es algunas veces conocido como "Anova de Fisher" o "análisis
de varianza de Fisher", debido al uso de la distribución F de Fisher como parte del contraste de
hipótesis
• El primer concepto fundamental es que todo valor observado puede expresarse mediante la
siguiente función:
ANALISIS DE VARIANZA PARA UN CRITERIO

Suponga que en un experimento industrial a un ingeniero le interesa la forma en que la absorción media de
humedad del concreto varia para 5 agregados de concreto diferentes. Las muestras se exponen a humedad
durante 48 horas y se decide que para cada agregado deben probarse 6 muestras, lo que hace que se requiera
probar un total de 30 muestras. Realice el análisis de varianza a un nivel de significancia del 0.05 e indique si la
resistencia promedio a la tensión de las seis maquinas diferente o no.
DATOS FORMULA SUSTITUCION

=23.11958333
ANALISIS DE VARIANZA PARA LA CLASIFICACION UNILATERAL
FUENTE DE SUMA DE GRADOS DE CUADRADOS F CALCULADA
VARIACION CUADRADOS LIBERTAD MEDIOS
TRATAMIENTOS
TRATAMIENTOS SCT
SCT
ERROR SCE
TOTAL
ERROR STC
SCE

TOTAL STC

ANALISIS DE VARIANZA PARA LA CLASIFICACION UNILATERAL


FUENTE DE SUMA DE GRADOS DE CUADRADOS F CALCULADA
VARIAZION CUADRADOS LIBERTAD MEDIOS
TRATAMIENTOS 23.11958333 5 4.623916666 F=1.3287
ERROR 62.64 18 3.48
TOTAL 85.75958333 23 8.103916666
V1 5
V2 2.77
18

CONCLUSION
Ho= 2.77
Ho se rechaza en el nivel de significancia de 0.05, porque no existe diferencia en la
resistencia promedio a la tensión de las 6 maquinas.
UNIVERSIDAD AUTONOMA DE NUEVO LEON
FACULTAD DE INGENIERIA MECANICA Y
ELECTRICA
BLOQUES ALEATORIOS

• Nombre: Eduardo Hernandez Avalos Matricula: 1953328


• Carrera: IMA Fecha: 09/11/21
• Materia: Estadística Inferencial
• Maestro: Rigoberto Américo Garza
 
Pruebe la hipótesis de que a un nivel de significancia del 0.05 para los datos de la tabla 13.1 sobre la absorción de
humedad por varios tipos de agregados para concreto

AGREGAD 1 2 3 4 5
O
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
SUMATORI 3320 3416 3663 2791 3664 1685.54
A TOTAL
MEDIA 563.33 569.33 610.5 465.17 610.67 561.8

 
ANALISIS DE VARIANZA PARA EL ANOVA DE UN FACTOR
FUENTE DE SUMA DE GRADOS DE CUADRADOS F CALCULADA
VARIACION CUADRADOS LIBERTAD MEDIOS
TRATAMIENTOS SCT K-1

ERROR SCE KN-1

TOTAL SC KN-1
AGREGADO 1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522

  ¿
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
SUMATORIA 3320 3416 3663 2791 3664
TOTAL 16854
MEDIA 553.33 569.33 610.5 465.17 610.67 561.8

AGREGAD 1 2 3 4 5
O
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 543 575 438 613  
499 633 648 415 656
632 517 677 555 679
SUMATORI 3320 3416 3663 2791 3664 16854
A TOTAL
MEDIA 71.68 56.75 2371.69 93.38 2587.95 14226.07
 𝑺𝑻𝑪 =𝟐𝟎𝟗𝟑𝟕𝟔 . 𝟖 𝑺𝑪𝑻 =𝟖𝟓𝟑𝟓𝟔 . 𝟒𝟐

FUENTE DE SUMA DE GRADOS DE CUADRADOS F CALCULADA


VARIACION CUADRAD0S LIBERTAD MEDIOS
TRATAMIENTO
TRATAMIENTO 85356.42
85356.42 5-1=4
5-1=4 = 21339.10 X4.30
SS
ERROR 124020.38 4(6-1)=25
TOTAL 209376.8 5X6-1029
ERROR 124020.38 4(6-1)=25

TOTAL 209376.8 5X6-1029


 A un nivel de significancia de a se rechaza la hipótesis nula cuando

VALORES CRITICOS DE LA DISTRIBUDCION F A00.05


Y2 YI
25 4
2.76

Se rechaza la hipótesis nila y se concluye que al menos dos medias no son iguales.
UNIVERSIDAD AUTONOMA DE NUEVO LEON
FACULTAD DE INGENIERIA MECANICA Y
ELECTRICA
PRUEBA DE TUKEY

Nombre: Eduardo Hernandez Avalos Matricula: 1953328


Carrera: IMA Fecha: 09/11/21
Materia: Estadística Inferencial
Maestro: Rigoberto Américo Garza
• La prueba de Tukey es un método que tiene como fin comparar las medias individuales provenientes de un
análisis de varianza de varias muestras sometidas a tratamientos distintos.
El test, presentado en el año 1949 por John.W. Tukey, permite discernir si los resultados obtenidos son
significativamente diferentes o no. Se le conoce también como la prueba de diferencia honestamente
significativa de Tukey
En los experimentos donde se compara entre tres o más tratamientos diferentes aplicados a igual número de
muestras, se requiere discernir si los resultados son significativamente distintos o no.
En la aplicación de esta prueba se calcula un valor w llamado el comparador de Tukey cuya definición es como
sigue:

PRUEBA
w = q √(MSE /r)

DE TUKEY
PRUEBA DE TUKEY
• Se consideran cuatro máquinas diferentes, M1, M2 M3 y M4, para ensamblar un producto específico. Se
decidió que para comparar las máquinas se usarían 6 operadores distintos en un experimento de bloques
aleatorizados. Las máquinas se asignaron al azar a cada operador. La operación de las máquinas requiere
destreza física, y se anticipó que habría una diferencia en la velocidad con que los operadores trabajaban con
las máquinas. En la tabla 13.9 se observan los tiempos (en segundos) requeridos para ensamblar el
producto. A un nivel de significancia de 0.05, pruebe la hipótesis H0 de que las máquinas se desempeña con
el mismo índice de velocidad promedio.
DATOS FORMULA
A= 0.05 )
H0: α1 = α2 = α3 = α4 = 0 (los efectos
de las máquinas son iguales a cero),
H1 : Al menos una de las αi
no es igual a cero.

SUSTITUCION PUNTOS PORCENTUALES


SUSTITUCION SUPERIORES
PUNTOSDEPORCENTUALES
LA DISTRIBUCION DE
RANGOSDE
SUPERIORES ESTUDENTIZADOS
LA DISTRIBUCION DE
RANGOS ESTUDENTIZADOS

Y K
4
15 4.06

Total 247.8 258.3 255.4 259.4


Medias 41.3 41.283 42.566 43.233 168.482
DIF. DE MEDIAS 4 3 2 MAQUINAS MEDIAS
43.23
43.23 42.57
42.57 41.42
41.42 41.3
41.3 1 41.3
1 41.3
41.3
1.93 1.27 0.12 2 41.42
2 41.42 3 42.57
41.42 1.81 1.15
4 43.23
2 42.57
42.57 0.66
2 43.23
43.23
CONDICION CONCLUSION
Después de Después de
obtener el obtener el
DIF. DE MEDIAS M4 M3 M2 M1 resultado de q, si resultado, se llego
43.23 42.57 41.41 41.43 una media es a la conclusión de
menor que q se que todas las
M1 41.3 1.93 1.27 0.12 considera igual, si medias son iguales
M2 41.42 1.81 1.15 es mayor se
considera
M3 42.57 0.66 diferente
M4 43.23
UNIVERSIDAD AUTONOMA DE NUEVO LEON
FACULTAD DE INGENIERIA MECANICA Y
ELECTRICA
PRUEBA DE DUNCAN

• Nombre: Eduardo Hernandez Avalos Matricula: 1953328


• Carrera: IMA Fecha: 09/11/21
• Materia: Estadística Inferencial
• Maestro: Rigoberto Américo Garza
• Al aplicar análisis de varianza (ANOVA) y determinar que existe una diferencia estadísticamente significativa,
normalmente surge la pregunta acerca de cuáles pares de medias son diferentes.
Para ello se utilizan las llamadas "Pruebas de Comparación Múltiple".
El Test de Duncan o Prueba de Rangos Múltiples de Duncan permite comparar las medias de los “t niveles” de un
factor después de haber utilizado ANOVA.
Aunque se puede aplicar sin que ANOVA haya arrojado significancia, lo lógico es aplicarla a partir de ese resultado,
para determinar a qué se deben las diferencias encontradas.
Aunque se puede aplicar sin que ANOVA haya arrojado significancia, lo lógico es aplicarla a partir de ese resultado,
para determinar a qué se deben las diferencias encontradas.

PRUEBA Consiste en calcular varios "rangos", denominados comúnmente “rangos significativos mínimos”, según la siguiente
fórmula:

DE
DUNCAN
• PRUEBA DE DUNCAN
Se consideran cuatro máquinas diferentes, M1, M2 M3 y M4, para ensamblar un producto
específico. Se decidió que para comparar las máquinas se usarían 6 operadores distintos en un
experimento de bloques aleatorizados. Las máquinas se asignaron al azar a cada operador. La
operación de las máquinas requiere destreza física, y se anticipó que habría una diferencia en la
velocidad con que los operadores trabajaban con las máquinas. En la tabla 13.9 se observan los
tiempos (en segundos) requeridos para ensamblar el producto. A un nivel de significancia de
0.05, pruebe la hipótesis H0 de que las máquinas se desempeñan con el mismo índice de
velocidad promedio.
DATOS FORMULA
)

SUSTITUCION
SUSTITUCION RANGOS
RANGOS ESTANDARIZADOS
ESTANDARIZADOS
MINIMPOS
MINIMPOS
1.5516

P 2 3 4
rp 3.014 3.16 3.25
3 2 1 DIFERE MEDIA M4 M3 M2
NCIA S 43.23 42.56 41.38
43.23 42.57 41.42 41.3
DE
1 41.3
1.93 1.27 0.12 M1 41.3 M4-Mi M3-Mi M2-Mi
41.42 Rp4 Rp3 Rp2
41.42
1.81 1.15
M2 41.38 M4-M2 M3-M2
42.57 Rp3 Rp2
42.57 0.66
4 43.23 M3 42.56 M4-M3
43.23 Rp2

DIF. DE MEDIAS CONDICION CONCLUSION


43.23 42.57 41.42 41.43
Si las diferencias de Son 2 las medias
41.3 1.93>1.673 1.27<1.626 0.12<1.551 medias son mayores diferentes. Se rechaza
1 8 6
que el valor de Rp las Ho porque existen
medias de los diferencias
41.42 1.81>1.626 1.15<1.551
8 6 tratamientos son significativas en las
diferentes medias.
42.57 0.66<1.626 estadísticamente
8

43.53
UNIVERSIDAD AUTONOMA DE NUEVO LEON
FACULTAD DE INGENIERIA MECANICA Y
ELECTRICA
ANALISIS DE VARIANZA PARA DOS CRITERIOS

• Nombre: Eduardo Hernandez Avalos Matricula: 1953328


• Carrera: IMA Fecha: 09/11/21
• Materia: Estadística Inferencial
• Maestro: Rigoberto Américo Garza
ANALISIS DE VARIANZA PARA DOS
CRITERIOS
• Es un diseño de anova que permite estudiar Una observación individual se representa como:
simultáneamente los efectos de dos fuentes de
variación.
• En cualquier caso, el investigador puede estar El primer subíndice indica el nivel del primer
interesado en estudiar si hay, o no, diferencia factor, el segundo el nivel del segundo factor y
en la evolución según el sexo. En un anova de el tercero la observación dentro de la muestra.
dos vías se clasifica a los individuos de acuerdo Los factores pueden ser ambos de efectos fijos
a dos factores (o vías) para estudiar (se habla entonces de modelo I), de efectos
simultáneamente sus efectos. En este ejemplo aleatorios (modelo II) o uno de efectos fijos y el
se harían cinco grupos de tratamiento para los otro de efectos aleatorios (modelo mixto). El
hombres y otros cinco para las mujeres, en modelo matemático de este análisis es:
total diez grupos; en general, si el primer factor
tiene a niveles y el segundo tiene b, se tendrán modelo I
ab muestras o unidades experimentales, cada
una con n individuos o repeticiones. modelo II

modelo mixto
• En un experimento realizado para determinar cuál de 3
sistemas de misiles distintos es preferible, se midió la tasa
de combustión del propulsor para 24 arranques estáticos. Se
emplearon 4 tipos de combustible diferentes y el
experimento generó observaciones duplicadas de las tasas
de combustión para cada combinación de los tratamientos.
Los datos, ya codificados, se presentan en la tabla 14.3.
Pruebe las siguientes hipótesis:
• a) H0: no hay diferencia en las tasas medias de combustión
del propulsor cuando se emplean diferentes sistemas de
misiles
• b) H0 : no existe diferencia en las tasas medias de
combustión de los 4 tipos de propulsor
• c) H0 : no hay interacción entre los distintos sistemas de
misiles y los diferentes tipos de propulsor.
SISTEMA DE MISILES TIPO DE PROPULSOR
b1 b2 b3 b4 PROMEDIO DE Y
a1

a2 33.35 31.45 28.25 28.95 30.5

a3 32.6 20 28.4 27.7 29.675


28.85 28 28.5 28.95 28.575
Promedio Y
31.6 29.817 29.383 28.533 29.583

SUMA DE 1 2 3 4
CUADRADOS
1 1156 906.01 888.04 841
1069.29 1075.84 712.89 835.21
2 1024 912.04 623.69 761.76
1102.24 888.04 789.09 772.84
3 806.56 734.41 882.09 829.44
858.49 835.21 745.29 846.81
=2 PROMEDIO
CELDAS
PROMEDIO DE J PROMEDIO DE I 29.583PROMED
IO
FORMULA SCAB

  =21097 33.35 31.6 30.5 29.583 0.693889


32.6 31.6 29.675 29.583 0.824464
28.85 31.6 28.575 29.583 3.034564
21.45 29.82 30.5 29.583 0.508369
30 29.82 29.675 29.583 0.007744
28 29.82 28.575 29.583 0.659344

••  + 28.25 28.38 30.5 29.583 1.096209


28.4 28.38 29.675 29.583 0.005184
28.5 28.38 28.575 29.583 1.272384
28.95 28.53 30.5 29.583 0.247009
27.7 28.53 29.675 29.583 0.850084
28.95 28.53 28.575 29.583 2.039184
11.2348428
• 


FUENTE DE SUMA DE GRADOS DE CUADRADO F CALCULADA


VARIANZION CUADRADOS LIBERTAD MEDIO
A SCA a-1 5.793
A SCA a-1 5.793
B SCB b-1 10.35
B SCB b-1 10.35
AB SC(AB) (a-1)(b-1) 2.91
AB
ERROR SC(AB)
SCE (a-1)(b-1)
Ab(n-1) 2.91

TOTAL STC Abn-1


ERROR SCE Ab(n-1)

TOTAL STC Abn-1


FUENTE DE SUMA DE GRADOS DE CUADRADO F VALORES CRITICOS V1=2 V1=3 V1=6
VARIACION CUADRADOS LIBERTAD MEDIO CALCULADA DE LA
DISTRIBUCION
F(0.05)(V1,V2)
A 14.923 2 7.4615 5.793 V2=12 3.89 3.49 3
B 39.993 3 13.331 10.35
AB 22.46 6 3.743 2.91
ERROR 15.454 12 1.288
TOTAL 92.84 23

F critica=F(gI factor, gl error, a) CONDICION CONCLUSION


F critica A= (2,12,0.05)=3.89 La Ho se rechaza en el nivel cuando a) Se rechaza Ho porque los
F critica B= (3,12,0.05)=3.49 sistemas de misiles dan
F critica AB=(6,12,0.05)=3 a) 5.793>3.89 diferentes tasas de medias de
b) 10.35>3.49 combustión del propulsor
c) 2.91<3
b) Se rechaza Ho se concluye que
las medias de combustión del
propulsor no son las mismas
para los 4 tipos de propulsores
c) Se rechaza Ho, la interacción es
insignificante a un nivel del 0.05
UNIVERSIDAD AUTONOMA DE NUEVO LEON
FACULTAD DE INGENIERIA MECANICA Y
ELECTRICA
Prueba de Kruskal Wallis

Nombre: Eduardo Hernandez Avalos Matricula: 1953328


Carrera: IMA Fecha: 09/11/21
Materia: Estadística Inferencial
Maestro: Rigoberto Américo Garza
Prueba de Kruskal Wallis
En estadística, la prueba de Kruskal-Wallis (de William Kruskal y W. Allen Wallis)
es un método no paramétrico para probar si un grupo de datos proviene de la misma
población. Intuitivamente, es idéntico al ANOVA con los datos reemplazados por
categorías. Es una extensión de la prueba de la U de Mann-Whitney para 3 o más
grupos.
Ya que es una prueba no paramétrica, la prueba de Kruskal-Wallis no asume normalidad
en los datos, en oposición al tradicional ANOVA. Sí asume, bajo la hipótesis nula, que
los datos vienen de la misma distribución. Una forma común en que se viola este
supuesto es con datos heterocedásticos.
Prueba de Kruskal Wallis

•• En
  un experimento realizado para
determinar cuál de 3 sistemas de
misiles distintos es preferible, se
midió la tasa de combustión del
propulsor para 24 arranques
estáticos. Se emplearon 4 tipos de
combustible diferentes y el
experimento generó
observaciones duplicadas de las
tasas de combustión para cada
combinación de los tratamientos
• .
Hipótesis:
a) H0: no hay diferencia en las tasas medias de combustión del propulsor cuando
se emplean diferentes sistemas de misiles
b) H0 : no existe diferencia en las tasas medias
de combustión de los 4 tipos de propulsor
c) H0 : no hay interacción entre los distintos
sistemas de misiles y los diferentes tipos de propulsor.

SISTEMA DE b1 b2 b3 b4
MISILES

a1 33.35 11 31.45 9 28.25 3 28.95 6.5

a2 32.6 10 30 8 28.4 4 27.7 1

a3 28.85 6 28 2 28.5 5 28.95 6.5

R1=27 R2=19 R3= 12 R4=14


N1=3 N2=3 N3=3 N4=3
B=5 n=6 n=8

19 1 17 23.2 19.8 18.1 7 11 2.5 2.5


14.4 9.5 17.6 20.2 17.8 13 9.5 8 12

R1= 61.0 r1= 63.5 r1= 65.5


SUSTITUCION Distribucion ji cuadrada
V= K-1
V=3-1
V 0.05
2 5.991

CONCLUSION
Como h=1.66,no cae en la región critica h>5.991 no hay
evidencia suficiente para rechazar la hipótesis de que las
tasas de combustión del propulsor son iguales para los 3
sistemas de misiles.

También podría gustarte