Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MCE
Héctor Eduardo De Cos Cholula
hector.decos@correo.buap.mx
Temario – Unidad 1
1.2. Estimadores puntuales e Intervalos de confianza.
1.3. σ Conocida o para una muestra grande.
1.4. Desviación Estándar de una población desconocida y una
muestra pequeña.
1.5. Intervalo de confianza para una proporción.
1.6. Factor de corrección para una población finita.
1.7. Tamaño apropiado de una muestra.
Temario – Unidad 2
2.2. Errores Tipo I y Tipo II.
2.3. Metodología para la prueba de hipótesis.
2.4. Pruebas de significancia de una y dos colas.
Temario – Unidad 2
(continuación)
2.5. Pruebas de hipótesis para la media.
2.6. El valor de P en las pruebas de hipótesis.
2.7. Pruebas de hipótesis para las proporciones.
Temario – Unidad 3
3.2. Pruebas de hipótesis de las muestras de poblaciones
independientes.
3.3. Pruebas de hipótesis para la diferencia entre las
proporciones muestrales de dos poblaciones.
3.4. Comparación de las medias de la población con muestras
pequeñas.
3.5. Pruebas de hipótesis de dos muestras dependientes.
3.6. Comparación de muestras dependientes e independientes
Temario – Unidad 4
4.1. Introducción ANOVA.
4.2. Distribución F.
4.3. Comparación de dos varianzas de población.
4.4. Suposiciones de ANOVA.
4.5. La prueba de ANOVA.
4.6. Inferencias sobre pares de medias de tratamiento.
4.7. Análisis de la varianza en dos direcciones.
Temario – Unidad 5
5.1. Introducción Regresión lineal y correlación.
5.2. El coeficiente de correlación y de determinación.
5.3. Pruebas de significancia del coeficiente.
5.4. Análisis de regresión. Mínimos cuadrados.
5.5. Error estándar de estimación.
5.6. Intervalos de confianza e intervalos de predicción.
Temario – Unidad 6
6.1. Introducción rgegresión lineal múltiple
6.2. Análisis de regresión múltiple.
6.3. Error estándar de estimación múltiple.
6.4. Tabla ANOVA.
6.5. Análisis de varianzas residuales.
Temario – Unidad 7
7.1. Introducción serie de tiempo y proyección.
7.2. Componentes de una serie de tiempo.
7.3. Método de promedio móvil.
7.4. Método de promedio móvil ponderado.
7.5. Tendencia lineal.
7.6. Método de los mínimos cuadrados.
7.7. Variación estacional.
7.8. Distribución Weibull.
Criterios de evaluación
Si tres vidas útiles de baterías medidas en días hubieran sido x1 = 5.6, x2 = 4.5 y
x3 = 6.1, el uso del estimador (promedio) habría dado por resultado la
estimación:
x = (5.6 + 4.5 + 6.1)/3 = 5.40.
El método de momentos
La idea básica de este método es poder igualar ciertas características muestrales,
tales como la media, a los valores esperados de la población correspondiente.
Ejemplo:
Distribución Gamma
Método de Momentos
Ejemplo:
Método de Momentos
Ejemplo:
Si tuviésemos los siguientes valores, ¿cuál sería el resultado de los estimadores
anteriores?
Que X1, X2, …, Xn tengan una función masa de probabilidad o una función de densidad
de probabilidad:
donde los parámetros θ1, …, θm tienen valores desconocidos. Cuando x1, …, xn son los
valores muestrales observados y la función anterior se considera como una función de
θ1, …, θm, se llama función de verosimilitud. Las estimaciones de máxima
verosimilitud (EMV) son aquellos valores de las θi que incrementan al
máximo la función de probabilidad, de modo que:
Cuando se sustituyen las Xi en lugar de las xi, se obtienen los estimadores de máxima
verosimilitud.
Método de Máxima
Verosimilitud
Ejemplo: Se obtuvo una muestra de diez cascos de ciclista nuevos fabricados por una
compañía. Al probarlos, se encontró que el primero, el tercero y el décimo estaban
agrietados, en tanto que los demás no. Sea p = P(casco agrietado) y defina X1, …, X10
como Xi = 1 si el i-ésimo casco está agrietado y cero de lo contrario. En ese caso las xi
son 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, así que la función masa de probabilidad conjunta de la
muestra es
^
Método de Máxima
Verosimilitud
Suponga que X1, X2, . . . , Xn es una muestra aleatoria de una
distribución exponencial con parámetro λ. Debido a la independencia, la función de
verosimilitud es un producto de las funciones de densidad de probabilidad
individuales:
El ln(verosimilitud) es
^
Método de Máxima
Verosimilitud
Ejercicio: Sean X1, X2, . . . , Xn una muestra aleatoria de una distribución normal. La
función de probabilidad es:
Ejemplo:
Intervalos de confianza
Desempeño de Desempeño de
proveedor 3σ proveedor 6σ
donde:
es el símbolo del error estándar de la media.
σ es la desviación estándar poblacional.
n es el numero de observaciones en la muestra.
Valores “Z”
Modo de empleo de un valor “z”
Valores “Z”
Ejemplo:
Valores “Z”
Ejemplo:
Valores “Z”
Ejemplo:
Valores “Z”
Cómo determinar intervalos para distintos valores de confianza “z”.
Valores “Z”
Uso de tablas “z”:
Valores “Z”
¿Por qué decidirse por un nivel de confianza de 95% cuando un nivel de 99% es alcanzable?
Porque el precio pagado por el nivel de confianza más alto es un intervalo más ancho. Como el
intervalo de 95% se extiende 1.96 errores muestrales a cada lado de x, el ancho del intervalo es
2(1.96) = 3.92 errores muestrales. Asimismo, el ancho del intervalo de 99% es 2(2.58) = 5.16
errores muestrales. Es decir, se tiene más confianza en el intervalo de 99% precisamente porque
es más ancho.
Si se considera que el ancho del intervalo especifica su precisión o exactitud, entonces el nivel de
confianza del intervalo está relacionado de manera inversa con su precisión. La estimación de un
intervalo altamente confiable puede ser imprecisa por el hecho de que los puntos extremos del
intervalo pueden estar muy alejados, mientras que un intervalo preciso puede acarrear una
confiabilidad relativamente baja. Por consiguiente no se puede decir de modo inequívoco que se
tiene que preferir un intervalo de 99% a uno de 95%; la ganancia de confiabilidad acarrea una
pérdida de precisión.
Una estrategia atractiva es especificar tanto del nivel de confianza deseado como el ancho del
intervalo y luego determinar el tamaño de muestra necesario.
Valores “Z”
Ejemplo:
Un intensivo monitoreo de un sistema de tiempo compartido de computadoras sugiere
que el tiempo de respuesta a un comando de edición particular está normalmente
distribuido con desviación estándar de 25 milisegundos. Se instaló un nuevo sistema
operativo y se desea estimar el tiempo de respuesta promedio verdadero en el nuevo
entorno. Suponiendo que los tiempos de respuesta siguen estando normalmente
distribuidos con 25, ¿qué tamaño de muestra es necesario para asegurarse de que el
intervalo de confianza de 95% resultante tiene un ancho de (cuando mucho) 10?
Valores “Z”
Valor de z es un numero de desviaciones estándar entre la media de los datos del proceso y el dato de
interés.
Si nuestro valor de interés es “x” de una población con “μ” y “σ”, tenemos:
Estandariza los datos para permitir entender de mejor modo diferentes casos
Es utilizado para encontrar las probabilidades de las distribuciones normales
Es utilizado para generar métricos de capacidad de los datos de procesos
Valores “Z”
Utilizando el valor de Z podemos hacer comparaciones entre diferentes procesos
Ejemplo:
Retrabajos de A Retrabajos de B
μ = 7 minutos μ = 3 minutos
σ = 1 minuto σ = 0.5 minuto
(m m) (0 0)
Z(x m) 0
s s
(m s m ) ( s )
Z ( x s) 1
s s
σ 1
μ 0
Ventajas:
“Todos nosotros estamos hablando el mismo lenguaje”, esto significa, que
cualquiera de nosotros entiende el significado del valor de Z. No es importante
en este ámbito el contexto original de los datos, porque estamos hablando y
trabajando con datos estandarizados.
Valores “Z”
Cómo determinar intervalos de confianza cuando se desconoce la desviación estandar
Valores “Z”
Ejemplo:
Valores “Z”
Ejemplo:
Intervalo de confianza para la
proporción de una población
Siempre que n sea pequeño comparado con el tamaño de la población, X puede ser
considerada como una variable aleatoria binomial con E(X) np y X np(1p) . .
Además, si tanto np≥10 como nq≥10, X tiene aproximadamente una distribución
normal.
Ejemplo:
El artículo “Repeatability and Reproducibility for Pass/Fail Data” (J. of Testing and
Eval., 1997: 151-153) reportó que en n=48 ensayos en un laboratorio particular, 16
dieron por resultado la ignición de un tipo particular de sustrato por un cigarrillo
encendido. Sea p la proporción a largo plazo de tales ensayos que producirían ignición.
Una estimación puntual de p es p=16/48=0.333.
Intervalo de confianza para la
proporción de una población
En algunas ocasiones se desea predecir solo un valor futuro (el valor inmediato
siguiente), para estos casos lo ideal es establecer un intervalo de predicción
Ejemplo
La expectativa del cliente en la refinería es que la cantidad promedio de
aceite por barril es igual a 55,0 galones. Usted decide tomar una
muestra aleatoria de 20 barriles para determinar cuál es el promedio
real. En su muestra de 20 barriles, encontrará que la media de la
muestra, x, es igual a 54,860 galones y que la desviación estándar, s, es
igual a 1,008 galones.
Los datos reales eran éstos:
54.1, 53.3, 56.1, 55.7, 54.0, 54.1, 54.5, 57.1, 55.2, 53.8,
54.1, 54.1, 56.1, 55.0, 55.9, 56.0 ,54.9, 54.3, 53.9, 55.0
Estadística descriptiva: C1
Variable máxima
C1 57,100
3
Intervalos de confianza con
varianza desconocida
Summary for C1
Anderson-Darling Normality Test
A-Squared 0.60
P-Value 0.105
Mean 54.860
StDev 1.008
Variance 1.016
Skewness 0.560026
Kurtosis -0.509797
N 20
Minimum 53.300
1st Quartile 54.100
Median 54.700
3rd Quartile 55.850
54 55 56 57 Maximum 57.100
95% Confidence Interval for Mean
54.388 55.332
95% Confidence Interval for Median
54.100 55.582
Median
54 .0 54 .4 54 .8 55 .2 55 .6
Tenemos un intervalo de confianza del 95% de que la media real está comprendida
entre 54,3882 y 55,3318.
También estamos corriendo un riesgo del 5% de equivocarnos.
Intervalos de confianza para la
varianza y la desviación estándar
Cuidado!!!
NO SON los mismos valores
Intervalos de confianza para la
varianza y la desviación estándar
Ejemplo:
Valores de temperatura en el manejo de metales fundidos en colado-1:
Ejemplo:
Valores de temperatura en el manejo de metales fundidos en colado-1:
Valores de ji cuadrada:
Intervalos de confianza para la
varianza y la desviación estándar
Ejemplo:
Valores de temperatura en el manejo de metales fundidos en colado-1:
Valores de ji cuadrada:
Ejercicios:
El artículo “Ultimate Load Capacities of Expansion Anchor Bolts” (J. of Energy Engr.,
1993: 139-158) reportó los siguientes datos resumidos sobre resistencia al esfuerzo
cortante (klb/pulg2) para una muestra de pernos de anclaje de 3/8 pulg: n = 78, x =
4.25, s = 1.30. Calcule un límite de confianza inferior utilizando un nivel de confianza de
90% para una resistencia al esfuerzo cortante promedio verdadero.
Intervalos de confianza
Ejercicios:
Una legisladora estatal desea encuestar a los residentes de su distrito para ver qué
proporción del electorado está consciente de su posición sobre la utilización de fondos
estatales para solventar abortos.
418 421 421 422 425 427 431 434 437 439 446 447 448 453 454 463 465
69.5 71.9 72.6 73.1 73.3 73.5 75.5 75.7 75.8 76.1 76.2 76.2 77.0 77.9 78.1
79.6 79.7 79.9 80.1 82.2 83.7 93.7