Está en la página 1de 79

Búscanos como

UH Escuela de Ingeniería Industrial

A nuestro Facebook e infórmese

Escuela de
Estadística Básica para mejora
continua.

Escuela de
Mejoramiento en la historia…

1920
1980

Study

Ciclo Deming.
Ciclo Shewart.

Ciclo DMAIC.

Escuela de
Situaciones a considerar en el mejoramiento…

• Control.
• Desempeño.
• Variabilidad.

Escuela de
Porqué mejorar…

• Incertidumbre.
• Riesgo.
• Desperdicio.
• Competencias.
• Competitividad.

Escuela de
Porqué tomar decisiones basadas en datos?

• Algunos puntos importantes que se pueden mencionar


de la toma de decisiones basada en datos:
• Datos más claros.
• Calidad de los datos.
• Agrupamiento - Gráficos.
• Técnicas estadísticas.
• Utilizables en todas las etapas de la solución de problemas.

Escuela de
Probabilidad y estadística.

• Estadística: Trata de la recopilación, presentación,


análisis y uso de la información para resolver
problemas, tomar decisiones, desarrollar estimaciones,
y diseñar y desarrollar productos y procedimientos.

Conclusiones y
Recoger Organizar Resumir Analizar decisiones

• Probabilidad: Cuantifica el grado de confianza en un


evento de interés.

Escuela de
Herramientas estadísticas.

• Entre las herramientas de la estadística podemos mencionar:


• Estadística descriptiva.
• Estadística inferencial.
• Análisis de regresión.
• SPC (Control Estadístico Proceso).
• Análisis gráficos.
• Estadística paramétrica – no paramétrica.
• Ingeniería de confiabilidad.
• DOE (Diseño Experimentos).
• Análisis de varianza (ANOVA).

Escuela de
Naturaleza de probabilidad y estadística.

• Estadística descriptiva.
• Concepto: Se ocupa de la organización, resumen y
presentación de los datos.
• Se dedica a:
• Ordenamiento y tratamiento mecánico de la información
para su presentación (tablas, gráficos).
• Se puede aplicar a poblaciones completas o muestras
finitas.
• Puede presentarse la información a cualquier lector, sea
especialista o no.

1Walpole, Ronald E.; Myers, Raymond H.; Myers, Sharon L.; Ye, Keying. Probabilidad y estadística para ingeniería y
ciencias. Octava edición. Pearson Educación, México, 2007.
Escuela de
Naturaleza de probabilidad y estadística.

• Estadística inferencial.
• Concepto: Saca conclusiones o hace inferencias sobre una
población finita a partir de muestras de la misma.

Escuela de
Relación entre Probabilidad y Estadística.

• La teoría de probabilidades es la base de la estadística


inferencial al suministrar los elementos para medir,
analizar y minimizar los riesgos de error presentes
dentro del proceso de inferencia.

• El proceso estadístico está fundamentado en la


inferencia que se hace sobre una población, teniendo
en cuenta la información suministrada por una
muestra.

Escuela de
Datos Estadísticos.

• Son conjuntos de valores referidos a una misma


característica y recogidos de tal modo que puedan ser
comparados, analizados o interpretados.

• La estadística se interesa por los fenómenos típicos o


las regularidades que presentan un conjunto de datos
y trata, de determinar propiedades de ese conjunto.

Escuela de
Datos e información.

Datos Información
Describe los atributos de una Conjunto de datos procesados
identidad. que tienen significado.

Constituyen la materia prima


Requiere unidad de análisis.
de la información.

Requiere consenso sobre su


Fácilmente estructurables.
significado.

No tienen significado por sí Se requiere de la


solos. intermediación humana.

Normalmente son
Conduce al conocimiento.
cuantificables.

Escuela de
Datos e información.

• En forma general, el análisis de información es un


proceso de carácter continuo y sistémico de
transformación de la información en conocimiento y
de este último, en decisiones estratégicas, en otras
palabras, busca extraer conocimiento por medio de
métodos y técnicas, tanto cuantitativas como
cualitativas para proporcionar información útil y
valiosa¹.

¹Ph.D. Daymara Díaz Duarte. Consultora Especialista en Información Cinentífico-Técnica y Bibliotecología.


Unidad de Información. Centro de Información de ETECSA.
Escuela de
Concepto población, muestra, aleatoriedad y
representatividad.

• Es el total o agregado de las unidades de


Población "N" estudio.

Población
Finita: Tiene limitado Infinita: Tiene ilimitado
número de elementos. número de elementos.
Ej.: libros en una Ej.: conjunto números
biblioteca. reales.

Un mismo conjunto de unidades de estudio puede dar origen a diferentes


poblaciones.
Escuela de
Concepto de población, muestra, aleatoriedad y
representatividad.

• Es un subconjunto de la población. Se
Muestra “n" estudia y posteriormente se generalizan los
resultados a toda la población.

• El uso del muestreo es un procedimiento más rápido


y barato y, en ciertos casos el único posible; sin
embargo, por tratarse de un procedimiento inductivo,
de la parte hacia el todo, se corre el riesgo de que la
parte seleccionada no sea representativa. Influyen
dos factores básicos: el tamaño de la muestra y la
forma de seleccionarla.
Escuela de
Concepto de población, muestra, aleatoriedad y
representatividad.

• Tamaño de muestra depende de la homogeneidad


que muestran los elementos de la población y el
grado de confianza que se quiere tener en la
inferencia.

Escuela de
Concepto de población, muestra, aleatoriedad y
representatividad.

Selección de la muestra.
Intencional: juicio de Por conveniencia:
Aleatoria o al azar: cada persona con experiencia escogiendo unidades o
elemento tiene la misma y conocimiento. elementos que están
probabilidad de ser disponibles.
incluido en la muestra.

El muestreo aleatorio elimina los sesgos de selección y produce


errores aleatorios que por su naturaleza se pueden medir
utilizando modelos probabilísticos.
Escuela de
Otros conceptos: muestreos.

• Con reemplazo: cada una de las observaciones


permanece independiente de las demás.

• Sin reemplazo: una vez que se ha tomado en cuenta


un valor o dato para formar parte de la muestra, no
se le vuelve a tomar en cuenta nuevamente.

Escuela de
Otros conceptos: ventaja del muestreo.

• Reducción de costos: gastos de recoger y tratar datos


son menores en muestras que en total de población.
• Rapidez: tiempo de recoger y tratar datos se reduce.
• Viabilidad: elección de muestra permite la realización
de estudios imposibles de realizar sobre el total de la
población.

Escuela de
Otros conceptos: parámetros y estimadores.

Parámetros y estimadores
Parámetros: medidas Estimadores: medidas
utilizadas para describir utilizadas para describir
poblaciones. Suelen estar muestras. Suelen estar
representadas por letras representadas por letras
griegas (por ejemplo µ y del alfabeto español (por
σ). ejemplo x o s).

Escuela de
Estadística descriptiva. Estadísticas básicas.

• Descripción numérica de datos sin agrupar.


• Tenemos tres tipos de medidas:
• Posición de la distribución, alrededor de que valor se
tienden a concentrar los datos.
• Variabilidad o dispersión de los datos alrededor de los
valores centrales.
• Forma o patrón de distribución de los datos.

Escuela de
Estadística descriptiva. Estadísticas básicas.

• Posición.
• Media aritmética o promedio.
• Mediana.
• Moda.
• Media geométrica.
• Media armónica.
• Cuantilos.
• La media geométrica y la media armónica tienen un uso bastante
restringido.

Escuela de
Estadística descriptiva. Estadísticas básicas.

• Variabilidad o dispersión.
• Amplitud o recorrido.
• Desviación media.
• Desviación estándar y varianza.
• Coeficiente de variación.

Escuela de
Estadística descriptiva. Estadísticas básicas.

• Forma o patrón.
• Asimetría.
• Kurtosis.

Escuela de
Estadística descriptiva. Estadísticas básicas.

• Ejemplo.
• Diámetro interior de los anillos forjados para pistones (mm).
Diámetro Interior De los Anillos Forjados Para Pistones (mm)
Muestra Observaciones
1 74.030 74.000 73.994 74.001 73.994 73.992 73.998 73.993
2 73.995 73.994 74.006 73.999 74.007 74.011 74.005 74.005
3 73.998 74.006 74.003 73.989 73.998 74.005 74.003 73.998
4 74.002 73.984 73.995 74.008 73.994 74.015 74.005 74.004
5 73.992 74.000 74.000 73.984 73.998 73.989 74.020 73.995
6 74.009 73.988 73.998 74.019 74.005 73.985 74.005 73.990
7 73.995 74.004 74.000 74.001 73.986 74.000 74.006 73.996
8 73.985 74.010 74.002 74.021 74.018 74.015 74.009 74.012
9 74.008 74.015 73.967 73.993 74.003 74.005 74.000 73.984
10 73.998 73.982 74.014 74.015 74.013 74.007 74.017 74.007
11 73.994 74.002 73.984 73.997 74.009 73.995 74.008 73.996
12 74.004 73.992 74.012 73.994 73.990 74.000 74.004 74.007
13 73.983 74.024 74.010 73.993 73.990 73.997 74.002 74.000
14 74.006 73.996 74.002 74.009 73.993 74.000 74.009 73.997
15 74.012 74.007 74.010 73.990 73.995 73.999 74.014 74.003
Escuela de
Hipótesis Estadística.

• Una hipótesis estadística es una aseveración o


conjetura con respecto a una o más poblaciones.
• La verdad o falsedad de una hipótesis estadística
nunca se sabe con absoluta certidumbre, a menos
que examinemos toda la población.
• En cambio, se toma una muestra aleatoria de la
población de interés, y se utilizan los datos
contenidos en esta para proporcionar evidencia que
apoye o no la hipótesis.

Escuela de
Hipótesis Estadística.

• El rechazo de una hipótesis simplemente implica que


la evidencia de la muestra la refuta.

• El rechazo significa que hay una pequeña


probabilidad de obtener la información muestral
observada cuando, de hecho, la hipótesis es
verdadera.

Escuela de
Hipótesis Estadística.

• Hipótesis nula.
• Cualquier hipótesis que deseamos probar y se
denota con H0.

• Hipótesis alternativa.
• El rechazo de H0 conduce a la aceptación de la
hipótesis alternativa H1.

Escuela de
Hipótesis Estadística.

• La comprensión de las diferentes funciones que


desempeñan la hipótesis nula H0 y la hipótesis
alternativa H1 es fundamental para entender los
principios de la prueba de hipótesis.
• La hipótesis alternativa H1, por lo general, representa
la pregunta que debe responderse, la teoría que debe
probarse y, por ello, su especificación es muy
importante.
• La hipótesis nula H0 anula o se opone a H1 y a
menudo es el complemento lógico para H1.

Escuela de
Hipótesis Estadística.

• Región crítica o de rechazo: son aquellos valores que


implican un rechazo de la hipótesis nula H0.

• Región de aceptación: son aquellos valores donde no


se rechaza H0.

• Valores críticos: fronteras de la región crítica.

Escuela de
Hipótesis Estadística. Tipos de error.

• Decisión de aceptar o rechazar la hipótesis nula se


basa en una estadística de prueba calculada a partir
de los datos de una muestra aleatoria. Cuando se
toma una decisión utilizando la información en una
muestra aleatoria, ésta está sujeta a error.

Escuela de
Hipótesis Estadística. Tipos de error.

• Tenemos dos tipos:


• Error tipo I: es el rechazo de la hipótesis nula cuando esta
es verdadera.
• α = P(error tipo I) = P(rechazar H0H0 es verdadera)
• La probabilidad de cometer error de tipo I, también es llamada
nivel de significancia.
• Se considera que el paciente está enfermo, a pesar de que en
realidad está sano; hipótesis nula: El paciente está sano.
• Se declara culpable al acusado, a pesar de que en realidad es
inocente; hipótesis nula: El acusado es inocente.
• No se permite el ingreso de una persona, a pesar de que tiene
derecho a ingresar; hipótesis nula: La persona tiene derecho a
ingresar.
• Error tipo II: es no rechazar la hipótesis nula cuanta esta
esta es falsa.
• β = P(error tipo II) = P(aceptar H0H0 es falsa)
Escuela de
Hipótesis Estadística. Tipos de error.

H₀ es verdadera H₀ es falsa

No rechace H₀ Decisión Correcta Error tipo II


Rechace H₀ Error tipo I Decisión Correcta

Escuela de
Hipótesis Estadística. Tipos de error.

• Ejemplo.
• Una socióloga se interesa en la eficacia de un curso
de entrenamiento diseñado para lograr que más
conductores utilicen los cinturones de seguridad en
los automóviles.
a) Qué hipótesis prueba ella si comete un error tipo I al
concluir de manera errónea que el curso de
entrenamiento no es eficaz?
b) Qué hipótesis prueba ella si comete un error tipo II al
concluir de forma errónea que el curso de entrenamiento
es eficaz?

Escuela de
Hipótesis Estadística. Tipos de error.

• Ejemplo.
• En un restaurante de carnes asadas una máquina de bebidas
gaseosas se ajusta de manera que la cantidad de bebida que
sirva esté distribuida de forma aproximadamente normal,
con una media de 200ml y una desviación estándar de 15ml.
La máquina se verifica periódicamente tomando una muestra
de 9 bebidas y calculando el contenido promedio. Si 𝑥ҧ cae en
el intervalo 191  𝑥ҧ  209, se considera que la máquina
opera de forma satisfactoria, de otro modo, concluimos que
𝜇 ≠ 200𝑚𝑙.

Escuela de
Propiedades Prueba Hipótesis.

• Un aumento en el tamaño muestral n reducirá a α y β


de forma simultánea.

• Si la hipótesis nula es falsa, β es un máximo cuando el


valor real de un parámetro se aproxima la valor
hipotético. Cuanto más grande sea la distancia entre el
valor real y el valor hipotético, β será menor.

Escuela de
Potencia De La Prueba.

• Es la probabilidad de que una hipótesis nula


falsa se rechace correctamente.

Potencia = 1 – β = P(rechazar H₀H₀ falsa).

Escuela de
Hipótesis Unilaterales Y Bilaterales.

• Hipótesis unilateral.
• H₀ : θ = θ₀ y H₁ : θ > θ₀
• H₀ : θ = θ₀ y H₁ : θ < θ₀
• Se denomina prueba de una sola cola.

• Hipótesis bilateral.
• H₀ : θ = θ₀ y H₁ : θ ≠ θ₀
• Se denomina prueba de dos colas.

Escuela de
Como Elegir Hipótesis.

• La hipótesis nula, H₀, con frecuencia se


establecerá usando el signo de igualdad.
• Debido a que rechazar H₀ siempre da por
resultado una conclusión fuerte, en tanto que
no rechazar H₀ puede dar lugar a una conclusión
débil, casi en todos los casos preferimos que la
afirmación en torno a la cual se desea una
conclusión fuerte esté en la hipótesis alternativa
H₁.

Escuela de
Una Muestra: Prueba Con Respecto A Media
(Varianza Conocida).
• Se considera la hipótesis:
H₀:  = ₀
H₁:  ≠ ₀

• El estadístico de prueba adecuado se debería basar


en la variable aleatoria 𝑥.ҧ

ҧ
𝑥−𝜇
• Estandarización de 𝑥ҧ  𝑧 =
𝜎 Τ𝑛

Escuela de
Una Muestra: Prueba Con Respecto A Media
(Varianza Conocida).
• Sabemos que bajo H₀, es decir, si  = ₀, entonces
𝑛 ∗ 𝑥ҧ − 𝜇0 Τ𝜎 tiene una distribución n(x;0,1) y por lo
tanto, se puede utilizar la expresión:
𝑥ҧ − 𝜇0
𝑃 −𝑧𝛼Τ2 < < 𝑧𝛼Τ2 = 1 − 𝛼
𝜎Τ 𝑛

• Si −𝑧𝛼Τ2 < 𝑧 < 𝑧𝛼Τ2 no se rechaza H₀. El rechazo de H₀


desde luego, implica la aceptación o no rechazo de la
de la hipótesis alternativa  ≠ ₀.

Escuela de
Una Muestra: Prueba Con Respecto A Media
(Varianza Conocida).
• Las pruebas de hipótesis unilaterales sobre la
media incluyen el mismo estadístico que se
describe en el caso bilateral. La diferencia, es
que la región crítica sólo está en una cola de la
distribución normal estándar.

• Se busca probar:
H₀:  = ₀
H₁:  > ₀ ó  < ₀

Escuela de
Una Muestra: Prueba Con Respecto A Media
(Varianza Conocida).
• Ejemplo.
• Una muestra aleatoria de 100 muestras registradas
en Canadá el año pasado mostró una vida promedio
de 71.8 años. Suponiendo una desviación estándar
poblacional de 8.9 años, esto parece indicar que la
vida media actual es mayor que 70 años. Utilice un
nivel de significancia de 0.05.

Escuela de
Una Muestra: Prueba Con Respecto A Media
(Varianza Conocida).
• Ejemplo.
• Un fabricante de equipo deportivo desarrolló un
nuevo sedal para pesca sintético que afirma que
tiene una resistencia media a la rotura de 8kg con
una desviación estándar de 0.5kg. Probar la
hipótesis de que  = 8kg contra la alternativa de que
 ≠ 8kg, si se prueba una muestra aleatoria de 50
sedales y se encuentra que tiene una resistencia
media a la rotura de 7.8kg. Utilice un nivel de
significancia de 0.01.

Escuela de
Una Muestra: Prueba Con Respecto A Media
(Varianza Conocida).
• Relación con el intervalo de confianza.
• Con un valor observado 𝑥ҧ no rechazar H₀ a un nivel
de significancia α implica que:

𝑥ҧ − 𝜇0
−𝑧𝛼Τ2 < < 𝑧𝛼Τ2
𝜎Τ 𝑛

que es equivalente a decir:


𝜎 𝜎
𝑥ҧ −𝑧𝛼Τ2 ∗ < 𝜇0 < 𝑥ҧ +𝑧𝛼Τ2 ∗
𝑛 𝑛
Escuela de
Una Muestra: Prueba Con Respecto A Media
(Varianza Desconocida).
• Se considera la hipótesis:
H₀:  = ₀
H₁:  ≠ ₀
• El estadístico de prueba adecuado se debería basar
en la variable aleatoria 𝑥.ҧ

ҧ 0
𝑥−𝜇
• Estandarización de 𝑥ҧ  𝑡 =
𝑠Τ 𝑛

Escuela de
Una Muestra: Prueba Con Respecto A Media
(Varianza Desconocida).
• Para la hipótesis bilateral en un nivel de
significancia , se aplican las regiones críticas
de dos colas.
• Para H₁:  > ₀, el rechazo resulta cuando 𝑡 >
𝑡𝛼,𝑛−1 .
• Para H₁:  < ₀, la región crítica está dada por
𝑡 < −𝑡𝛼,𝑛−1 .

Escuela de
Una Muestra: Prueba Con Respecto A Media
(Varianza Desconocida).
• Ejemplo.
• Pruebe la hipótesis de que el contenido promedio
de los envases de un lubricante específico es de 10lt,
si los contenidos de una muestra aleatoria de 10
envases son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9,
10.4, 10.3, 9.8 litros. Utilice un nivel de significancia
de 0.01 y suponga que la distribución del contenido
es normal.

Escuela de
Elección De Tamaño De Muestra Para Probar
Medias (Una Muestra).
• Por lo general el tamaño de la muestra se
establece para lograr una buena potencia para
una α fija y una alternativa específica fija.

2
𝑧𝛼Τ2 + 𝑧𝛽 ∗ 𝜎2
𝑛≈
𝛿2

• Dónde δ = 𝜇 − 𝜇0 .

Escuela de
Elección De Tamaño De Muestra Para Probar
Medias (Una Muestra).
• Ejemplo.
• Una muestra aleatoria de 64 bolsas de palomitas
(rosetas) de maíz con queso chedar pesan, en
promedio, 5.23 onzas con una desviación estándar
de 0.24 onzas. Si se deseara probar la hipótesis de
que μ = 5.5 onzas contra la hipótesis alternativa μ 
5.5 onzas con un nivel de significancia de 0.05; que
tan grande se requiere que sea la muestra , si la
potencia de nuestra prueba debe ser 0.90 cuando la
media real es 5.2?

Escuela de
Dos Muestras: Prueba Sobre Dos Medias (Varianzas
Conocidas).
• Hipótesis bilateral sobre dos medias se escribe con
bastante generalidad como H₀:₁ - ₂ = d₀.
• La alternativa puede ser bilateral o unilateral, el
estadístico de prueba está dado por:

𝑥ҧ1 − 𝑥ҧ2 − 𝑑0
𝑧=
𝜎12 Τ𝑛1 + 𝜎22 Τ𝑛2

• Se rechaza H₀ a favor de H₁ =₁ - ₂≠ d₀ si :


𝑧 > 𝑧𝛼Τ2 ó 𝑧 < −𝑧𝛼Τ2

Escuela de
Dos Muestras: Prueba Sobre Dos Medias (Varianzas
Conocidas).
• Ejemplo.
• Una muestra aleatoria de tamaño 25, que se toma
de una población normal con una desviación
estándar de 5.2, tiene una media 81. Una segunda
muestra aleatoria de tamaño 36, que se toma de
una población normal diferente con una desviación
estándar de 3.4, tiene una media 76. Se puede
afirmar que hay diferencia entre las medias de
ambas muestras?

Escuela de
Dos Muestras: Prueba Sobre Dos Medias (Varianzas
Desconocidas Pero Iguales).
• Se supone que ambas distribuciones son normales y
que ₁ = ₂ = , se puede utilizar la prueba t
combinada. El estadístico de prueba está dado por el
siguiente procedimiento:
2 2
𝑥ҧ1 − 𝑥ҧ2 − 𝑑0 𝑛1 − 1 ∗ 𝑠1 + 𝑛 2 − 1 ∗ 𝑠2
𝑡= 𝑐𝑜𝑛 𝑠𝑝2 =
𝑠𝑝 ∗ 1Τ𝑛1 + 1Τ𝑛2 𝑛1 + 𝑛2 − 2

• Se incluye la distribución t y no se rechaza la hipótesis


bilateral cuando:
−𝑡𝛼Τ2,𝑛1 +𝑛2−2 < 𝑡 < 𝑡𝛼Τ2,𝑛1 +𝑛2 −2
Escuela de
Dos Muestras: Prueba Sobre Dos Medias (Varianzas
Desconocidas Pero Iguales).
• Ejemplo.
• Una empresa le ha solicitado su asesoría, pues mantiene una
disputa con el contratista que le da mantenimiento a cierto
equipo, al considerar que durante el tiempo que el aparato
presentó cierta avería, que si bien es cierto no significó la
paralización total del aparato, considera que implicó una
disminución en la producción horaria (suponga que no hay otras
razones involucradas). De ser correcto, aplicaría una multa de
US$1.000 por cada 150 kilos/hora o fracción que disminuyó la
producción, considerando que la capacidad de diseño de
producción es de 1385 kilos/hora. Según las condiciones
contractuales, toda inferencia se hará con un nivel de
significancia de 5%. A continuación se presentan los datos de
producción antes de la avería (del 10 al 21 de abril 2004,
inclusive.); y durante el evento (del 22 de abril al 12 de mayo
2004, inclusive). El único domingo laborado fue el 6 de mayo de
Escuela de 2004. Qué recomendación le daría usted a la empresa?
Dos Muestras: Prueba Sobre Dos Medias (Varianzas
Desconocidas Pero Iguales).
• Ejemplo.
Promedio Promedio Promedio
Día Día Día
kilos/hora kilos/hora kilos/hora
10-Abr-04 913,31 22-Abr-04 867,75 4-May-04 972,54
12-Abr-04 1.032,63 23-Abr-04 900,21 5-May-04 1.008,50
13-Abr-04 1.071,25 24-Abr-04 583,38 6-May-04 996,33
14-Abr-04 974,50 26-Abr-04 783,21 7-May-04 669,29
15-Abr-04 812,08 27-Abr-04 996,08 8-May-04 668,38
16-Abr-04 865,38 28-Abr-04 1.029,50 10-May-04 812,21
17-Abr-04 651,19 29-Abr-04 942,92 11-May-04 1.089,04
19-Abr-04 1.089,83 30-Abr-04 1.037,58 12-May-04 1.028,25
20-Abr-04 952,54 1-May-04 630,38
21-Abr-04 900,13 3-May-04 1.006,00

Escuela de
Dos Muestras: Prueba Sobre Dos Medias (Varianzas
Desconocidas Pero Iguales).
• Ejemplo.
• Se realiza un estudio para determinar si los temas de la
materia en un curso de física se comprenden mejor cuando
se emplea un laboratorio en parte del curso. Se seleccionan
estudiantes al azar para que participen, ya sea en un curso de
tres semestres-hora con laboratorio. En la sección con
laboratorio 11 estudiantes tuvieron una calificación
promedio de 85 con una desviación estándar de 4.7;
mientras que en la sección sin laboratorio 17 estudiantes
tuvieron una calificación promedio de 79 con una desviación
estándar de 6.1. Se puede afirmar que el curso con
laboratorio aumenta la calificación promedio hasta en 8
puntos? Las poblaciones se distribuyen de forma
aproximadamente normal con varianzas iguales.

Escuela de
Observaciones Pareadas.

• Cada unidad experimental tiene un par de


observaciones , una para cada población.
• Por ejemplo, si realizamos una prueba de una nueva
dieta con 15 individuos, los pesos antes y después de
seguir la dieta forman la información de nuestras dos
muestras. Estas dos poblaciones son “antes” y
“después”, y la unidad experimental es el individuo.
• Evidentemente, las observaciones tienen algo en
común: mismo individuo.
• Para determinar si la dieta es efectiva, consideramos las
diferencias d1, d2, … , dn en las observaciones pareadas.

Escuela de
Observaciones Pareadas.

• Al seleccionar unidades experimentales relativamente


homogéneas (dentro de las unidades) y permitir que
cada unidad experimente ambas condiciones
poblacionales, se reduce la “varianza del error
experimental” efectiva (en este caso 𝜎𝐷2 ).
• El i-ésimo par consiste en la medición:
𝐷𝑖 = 𝑥1𝑖 − 𝑥2𝑖

Escuela de
Observaciones Pareadas.

• El cálculo del intervalo de confianza para 𝜇1 − 𝜇2 en la situación


con observaciones pareadas se basa en la variable aleatoria:

ഥ − 𝜇𝐷
𝐷
𝑇=
𝑠𝑑 Τ 𝑛

• Donde D-barra y Sd son variables aleatorias que representan la


media muestral y las desviaciones estándar de las diferencias de
las observaciones en las unidades experimentales.

Escuela de
Observaciones Pareadas.

• El problema de dos muestras se reduce en esencia a un


problema de una muestra utilizando las diferencias
calculadas d1, d2,…, dn. Así, la hipótesis se reduce a:
𝐻0 : 𝜇𝐷 = 𝑑0 ó 𝜇𝐷 − 𝑑0 = 0
• El estadístico de prueba calculado está dado por:
𝑑ҧ − 𝑑0
𝑡=
𝑠𝑑 Τ 𝑛
• La región crítica es igual que con una muestra en partes
independientes (con alfa medios).

Escuela de
Observaciones Pareadas.

• Ejemplo.
• En un estudio realizado por el Departamento de
Nutrición Humana y Alimentos del Instituto
Politécnico y Universidad Estatal de Virginia, se
registraron los siguientes datos acerca de la
comparación de residuos de ácido sórbico, en partes
por millón, en jamón inmediatamente después de
sumergirlo en una solución ácido y después de 60
días de almacenamiento:

Escuela de
Observaciones Pareadas.

Suponiendo que las poblaciones se distribuyen


normalmente, podríamos decir que la duración del
almacenamiento influye en las concentraciones
residuales de ácido sórbico?
Escuela de
Una Muestra: Prueba Sobre Una Sola Proporción.

• Tenemos el problema de probar la hipótesis


de que la proporción de éxitos en un
experimento binomial es igual a algún valor
específico.
• Probar la hipótesis nula H₀ que p = p₀,
donde p es el parámetro de la distribución
binomial.
• Se utiliza la distribución binomial para
calcular el valor de P.
Escuela de
Una Muestra: Prueba Sobre Una Sola Proporción.

• Hipótesis H₀: p = p₀, H₁: p < p₀


• P = P(X ≤ x cuando p = p₀)
• x es el número de éxitos en muestra de tamaño n. Si
valor P es menor que o igual a α, prueba es significativa
en el nivel α y se rechaza H₀ a favor de H₁.

• Hipótesis H₀: p = p₀, H₁: p > p₀


• P = P(X > x cuando p = p₀)
• Si valor P es menor que o igual a α, prueba es
significativa en el nivel α y se rechaza H₀ a favor de H₁.

Escuela de
Una Muestra: Prueba Sobre Una Sola Proporción.

• Hipótesis H₀: p = p₀, H₁: p ≠ p₀


• P = 2P(X ≤ x cuando p = p₀) si x < np₀
• P = 2P(X ≥ x cuando p = p₀) si x > np₀

• Se rechaza H₀ a favor de H₁, si el valor calculado


de P es menor que o igual a α.

Escuela de
Una Muestra: Prueba Sobre Una Sola Proporción.

• Ejemplo.
• Se cree que al menos 60% de los
residentes de cierta área favorecen una
demanda de anexión de una ciudad
vecina. Qué conclusión extraería, con un
nivel de significancia de 0.05; si solo 110
en una muestra de 200 votantes están a
favor de la demanda?

Escuela de
Una Muestra: Prueba Sobre Una Sola Proporción.

• Ejemplo.
• Un experto en marketing de una compañía
fabricante de pasta considera que 40% de los
amantes de la pasta prefieren la lasagna (Si el
porcentaje es mayor, no se tiene capacidad de
planta para satisfacer la demanda; si es menor se
estarían desperdiciando recursos. Si 9 de 20
amantes de la pasta eligen lasagna sobre otras
pastas. Qué se puede concluir acerca de la
afirmación del experto? Utilice un nivel de
significancia de 0.05.
Escuela de
Una Muestra: Prueba Sobre Una Sola Proporción.

• Para n grande, se requieren procedimientos


de aproximación.

• Aproximación de la curva normal, con


parámetros  = np₀ y ² = np₀q₀, por lo
general, se prefiere n grande y es muy
precisa. En tanto que p₀ no esté
extremadamente cerca de 0 o de 1.

Escuela de
Una Muestra: Prueba Sobre Una Sola Proporción.

• Utilizando aproximación normal, el valor z


para probar p = p₀ está dado por:
𝑥 − 𝑛 ∗ 𝑝0 𝑝ො − 𝑝0
𝑧= =
𝑛 ∗ 𝑝0 ∗ 𝑞0 𝑝0 ∗ 𝑞0 Τ𝑛

• Para una prueba de dos colas al nivel de


significancia de α, la región crítica es:
𝑧 < −𝑧𝛼Τ2 ó 𝑧 > 𝑧𝛼Τ2

Escuela de
Una Muestra: Prueba Sobre Una Sola Proporción.

• Ejemplo.
• En un invierno con epidemia de gripe, una compañía
farmacéutica bien conocida estudió a 2000 bebés, para
determinar si el nuevo medicamento de la compañía era
eficaz después de dos días. Entre 120 bebés que tenían
gripe y se les suministró el medicamento, 29 se curaron
dentro de dos días. Entre 280 bebés que tenían gripe
pero que no recibieron el fármaco, 56 se curaron dentro
de dos días. Hay alguna indicación significativa que
apoye la afirmación de la compañía de la efectividad del
medicamento?

Escuela de
Dos Muestras: Pruebas Sobre Dos Proporciones.

• Probar la hipótesis nula de que dos


proporciones, o parámetros binomiales son
iguales.

• Probamos p₁ = p₂ contra una de las alternativas


p₁ < p₂, p₁ > p₂ ó p₁ ≠ p₂.

Escuela de
Dos Muestras: Pruebas Sobre Dos Proporciones.

• La estimación combinada de la proporción p es:


𝑥1 + 𝑥2
𝑝ො =
𝑛1 + 𝑛2

donde x₁ y x₂ son el número de éxitos en cada


una de las muestras. El valor z para probar p₁ =
p₂ se determina:
𝑝Ƹ1 − 𝑝Ƹ 2
𝑧=
𝑝Ƹ ∗ 𝑞ො ∗ 1Τ𝑛1 + 1Τ𝑛2

Escuela de
Dos Muestras: Pruebas Sobre Dos Proporciones.

• Para la alternativa p₁ ≠ p₂ con un nivel de


significancia α, la región crítica es:
𝑧 < −𝑧𝛼Τ2 ó 𝑧 > 𝑧𝛼Τ2

• Para la alternativa p₁ < p₂ la región crítica será:


𝑧 < −𝑧𝛼

• Para la alternativa p₁ > p₂ la región crítica será:


𝑧 > 𝑧𝛼

Escuela de
Dos Muestras: Pruebas Sobre Dos Proporciones.

• Ejemplo.
• Una comunidad urbana quiere demostrar que la
incidencia de cáncer de seno es mayor en ella que en un
área rural vecina (Se encontró que los niveles de PCB son
más altos en el suelo de la comunidad urbana). Si se
encuentra que 20 de 200 mujeres adultas en la
comunidad urbana tienen cáncer de seno y 10 de 150
mujeres adultas en la comunidad rural tienen cáncer de
seno, podríamos concluir con un nivel de significancia de
0.05 que este tipo de cáncer prevalece más en la
comunidad urbana?

Escuela de
Evaluación de Normalidad.

• Se realiza una evaluación para determinar si los datos bajo


análisis se distribuyen de manera “normal”, es decir, datos
distribuidos normalmente alrededor de un valor central
(media).
• Al confirmar la normalidad de los datos, se facilita la
predictibilidad del comportamiento de la población de la cuál
provienen los datos.
• Facilita los cálculos de inferencias sobre la población.
• Prueba de Bondad de Ajuste, hipótesis:
H0: los datos se distribuyen de manera normal
H1: los datos no se distribuyen de manera normal

Escuela de
Evaluación de Normalidad.

• Evaluación inicial:
• Gráfico de Probabilidad Normal.
• Prueba de Bondad de Ajuste Anderson-Darling (AD).

Escuela de
Evaluación de Normalidad.

• Evaluaciones secundarias (si la evaluación inicial no


es concluyente, y no hay evidencia de error en los
datos – RCA):
• Prueba de Bondad de Ajuste Ryan-Joyner.
• Análisis de Asimetría / Kurtosis.
• Datos sesgados lejos de especificación unilateral.
• Datos exhiben un Factor de Seguridad Robusto de
especificaciones.

Escuela de
Preguntas,
Comentarios,
Gracias…
“Es tan vana la esperanza de que se llegará sin trabajo
y sin molestia a la posesión del saber y la experiencia,
cuya unión produce la sabiduría, como contar con una
cosecha donde no se ha sembrado ningún grano”.
Benjamín Franklin (Político, científico, inventor estadounidense. 1706 – 1790).

Escuela de

También podría gustarte