Está en la página 1de 73

Inferencia Estadística sobre la Calidad

del Producto y del Proceso


4–1
Rol de la Estadística

Métodos Información Decisiones


Estadísticos Útil y Acciones

Datos Mejorar
Proceso

PROCESO

ESTADISTICA  MEJORAMIENTO
Estadística es acerca de convertir datos en conocimiento
Conocimiento nos ayuda a tomar buenas decisiones para mejorar un proceso
4–2
4–3
Describir Distribuciones
Variación de Probabilidad

La Distribución Inferencia
Normal Estadística
Tópicos

Inferencia Inferencia
Estadística para Estadística para
Una Muestra Dos Muestras

4–4
Describir Variación

4–5
Gráfico Tallo y Hoja
 Gráfico basado en texto.

 Tallo:
 Ancho del gráfico. Contiene los dígitos para los datos.

 Hoja
 Puntos individuales de los datos.

4–6
Ejemplo de Tallo y Hoja

4–7
Percentiles

Definición Valores Comunes


 Un valor tal que un x% de  10mo percentil
los datos caen bajo este
punto y un 100-x% están en  25avo percentil (1er cuartil – Q1)
o arriba de este punto.  50avo percentil (mediana – Q2)

 75avo percentil (3er cuartil – Q3)

 Rango Intercuartil (IQR) =


 75avo percentil – 25avo
percentil.

4–8
Ejemplo : Calcular Percentiles
Orden Valor 10th percentil: Orden = .1(10) + .5 = 1.5
Valor = Prom (2,4) = 3
1 2
2 4 25th percentil: Orden = .25(10) + .5 = 3
Valor = 6
3 6
4 8 50th percentil: Orden = .5(10) + 0.5 = 5.5
Valor = Prom (10, 12) = 11
5 10
6 12 Median : Orden = (n+1)/2 = (11/2) = 5.5
7 14 Valor = Prom (10,12) = 11

8 16 75th percentil: Orden = .75(10) + .5 = 8


9 18 Valor = 16

10 20 Rango Intercuartil = 75th – 25th


16 – 6 = 10
4–9
Gráfico de Series de Tiempo

4 – 10
Histograma
 Usado para describir datos
gráficamente.

 Los datos se agrupan en


clases y se reporta la
frecuencia por cada clase.

 El número de clases debe ser


aproximado a la raíz cuadrada
del número de
observaciones.

4 – 11
Histograma con Datos Categóricos
 ¿Qué conclusiones se pueden obtener del histograma mostrado?

4 – 12
Resúmenes Numéricos de Datos

 Media Muestral
 Medida de tendencia central

x  x  x  x
n

x 1

2 n i 1 i

n n

4 – 13
Un error de concepto
¿Son la media y la mediana
iguales?

NO!!!!!

4 – 14
Ejemplos
Distribución A Distribución B
Prom = 100, Mediana = 100 Prom =100, Mediana = 96

4 – 15
Ejemplo 4.4 – Contribuciones a la
Campaña
 Candidato A
Contribución Promedio = $1200
Contribución Mediana = extremo superior de la categoría de menos de $200.

 Candidato B
Contribución Promedio = $1600
Contribución Mediana = extremo superior de la categoría de $500 - $999.

4 – 16
Desviación Estándar de la Muestra
 Describe qué tanta variabilidad (o dispersión) hay en los
datos.
 Una varianza pequeña, indica que la mayoría de los datos están
localizados cerca de la media.
 Una varianza grande indica que los datos están dispersos.

  xi  x 
n
2

s i 1

n 1
4 – 17
Coeficiente de Variación
Desviación Estándar
Coeficient e de Variación 
Media

 Describe la dispersión de la desviación estándar con respecto a la


media.

 Caso 1 – No hay variabilidad


 Coeficiente de variación = 0/10 = 0

 Caso 2 – Un poco de variabilidad


 Coeficiente de variación = 3/10 = 0.3

 Caso 3 – Un poco más de variabilidad


 Coeficiente de variación = 6/10 = 0.6

Conforme la variación aumenta, el coeficiente de variación también aumenta.


4 – 18
Gráfico de Caja
Gráfico que ilustra:
• Mediana

• 1er cuartil

• 3er cuartil

• Atípicos (Outliers)

4 – 19
Gráfico de Caja

4 – 20
4 – 21
Describir Distribuciones
Variación de Probabilidad

La Distribución Inferencia
Normal Estadística
Tópicos

Inferencia Inferencia
Estadística para Estadística para
Una Muestra Dos Muestras

4 – 22
Distribuciones de Probabilidad
Un modelo matemático que relaciona el valor de la
variable con la probabilidad de ocurrencia dentro de la
población.
Continua Discreta

 Cuando la variable puede ser  Cuando la variable puede solo


expresada en una escala tomar ciertos valores.
continua.

 Ejemplos:  Ejemplos:
 Largo  Enteros (0,1,2,3)
 Espesor  Conteo de artículos
 Peso  Género
 Resistencia  Acepta/Rechaza
4 – 23
Tipos de Distribuciones

Continua Discreta

4 – 24
4 – 25
Muestra vs. Población

4 – 26
Describir Distribuciones
Variación de Probabilidad

La Distribución Inferencia
Normal Estadística
Tópicos

Inferencia Inferencia
Estadística para Estadística para
Una Muestra Dos Muestras

4 – 27
La Distribución Normal  N (μ, 2)

4 – 28
Las Tres Zonas
 Zona 1: m +/- 1
68.26% de los datos se esperan
contener dentro de una
desviación estándar de la
media.

 Zona 2: m +/- 2
95.46% de los datos se esperan
contener dentro de dos
desviaciones estándar de la
media.

 Zona 3: m +/- 3
99.73% de los datos se esperan
contener dentro de tres
desviaciones estándar.

4 – 29
Ecuación de la Distribución Normal

4 – 30
El Valor Z - Estandarizar
 En esta ecuación, m es la
media,  es la desviación
estándar, y x es un valor que nos
gustaría evaluar.

 x-m calcula que tan lejos se


está de la media.

 Cuando se divide por , se


está calculando cuantas
desviaciones estándar se está de
la media.

4 – 31
Ejemplo 4.7

4 – 32
Leyendo una Tabla Z
Un Z de 0.00 está en el centro de la tabla. Este es el percentil 50avo.
Valores de Z menores que 0 son del percentil 0-50avo. Valores Z sobre 0
son del 50-99.9999avo percentil. Un Z de 1.6 es el percentil 94.520avo .

4 – 33
Calculando Probabilidades para una
Distribución Normal
 Tres casos:
1. Probabilidad de ser menor que un valor dado.

2. Probabilidad de ser mayor que un valor dado.

3. Probabilidad de estar entre dos valores.

4 – 34
Teorema del Límite Central – TLC
 Uno de los resultados más importantes en estadística. Nos
permite aplicar muchas técnicas estadísticas a los datos que no
son distribuidos normalmente!

E(x )  m x 
n

4 – 35
Ejemplo del TLC

4 – 36
Gráficos de Probabilidad Normal
 Usado para ver si los datos
son o no distribuidos
normalmente. (los puntos de
los datos son graficados
contra percentiles
anticipados).

 Idealmente, los datos deben


estar en una línea recta. Ver
valor P.

 Los gráficos pueden ser


construidos con software
estadístico o a mano.

4 – 37
Describir Distribuciones
Variación de Probabilidad

La Distribución Inferencia
Normal Estadística
Tópicos

Inferencia Inferencia
Estadística para Estadística para
Una Muestra Dos Muestras

4 – 38
4 – 39
El Valor P
 El valor P representa la probabilidad de que la estadística de prueba tome un valor
al menos tan extremo como el valor observado en ella cuando Ho es verdadera.

 Representa el nivel de significancia () mas pequeño que conduciría al rechazo de


Ho.

 Se acostumbra calificar como significativa a la estadística de prueba (y los datos)


cuando se rechaza la hipótesis nula Ho, por lo que podemos considerar el valor P
como el nivel  mas pequeño en el que los datos son significativos.

 El Valor P es usado para determinar si existe suficiente evidencia para rechazar la


hipótesis nula en favor de la alternativa.

 El valor P es la probabilidad de rechazar incorrectamente la hipótesis nula.


Regla General de Decisión:
 Si Valor P ≥ , Acepte H0

 Si Valor P < , Rechace H0


4 – 40
Inferencia Estadística
 Son técnicas que permiten obtener conclusiones sobre los datos
que han sido recolectados. Ya que nunca sabremos con certeza
absoluta (a menos que se recolecta toda la población), entonces
se toman dos tipos de error.

 Error Tipo I: Error de Exclusión:


Ocurre cuando se concluye que un conjunto de datos no cumple
un criterio dado aunque lo hace.

 Error Tipo II: Error de Inclusión:


Ocurre cuando se concluye que un conjunto de datos cumple un
criterio dado aún cuando no lo hace.

4 – 41
El Intervalo de Confianza
Intervalo de Confianza

 Un intervalo construido
alrededor de un parámetro
de una distribución.

 En este caso, un intervalo es


construido alrededor de la
media muestral usando la
distribución muestral para
capturar un % de la
distribución.

4 – 42
Describir Distribuciones
Variación de Probabilidad

La Distribución Inferencia
Normal Estadística
Tópicos

Inferencia Inferencia
Estadística para Estadística para
Una Muestra Dos Muestras

4 – 43
Intervalo de Confianza
 Interpretación de un Intervalo de Confianza (IC)
 Un intervalo de confianza es un intervalo aleatorio que cubre el parámetro con una
probabilidad específica, o sea, un IC del 95% en la media de una distribución normal,
es un intervalo tal que si se toman muchas muestras de la población, un 95% de los
IC construidos incluirían el valor verdadero de la media.

 Invalidez de un IC
 Un IC no es válido si las muestras no sean muestras aleatorias.

 Intervalo de Confianza Bilateral


 El riesgo se distribuye igualmente en ambos lados. Por ejemplo, un intervalo de
confianza del 90% sería diseñado para excluir el 5avo percentil inferior y el 95avo
percentil y hacia arriba (un total del 10%).

 Intervalo de Confianza Unilateral


 El riesgo es concentrado en un lado, por ejemplo, un IC del 90% superior excluiría el
percentil 90avo y hacia arriba (10%).

4 – 44
IC para la media cuando n > 30 datos
( conocido)

4 – 45
Ejemplo 4.11

4 – 46
IC para la media cuando n < 30
( desconocido)
 Cuando hay disponibles menos de 30 datos, se necesita hacer un
ajuste para tomar en cuenta el hecho que hay pocos datos y que
los mismos no capturen atípicos.

 La distribución t acomoda esto e incluye el número de datos (n)


cuando determina el valor t.

4 – 47
IC para la media cuando hay disponibles
menos de 30 datos

4 – 48
Leyendo una tabla t
Para encontrar el valor t correspondiente al 5% y 9 grados de libertad,
busque en la columna de 0.05 y la fila de 9. El valor es 1.833.

4 – 49
Ejemplo 4.12

4 – 50
IC para Proporciones
 Los intervalos de confianza pueden también ser calculados para
una proporción de una población, p.

 La formula mostrada es solo aplicable cuando hay más de 30


datos y la proporción es mayor que 10%.

4 – 51
Ejemplo 4.13

4 – 52
IC para Varianzas
 Varianza: La varianza es la raíz cuadrada de la desviación estándar.

 Al reducir la variabilidad, se puede recibir ganancias significativas al


tener un proceso más consistente.

 Los IC son usados para describir la varianza asociada con varios


procesos.

4 – 53
IC para Varianzas
 La distribución chi-cuadrada
no es simétrica y su forma
depende del número de
grados de libertad.

4 – 54
Leyendo una tabla Chi-cuadrado
Para encontrar el valor chi-cuadrado correspondiente al 5 % y 95% con
nueve grados de libertad. Se busca en la columna de 0.05 y 0.95 y se
haya el valor correspondiente . Los valores son 16.92 y 3.33,
respectivamente.

4 – 55
Ejemplo 4.14

4 – 56
Ejemplo 4.14

4 – 57
Describir Distribuciones
Variación de Probabilidad

La Distribución Inferencia
Normal Estadística
Tópicos

Inferencia Inferencia
Estadística para Estadística para
Una Muestra Dos Muestras

4 – 58
Inferencia Estadística para
Dos Muestras
 Cuando se compara dos
artículos diferentes o grupos,
se desearía determinar si son
los mismos o si son
diferentes.

 Los IC numéricamente toman


en cuenta la variabilidad en
los dos grupos y e hecho que
el número de datos puede
ser diferente.

4 – 59
IC para las diferencias en las medias
cuando n > 30
 Cuando se desea comparar dos poblaciones y se tiene mas de 30
datos en cada población, entonces el intervalo de confianza para
la media cambia de:

a:

4 – 60
Ejemplo 4.15

4 – 61
Ejemplo 4.15

4 – 62
IC para la diferencia en las media
cuando se tiene n < 30
 Cuando se tienen menos de 30 datos en cada población, se
utilizan multiplicadores de la distribución t.

 El IC para la media cambia de:

a:

4 – 63
Ejemplo 4.16

4 – 64
IC para la Diferencia de Proporciones
 IC pueden también ser creados para las diferencias en
proporciones de poblaciones, p.

 La formula mostrada es aplicable cuando hay más de 30 datos


disponibles.

4 – 65
Ejemplo 4.17

4 – 66
IC para la Razón de Dos en Varianzas
 Cuando la diferencia en varianzas es evaluada, la diferencia como
una razón de la varianza de la población 1 a la población 2 es
calculada.

 Si son iguales, entonces la razón debe ser igual a 1. Esto permite el


uso de la distribución F donde una variable aleatoria F es la razón
de dos desviaciones estándar muestrales.

4 – 67
Ejemplo 4.18

4 – 68
Relación entre IC y Pruebas de Hipótesis
 Los IC se han usado para realizar pruebas de hipótesis.

 También es posible obtener tales conclusiones usando estadísticos


formales de prueba y valores p.

 EL IC da un rango dónde el parámetro es probable que se


encuentre. Esto ayuda en mucha situaciones.

 El método formal de hipótesis da mas estructura y un poco más


de información a través del valor p.

4 – 69
Ejemplo 4.19

4 – 70
Ejemplo 4.19

4 – 71
Ejemplo 4.19

4 – 72
Ejemplo 4.19

4 – 73

También podría gustarte