Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
Objetivo
Revisar los mtodo estadsticos descriptivos e inferenciales ms comunes para analizar la calidad de los procesos para una toma de decisiones informada y soportada por datos.
Contenido
Concepto de variabilidad y estadstica Elementos de la estadstica Medidas estadsticas Mtodos grficos Pruebas de hiptesis
Qu es la estadstica?
Es el arte de tomar decisiones acerca de un proceso o una poblacin con bases en un anlisis de la informacin contenida en una muestra tomada de tal poblacin.
Qu mide la estadstica?
Ubicacin
Consistencia
FO
R MA
Poblacin
El estudio estadstico involucra el estudio a un conjunto de personas o cosas.
Este conjunto es la poblacin.
Poblacin
Una poblacin puede ser finita o infinita. Ejemplo de poblaciones:
Los estudiantes de nuevo ingreso de la UANL en el ao 2012. Defectos encontrados en la lnea de ensamblaje de la empresa ACME.
Muestra
Subconjunto de elementos de una poblacin. Se desea que la muestra sea representativa de la poblacin.
Variacin
No existen dos hojas iguales en el mundo, la variacin es inevitable. Igual que las hojas, dos productos o servicios no son iguales, siempre existirn diferencias.
Variable Aleatoria
Variables y Atributos
Los caracteres de un elemento se pueden clasificar en dos clases
1. Variables cualitativas: se describen por medio de nmeros.
Discusin
En la empresa ACME midieron la altura en la que posicionaban las varillas en un proceso de soldadura, sin embargo definieron a esta variable como cuantitativa discreta, y el asesor de estadstica dijo que estaba bien como es posible, si la altura es una variable naturalmente continua, pues puede obtener cualquier valor entre cero e infinito?
Estadstico: medias que describen a una muestra. Tambin se les llama estimadores, porque su intencin es la de estimar el verdadero valor de los parmetros. Son representados por letras de nuestro alfabeto.
Ej. X, s, s2
Estadstica inferencial
Se encarga de emitir conclusiones sobre poblaciones usando los datos obtenidos de una muestra sacada de esa poblacin.
2 ,, Poblacin
Muestra
Frecuencia relativa
Representa la cantidad de datos en tantos por 1 o porcentaje de datos dentro de un conjunto con respecto al total.
Ejemplo
Valor 1 2 3 4 5 6 7 8 9 10 11 12 Suma:
Frecuencia Frecuencia Frecuencia Acumulada Relativa 8 8 0.125 14 22 0.219 12 34 0.188 8 42 0.125 6 48 0.094 4 52 0.063 3 55 0.047 3 58 0.047 2 60 0.031 2 62 0.031 1 63 0.016 1 64 0.014 64 1.000
Frecuencia Relativa Acumulada 0.125 0.344 0.532 0.657 0.751 0.814 0.861 0.908 0.939 0.970 0.986 1
Medidas estadsticas
Las medidas estadsticas permiten resumir la informacin de la muestra de datos para obtener un mejor conocimiento de la poblacin.
1. 2. 3. 4. Tendencia central Dispersin Locacin Simetra
Mediana
El punto central de los datos Los datos se ordenan del menor al mayor. La mediana ser el dato que este al centro. Si existen dos datos al centro se tomara promedio.
Moda
Es el valor que mas se repite en un conjunto de datos
Clculo de la Media
Valor Frecuencia 1 8 2 14 3 12 4 8 5 6 6 4 7 3 8 3 9 2 10 2 11 1 12 1 Suma: 64
Frecuencia Relativa 0.125 0.219 0.188 0.125 0.094 0.063 0.047 0.047 0.031 0.031 0.016 0.014 1.000
Frecuencia Relativa Acumulada 0.125 0.344 0.532 0.657 0.751 0.814 0.861 0.908 0.939 0.97 0.986 1
Moda
V X FR
0.125 0.438 0.564 0.5 0.47 0.378 0.329 0.376 0.279 0.31 0.176 0.168 4.113
Mediana
Histograma
16 14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10 11 12
Media
Medidas de dispersin
Rango
El mximo valor los datos menos el valor mnimo.
Cuartiles
Ordenados los datos de manera ascendente, el primer, segundo y tercer cuartil dividen en cuatro partes iguales el conjunto de datos.
Varianza de poblacin
Cuadrado de la desviacin media de los datos.
Desviacin estndar
Raz cuadrada de la varianza.
Rango
En un conjunto de mediciones, es la diferencia entre el valor mayor y el mejor de los datos. Es muy fcil de calcular engaarnos, ejemplo: 4,5,5,5,6,7,8,9,9,9 4,9,9,9,9,9,9,9,9,9 pero puede
Rango=9-4=5 Rango=9-4=5
Varianza
Varianza de la poblacin
Suma de las desviaciones cuadradas de la media por la frecuencia de ocurrencia
2 =
=1
2 =
2 =1 ( =1 )2
2 =
=1
Estimador de la varianza 2
Suma de las desviaciones cuadradas de la media entre los grados de libertad de la muestra (n-1)
2 =
=1
Desviacin Estndar
Desviacin estndar de la poblacin ( )
Es la raz cuadrada de la varianza de la poblacin, o sea:
= 2
s = 2
Desviacin Estndar
Medidas de localizacin
Cuartiles
Ordenados los datos de manera ascendente, el Primer, segundo y tercer cuartil dividen en cuatro partes iguales el conjunto de datos.
Percentiles:
Dividen a la poblacin en 100 partes iguales.
Cuartiles
Primer cuartil (Q1)
Punto abajo del cual se encuentra el 25% de los datos que han sido ordenados ascendentemente.
Percentiles
Datos en bruto
Densidad 4.5 3.8 7.6 3.5 7.8 5.6 4.6 3.5 6.7 9.1 7.6 4.8
i 1 2 3 4 5 6 7 8 9 10 11 12
Densidad Percentil 3.5 4.17 3.5 12.50 3.8 20.83 4.5 29.17 4.6 37.50 4.8 45.83 5.6 54.17 6.7 62.50 7.6 70.83 7.6 79.17 7.8 87.50 9.1 95.83
Medidas de forma
Asimetra o sesgo
Decimos que una distribucin es simtrica, cuando su media aritmtica y su moda coinciden.
Apuntamiento o curtosis
Miden que tantos datos estn agrupados alrededor de la moda.
Medidas de forma
Ejemplos de formas segn sus simetra:
Distribucin con sesgo a la izquierda: sesgo <0 Distribucin simtrica =0 Distribucin con sesgo a la derecha: sesgo >0
0 =
3 ( ) =1 = 3
Medidas de forma
Ejemplos de formas segn su curtosis
Leptocurtica
Apuntamiento mayor al de una distribucin normal (curtosis >1)
Mesocurtica
Apuntamiento similar al de una distribucin normal (curtosis=1)
Platicurtica
Apuntamiento menor al de una distribucin normal (curtosis<1)
Leptocurtica
Mesocurtica
Platicurtica
17
12 22 13 8 15 19 11
Total: N: Moda: Media: Sigma^2: Sigma: S^2: S: Mnimo: Primer Cuartil: Mediana: Tercer Cuartil: Mximo:
TOTAL
Respuesta
Estadstica Descriptiva: Das
Variable Das Variable Das N 40 Q3 40.00 Mean 33.25 Maximum 56.00 StDev 9.37 Range 40.00 Variance 87.88 Skewness 0.17 CoefVar 28.19 Kurtosis -0.32 Sum 16.00 Minimum 26.25 Q1Median 33.50
Qu ves en la figura?
Qu ves en la figura?
Qu ves en la figura?
Qu ves aqu?
Qu ves aqu?
Qu ves aqu?
Qu ves aqu?
Qu ves aqu?
Nombre de variable = 40
Cantidad de Datos
Unidad de medida de las hojas
Histograma
1. El primer paso para crear un histograma es dividir el rango de los datos en intervalos, tambin llamados intervalos de clase. De ser posible, hacer que los intervalos sean todos del mismo tamao. Generalmente entre 5 y 20 intervalos de clase son suficientes. La raz cuadrada de n nos puede servir de referencia para determinar la cantidad de intervalos. La altura de las barras corresponde a la frecuencia o cantidad de datos dentro de cada intervalo. Tambin puede utilizarse la frecuencia relativa.
2.
3.
4. 5.
6.
Diagrama de Caja
El valor Z
Poblacin
Muestra
El valor z no es mas que la cantidad de desviaciones estndares a la que se encuentre un dato de media. A la distribucin de los valores le llamamos distribucin normal estndar. Nos permite comparar elementos de distintas poblaciones entre si.
Ejercicio 4: Calcule Z
Tomando en cuenta los datos del ultimo ejercicio, calcule el valor z para de los valores 450, 438 y 431.
Tabla Z
reas bajo la curva normal estndar. Los valores de la tabla que no se muestran en negrita representan la probabilidad de observar un valor menos o igual a z. La cifra entera y el primer decimal de z se buscan en la primera columna, y el segundo decimal en la cabecera de la tabla.
P(Z z)=
z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4
0.00 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.9997
0.01 0.02 0.5040 0.5080 0.5438 0.5478 0.5832 0.5871 0.6217 0.6255 0.6591 0.6628 0.6950 0.6985 0.7291 0.7324 0.7611 0.7642 0.7910 0.7939 0.8186 0.8212 0.8438 0.8461 0.8665 0.8686 0.8869 0.8888 0.9049 0.9066 0.9207 0.9222 0.9345 0.9357 0.9463 0.9474 0.9564 0.9573 0.9649 0.9656 0.9719 0.9726 0.9778 0.9783 0.9826 0.9830 0.9864 0.9868 0.9896 0.9898 0.9920 0.9922 0.9940 0.9941 0.9955 0.9956 0.9966 0.9967 0.9975 0.9976 0.9982 0.9982 0.9987 0.9987 0.9991 0.9991 0.9993 50 0.9994 0.9995 0.9995 0.9997 0.9997
Segunda cifra decimal del valor de z 0.03 0.04 0.05 0.06 0.5120 0.5160 0.5199 0.5239 0.5517 0.5557 0.5596 0.5636 0.5910 0.5948 0.5987 0.6026 0.6293 0.6331 0.6368 0.6406 0.6664 0.6700 0.6736 0.6772 0.7019 0.7054 0.7088 0.7123 0.7357 0.7389 0.7422 0.7454 0.7673 0.7704 0.7734 0.7764 0.7967 0.7995 0.8023 0.8051 0.8238 0.8264 0.8289 0.8315 0.8485 0.8508 0.8531 0.8554 0.8708 0.8729 0.8749 0.8770 0.8907 0.8925 0.8944 0.8962 0.9082 0.9099 0.9115 0.9131 0.9236 0.9251 0.9265 0.9279 0.9370 0.9382 0.9394 0.9406 0.9484 0.9495 0.9505 0.9515 0.9582 0.9591 0.9599 0.9608 0.9664 0.9671 0.9678 0.9686 0.9732 0.9738 0.9744 0.9750 0.9788 0.9793 0.9798 0.9803 0.9834 0.9838 0.9842 0.9846 0.9871 0.9875 0.9878 0.9881 0.9901 0.9904 0.9906 0.9909 0.9925 0.9927 0.9929 0.9931 0.9943 0.9945 0.9946 0.9948 0.9957 0.9959 0.9960 0.9961 0.9968 0.9969 0.9970 0.9971 0.9977 0.9977 0.9978 0.9979 0.9983 0.9984 0.9984 0.9985 0.9988 0.9988 0.9989 0.9989 0.9991 0.9992 0.9992 0.9992 0.9994 0.9994 0.9994 0.9994 0.9996 0.9996 0.9996 0.9996 0.9997 0.9997 0.9997 0.9997
0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.9997
0.08 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.9997
0.09 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 0.9998
1. 2. 3. 4. 5. 6. 7.
La probabilidad de obtener valores menores a 150. La probabilidad de obtener valores mayores a 150. La probabilidad de obtener valores entre 135 y 165. La probabilidad de obtener valores entre 120 y 180. La probabilidad de obtener valores menores a 105. La probabilidad de obtener valores mayores a 195. La probabilidad de obtener 120.
Del Proceso A se obtuvo una pieza cuya caracterstica de calidad tenia valor de a = 13, y del proceso B se medio una pieza b = 2. Que pieza, a o b es mas representativa a la poblacin a la que pertenece?
Inferencia estadstica
Estudia como sacar conclusiones generales para toda poblacin a partir del estudio de una muestra de la misma. Existen dos formas para hacer inferencia estadstica:
Estimacin de parmetros (puntual o por intervalo). Las pruebas de hiptesis.
Estas tcnicas exigen que la muestra sea representativa de la poblacin, y para ello procuraremos que se haya tomado de manera aleatoria, donde cada dato de la poblacin tiene la misma probabilidad de pertenecer a la muestra.
Para calcular los parmetros necesitaramos todos los elementos de la poblacin, y como no es posible, nos limitamos a inferirlos a partir de una muestra.
2 = 1
Si x es el nmero de xitos en una poblacin que tiene distribucin Binomial con parmetros n y p, con p desconocida, una forma de estimar p es mediante:
=
1 =1
La nica forma de conocer el verdadero valor del parmetro es conociendo toda la poblacin, lo cual raramente se puede.
Una forma de tomar en cuenta el error de la estimacin es mediante la estimacin por intervalo.
El nivel de confianza indica la probabilidad de que el verdadero valor del parmetro poblacional se encuentre contenido dentro de los lmites expuestos.
IC 95% = 501.96
10
25
= 46.08, 53.92
Pruebas de hiptesis
La prueba de Hiptesis es un procedimiento estadstico usado para tomar una decisin, con base en una muestra, en cuanto al valor que puede tener algn parmetro (media, varianza, proporcin), so sobre la distribucin que puede tener la poblacin de donde provienen los datos
Pruebas de hiptesis
Los elementos de una prueba de hiptesis son: Las hiptesis. La que se desea probar (Ho) y su complemento (Ha). La(s) muestra(s). La informacin que se obtiene de la poblacin o poblaciones. El estadstico de prueba (EP). Es una variable aleatoria que resume la informacin de la muestra. La regin de rechazo de Ho. Es una parte de la distribucin de referencia en la cual si el EP se encuentra ah, se rechaza Ho. La decisin. Decidir si se rechaza o no a Ho. El nivel de confianza de la prueba (1-).
Tipos de error
Los tipos de errores y sus probabilidades son:
= P(Error tipo I) = P(rechazar Ho|Ho verdad) = P(Error tipo II) = P(aceptar Ho|Ho falso)
EP: =
IC=
2
Z=
EP:
t=
IC = ,1
2
IC = (1 2 )
2
2 1
+ 2
2
2
b1 ) 1 = 2
EP: t=
1 2 (1 2 )
IC= ,1+22
2
1 1
1
2
EP: t=
1 2 (1 2 )
2 2 1 + 2 1 2
2
IC= ,
2
2 1
+ 2
2
2
2 +( 1) 2 1 1 2 2
1 +2 2
gl=
1 2 2 2 (1 )2 (2 )2 1 + 2 1 1 2 1
( 1 + 2 )2
IC = (1 2 )
2
2 1
+ 2
2
2
b1 ) 1 = 2
EP: t=
1 2 (1 2 )
IC= ,1+22
2
1 1
1
2
EP: t=
1 2 (1 2 )
2 2 1 + 2 1 2
2 1 1 2
IC= ,
2
2
2 1
+ 2
2
2
2 +( 1) 2 1 1 2 2
1 +2 2
gl =
2 1 1
2 2 2 2
1 1
2 2 2
2 1
Hiptesis Estadsticas: H0 : = 0
H1 :
Regin de Rechazo de H0 > 0 --------------------- > < 0 --------------------- > 0 --------------------- > 2
Estadstico de Prueba:
+0.5 0 0 (10 ) 0.5 0 0 (10 )
, < 0 IC = 2 , > 0
(1)
EP: =
: 1 2 2
1 = 1
2 = 2
1+2
1 +2
PH e IC para varianzas
Hiptesis Estadsticas: H0 : 2 = 2 0 H1 :
Estadstico de Prueba: EP: =
1 2 , 2
Regin de Rechazo de H0
2 > 2 0 --------------- > 2 < 2 0 --------------- > 2 2 0 --------------- > /2
= 1
2 1 2 1 IC = 2 < 2 < 2 , 1 1 , 1 2 2
Estadstico de Prueba:
2 1 2 1 EP: F = 2 2 , = 1 1, 2 1 2 2 2 1 1 21 < 2 < 2 , 1 1, 2 1 2 , 1, 1 2 2 1 2 2
21 IC = 2 2
Grfica Cuantil-Cuantil
Salvo por la prueba de diferencia de proporciones, todas estas pruebas asumen que los datos provienen de una distribucin normal. Una forma rpida de validar si los datos provienen de una distribucin normal es mediante el uso de grficas cuantil-cuantil
Si la grfica muestra una lnea aproximadamente recta, se puede asumir que los datos tienen un comportamiento razonablemente normal.
Grfica Cuantil-Cuantil
1. 2. Ordenas los residuos del menor al mayor Calcular el valor del cuantil de cada dato usando la ecuacin = + 0.5 /, donde es la cantidad de observaciones con valores menores a la observacin , es la cantidad de empates con la observacin (si no hay empates = 1), es el total de datos. Calcular el cuantil de una distribucin normal estndar usando como probabilidad acumulada, es decir, obtener el valor que cumple = , donde ~ 0,1 Estimar la media y la desviacin estndar de los datos originales. Calcular = Graficar vs.
2.5
1.5
3.
4. 5. 6.
-1.5
-2
qi
2.
3.
4.
5.
2.
3.
4.
5.