Está en la página 1de 39

Tema 1 La estadstica: definiciones bsicas Deming: ahora se va a dar inicio al mdulo Medicin y mejora de los sistemas de gestin de la calidad

en el sector pblico. Se trabajar principalmente con la estadstica, que quiz, para algunos de ustedes es familiar; Nosotros, haremos que retome los conocimientos de la estadstica de manera amigable y agradable, pues solo as, podr ver lo til que resulta manejar sus herramientas.

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Chulo: Yo he escuchado que en la actualidad el uso de las herramientas estadsticas se hace cada da ms generalizado, especialmente para apoyar el seguimiento de la implementacin del sistema de gestin de calidad. Deming: Es correcto, todo el sistema de gestin de calidad debe medirse y controlarse y, no hay otra manera, que haciendo uso de dichas herramientas.

Chulo: Pero bueno, Qu es la estadstica? Deming: es un instrumento relativamente sencillo para tomar informacin, visualizarla, interpretarla, analizarla y tomar decisiones a tiempo. Sencillo, verdad? Chulo: Y desde hace cunto se utiliza la estadstica Deming: La estadstica fue primeramente un mtodo de descripcin de datos en los estados. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

El Estadstico se encarga del ordenamiento y manejo de datos presentndolos en tablas y grficos que facilitan el anlisis, para establecer conclusiones y recomendaciones para toma de decisiones oportunas

Ejemplos de estadstica

Fisher Ronald

Galton Francis (regresin)

Anlisis de varianza

QUESTELE, frecuencia relativa y probabilidad matemtica El Estadista es una persona versada en un negocio, conoce la evolucin diaria del pas en trminos de valores. Kart Pearson Fundo Dpto. de Estadstica U. Londres

DATO CURIOSO: Qu personaje de Colombia en recuerda usted que se haya hecho notar como estadista?

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Carlos Lleras Restrepo

Albero Lleras Camargo

Deming: El primer paso para poder hacer estadstica es la recopilacin de informacin, que debe ser bien recopilada en datos o variables y, presentadas de manera oportuna y correctas

Apreciado estudiante, le recomendamos ir al glosario para que pueda entender e identificar los trminos que se usarn de aqu en adelante. Variable: son los datos en trminos numricos
Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Variable Cuantitativa: Son aquellas que se pueden medir y de las que podemos esperar un resultado numrico, se pueden clasificar en discreta y continua Discreta: es aquella que se representa por nmeros enteros sin fracciones, como por ejemplo nmero de personas (128 personas), nmero de pupitres en el saln (35 pupitres), numero de cajas de 12 unidades, numero de hijos que tiene una familia, nmero de alumnos que tiene un saln de clase Continuas: Son aquellas que representan cantidades muy dispersas en valores fraccionarios como por ejemplo la edad (58, 6 aos), el peso (58,7 kilos), estatura (1,68 m). Variables Cualitativas: son aquellas que expresan distintas cualidades, caracterstica o modalidad, cada modalidad que se presenta se determina atributo. Atributos: cuando la verificacin de calidad no se puede medir en trminos de variables se usa el concepto de aceptada o rechazada, pasa o no pasa, defectuosa o no defectuosa, adecuada o inadecuada, el sistema de clasificacin es por intermedio de - sentidos humanos: vista, olfato, tacto, gusto, odo. - calibradores o galgas: pasa no pasa - Conteo: nmero de piezas malas en un lote.
Proceso: como defini en el mdulo uno, es un conjunto de actividades mutuamente

relacionadas que transforman entradas en salidas.

Control: todas aquellas actividades dirigidas a mantener un proceso en estado deseado. Es, tambin, la vigilancia peridica y continua sobre el desarrollo de un proceso o la calidad de un producto para comprobar que cumple con las especificaciones establecidas

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Apreciado estudiante: le sugerimos que vaya a la semana 3 del mdulo uno, all podr recordar lo concerniente a proceso. Por intermedio del control estadstico de los procesos se puede mantener el proceso dentro de normas establecidas. Deming: Hay un trmino muy importante que se debe tener en cuenta: Poblacin (se representa con la letra N); corresponde a la totalidad de los elementos que forman el universo de inters.; pertenecen a la poblacin todos aquellos elementos que poseen la caracterstica que se desea estudiar.

Chulo: y, A qu se le llama muestra? Deming: Cuando se presentan cantidades poblacionales resulta poco prctico y costoso analizar la totalidad de los elementos o partes que compone una dicha poblacin, es preferible seleccionar unas cuantas partes para estudiarlas. Estas partes o piezas seleccionadas generalmente de manera aleatoria se le llaman muestra.

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Hacer cuadro, fotografa de una poblacin y luego fotografa de una muestra Deming: La muestra (Se representa con la letra n), Est integrada por algunos elementos de la poblacin, estas muestras para efectos de anlisis estadstico debe cumplir con caractersticas como la de ser representativa de la poblacin. Chulo, eso quiere decir que, los elementos que la integran son escogidos de manera aleatoria o al azar, lo que significa que todos tienen la misma probabilidad de ser escogidos. Deming: Exacto! Decimos, entonces, que cuando no es fcil o posible observar a toda la poblacin, y se necesita tomar informacin para decidir o tener una evidencia que apoye una decisin, se debe extraer una o unas pocas muestras representativas de la poblacin. Chulo: Yo he escuchado hablar de la estadstica descriptiva, esto qu es. Deming: La estadstica descriptiva; es una parte de la estadstica que se dedica a analizar y representar los datos. Este anlisis es bsico, pero fundamental en todo estudio.

Deming: Para hacer un buen estudio con las herramientas que nos brinda la estadstica, es necesario conocer algunos trminos. Medidas de tendencia central: moda, mediana, media Medidas de dispersin o de variacin: rango, varianza y desviacin estndar Organizacin y procesamiento de datos: serie estadstica simple, agrupada en frecuencias y agrupada en clases Presentacin grfica de datos: histograma

Deming: Pasaremos a ver la aplicacin de estos trminos con un ejemplo. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Ejemplo. Las edades en trminos de variables discretas (aos completos) de un grupo de funcionarios de una entidad pblica son: 1. Recopilacin o tabulacin de la informacin: edades de funcionarios pblicos 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33 2. Organizar los datos de menor valor a mayor valor de cada variable discreta 24, 24, 28, 28, 29, 30, 33, 33, 33, 33, 33, 38, 38, 38, 38, 38, 45, 53, 55, 57, 57 3. Uso de la estadstica

Existen diferentes tipos de medidas de centralizacin, las ms comunes son la media, la Mediana y la Moda Deming: Vayamos contestando algunas preguntas y vamos avanzando en recordar estos tipos de medidas. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

3.1 Cuntos empleados se incluyeron en el estudio? 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33 Respuesta: 21 3.2 La edad ms frecuente: 33 aos es la moda (valor presentado con mayor frecuencia en una serie de datos) 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33 ^ Moda

Deming: La moda de una serie de nmeros es aquel valor que ms se repite, es decir, es el valor ms comn. La moda puede no existir, incluso si existe puede no ser nica. La moda se indica con ^X Ejemplo 1.1 El sistema de nmeros 3, 5, 6, 6, 7, 8, 9, 9, 9, 10, 11 Tiene de moda el 9 El sistema de nmeros 3, 5, 6, 7, 7, 7, 8, 8, 9, 9, 9, 10 Tiene dos modas: 7 y 9 Chulo: Eso quiere decir que, si se obtiene una sola moda es unimodal, si son 2 es bimodal y ms de 2 multimodal. Deming: Eso es correcto. 3.3 Cul fue el valor encontrado en la mitad de los datos? Respuesta: 33, esto es la mediana, que es el valor o variable medio de una secuencia de datos Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Para obtener la mediana, se ordenan los datos de menor a mayor, si el numero de muestras es par, la posicin de la mediana ser entre dos variables que corresponde a la posicin central, si N es impar la posicin de la mediana es la posicin media. La mediana es el conjunto de datos ordenados en orden de magnitud ya sea ascendente o descendente, el valor que ocupa la posicin central dentro del conjunto de datos (cuando se tiene un nmero impar de datos), o el promedio de los dos valores medios (cuando el nmero de datos es par) Ejemplo 1 Los nmeros 3, 4, 4, 5, 6, 7, 8, 8, 9, 10, 11 tiene de mediana el valor o variable 7 Ejemplo 2 Los nmeros 3, 4, 4, 5, 6, 7, 8, 8, 9, 9, 10 Su mediana ser (7 + 8) = 7.5

3.4 Cul es el valor promedio? Respuesta: edad promedio: 35.57 aos Esto es la media que es la suma de todos los valores de una variable especfica (en este caso edad) dividida por el total de datos Xi n La formula de la media es X

X De un conjunto de N nmeros X1, X2, X3,, XN, es el valor promedio de una muestra o poblacin y es igual a la suma del conjunto de datos dividido entre el nmero de datos Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

X = X1 + X2 + X3+...+ Xn = N Veamos otro ejemplo, la media de los nmeros 8 + 9 + 7 + 12 + 10 + 3 y 11 es X = 8 + 9 + 7 + 12 + 10 + 3 + 11 n 8.57 Donde (sigma mayscula / letra griega) significa sumatoria Xi: representa observaciones individuales n : es el nmero de observaciones Xi: 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33

La media se ilustra con una X y sobre ella una pequea lnea Xmedia = 773 21 Deming: Bueno ahora como hemos agrupado las diferentes edades que se repiten, esa repeticin es lo que se denomina frecuencia (fr) Agrupadas las edades multiplicamos cada edad (Xi) por las veces que se presentan (fr.) y tenemos el valor (fr. * Xi) 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33 Tabla agrupada en frecuencias = 36,8095 aos

Xi 24

frecuencia 2

fr. * Xi 48 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

28 29 30 33 38 45 53 55 57

2 1 1 5 5 2 1 1 1 21

56 29 30 165 190 90 53 55 57 773

Deming: Si sumamos los resultados de fr.*Xi da como resultado el total de edades, como cuando en un grupo de personas mayores alguien dice: Entre nosotros sumamos ms de 300 aos, as es, aqu entre todos suman 773 aos Chulo: (Asombrado) Uy! O sea que el promedio de 773 aos entre 21 funcionarios es de 36,809 aos Deming: Ojo! a propsito de los promedios, hay que tener cuidado, pues un valor muy alto o unos valores muy bajos, pueden dar resultados que deben analizarse antes de accionar; existe un ancdota interesante sobre el concepto de un promedio.

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

HISTORIA PARA ANALIZAR: Profundidad promedio de 70 centmetros En una oportunidad un joven de 1,58 m de estatura, estudiante de estadstica de una prestigiosa universidad, en sus vacaciones quiso conocer la belleza del llano, pues escuchaba el llano es lindo se dio al recorrido, pero ya estando en el llano, se encontr con que se termin la carretera, pues segua un ro, su situacin era muy difcil pues no sabia nadar y tenia que tomar la decisin de seguir adelante pasando el ro; en la orilla se encontraba un anciano se le acerco y le pregunto En promedio cunto tiene de profundidad el ro?, el seor anciano quien conoca el ro en pocas de verano y que tambin conoca de estadstica le respondi: El ro en promedio tiene 70 cm. de profundidad. El estudiante muy alegre por el dato que el anciano le haba dado, pues 70 cm eran una profundidad pasable, se dio a la tarea de pasar el ro, pero cuando iba bien adentro en el recorrido del ro, se encontr con una profundidad de 2,00 m y se ahog Charles Belt Little

Chulo: Pobre joven, no tuvo en cuenta que los valores de las medias de dispersin son mayores cuando estn muy disgregadas y son menores cuando los datos estn cercanamente agrupados 3.5 Qu tan separados estn los datos? Respuesta: 33, ya que la edad mayor 57 menos la edad menor 24 = 33. Esto se llama rango o amplitud. 3.6 Qu tanto estn separados los datos del promedio o media? Esto se obtiene con la desviacin estndar (S) que expresa que tanto se dispersan los datos en relacin a la media

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

La S es la medida de dispersin ms adecuada para la estadstica descriptiva. Es el valor de la raz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada valor

S=

1 xi x ) 2 ( n 1

Serie agrupada en clases Cuando la muestra est integrada por un nmero mayor de datos, estos datos se agrupan en subconjuntos o subclases. El nmero de clases o pisos o niveles (NC) se puede calcular NC = 1 + 3.3 log n (n es el tamao de la muestra)

Bueno no nos compliquemos la vida, el nmero de pisos o clases lo podemos determinar con base en el siguiente criterio entrenado Usted puede utilizar la tabla que relaciono a continuacin, es una gua que nos muestra para diferentes cantidades de datos, el nmero recomendado de clases a utilizar as Nmero de datos Menos de 50 50 - 100 101 - 250 Ms de 250 Nmero de clases (k) 5-7 6 - 10 7 - 12 10 - 20

Otra forma muy prctica es tomando la raz cuadrada del numero de muestras o elementos que componen la muestra de variables y aproximando el resultado al nmero entero inmediatamente superior Ejemplo n = 90 datos Raz cuadrada de 90 = 9, 4868 Nmero de clases 10 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Intervalo de clase IC es la diferencia entre el dato mayor (DM) y el dato menor (dm) de la serie dividida por el nmero de clase o pisos que se ha determinado con anticipacin Ejemplo: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos agruparlos en 8 niveles o nmeros de clase (NC) El intervalo de clase de cada nivel o piso es IC = DM - dm 8 niveles

IC = 57 24 21 IC = 4,125 Clase 1 2 3 4 5 6 7 8 valor base 24,000 28,126 32,251 36,376 40,501 44,626 48,751 52,876 IC 4,125 4,125 4,125 4,125 4,125 4,125 4,125 4,125 Inter. de clase 28,125 32,250 36,375 40,500 44,625 48,750 52,875 57,000

Observe usted que precisamente la informacin de las edades de los 21 funcionarios qued toda incluida en 8 niveles. Qu observa usted?

Que en la primera clase inicia con la menor edad 24 aos y se le agrega el intervalo de clase de 4.125 y se logra el primer rango o sea hasta 28,125

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Los siguientes niveles se va sumando el ndice de confianza, en este caso 4,125 al anterior mayor valor del rango y se le sigue sumando hasta llegar al valor de la variable mxima, en este caso 57,00 aos.

Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior y sumndole una unidad, o una centsima, o una milsima o valor que haga diferenciar del anterior rango

Tema 2

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Evolucin histrica de la Estadstica en su aplicacin de la calidad


Evolucin cronolgica De 1920 a 1930 Shewarth precursor que inicia a utilizar mtodos estadsticos en Bell Telephone En 1941 Harol Dodge y Henry Raming propusieron uso de tablas simplificadas de muestreo para inspeccin de entradas. En el ao 1950 Armand Feigenbaun, desarrolla el Control Total de Calidad (TQC), en el que se involucra a todos los integrantes de una organizacin En 1950 uno de los alumnos de Juran y de Deming, Genichi Taguchi hace aportes sobre Mtodos estadsticos Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

En el ao 1951, La revolucin de la calidad en el Japn, se establece el premio Deming de la Calidad, Deming propone Mtodos de muestreo y recomienda 14 principios sobre el uso de herramientas estadsticas y la calidad En 1955, Ishikawa difunde por primera vez en Japn el concepto de Grfico de Control. En 1962, Con Ishikawa aparece el Movimiento de los Crculos de Calidad (mejorar la calidad, estandarizar la operacin y lograr resultados significativos en la mejora de la calidad, reduccin de costos, productividad y seguridad) En 1968, Shigeo Shingo. El sistema de produccin de Toyota y el Justo a tiempo, el Kam-Ban, Poca -Yore, la Cultura de las Cinco Ss 1970, un comit de la Unin Japonesa de Cientficos e Ingenieros (JUSE) analizaron un gran conjunto de tcnicas herramientas y las denominaron las Siete Nuevas Herramientas de Gestin y Planificacin En 1971 Ishikawa expone una herramienta muy til, el Diagrama Causa-Efecto En 1979, Philip B. Crosby. Hacer bien las cosas a la primera vez, se le responsabiliza al operario acerca de la calidad y el debe llevar e interpretar las medidas y variables usando grficas de control En 1980 Creacin de grupos de trabajo, formacin para la calidad, Normas internacionales ISO 9000 En 1990, Globalizacin de la Calidad, Normas Automotrices QS 900, normas internacionales ISO 14000 y TQM (Total Quiality Management)

Tema 3

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Estadstica descriptiva
Distribucin de frecuencias Chulo: En este tema se trabajarn las frecuencias, absoluta, relativa y sus componentes Deming: lo primero que se debe hacer es determinar la frecuencia de cada clase (fr.), sumando de cada clase uno de los valores de la clase, as se construye una tabla de dos columnas, en la primera se relacionan las clases y en la segunda su frecuencia. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Chulo: Tenga en cuenta apreciado estudiante que existen dos tipos de frecuencias: relativas y acumuladas. Frecuencias relativas: cuando la frecuencia de cada valor o clase, llamada frecuencia absoluta (fr. abs.), se divide entre el nmero total de valores (N) se obtiene la frecuencia relativa (Fr. R) Se calcula con la ecuacin fr.R = fr. abs. Para proporciones y se multiplica por 100 para porcentaje N Fr.R= fr.abs. x 100 N

Frecuencias relativas acumuladas: se obtienen sumando las fr. de cada valor o clase y de las anteriores, las cuales pueden expresarse como proporcin (fraccin de 1) o porcentajes (%) Xi 24 28 29 30 33 38 45 53 55 57 Total frecuencia absoluta 2 2 1 1 5 5 2 1 1 1 21 frecuencia acumulada 2 4 5 6 11 16 18 19 20 21 frecuencia relativa 0,0952381 0,0952381 0,04761905 0,04761905 0,23809524 0,23809524 0,0952381 0,04761905 0,04761905 0,04761905 1,00000001 frecuencia Relativa acumulada 0,0952381 0,1904762 0,2380952 0,2857142 0,5238094 0,7619046 0,8571427 0,9047617 0,9523807 1 porcentaje % 9,52380952 9,52380952 4,76190476 4,761905 23,8095238 23,8095238 9,52381 4,761905 4,761905 4,761905 100,000001 grados ngulo 34,2857143 34,2857143 17,1428571 17,142858 85,7142857 85,7142857 34,285716 17,142858 17,142858 17,142858 360,000005

Bueno ya que llegamos a este punto y con base en este ejercicio, aprovechemos para ver las propiedades de las frecuencias, para cada propiedad usted mismo verifique su cumplimiento, si o no cumple. Propiedad Primera Segunda Tercera Cuarta Quinta Sexta Descripcin de la propiedad La suma de las frecuencias absolutas ordinarias es igual al tamao de la muestra La suma de las frecuencias relativas o porcentuales es igual a 1 o sea al 100% de las observaciones. Las frecuencias absolutas son siempre valores enteros. Las frecuencias relativas son siempre valores fraccionarios El ltimo valor de las frecuencias absolutas acumuladas es igual al total de las observaciones El ltimo valor de las frecuencias relativas acumuladas debe ser igual a 1 o el 100% de observaciones Cumple? Si Si, Si Si Si, Si,

Agrupada en clases Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Cuando la muestra est integrada por un nmero mayor de datos, estos datos se agrupan en subconjuntos o subclases El nmero de clases o pisos o niveles (NC) se puede calcular NC = 1 + 3.3 log n n es el tamao de la muestra Deming: Pero bueno, no nos compliquemos la vida, el nmero de pisos o clases lo podemos determinar con base en el siguiente criterio entrenado, o en la experiencia. Usted puede utilizar la siguiente tabla, es una gua que muestra para diferentes cantidades de datos, el nmero recomendado de clases o pisos a utilizar as. Nmero de datos Menos de 50 50 - 100 101 - 250 Ms de 250 Nmero de clases (k) 5-8 6 - 10 7 - 12 10 - 20

Otra forma muy prctica es tomando la raz cuadrada del numero de muestras o elementos que componen la muestra de variables y aproximando el resultado al nmero entero inmediatamente superior. Chulo: para la extraccin de la raz cuadrada puede utilizar la calculadora, que puede ser una barata. Ejemplo: n = 90 datos Raz cuadrada de 90 = 9, 4868 Nmero de clases 10 Deming: Ahora veremos el Intervalo de clase IC, el cual es la diferencia entre el dato mayor (DM) y el dato menor (dm) de la serie dividida por el nmero de clase o pisos que se ha determinado con anticipacin

Deming: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos agruparlos en 8 niveles o nmeros de clase (NC) Chulo: El intervalo de clase de cada nivel o piso es IC = DM - dm n 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33= 21personas IC = 57 24 21 IC = 4,125 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Clase 1 2 3 4 5 6 7 8 Deming: Qu observa usted? Chulo:

valor base 24,000 28,126 32,251 36,376 40,501 44,626 48,751 52,876

IC 4,125 4,125 4,125 4,125 4,125 4,125 4,125 4,125

Inter. de clase 28,125 32,250 36,375 40,500 44,625 48,750 52,875 57,000

Deming: Observe usted que precisamente la informacin de las edades de los 21 funcionarios qued toda incluida en 8 niveles.

Que en la primera clase inicia con la menor edad 24 aos y se le agrega el intervalo de clase de 4.125 y se logra el primer rango o sea hasta 28,125 Los siguientes niveles se va sumando el ndice de confianza, en este caso 4,125 al anterior mayor valor del rango y se le sigue sumando hasta llegar al valor de la variable mxima, en este caso 57,00 aos. Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior y sumndole una unidad, o una centsima, o una milsima o valor que haga diferenciar del anterior rango

Deming: Muy bien, ahora trabajemos la desviacin estndar Chulo: Qu tanto estn separados los datos del promedio o media? Deming: Esto se puede saber con la desviacin estndar (S) que expresa qu tanto se dispersan los datos en relacin a la media La desviacin estndar es la medida de dispersin ms adecuada para la estadstica descriptiva. Es el valor de la raz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada valor Chulo: Bueno nos tratamos de confundir verdad? Ser que lo podemos hacer ms fcil Deming: por supuesto, tomemos la frmula nos sirve y nos servir muchsimo.

S =

1 ( xi x ) 2 n 1

Deming: Con base en esta formula definamos la desviacin estndar, usted por su parte trate de definirla, no se la aprenda, analcela y entindala
Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Chulo: Es la raz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la media o promedio de todas las variables (X con palito), todo dividido por el nmero de las muestras.
Deming: Cuando la desviacin estndar es para poblacin se toma toda la cantidad como valor de n o sea el total de la poblacin Bueno sigamos con la misma informacin para calcular la desviacin estndar Xi 1 24 28 29 30 33 38 45 53 55 57 Sumatorias frec. absol fr. 2 2 2 1 1 5 5 2 1 1 1 21 fr. * Xi 3 48 56 29 30 165 190 90 53 55 57 773 (Xi-media) 4 -12,809 -8,809 -7,809 -6,809 -3,809 1,191 8,191 16,191 18,191 20,191 (Xi-media)2 5 164,070481 77,598481 60,980481 46,362481 14,508481 1,418481 67,092481 262,148481 330,912481 407,676481
fr.(Xi- Xmedia)2

6 328,140962 155,196962 60,980481 46,362481 72,542405 7,092405 134,184962 262,148481 330,912481 407,676481 1805,2381

Media = 773/21 = 36,809 Media = 36,809 (fr.(Xi-media)2)n-1 1805,2381/21-1 1805,2381/20 90,2619051 Raz cuadrada 9,5006 Desviacin estndar = 9,5 aos

Observemos los siguientes aspectos El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo, no es
para preocuparse cuando lo eleve al cuadrado quedar positivo (ver columna 5)

Estudiante, tenga en cuenta que para el ejercicio en particular las edades tomadas no es el de la totalidad de los funcionarios de la entidad sino que corresponde a unas muestras, por lo tanto as la cantidad de 21 es superior a 20, los resultados corresponden a unas muestras, por lo tanto se le descuenta una muestra, por eso el clculo de la desviacin se hizo con n= 20 (21 1)

Ahora, ya ha llegado a saber calcular la desviacin estndar, el resultado es 9,5 aos ese valor corresponde al valor de lo que est separado del promedio y corresponde a una sola desviacin
Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Una de las ventajas de la estadstica, es que debe ser fcilmente interpretada por las partes interesadas, la representacin grfica debe ayudar a cumplir con dicho objetivo, son varias las grficas que se recomiendan utilizar. Representacin grfica 1. Histograma de frecuencias o Diagrama de distribucin Estos diagramas constan de dos lneas: a. una llamada abscisa que normalmente corresponde a las variables de Xi b. otra llamada ordenada normalmente corresponde a las variables de Yi Volvamos a tomar la distribucin de frecuencias de la informacin de las edades de los funcionarios de una entidad pblica Para las edades de los 21 funcionarios lo tomamos como valores de Xi Para mostrar la cantidad de funcionarios de cada edad lo tomamos como valores de Yi Hacemos entonces la grfica EDADES Xi 24 28 29 30 33 38 45 53 55 57 Frecuencia Yi 2 2 1 1 5 5 2 1 1 1

Histograma
6 5 4 3 2 1 0 24 28 29 30 33 38 45 53 55 57 e Frecuencia

Chulo: Qu fcil de entender la informacin de manera grfica!

Verdad?

Ahora podemos observar con esta grfica que la mayora de los funcionarios estn en la edad de 33 aos y de 38 aos, se pueden hacer varios anlisis que facilitarn la toma de decisiones Chulo: sigamos aprovechando esta informacin para utilizar otra grfica u otras grficas: Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

2. La grfica de pastel o circular Como su nombre lo indica, haga de cuenta que el 100% de la informacin es el total del pastel, cada una de las edades tiene una frecuencia o cantidad de funcionarios que tienen esa edad y corresponde a un porcentaje del total

SERIE 1 2 3 4 5 6 7 8 9 10

EDADES Frecuencia Porcentaje 24 2 9,524 28 2 9,524 29 1 4,762 30 1 4,762 33 5 23,810 38 5 23,810 45 2 9,524 53 1 4,762 55 1 4,762 57 1 4,762

Porcentaje

9 4,762 8 4,762 7 9,524

10 4,762

1 9,524 2 9,524 3 4,762 4 4,762

6 23,810

5 23,810

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Deming: Cmo le parece? Verdad qu es una gran ayuda visual, es una herramienta que visualiza toda la informacin Usted puede tambin utilizar otras grficas como la de una barra horizontal donde muestra del total del 100% los diferentes porcentajes para cada edad

El anterior diagrama es poco utilizado, pero es muy prctico cuando en un informe ejecutivo a falta de espacio para hacer un histograma o un crculo llamado pastel, puede utilizar este diagrama Chulo: Es sper fcil!, adems, las grficas nos ayudan a comprender mejor la informacin.

Tema 4: Herramientas estadsticas para aseguramiento de la calidad

2 4 9 2 ,5

2 8 9 2 ,5

Deming: Estas herramientas, son muy sencillas y muy importantes, pocas de ellas son conocidas en la industria y menos en actividades de servicios, se trata de herramientas estadsticas y anlisis de uso general, tales como: a. Diagrama causa-efecto. b. Diagramas de Pareto Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

c. Diagramas de flujo de procesos d. Plantillas para recoleccin de datos. e. Control estadstico de procesos a. Diagramas de causa efecto Ley de Mecnica Clsica (Isaac Newton) A toda accin corresponde una reaccin Deming: En muchos casos se resuelven los problemas sin conocer las causas de los mismos y mucho menos, se tiene en cuenta a las personas que hacen los procesos, lo cual es una prctica perjudicial. El buen uso de esta herramienta corresponde a Administracin por causas vs. Administracin por efectos Para el buen uso de este diagrama se recomienda la prctica del Breakstorming, que corresponde a la participacin activa de todo el personal involucrado directa e indirectamente, donde con base en la grfica, previamente establecida, se va escuchando el comentario que va haciendo el personal, se plantean las causas y se van clasificando de acuerdo al grupo de una causa principal, lo ms comn es de acuerdo a las llamadas cinco Ms, que como que las rene o clasifica.

Las causas que potencialmente van generando un determinado efecto se presentan en forma jerarquizada. Este diagrama por su forma, se denomina, tambin, diagrama de espina de pescado

Deming: Los pasos para la construccin del diagrama espina de pescado son: Determinar claramente el efecto o problema a estudiar. Reunir a las personas que conocen del problema y realizar una lluvia de ideas. Seleccionar las causas aportadas por todos los participantes, relacionndolas en las causas principales, eliminando repeticiones(esto se puede hacer mediante tarjetas) Dibujar el diagrama resultante

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

b. Diagrama de Pareto Son representaciones de la densidad y la distribucin de variables aleatorias nominales, usualmente causas de falla en sistemas o, defectos en productos o servicios Las causas se ordenan de modo de distinguir cuales son las ms importantes. Deming: Usualmente opera la regla del 80 20, el 80% de los problemas se deben al 20% de las causas Chulo: Que conocimientos de estadstica tenemos que tener para disear una grfica de pareto 1. Recopilacin de la informacin sobre las diferentes causas o motivos de un problema, por ejemplo, los tipos de defectos por los cuales un producto es rechazado por mala calidad o en caso prctico, las causas por las cuales los funcionarios de una entidad dejaron de asistir al trabajo en los primeros seis meses del ao 2008. 2. Con base en la estadstica, relacione la frecuencia o repeticin de cada causa en un periodo determinado. 3. Organice las causas por orden de frecuencia o costos, pues tambin lo puede hacer por los costos que originan esas causas En desorden nmero 1 2 3 4 5 6 7 8 9 10 11 Causa ausencia Se enferm la suegra Se enferm un hijo Se enferm el perro Accidente casero Enfermedad de gripa Citacin juzgado Enfermedad migraa Inundacin de la casa Guayabo Robo en la casa Otros cantidad de casos 10 13 8 35 75 5 53 7 3 1 6

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Total

216

Chulo: Las causas estn en desorden con relacin a las frecuencias de ocurrencias Ahora hay que ordenar las causas de acuerdo al peso o cantidad de frecuencias. El tem otros debe ubicarse en el ltimo rengln, independiente de su magnitud de frecuencias o de costos, cuando se hace con costos. En orden

Numero causa 5 7 4 2 1 3 8 6 9 10 11

Causa Ausencia Enfermedad de gripa Enfermedad migraa Accidente casero Se enferm un hijo Se enferm la suegra Se enferm el perro Inundacin de la casa Citacin juzgado Guayabo Robo en la casa Otros

cantidad de casos 75 53 35 13 10 8 7 5 3 1 6 216

Total acumulado 75 128 163 176 186 194 201 206 209 210 216

frecuencia relativa 0,3472 0,2453 0,162 0,0602 0,04629 0,037 0,0324 0,02315 0,01389 0,004629 0,02778 0,999839

Composicin porcentual 34,72 24,53 16,2 6,02 4,629 3,7 3,24 2,315 1,389 0,4629 2,778 99,9839

Porcentaje acumulado 34,72 59,25 75,45 81,47 86,1 89,8 93,04 95,35 96,74 97,2 99,98

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

80 70 60 50 40 30 20 10 0

120 100 80 60 40 20 0
% Acumu

Tema 5: REGRESIN

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Deming: La magia de la estadstica radica en que se puede predecir un tiempo futuro a partir de unas variables conocidas en tiempo presente. Es decir, partiendo de datos conocidos o sea de aos ya pasados se puede calcular lo esperado en una fecha futura. Para empezar, se utilizan dos variables, X e Y como una relacin de tipo funcional; si la funcin que liga X e Y fuese de tipo lineal, responde a la forma general Y=aX+b a y b: son constantes que tienen un significado particular para analizar b: determina el punto donde la lnea corta al eje de las Y a: determina la pendiente de la recta a = n XY ( X) ( Y) (n x2) ( X)2 Si el resultado de a es negativo la tendencia es que X aumenta y, Y disminuye, o sea, es inversamente proporcional. Si el resultado de a es positivo la tendencia es que X aumenta y, Y aumenta. b=YaX n Deming: Observe el siguiente ejemplo para efectuar el clculo de una regresin. Supongamos que queremos analizar la variable Nivel de Colesterol con relacin a la edad de las personas, ajustndolo a un modelo lineal. Disponemos de 20 pacientes de quienes se ha registrado: Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Nivel de colesterol en plasma sanguneo (mg/100ml) Edad (aos) paciente Edad Colesterol n Xi Yi Xi * Yi 1 80 350 28000 2 30 190 5700 3 42 263 11046 4 50 320 16000 5 45 280 12600 6 35 198 6930 7 18 232 4176 8 32 320 10240 9 49 303 14847 10 35 220 7700 11 50 405 20250 12 20 190 3800 13 40 230 9200 14 30 227 6810 15 30 440 13200 16 23 318 7314 17 35 212 7420 18 18 340 6120 19 22 195 4290 20 41 223 9143 725 5456 204786

X2 6400 900 1764 2500 2025 1225 324 1024 2401 1225 2500 400 1600 900 900 529 1225 324 484 1681 30331

nX*Y (X)(Y) nX2 (X)2 a = a = b = b= b = b=

204786 3955600 606020 (725)2 (n(X*Y)-(X)(Y))/((nX2) - (X)2) 1,742894 ((Y) - (aX))/n) ((5456) - (1,74289446)(725))/20 4539.9 / 20 226,99

Cul ser el valor de colesterol para una persona de 61 aos, o sea el X es 61 aos y = aX + b y = aX + b 1,74 X, + b 1,74 * 61 + 226.99 y = aX + b 333,13 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Grfica

500 450 400 350 300 250 200 150 0 20 40 60 80 100 y = 1,73x + 210,09 R2 = 0,1172 Serie1 Lineal (Serie1)

Recomendacin: Cuando se tiene la informacin se debe presentar un informe que sirva para tomar decisiones, para lo cual se recomienda analizar los datos e investigar sobre el tema de la informacin, para nuestro caso: Colesterol es una grasa orgnica llamada liprotena de alta densidad o LDL, medicin que debe hacerse por lo menos una vez cada ao Los valores: Deseables debe ser < 130 mg/100 ml de sangre Riesgo potencial: 130 160 mg/100ml de sangre Riesgo alto: > 160 mg/100ml de sangre

HDL; Colesterol bueno, son los encargados de remover y retirar el exceso de colesterol LDL y llevarlo al hgado para su eliminacin. La relacin colesterol total dividida por el HDL debe ser inferior a 5 para estar exento de riesgo coronario Ejemplo: si se tiene un colesterol total de 260mg/100ml de sangre y un HDL de 30mg/100ml de sangre, su relacin o ndice (en la semana 3 desarrollaremos con mayor detalle el concepto de ndice) es 260/30 = 8,6 uno se encuentra en franco riesgo de sufrir un ataque cardiaco. Ojo Ataque cardiaco Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Se debe estar en valor inferior a 3 para estar libre de sufrir infarto Ejemplo, si se tiene un LDL de 130mg/ml de sangre y HDL de 45mg/100ml de sangre el ndice es de 2,88 se encuentra en que no se tiene mayor riesgo de sufrir un ataque cardiaco Chulo: Nos damos cuenta de la importancia de la estadstica y sobretodo de entender los resultados para tomar decisiones y sobre todo acciones a tiempo. Deming: La importancia de utilizar la regresin es muy grande, con ella puede el estadstico que somos nosotros encontrar valores del futuro o valores que no se tienen con el uso de valores conocidos, eso es buensimo! Chulo: Por ejemplo, se puede hacer proyeccin de produccin para un futuro con base en los datos conocidos y establecer presupuestos de recursos sabiendo los elementos que se necesitan para un solo producto, a esto se le llama explosin de materiales 4.1 Desviacin estndar Chulo: Recuerda lo que vimos anteriormente sobre el concepto de desviacin estndar?, bueno recordmoslo Deming: La desviacin estndar es la medida de dispersin ms adecuada para la estadstica descriptiva. Es el valor de la raz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada valor Deming: Para que lo entienda mejor, lo haremos ms fcil, tomemos la frmula

S=

1 i ) ( x x2 n 1

Deming: Con base en esta frmula definamos la desviacin estndar, haber usted por su parte trate de definirla, no se la aprenda, analcela, entindala Chulo: Es la raz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la media o promedio de todas las variables (Xi con palito), todo dividido por el nmero de las muestras.

Deming: La desviacin estndar es una medida del grado de dispersin de los datos del valor promedio. Dicho de otra manera, la desviacin estndar es, simplemente, el "promedio" o variacin esperada con respecto de la media aritmtica. Una desviacin estndar grande indica que los puntos estn lejos de la media, y una desviacin pequea indica que los datos estn agrupados cerca a la media.

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estndar son 7, 5 y 1, respectivamente. La tercera muestra tiene una desviacin mucho menor que las otras dos porque sus valores estn ms cerca de 7. Chulo: Cuando la desviacin estndar es para poblacin se toma toda la cantidad como valor de n Sigamos con la misma informacin para calcular la desviacin estndar Xi 1 24 28 29 30 33 38 45 53 55 57 Sumatorias frec. absol fr. 2 2 2 1 1 5 5 2 1 1 1 21 fr. * Xi 3 48 56 29 30 165 190 90 53 55 57 773 (Xi-media) 4 -12,809 -8,809 -7,809 -6,809 -3,809 1,191 8,191 16,191 18,191 20,191 (Xi-media)2 5 164,070481 77,598481 60,980481 46,362481 14,508481 1,418481 67,092481 262,148481 330,912481 407,676481 fr.(Xi-media)2 6 328,140962 155,196962 60,980481 46,362481 72,542405 7,092405 134,184962 262,148481 330,912481 407,676481 1805,2381

Media = 773/21 = 36,809 Media = 36,809 (fr.(Xi-media)2)n-1 1805,2381/21-1 1805,2381/20 90,2619051 Raz cuadrada 9,5006 Desviacin estndar = 9,5 aos Observemos los siguientes aspectos El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo, no es para preocuparse cuando lo eleve al cuadrado quedar positivo (ver columna 5) Chulo: Para el ejercicio en particular las edades tomadas no son de la totalidad de los funcionarios de la entidad, sino que, corresponden a unas muestras, por lo tanto, si la cantidad es 21 se le descuenta una muestra, por eso el clculo de la desviacin se hizo con n= 20 (21 1). Bueno ya hemos llegado a saber calcular la desviacin estndar, el resultado es 9,5 aos ese valor corresponde al valor de lo que est separado del promedio y corresponde a una sola desviacin Veamos una grfica de las desviaciones estndar bajo la curva normal

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

La informacin total de las variables se encuentra dentro de esta curva Media aritmtica, Xmedia + 1 S = 34,135 %; o sea cubre el 34,135% de todas las variables tomadas Media aritmtica, X media - 1S = 34,135 %; o sea cubre tambin el 34, 135 % de las variable Esto quiere decir que, si al valor del promedio le agregamos una desviacin y tambin le quitamos una desviacin, cubre todo un 68,27% de todas las variables, claro est que, eso sucede cuando la curva es completamente normal, es decir, que la mitad de la curva que tiene la forma de una campana, es exactamente igual a la otra mitad de la campana. Deming: Ahora cubramos dos desviaciones, vea la grfica de la distribucin que usted tiene atrs Media aritmtica, Xmedia + 2 S = 47,725 %; o sea cubre el 47,725% de todas las variables tomadas Media aritmtica, X media 2S = 47,725 %; o sea cubre el 47,725 % de las variables tomadas

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Esto quiere decir que si al valor del promedio le agregamos 2 desviaciones y tambin le quitamos dos desviaciones, cubre todo un 95,45% de todas las variables, claro est que eso sucede cuando la curva es completamente normal. Deming: Ahora con tres desviaciones, tanto a la izquierda como a la derecha de la media o sea del centro de la curva normal de forma de campana. Media aritmtica, Xmedia + 3 S = 47,725 %; o sea cubre el 49,865% de todas las variables tomadas Media aritmtica, X media 3S = 47,725 %; o sea cubre el 49,865 % de las variables tomadas Esto quiere decir que si al valor del promedio le agregamos 3 desviaciones y tambin le quitamos tres desviaciones, cubre todo un 99,73% de todas las variables, claro est que eso sucede cuando la curva es completamente normal. Deming: Como nos damos cuenta, queda un 0,27% por fuera del cubrimiento de control, esto es preocupante, pues cada da el cliente o los clientes tanto internos como externos son y deben ser ms exigentes. Deming: Por ejemplo, tenemos la necesidad de comprarle a la abuela un marcapasos cuyo tiempo esperado de que funcione es de diez aos. Hagamos el clculo de un error de 0,27% o sea que el marcapasos que le compramos a la abuela sea de los que quedaron por fuera de control o sea que tiene una probabilidad de error del 0,27% 10 aos x 365 das x 24 horas x 60 min. = 5256.000 minutos que se espera funcione correctamente De los 5256.000 minutos tenemos la probabilidad del 0,27% de que el marcapasos no funcione y eso corresponde a un tiempo de 236,52 horas o sea 9,85 das, y en esos das sin marcapasos la abuela se muri. Si usted hace reclamo ante la empresa que le vendi el marcapasos, el fabricante puede contestarle En la produccin de los marcapasos de hizo control de calidad y el rango de desviacin cubriendo tres desviaciones a la izquierda del valor nominal (valor exacto esperado) y tres desviaciones a la derecha del valor nominal, el control cubri el 99,73 de los marcapasos elaborados o sea que estuvimos muy de malas. Chulo: Verifiquemos a ver si la tendencia esperada se presenta en el ejemplo que estamos desarrollando. El promedio de las variables del caso que estamos desarrollando es X media = 36,809 y la desviacin estndar es igual a 9,5 aos Xmedia + 1S = 36,809 + 1(9,5) = 46,309 Xmedia 1S 36,809 - 1(9,5) = 27,308 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Preguntmonos entonces Cuntos funcionarios estn entre la edad de 27,308 y 46,309 aos Xi edad 24 28 29 30 33 38 45 53 55 57 frec. absol fr. 2 2 1 1 5 5 2 1 1 1 21

De acuerdo a la informacin recopilada en el cuadro anterior son 16 los funcionarios del total de 21 o sea 16/21 corresponde a un 76%; la tendencia para una distribucin completamente normal seria el 68,27 %, pero la distribucin nuestra no es completamente normal as que cumple la tendencia. Bueno!, una nueva pregunta cuntos funcionarios estn? , si a la informacin le agregamos y le quitamos al mismo momento dos desviaciones Xmedia + 2S = 36,809 + 2(9,5) = 55,08 aos Xmedia 2S 36,809 - 2(9,5) = 17,08 aos Los funcionarios que estn entre 17,08 y 55,08 aos son 20

Xi 24 28 29 30 33 38 45 53 55 57

frec. absol fr. 2 2 1 1 5 5 2 1 1 1 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Deming: El porcentaje de funcionarios que estn en este rango corresponden a 20 personas y esta cantidad corresponde a 20/21 = 95.2381%; el valor esperado para una distribucin completamente normal es de 95,45%, se cumple entonces la tendencia verdad? Bueno!, una tercer pregunta cuntos funcionarios estn? , si a la informacin le agregamos y le quitamos al mismo momento tres desviaciones Xmedia + 3S = 36,809 + 3(9,5) = 36,809 + 28.5 = 65,305 aos Xmedia 3S 36,809 - 3(9,5) = 7,59 aos Los funcionarios que estn entre 7,59 aos y 65,39 aos son todos o sea el 100% del total de funcionarios, el valor esperado era del 99,73% Chulo: Bueno hemos entendido verdad?

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

También podría gustarte