MAESTRIA EN GESTION INDUSTRIAL Y SISTEMAS PRODUCTUVOS
ESTADISTICA CARLOS O. SORIA TUBN
PAQUETE ESTADISTICO O SOFTWARE ESTADISTICO Conceptualmente, un paquete estadstico es un conjunto de programas informticos especficamente diseados para el anlisis estadstico de datos con el objetivo de resolver problemas de estadstica descriptiva, inferencial o ambos Un paquete estadstico es un programa informtico que est especialmente diseado para resolver problemas en el rea de la estadstica, o bien est programado para resolver problemas de esta rea. Existen muchos programas que no son especialmente estadsticos pero que pueden hacer algunos clculos aplicables en estadstica aplicada. Estos programas han impulsado y siguen impulsando enormemente la labor de los investigadores que desean utilizar la estadstica como apoyo en su trabajo. Los paquetes ms sencillos tienen interfaz por ventanas, lo que implica facilidad de uso y aprendizaje pero un mayor encorsetamiento a la hora de hacer clculos que el programa no tenga predefinidos. Los programas ms complejos suelen tener la necesidad de conocer su lenguaje de programacin, pero suelen ser mucho ms flexibles al poderse incluir en ellos funciones, tests o contrastes que no traen instalados por definicin. VENTAJAS La potencia de clculo de un ordenador puede ayudar a un investigador a realizar cientos o miles de contrastes de hiptesis en un tiempo muy reducido. Asimismo puede calcular decenas de modelos de regresin en un tiempo muy corto y despus quedarse con el ms apropiado de ellos. En problemas de investigacin de operaciones un programa estadstico es capaz de realizar miles de iteraciones por segundo de un algoritmo en el que una persona tardara varios minutos en cada una de ellas. Asimismo, es capaz de elegir entre miles de resultados posibles cul de todos ellos es el ptimo. Bsicamente, lo que permiten es resolver problemas de estadstica aplicada por fuerza bruta o por probar miles de combinaciones para quedarse finalmente con la que se crea que es la mejor para el uso DESVENTAJAS En los programas ms complejos se necesita tener conocimientos de programacin, as como para realizar los clculos ms laboriosos. Por ejemplo si se desea realizar una operacin dada a una columna concreta, lo ms frecuente es que se pueda hacer esto por ventanas, sin embargo, si deseamos hacer esto mismo para todas las columnas de nuestro documento, que pueden ser centenares, es posible que necesitemos programar un bucle en la sintaxis del programa. Otro inconveniente est en que en estadstica a menudo nos pueden salir resultados contradictorios entre tests distintos. Un programa informtico se dar cuenta de ello y nos avisar de algn modo, pero tendr que ser el usuario el que decida a cul de los test hacer caso, y esto en ocasiones es complejo, sobre todo si no se est familiarizado a fondo con la estadstica o se tiene poca experiencia. VARIABLES A TENER EN CUENTA ANTES DE ADQUIRIR O UTILIZAR UN PAQUETE O SFTWARE ESTADSTICO 1.- COSTO: Este es uno de los puntos ms importantes que hay que tocar al momento de elegir un Paquete Estadstico, desafortunadamente, el costo de sus licencias est fuera del alcance de la mayor parte de los usuarios y la obtencin de copias ilegales no es posible para muchos ni fcil en absoluto para ninguno. 2.- NIVEL DE SOFISTICACIN DEL USUARIO: Idealmente, ste debera ser un entendido en estadstica y tener ciertos conocimientos de programacin. En la medida que carezca de los segundos, tendr que renunciar a realizar por su cuenta cierto tipo de anlisis que vayan ms all de los ms comunes; y en tanto que carezca de los primeros, ser ms dependiente de aquellos paquetes con un interfaz ms informativo. 3.- TAMAO DEL CONJUNTO DE DATOS: En la mayor parte de los problemas -al menos, en lo que respecta a su nmero, no a su dificultad ni importancia- esta variable no supone ninguna restriccin significativa. De hecho, la mayora de los paquetes pueden manejar sin mayores problemas conjuntos de datos no excesivamente grandes. Slo cuando se rebasa cierto umbral es preciso considerar paquetes especficamente diseados para hacer frente a este tipo de condicionantes. 4.- GRADO DE INTENSIDAD COMPUTACIONAL: El incremento en la potencia computacional de los ordenadores permite hoy en da aplicar ciertas tcnicas estadsticas impensables hace unos aos y ampliar su campo de aplicacin a mbitos inasequibles para las tradicionales. Las tcnicas de re muestreo o de validacin cruzada, ciertos tests exactos y gran parte de las tcnicas exigen una enorme capacidad de clculo. No todos los paquetes estadsticos estn igualmente adaptados para este tipo de problemas. Con muchos de ellos -por ejemplo, Minitab, Stata y gran parte de los paquetes gratuitos- resulta simplemente imposible porque fueron diseados nicamente para implementar tcnicas tradicionales y carecen de un verdadero lenguaje de programacin asociado que resulte eficiente. 5.- ERGONOMA: Curiosamente, el aspecto que tal vez ms encarezca determinados paquetes estadsticos es el ergonmico: la posibilidad de contar con ayudas interactivas o tutoriales, de representar grficamente datos con un golpe de ratn, de exportar automticamente los resultados a formato .html o .pdf, etc. Bajo cierto punto de vista, el coste de las licencias es, de hecho, el costo de la impericia o la pereza. A la primera, en mercadotecnia, se la suele denominar productivity; a la segunda, learning curve. Es ms productivo y exige menor esfuerzo mental un paquete estadstico en que para imprimir no haya sino que pulsar el icono de la impresora, en que para visualizar unos datos baste con visitar el men Grficos o el Importar para leer datos de un fichero con el formato de cierta hoja de clculo. Este tipo de habilidades son realmente redundantes si se cuenta con un mnimo de habilidad y no se pretende escatimar un poco de esfuerzo: utilizando ficheros de texto como intermediarios, se pueden intercambiar datos con cualquier hoja de clculo o con otros programas que permiten manipular datos o grficos, gran parte de los cuales son de distribucin gratuita. 6.- FACILIDAD DE PROGRAMACIN: Si bien contar con lenguajes de programacin complejos no es lo deseable, si lo es disponer de la capacidad de generar programas sencillos tipo "batch files" que permitan realizar tareas de transformacin, clculo de datos, realizacin de pruebas estadsticas, generacin de nuevos archivos y documentos conteniendo resultados sin necesidad de estar digitando cada vez los comandos correspondientes, con el consiguiente ahorro de tiempo y esfuerzo. Programas estadsticos ms utilizados: R SAS SPSS Epi Info 7 SPAD Stata Statgraphics Redatam Minitab Matlab S-PLUS LISREL WinQSB Excel Existen multitud de paquetes informticos aparte es stos, tanto de software privado como de software libre, sin embargo, los ms utilizados son estos. A pesar de que SAS y SPSS suelen ser considerados los ms potentes, hay muchsimas empresas que utilizan programas mucho menos potentes como Excel. Esto se debe sobre todo a que su uso parece ms sencillo, la mayora de las personas estn familiarizadas con l y la mayor parte de las empresas ya tienen instalado Excel en sus ordenadores, mientras que las licencias de SAS y SPSS cuestan varios miles de dlares. Sin embargo, a nivel de investigacin estadstica se utilizan siempre paquetes estadsticos propiamente dichos ya que suelen tener una capacidad mucho mayor. FUNCIONES ESTADISTICAS EN EXCEL Las funciones Estadsticas sirven para realizar el anlisis de los datos almacenados en una hoja de clculo. Permitiendo por ejemplo obtener el nmero de entradas de datos o el valor promedio de los mismos.
La estadstica es una disciplina matemtica que estudia las formas de recopilar, resumir y sacar conclusiones de los datos. Las funciones estadsticas de Excel permiten realizar el anlisis estadstico de informacin, ya que este requiere de frmulas para obtener la media, varianza mediana, desviacin estndar y otras. Las principales funciones estadsticas comnmente utilizadas en Excel son: PROMEDIO, CONTAR, FRECUENCIA, MAX, MEDIANA, MIN y MODA El siguiente resumen muestra la lista de cules son las funciones estadsticas predefinidas en Excel. DESVPROM PROMEDIO PROMEDIOA PROMEDIO.SI PROMEDIO.SI.CONJUNTO DISTR.BETA DISTR.BETA.INV DISTR.BINOM DISTR.CHI PRUEBA.CHI.INV PRUEBA.CHI INTERVALO.CONFIANZA COEF.DE.CORREL CONTAR CONTARA CONTAR.BLANCO CONTAR.SI CONTAR.SI.CONJUNTO COVAR BINOM.CRIT DESVIA2 DISTR.EXP DISTR.F DISTR.F.INV FISHER PRUEBA.FISHER.INV PRONOSTICO FRECUENCIA PRUEBA.F DISTR.GAMMA DISTR.GAMMA.INV GAMMA.LN MEDIA.GEOM CRECIMIENTO MEDIA.ARMO DISTR.HIPERGEOM INTERSECCION.EJE CURTOSIS K.ESIMO.MAYOR ESTIMACION.LINEAL ESTIMACION.LOGARITMICA DISTR.LOG.INV DISTR.LOG.NORM MAX MAXA MEDIANA MIN MINA MODA NEGBINOMDIST DISTR.NORM DISTR.NORM.INV DISTR.NORM.ESTAND DISTR.NORM.ESTAND.INV PEARSON PERCENTIL RANGO.PERCENTIL PERMUTACIONES POISSON PROBABILIDAD CUARTIL JERARQUIA COEFICIENTE.R2 COEFICIENTE.ASIMETRIA PENDIENTE K.ESIMO.MENOR NORMALIZACION DESVEST DESVESTA DESVESTP DESVESTPA ERROR.TIPICO.XY DISTR.T DISTR.T.INV TENDENCIA MEDIA.ACOTADA PRUEBA.T VAR VARA VARP VARPA DIST.WEIBULL PRUEBA.Z
A continuacin una breve descripcin de las funciones estadsticas Excel. DESVPROM.- Devuelve el promedio de las desviaciones absolutas de la media de los puntos de datos. PROMEDIO.- Devuelve el promedio de sus argumentos. PROMEDIOA.- Devuelve el promedio de sus argumentos, incluidos nmeros, texto y valores lgicos. PROMEDIO.SI.- Devuelve el promedio (media aritmtica) de todas las celdas de un rango que cumplen unos criterios determinados. PROMEDIO.SI.CONJUNTO.- Devuelve el promedio (media aritmtica) de todas las celdas que cumplen mltiples criterios. DISTR.BETA.- Devuelve la funcin de distribucin beta acumulativa. DISTR.BETA.INV.- Devuelve la funcin inversa de la funcin de distribucin acumulativa de una distribucin beta especificada. DISTR.BINOM.- Devuelve la probabilidad de una variable aleatoria discreta siguiendo una distribucin binomial. DISTR.CHI.- Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribucin chi cuadrado de una sola cola. PRUEBA.CHI.INV.- Devuelve la funcin inversa de la probabilidad de una variable aleatoria continua siguiendo una distribucin chi cuadrado de una sola cola. PRUEBA.CHI.- Devuelve la prueba de independencia. INTERVALO.CONFIANZA.-Devuelve el intervalo de confianza de la media de una poblacin. COEF.DE.CORREL.- Devuelve el coeficiente de correlacin entre dos conjuntos de datos. CONTAR.- Cuenta cuntos nmeros hay en la lista de argumentos. CONTARA.- Cuenta cuntos valores hay en la lista de argumentos. CONTAR.BLANCO.- Cuenta el nmero de celdas en blanco de un rango. CONTAR.SI.- Cuenta el nmero de celdas, dentro del rango, que cumplen el criterio especificado. CONTAR.SI.CONJUNTO.- Cuenta el nmero de celdas, dentro del rango, que cumplen varios criterios. COVAR.- Devuelve la covarianza, que es el promedio de los productos de las desviaciones para cada pareja de puntos de datos. BINOM.CRIT.- Devuelve el menor valor cuya distribucin binomial acumulativa es menor o igual a un valor de criterio. DESVIA2.- Devuelve la suma de los cuadrados de las desviaciones. DISTR.EXP.- Devuelve la distribucin exponencial. DISTR.F.- Devuelve la distribucin de probabilidad F. DISTR.F.INV.- Devuelve la funcin inversa de la distribucin de probabilidad F. FISHER.- Devuelve la transformacin Fisher. PRUEBA.FISHER.INV.- Devuelve la funcin inversa de la transformacin Fisher. PRONOSTICO.- Devuelve un valor en una tendencia lineal. FRECUENCIA.- Devuelve una distribucin de frecuencia como una matriz vertical. PRUEBA.F.- Devuelve el resultado de una prueba F. DISTR.GAMMA.- Devuelve la distribucin gamma. DISTR.GAMMA.INV.- Devuelve la funcin inversa de la distribucin gamma acumulativa. GAMMA.LN.- Devuelve el logaritmo natural de la funcin gamma, G(x). MEDIA.GEOM.- Devuelve la media geomtrica. CRECIMIENTO.- Devuelve valores en una tendencia exponencial. MEDIA.ARMO.- Devuelve la media armnica. DISTR.HIPERGEOM.- Devuelve la distribucin hipergeomtrica. INTERSECCION.EJE.- Devuelve la interseccin de la lnea de regresin lineal. CURTOSIS.- Devuelve la curtosis de un conjunto de datos. K.ESIMO.MAYOR.- Devuelve el k-simo mayor valor de un conjunto de datos. ESTIMACION.LINEAL.- Devuelve los parmetros de una tendencia lineal. ESTIMACION.LOGARITMICA.- Devuelve los parmetros de una tendencia exponencial. DISTR.LOG.INV.- Devuelve la funcin inversa de la distribucin logartmico-normal. DISTR.LOG.NORM.- Devuelve la distribucin logartmico-normal acumulativa. MAX.- Devuelve el valor mximo de una lista de argumentos. MAXA.- Devuelve el valor mximo de una lista de argumentos, incluidos nmeros, texto y valores lgicos. MEDIANA.- Devuelve la mediana de los nmeros dados. MIN.- Devuelve el valor mnimo de una lista de argumentos. MINA.- Devuelve el valor mnimo de una lista de argumentos, incluidos nmeros, texto y valores lgicos. MODA.- Devuelve el valor ms comn de un conjunto de datos. NEGBINOMDIST.- Devuelve la distribucin binomial negativa. DISTR.NORM.-Devuelve la distribucin normal acumulativa. DISTR.NORM.INV.- Devuelve la funcin inversa de la distribucin normal acumulativa. DISTR.NORM.ESTAND.- Devuelve la distribucin normal estndar acumulativa. DISTR.NORM.ESTAND.INV.- Devuelve la funcin inversa de la distribucin normal estndar acumulativa. PEARSON.- Devuelve el coeficiente de momento de correlacin de producto Pearson. PERCENTIL.- Devuelve el k-simo percentil de los valores de un rango. RANGO.PERCENTIL.- Devuelve el rango porcentual de un valor de un conjunto de datos. PERMUTACIONES.- Devuelve el nmero de permutaciones de un nmero determinado de objetos. POISSON.- Devuelve la distribucin de Poisson. PROBABILIDAD.- Devuelve la probabilidad de que los valores de un rango se encuentren entre dos lmites. CUARTIL.- Devuelve el cuartil de un conjunto de datos. JERARQUIA.- Devuelve la jerarqua de un nmero en una lista de nmeros. COEFICIENTE.R2.- Devuelve el cuadrado del coeficiente de momento de correlacin de producto Pearson. COEFICIENTE.ASIMETRIA.- Devuelve la asimetra de una distribucin. PENDIENTE.- Devuelve la pendiente de la lnea de regresin lineal. K.ESIMO.MENOR.- Devuelve el k-simo menor valor de un conjunto de datos. NORMALIZACION.- Devuelve un valor normalizado. DESVEST.- Calcula la desviacin estndar a partir de una muestra. DESVESTA.- Calcula la desviacin estndar a partir de una muestra, incluidos nmeros, texto y valores lgicos. DESVESTP.- Calcula la desviacin estndar en funcin de toda la poblacin. DESVESTPA.- Calcula la desviacin estndar en funcin de toda la poblacin, incluidos nmeros, texto y valores lgicos. ERROR.TIPICO.XY.- Devuelve el error estndar del valor de y previsto para cada x de la regresin. DISTR.T.- Devuelve la distribucin de t de Student. DISTR.T.INV.- Devuelve la funcin inversa de la distribucin de t de Student. TENDENCIA.- Devuelve valores en una tendencia lineal. MEDIA.ACOTADA.- Devuelve la media del interior de un conjunto de datos. PRUEBA.T.- Devuelve la probabilidad asociada a una prueba t de Student. VAR.- Calcula la varianza en funcin de una muestra. VARA.- Calcula la varianza en funcin de una muestra, incluidos nmeros, texto y valores lgicos. VARP.- Calcula la varianza en funcin de toda la poblacin. VARPA.- Calcula la varianza en funcin de toda la poblacin, incluidos nmeros, texto y valores lgicos. DIST.WEIBULL.- Devuelve la distribucin de Weibull. PRUEBA.Z.- Devuelve el valor de una probabilidad de una cola de una prueba z. DIAGRAMA DE TALLO Y HOJAS El diagrama "tallo y hojas" (Stem-and-Leaf Diagram) permite obtener simultneamente una distribucin de frecuencias de la variable y su representacin grfica. Para construirlo basta separar en cada dato el ltimo dgito de la derecha (que constituye la hoja) del bloque de cifras restantes (que formar el tallo). Esta representacin de los datos es semejante a la de un histograma pero adems de ser fciles de elaborar, presentan ms informacin que estos. Ejemplos Horarios de trenes Edad de 20 personas Comparar dos distribuciones HORARIOS DE TRENES Basndome en un artculo de Juan C. Drsteler En InfoVis.net, tomamos como ejemplo un horario de trenes confeccionado a partir de un dptico de la lnea Castelldefels- Barcelona/Sants recogido en la estacin de Renfe. Originalmente el horario ocupa una tabla de 10 filas y 9 columnas ms una columna "viuda" con el tren de las 22:38. Un total de 91 campos con formato hh.mm cada uno, 455 caracteres. Dptico original Trayecto Castelldefels -> Barcelona-Sants 5.03 7.32 9.02 11.07 13.32 15.07 16.50 18.32 20.07 22.38 6.02 7.37 9.07 11.32 13.37 15.20 17.02 18.37 20.20 6.18 7.50 9.24 11.37 13.50 15.32 17.07 18.50 20.32 6.37 8.02 9.32 12.02 14.02 15.37 17.20 19.02 20.37 6.48 8.05 9.37 12.07 14.07 15.50 17.32 19.07 20.50 6.55 8.20 10.02 12.32 14.20 16.02 17.37 19.20 21.02 7.02 8.24 10.07 12.37 14.32 16.07 17.50 19.32 21.07 7.07 8.32 10.32 13.02 14.37 16.20 18.02 19.37 21.20 7.20 8.37 10.37 13.07 14.50 16.32 18.07 19.50 21.32 7.25 8.51 11.02 13.20 15.02 16.37 18.20 20.02 21.37 En el diagrama Stem & Leaf se representa la hora a la izquierda de la barra de separacin | y los minutos de la salida de cada tren a la derecha. La frecuencia de los trenes se deduce fcilmente de la longitud de las filas y es, adems, muy fcil ver en que minutos de cada hora pasan tpicamente los mismos. Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf 05 | 03 06 | 02 18 37 48 55 07 | 02 07 20 25 32 37 50 08 | 02 05 20 24 32 37 51 09 | 02 07 24 32 37 10 | 02 07 32 37 11 | 02 07 32 37 12 | 02 07 32 37 13 | 02 07 20 32 37 50 14 | 02 07 20 32 37 50 15 | 02 07 20 32 37 50 16 | 02 07 20 32 37 50 17 | 02 07 20 32 37 50 18 | 02 07 20 32 37 50 19 | 02 07 20 32 37 50 20 | 02 07 20 32 37 50 21 | 02 07 20 32 37 22 | 38 Por otra parte, dado que a algunas horas se repite exactamente el horario de los trenes se puede reducir an ms el tamao del grfico, sin perder informacin y ganando en claridad. Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf reducido
05 | 03 06 | 02 18 37 48 55 07 | 02 07 20 25 32 37 50 08 | 02 05 20 24 32 37 51 09 | 02 07 24 32 37 10 11 12 | 02 07 32 37 13 14 15 16 17 18 19 20 | 02 07 20 32 37 50 21 | 02 07 20 32 37 22 | 38 Al final tenemos 59 campos de 2 dgitos, 118 caracteres ms los separadores, es decir 4 veces menos dgitos que con el horario original, menos espacio y ms claridad. Esto nos da idea de que una disposicin apropiada de los datos puede ser doblemente informativa y que la representacin grfica puede contribuir enormemente a la percepcin de patrones y a la comprensin de la naturaleza de los fenmenos. EDAD DE 20 PERSONAS Supongamos la siguiente distribucin de frecuencias 36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Que representan la edad de un colectivo de N = 20 personas y que vamos a representar mediante un diagrama de Tallos y Hojas. Comenzamos seleccionando los tallos que en nuestro caso son las cifras de decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4. A continuacin efectuamos un recuento y vamos aadiendo cada hoja a su tallo
Por ltimo reordenamos las hojas y hemos terminado el diagrama
COMPARAR DOS DISTRIBUCIONES Podemos comparar, mediante estos diagramas, dos distribuciones. Supongamos una segunda distribucin
35 38 32 28 30 29 27 19 48 40
39 24 24 34 26 41 29 48 28 22
De ella podemos elaborar sus diagramas de Tallos y Hojas y compararla con la anterior.
MEDIDAS DE DISPERCION
Las medidas de dispersin nos resumen la informacin de la muestra o serie de datos, dndonos as informacin acerca de la magnitud del alejamiento de la distribucin de datos en relacin a un valor central o de concentracin de los datos
RANGO.- Rango no es ms que la diferencia entre el mximo y mnimo valor de una serie de datos y nos da una vaga referencia a la posible dispersin que se puede tener de los datos.
Frmula de Rango: Dato ms alto - Dato ms pequeo. ( X2 - X1 )
Interpretacin de Rango: El Rango lo podremos interpretar como la amplitud existente entre una serie de datos, es decir, mide cun lejos est el valor ms pequeo y el valor ms grande de la muestra o poblacin.
Ejemplo de Rango: Si tenemos una produccin de franelas y sabemos que diariamente se producen un promedio de 500 franelas, y si un da se produce un mnimo de 415 franelas y otro da se produce un mximo de 573 franelas entonces si vemos el RANGO de produccin estar entre 158 franelas, es decir, podemos tener una produccin de 158 franelas a partir del valor mnimo
DESVIACIN TPICA.- Es la Medida de Dispersin ms importante y de mayor utilidad prctica, se representa normalmente por el smbolo (sigma) y es la que mejor nos da una idea de la variacin de los datos respecto a algunas de las medidas de tendencia central o posicin. En otras palabras, es el nmero que nos dice cun alejado estn los datos del valor de centraje o posicin previamente obtenido.
Frmula de Desviacin Tpica:
Interpretacin de la Desviacin Tpica: Es una medida de distancia promedio de los valores observados a su media. La distancia de cada valor a la media se mide tomando el valor absoluto de la diferencia entre ese valor y la media, es decir, es la distancia de cada dato respecto a su promedio.
Ejemplo de la Desviacin Tpica: Por ejemplo, si tenemos una produccin de franelas y sabemos que diariamente se producen un promedio de 500 franelas, adicionalmente tenemos tambin que la desviacin es de 25 franelas, tendremos entonces una mejor comprensin del proceso pues este ltimo nmero nos indica que diariamente se producen entre 475 y 525 franelas.
VARIANZA.- es la Medida de Dispersin de los valores alrededor de la Media. Caracterstica de una muestra o poblacin que cuantifica su dispersin o variabilidad. La Varianza tiene unidades al cuadrado de la variable. Su raz cuadrada positiva es la Desviacin Tpica. Equivale a la dispersin respecto de la Media en una serie de datos contnuos.
Interpretacin de la Varianza: Esta medida carece de interpretacin.
Ejemplo de la Varianza: No tiene ejemplos didcticos, la Varianza es ms para fines tericos que prcticos. WEBGRAFIA http://www.cavsi.com/ funciones-estadisticas-excel http://estadisticaorquestainstrumento.wordpress.com/2012/11/30/tema-1-introduccion- a-la-estadistica/ http://es.wikibooks.org/wiki/Estad%C3%ADstica/Introducci%C3%B3n
COEFICIENTE DE VARIACIN.- Es en realidad una Medida de Dispersin relativa, pero de gran importancia, y de gran versatilidad, ya que su interpretacin est basada en porcentajes, y nos da la relacin existente entre la medida de posicin o centraje y su precisin. Se suele expresar en "tanto" por ciento.
Frmula del Coeficiente de Variacin:
Interpretacin del Coeficiente de Variacin: El Coeficiente de Variacin, mide la variabilidad relativa a la Media. Expresa la proporcin de variabilidad de una caracterstica por cada unidad de la Media.
Ejemplo del Coeficiente de Variacin: Sabemos que la fbrica de textiles produce 500 franelas diarias con una desviacin tpica de ms o menos () 25 franelas, entonces, el Coeficiente de Variacin ser 500/25 = 0,05, es decir, tenemos una variacin de 5% en la produccin diaria de franelas.
UTILIDAD DE LAS MEDIDAS DE DISPERCION
Las estadsticas bsicas nos permiten tener una visin del comportamiento de una serie de sucesos o eventos a los que denominamos "variables", as tenemos varias herramientas estadsticas como lo son la Media, la Mediana y la Moda. Pero estas Medidas no son suficientes, necesitamos conocer la variabilidad de los datos, es decir, cun parecidos son los datos reales en comparacin a las Medidas de Tendencia Central, para esto contamos con esta nueva herramienta: las Medidas de Dispersin, que no son otra cosa que indicadores de variabilidad y cuya importancia reside en la necesidad de tomar decisiones, basadas en estadsticas bsicas.
Por ejemplo, si tenemos una produccin de franelas y sabemos que semanalmente se producen un promedio de 500 franelas, podramos decir que todos los das se producen 100 franelas, pero nada nos garantiza eso porque podran producirse en slo dos das 250 franelas y el promedio semanal nos dara idntico, as si adicionalmente tenemos una Desviacin Estndar de 5 franelas, tendremos entonces una mejor comprensin del proceso, pues este ltimo nmero nos indica que semanalmente se producen entre 495 y 505 franelas, es decir, que diariamente s se deben producir aproximadamente 100 franelas.