Está en la página 1de 49

1-1

Universidad Catlica de Santa Mara


Programa Profesional de Ingeniera Industrial

Control de Procesos Descripcin de los datos: Medidas de tendencia central y Medidas de Dispersin

Medidas de Tendencia Central

Un nico valor que resume un conjunto de datos. Seala el centro de los valores. Las medidas de tendencia central de comn uso son: La media aritmtico La mediana La moda

Media de la poblacin

Para datos no agrupados, la media de la poblacin es la suma de todos los valores en ella dividida entre el total de valores en la poblacin:

= X / N

donde representa la media de la poblacin. N es el nmero total de elementos en la poblacin. X representa cualquier valor en particular. indica la operacin de sumar.

3-3

EJEMPLO 1

Parmetro: cualquier caracterstica medible de una poblacin es un parmetro. La familia Kiers posee cuatro carros. Los datos son las millas recorridas por cada uno: 56 000, 23 000, 42 000 y 73 000. Encuentre el promedio de millas de los cuatro carros. Esto es (56 000 + 23 000 + 42 000 + 73 000)/4 = 48 500

3-4

Media de una muestra

Para datos no agrupados, la media de una muestra es la suma de todos los valores divididos entre el nmero total de los mismos:

X = X / n
donde X denota la media muestral n es el nmero total de valores en la muestra.

EJEMPLO 2
Dato estadstico: se llama as a cualquier medida basada en datos muestrales Una muestra de cinco ejecutivos recibi la siguiente cantidad en bonos el ao pasado: $14 000, $15 000, $17 000, $16 000 y $15 000. Encuentre el promedio en bonos para los cinco ejecutivos. Como estos valores representan la muestra de 5 ejecutivos, la media de la muestra es (14 000 + 15 000 + 17 000 + 16 000 + 15 000) / 5 = $15 400.

Propiedades de la media aritmtica


Todo conjunto de datos de nivel de intervalo y de nivel de razn tiene un valor medio. Al evaluar la media se incluyen todos los valores. Un conjunto de valores slo tiene una media. La media es una medida muy til para comparar dos o ms poblaciones. La media es la nica medida de ubicacin donde la suma de las desviaciones de cada valor con respecto a la media, siempre es cero.

EJEMPLO 3

Considere el conjunto de valores: 3, 8 y 4. La media es 5. Para ilustrar la quinta propiedad, (3 - 5) + (8 - 5) + (4 - 5) = - 2 + 3 1 = 0. En otras palabras,

( X X ) = 0
La media es afectada de modo notable por valores extraordinariamente grandes o pequeos

Mediana

Mediana: es el punto medio de los valores despus de ordenarlos de menor a mayor, o de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella. Nota: para un conjunto con un nmero par de nmeros, la mediana ser el promedio aritmtico de los dos nmeros medios.

EJEMPLO 4

Calcule la mediana para los siguientes datos. La edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22. Al ordenar los datos de manera ascendente quedan: 19, 20, 21, 22, 25. La mediana es 21. La altura, en pulgadas, de cuatro jugadores de basquetbol es 76, 73, 80 y 75. Al ordenar los datos de manera ascendente quedan: 73, 75, 76, 80. La mediana es 75.5.

Propiedades de la mediana

La mediana es nica para cada conjunto de datos. No se ve afectada por valores muy grandes o muy pequeos, y por lo tanto es una medida valiosa de tendencia central cuando ocurren. Puede obtenerse para datos de nivel de razn, de intervalo y ordinal.

Propiedades de la mediana
Ejemplo: Supngase que intenta adquirir una casa en Yanahuara. El vendedor le indic que el precio promedio de las casas disponibles en este momento es de 4225 UM. Si tuviera 2800 UM, podra pensar que est fuera de sus posibilidades. Sin embargo al verificar los precios individuales de las casas podra cambiar de idea. Los precios son 2300 UM, 2600 UM, 3500 UM y 8500 UM. El precio de 8500 UM esta haciendo que la media se incline hacia arriba, por lo que es un promedio no representativo. Un precio entre 2600 y 3500 es un promedio ms representativo.

Moda

La moda es el valor de la observacin que aparece con ms frecuencia. Es especial para describir niveles nominales y ordinales de medicin. EJEMPLO 5: las calificaciones de un examen de diez estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87. Como la calificacin 81 es la que ms ocurre, la calificacin modal es 81.

Media de datos agrupados

La media de una muestra de datos organizados en una distribucin de frecuencias se calcula mediante la siguiente frmula:

Xf Xf X= = f n
X = es el valor central o punto medio de cada clase f = es la frecuencia de cada clase

EJEMPLO 9

Una muestra de diez cines en una gran rea metropolitana dio el nmero total de pelculas exhibidas la semana anterior. Calcule la media de las pelculas proyectadas.

Xf Xf X= = f n

EJEMPLO 9

continuacin

Pelculas exhibidas 1-2 3-4 5-6 7-8 9-10 Total

frecuencia punto medio f de clase X 1 1.5 2 3 1 3 10 3.5 5.5 7.5 9.5

(f)(X) 1.5 7.0 16.5 7.5 28.5 61

61/10 = 6.1 pelculas

Mediana de datos agrupados


La mediana de una muestra de datos organizados en una distribucin de frecuencias se calcula mediante la siguiente frmula:

n FA Mediana = L + 2 (i ) f
donde L es el lmite inferior de la clase que contiene a la mediana, FA es la frecuencia acumulada que precede a la clase de la mediana, f es la frecuencia de clase de la mediana e i es el intervalo de clase de la mediana.

Clculo de la clase de la mediana

Para determinar la clase de la mediana de datos agrupados: Elabore una distribucin de frecuencias acumulada. Divida el nmero total de datos entre 2. Determine qu clase contiene este valor. Por ejemplo, si n =50, 50/2 = 25, despus determine qu clase contiene el 25 valor (la clase de la mediana).

EJEMPLO 10

Pelculas exhibidas 1-2 3-4 5-6 7-8 9-10

Frecuencia 1 2 3 1 3

Frecuencia acumulada 1 3 6 7 10

La clase de la mediana es 5 - 6, ya que contiene el 5 valor (n/2 = 5)

EJEMPLO 10

continuacin

De la tabla, L = 5, n = 10, f = 3, i = 2, FA = 3. As, mediana = 5 + [((10/2) - 4)/3](2) = 6.33

Moda de datos agrupados

La moda de los datos agrupados se aproxima por el punto medio de la clase que contiene la frecuencia de clase mayor. Las modas en el EJEMPLO 10 son 5.5 y 9.5. Cuando dos valores ocurren una gran cantidad de veces, la distribucin se llama bimodal, como en el ejemplo 10.

Distribucin simtrica

sesgo cero media

moda = mediana =

Distribucin con asimetra positiva

sesgo a la derecha: media y mediana se encuentran a la derecha de la moda.

moda < mediana < media

Distribucin con asimetra negativa

sesgo a la izquierda: media y mediana estn a la izquierda de la moda.

media < mediana < moda

Dispersin

Supngase que usted es un agente de compras de una empresa, y que con regularidad coloca pedidos con dos proveedores distintos. Ambos le indican que necesitan alrededor de 10 das hbiles para surtir sus pedidos. Despus de meses de trabajar se encuentra que el promedio de das necesarios para surtir los pedidos es realmente unos 10 para cada proveedor. Los histogramas que resumen la cantidad de das hbiles requeridos para surtir los pedidos se ven en la siguiente figura.

Dispersin
Aunque la cantidad promedio de 10 en ambos casos tienen stos el mismo grado de confiabilidad para entregar a tiempo? qu proveedor prefiere usted?
Proveedor A Proveedor B

5 4 3 2 1 9 10 11 Das hbiles

5 4 3 2 1 7 9 10 11 Das hbiles 15

Amplitud de Variacin

Amplitud de Variacin: Se trata de la diferencia entre el valor ms grande y el ms pequeo de un conjunto de datos.
Amplitud = Valor ms grande Valor ms pequeo

Un defecto importante es que se basa slo en dos valores, el mximo y el mnimo; no considera todos los datos.

Amplitud de Variacin

Ejemplo: La amplitud de la produccin diaria en la planta A es 4, obtenida de la diferencia entra la produccin diaria ms alta, que es 52 y las ms baja que es 48. En la planta B la amplitud es de 20, obtenida entre 60 y 40. Hay menos dispersin en la planta A La produccin de la planta A se acumula ms cerca de la media que es 50

Desviacin media

Desviacin media: media aritmtica de los valores absolutos de las desviaciones respecto a la media aritmtica.

XX MD = n
Mide el valor en promedio en que varan los valores de una poblacin, o muestra, con respecto a su media.

Desviacin media

Su principal ventaja es que se utiliza en su clculo todos los valores en la muestra, a diferencia de la amplitud. Es fcil de comprender, pues es el promedio en que los valores se desvan con respecto a la media. Su principal desventaja es el uso de valores absolutos. Por lo tanto, la DM no se usa tan frecuentemente como las otras medidas de dispersin.

Varianza de la poblacin

La varianza de la poblacin para datos no agrupados es la media aritmtica de las desviaciones cuadrticas respecto a la media de la poblacin.

( X ) 2 = N

EJEMPLO 2

Las edades de la familia Dunn son 2, 18, 34, y 42 aos. Cul es la variancia de la poblacin?

= X / N = 96 / 4 = 24

2 = ( X ) 2 / N = 944 / 4 = 236

Varianza poblacional

continuacin

Una frmula alternativa para la variancia poblacional es:

X = N

X 2 ( ) N

En general, es ms difcil interpretar la varianza, porque las unidades en las que se expresa son valores elevados al cuadrado. Es ms frecuente el uso de la raz cuadrada.

Desviacin estndar poblacional

La desviacin estndar poblacional (!) es la raz cuadrada de la variancia de la poblacin. Para el EJEMPLO 2, la desviacin estndar poblacional es 15.19 (raz cuadrada de 230.81). Una desviacin estndar pequea indica que los datos se encuentran localizados cerca de la media.

Desviacin estndar poblacional

(X )
N

Varianza muestral

La variancia muestral estima la variancia de la poblacin.


2 ( X X ) Frmula conceptual = S 2 = n 1 2 ( X ) X 2 n Frmula operativa = S 2 = n 1

EJEMPLO 3

Una muestra de cinco salarios por hora para varios trabajos en el rea es: $7, $5, $11, $8, $6. Encuentre la variancia. X = 37/5 = 7.40 s 2 = 21.2/(5-1) = 5.3

Desviacin estndar muestral

La desviacin estndar muestral es la raz cuadrada de la variancia muestral. En el EJEMPLO 3, la desviacin estndar de la muestra es = 2.30
X X n 1
2

S=

Varianza muestral para datos agrupados

La frmula de la variancia para datos agrupados usada como estimador de la variancia poblacional es: 2 ( fX ) 2 fX n S2 = n 1 donde f es la frecuencia de clase y X es el punto medio de la clase.

Interpretacin y usos de la desviacin estndar

Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporcin mnima de valores que est dentro de k desviaciones estndar desde la media es al menos 1 - 1/k , donde k2 es una constante mayor que 1.

Interpretacin y usos de la desviacin estndar

Ejemplo: Ejemplo: Suponga que la cantidad media quincenal depositada por los empleados de una empresa en el plan de participacin de utilidades de la empresa fue $51,04 y se obtuvo una desviacin estndar de $7,51. A l m e n o s Q u p o r c e n t a j e d e l a s contribuciones se encuentran a una distancia de +/- 2 desviaciones estndares de la media? Aproximadamente el 75% 1 1/K2 = 1-1/22 = 1-1/4 = 0.75

Interpretacin y usos de la desviacin estndar

Regla emprica: Para una distribucin de frecuencia simtrica de campana, aproximadamente 68% de las observaciones se encontrar a ms y menos una desviacin estndar de la media; aproximadamente 95% de las observaciones se encontrarn a ms y menos dos desviaciones estndares desde la media; y prcticamente todas las observaciones 99,7% se encontrarn a ms y menos tres desviaciones estndares de la media.

Interpretacin y usos de la desviacin estndar

-3s

-2s

-1s

1s

2s

3s

68% 95% 99,7%

Asimetra

Asimetra (sesgo) es la medida de la falta de simetra en una distribucin. El coeficiente de asimetra se calcula mediante la siguiente frmula:

Sk =

3(media - mediana) desviacin estndar

Curtosis

Mide el grado de agudeza de una distribucin Cuando la curtosis es cero, significa que se trata de una curva normal. Si es positiva, quiere decir que la curva o distribucin es ms levantada. Si es negativa, quiere decir que la curva es ms plana.

Curva Leptocrtica

Curva Mesocrtica

Curva Platicrtica

Asimetra

Custosis

Curtosis
Asimetra
h _ 3

xi x * fi i =1 n a3 = 3 s
Curtosis

xi x * fi i =1 n a4 = 4 s

Curtosis
Asimetra

Curtosis

También podría gustarte