Está en la página 1de 8

UNIVERSIDAD NACIONAL DE SAN AGUSTÍN DE AREQUIPA

FACULTAD DE INGENIERÍA DE PRODUCCION Y SERVICIOS


ESCUELA PROFESIONAL DE INGENIERIA INDUSTRIAL

GUIA DE LABORATORIO No3

PROFESOR : Dr. Ing. José Javier Zavala Fernández

ASIGNATURA : Análisis de Datos 1

TEMA :ESTADISTICA DESCRIPTIVA – MEDIDAS DE DISPERSION


SOFTWARE: EXCEL – MINITAB - SPSS

CICLO : 2020-II

I. OBJETIVOS

 Conocer y explicar Las medidas de dispersión -. Varianza y desviación estándar


 Utilizar el Excel y Minitab para el cálculo de las medidas de dispersion

II. TEMAS A TRATAR

 Amplitud de clase, desviación media


 Varianza y desviación estándar

III. MARCO TEÓRICO

DEFINICIONES
Amplitud o Intervalo de variación: Valor más grande – Valor más pequeño
Desviación Media: Es el promedio aritmético de los valores absolutos de las deviaciones

DM =
X−X
con respecto a la media aritmética. n
Varianza: La media aritmética de las desviaciones cuadráticas con respecto a la media.
Desviación Estándar: La raíz cuadrada positiva de la varianza

 2
=
 ( X − ) 2

Varianza Poblacional: N

=
 ( X − ) 2

Desviación Estándar Poblacional: N


( X ) 2
(X − X ) 2
X 2

n
s 2
= s =
2

Varianza Muestral: n −1 o la directa n −1

( X ) 2
X 2

n
s=
Desviación Estándar Muestral: n −1

Medidas de dispersión para datos agrupados;

( fX ) 2
 fX 2

n
s=
Desviación Estándar datos agrupados: n −1
Teorema de Chebyshev: para un conjunto cualquiera de observaciones (muestra o
población) la proporción mínima de los valores que se encuentran dentro de k
desviaciones estándar desde la media es por lo menos 1-1/k2, donde k es una constante
mayor que 1.
Coeficiente de Variación: Es la razón (cociente) de la desviación estándar y la media
s
CV = (100)
aritmética, expresada como un porcentaje. X

3( Media − Mediana ) n   X − X 3 
CA = =    
s (n − 1)( n − 2)   s  
Coeficiente de Asimetría:
Diagrama de Caja: es una representación gráfica basada en los cuartiles, que ayuda a
ilustrar un conjunto de datos...
a) DIAGRAMA DE CAJA Y VALORES ATÍPICOS

El diagrama de caja es una representación semigráfica de una distribución construida para


mostrar sus características principales, como por ejemplo la forma. Resultan bastante útiles
cuando el tamaño de la muestra no es muy grande y los histogramas no muestran bien su
forma. También para señalar los posibles datos atípicos, es decir, aquellas observaciones
que parecen ser distintas a las demás.

CONSTRUCCIÓN DE UN DIAGRAMA DE CAJA.

Se construye como sigue:

▪ Se ordena los datos de una muestra, identificando el valor mínimo y el máximo.


▪ Se dibuja un rectángulo cuyos extremos son Q1 y Q3, e indicar la posición de la
mediana mediante un segmento de recta vertical. Así, dentro de la caja queda representado
el 50% central de la información contenida en los datos.
▪ Se calculan los límites admisibles superior e inferior que sirven para identificar los
valores atípicos, como sigue:
▪ Dibujar un segmento de línea recta que vaya desde cada extremo del rectángulo
central hasta los límites admisibles LI y LS.
▪ Identificar todos los datos que están fuera del intervalo [LI;LS], marcándolos como
atípicos.

Así:

▪ Si la línea que se extiende desde el límite superior de la caja al máximo valor de las
variables es más larga, los datos presentan asimetría a la derecha.
▪ Si es más larga de línea que va desde el límite inferior de la caja hasta el mínimo
valor, hay indicios de asimetría a la izquierda.

EJEMPLO: Cada día de la primera quincena de enero atracan en un puerto pesquero el


siguiente número de lanchas pesqueras.

95 89 77 87 81 89 92 103
87 82 80 100 79 74 83

Dibuje un diagrama de caja para estudiar la forma de distribución de los datos.

✓ SOLUCIÓN: Primero ordenamos los datos de menor a mayor:

74 , 77 , 79 , 80 , 81 , 82 , 83 , 84 , 87 , 87 , 89 , 92 , 95 , 100 , 103

Los datos extremos son X max= 74 y X mín= 103


El recorrido de la variable es : R= 103 – 74 = 29

El primer cuartil Q1 es el valor que ocupa el lugar n+1 / 4 = 16 / 4 = 4


así: Q1 = 80

El segundo cuartil Q2 es el valor que ocupa el lugar n+1 / 2 = 16 / 2 = 8


con lo que Q2 = 84

El tercer cuartil Q3 es el valor que ocupa el lugar 3(n+1) / 4 = 3(16) / 4 = 12


entonces Q3 = 92.

Los límites admisibles son.


LI = Q1 – (1.5)(Q3 - Q1) = 80 – (1.5)(92 – 80) = 62
LS= Q3 + (1.5)(Q3 – Q1) = 92 + (1.5)(92-80) = 110
El diagrama de caja es:

b) COEFICIENTE DE ASIMETRÍA

En curvas de frecuencia unimodales, una medida absoluta de la asimetría está dado por la
diferencia entre la media aritmética y la moda.

INTERPRETACIÓN:

▪ As, será negativa (As < 0), si la distribución tiene asimetría negativa.
▪ As, será nulo ( As = 0), si la distribución es simétrica.
▪ As, será positiva (As > 0), si la distribución tiene asimetría positiva.

Pero tal medida tiene el inconveniente de expresarse en unidades originales de la variable,


y así cambia al cambiar la unidad de medición. Para eliminar este defecto introducimos una
medida relativa de la asimetría.

COEFICIENTE DE PEARSON

Teniendo en cuenta que la media aritmética y la moda coinciden en una distribución


simétrica, Pearson propuso un coeficiente relativo de asimetría para curvas de frecuencia
unimodales.

Como la moda de una distribución no es fácil de calcular, entonces podemos expresar el


numerador de la expresión anterior en función de la mediana.
El coeficiente de asimetría anterior propuesto por Pearson se expresa como:

INTERPRETACIÓN

▪ Si Cas < 0, la distribución es asimétrica negativa.


▪ Si Cas = 0, la distribución es simétrica.
▪ Si Cas > 0, la distribución es asimétrica positiva.

Los coeficientes de asimetría anteriores se llaman, respectivamente primero y segundo


coeficientes de Pearson.
COEFICIENTE DE ASIMETRÍA EN FUNCIÓN DE LOS CUANTILES

a. El coeficiente de asimetría cuartílico o de BOWLY, está dado en función de los cuartiles.

b. El coeficiente de asimetría en función de percentiles(10-90) está dado por:

La interpretación es la misma que los otros coeficientes de asimetría.

1) Medidas de Apuntamiento o Curtosis

Se entiende por curtosis, la medida de la deformación vertical de una distribución de


frecuencias, es decir la medida de apuntamiento o achatamiento de una distribución.
Entonces, el apuntamiento de una distribución de frecuencias indica la mayor o menor
altura del máximo central, con respecto a la altura de la curva normal con media y
desviación típica igual que la distribución que se estudia.

a) FORMAS DE MEDIR LA CURTOSIS

El grado de curtosis o apuntamiento puede medirse en función de momentos o de cuantiles.

CURTOSIS EN FUNCIÓN DE MOMENTOS:

El grado de apuntamiento o de curtosis está dado


por:

Donde:
M4 = cuarto momento respecto a la media
S = desviación típica

Como se observa K1 es positivo y se define de ésta forma porque en una distribución normal,
este coeficiente toma el valor 3, es decir se tiene que:

Y al tomarla como referencia, K1 se interpreta como sigue:

▪ Si, K1 > 3, la distribución es más apuntada que la normal y recibe el nombre de


LEPTOCURTICA.
▪ Si K1 = 3, la distribución es moderadamente apuntada y se llama MESOCURTICA
▪ Si K1 < 3, la distribución es menos apuntada que la normal o sea ACHATADA y se llama
PLATICÚRTICA
En ocasiones se puede buscar el apuntamiento o exceso de una distribución de frecuencia
en la parte central de la distribución mediante el coeficiente:

INTERPRETACIÓN

▪ Si K2 = 0, la distribución es mesocúrtica
▪ Si K2 > 0, la distribución es leptocúrtica
▪ Si K2 < 0, la distribución es achatada o platicúrtica.

CURTOSIS EN FUNCIÓN DE CUANTILES

El coeficiente está dado por:

Donde:
K3 = coeficiente de curtosis percentílico
Q1 y Q3 = primer y tercer cuartil repectivamente.
P90 y P10 = percentiles 90 y 10.

INTERPRETACIÓN

▪ Si K3 = 0.263, la distribución es mesocúrtica


▪ Si K3 < 0.263, la distribución es platicúrtica
▪ Si K3 > 0.263, la distribución es leptocúrtica
IV. ACTIVIDADES (LA PRÁCTICA TIENE UNA DURACIÓN DE 02 HORAS)

EJERCICIOS DESARROLLADOS
Tiempo de ensamblaje de 30 empleados, minutos

10 14 15 13 17
16 12 14 11 13
15 18 9 14 14
9 15 11 13 11
12 10 17 16 12
11 16 12 14 15

SOFTWARE EXCEL
1) Abra Excel. En la celda A1 ingrese el rótulo de la columna: Tiempos de ensamblaje,
min. Ingrese los valores de los datos en la columna A comenzando en la celda A2.
2) Haga clic en Herramientas —>Análisis de Datos->Estadística Descriptiva. Haga clic
en OK.
3) Designe como Rango Entrada: $A$ 1 :$A$30.
4) Elija Rango de Salida e inserte: $C$1 (para contar con una columna de espacio entre
la entrada y la salida).
6) Seleccione Resumen de Estadísticas.
7) Haga clic en OK.
SOFTWARE MINITAB
1) Abra Minitab. En la celda para el nombre de la columna de la columna Cl ingrese:
Tiempo de ensamblaje, min. Después ingrese los datos de la muestra en la columna Cl.
2) Haga clic en Stat -» Basic Statistics-> Display Descriptive Statistics.
3) Como Variables ingrese: Cl.
4) Haga clic en OK.
V. EJERCICIOS PROPUESTOS

1. Los valores del metabolismo basal de 50 individuos de una población que se supone
normal son los siguientes:

102 98 93 100 98 105 115 110 99 120


115 130 100 86 95 103 105 92 99 134
116 118 89 102 128 99 119 128 110 130
112 114 106 114 100 116 108 113 106 105
120 106 110 100 106 117 109 108 105 106

a) Calcular el coeficiente de asimetría, deviación y varianza

2. Dada la siguiente distribución:

Xi → 1 3 4 6 10
Ni→ 5 12 20 8 5

a) Hallar la media aritmética, la moda, la desviación típica, el coeficiente de


variación y los coeficientes de asimetría y curtosis de la variable X.
b) Hallar también el coeficiente de asimetría de Pearson.

3. La distribución por edades de los trabajadores de una exploración agraria es la


siguiente:

Número de
Edades Empleados
0-20 7
20-40 13
40-60 20
60-80 15
80-100 5
a) Hallar la media aritmética, el coeficiente de asimetría y el coeficiente de curtosis.

También podría gustarte