Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 2 Bases Estadisticas para El Control A
Unidad 2 Bases Estadisticas para El Control A
UNIDAD II
¡ ¡
¡
2.1 Estadística Descriptiva
OBJETIVO: Conocer y calcular las medidas de tendencia central
e-mail: mmiranda@ufg.edu.sv
CONTENIDO
Conceptos básicos. Tipos de datos. Aleatorización y otras estrategias de muestreo.
Organización de datos. Representación de datos. Medidas de tendencia central. Ø
Datos no agrupados Ø Datos agrupados Visualización de datos. Medidas de
dispersión
GENERALIDADES
Los métodos empleados para resumir y organizar datos se denominan estadística
descriptiva; mientras que los métodos para tomar decisiones se denominan inferencia
estadística.
¡
ESTADÍSTICA DESCRIPTIVA
¡
Variables:
l Son
Datos:
l Son
los valores que toma la variable en cada caso. l Son las observaciones recolectadas
(como mediciones, géneros, respuestas de encuestas).
l
PARAMETRO: Es una medición numérica que describe algunas características de una
población. EJEMPLO: Cuando Lincoln fue elegido presidente por primera vez,
recibió el 39.82% de 1, 865,908 votos. Si suponemos que el conjunto de todos esos
votos es la población a considerar, entonces el 39.82% es un parámetro, no un
estadístico. ESTADISTICO: Es una medición numérica que describe algunas
características de una muestra. EJEMPLO: Con base en una muestra de 877
ejecutivos encuestados, se encontró que el 45% de ellos no contaría a alguien con
un error ortográfico en su solicitud de empleo. Esta cifra de 45% es un
estadístico, ya que está basado en una muestra, no en la población completa de
todos los ejecutivos.
¡
DATOS CUALITATIVOS (categóricos o de atributos): Son datos que solo toman valores
asociados a las cualidades o atributos, clasificándolos en una de varias
categorías, es decir, no son valores numéricos. Ejemplo:
l l l l l
Sexo: f/m. Hábito de fumar: Fumador/No fumador Color de ojos: negro, azul, marrón,
… Religión: católica, evangélica, … Estado civil: soltero, casado, divorciado,…
¡
PROBALISTICO O ALEATORIOS
NO PROBALISTICOS (Determinístico)
¡
MUESTREO ALEATORIO SIMPLE
Se selecciona una muestra de tamaño de n sujetos de manera que cada posible
muestra del mismo tamaño n tenga la misma posibilidad de ser elegida.
n de
MUESTREO ESTRATIFICADO
La población se divide en grupos homogéneos, llamamos estratos. La proporción de
cada estrato en la población se mantiene en la muestra. Cada uno de los estrato de
la muestra se obtiene por muestreo aleatorio simple sobre el estrato
correspondiente de la población.
Estrato 1 Estrato 2
Población
Muestra
Los estratos más grandes tienen probabilidad de ser representados.
mayor
Grupo 2A Grupo 3B
ORGANIZACIÓN DE DATOS NO AGRUPADOS
Si
los datos muéstrales no se reúnen de forma adecuada, resultarían tan inútiles que
ninguna cantidad estadística podrá salvarlos.
Ejemplo:
78 68 70 35 41
78 84 87 42 42
82 75 77 34 45
85 78 82 44 42
81 76 84 49 35
86 76 48 34 38
80 82 49 30 39
73 85 39 43 42
84 91 39 31 43
78 80 43 34 29
Solución: 1. Ordenar datos de menor a mayor:
29 39 44 76 82
30 39 45 77 82
31 41 48 78 84
34 42 49 78 84
34 42 49 78 84
34 42 68 78 85
35 42 70 80 85
35 43 73 80 86
38 43 75 81 87
39 43 76 82 91
2. Determinar el :
Valor mínimo (Vmin) = 29 Valor máximo (Vmax) = 91
3. Calcular el Rango (R) = Vmax – Vmin Rango (R) = 91 - 29= 62 Rango (R) = 62
MEDIDAS DE LOCALIZACIÓN
¡
Centralización o de tendencia central Indican valores con respecto a los que los
datos parecen agruparse. Media, Mediana y Moda
Posición
Percentiles, mediana.
Cuartiles,
Decilesy
¡
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS
¡
tendencia
central
más
¡
MEDIA ARITMÉTICA
¡La
¡Es ¡
¡Se
¡ ¡
x 1 + x 2 + ... + x n i = 1 µ=X= = n n
∑x
i
Ejemplo: datos no agrupados
78 68 70 35 41
78 84 87 42 42
82 75 77 34 45
85 78 82 44 42
81 76 84 49 35
86 76 48 34 38
80 82 49 30 39
73 85 39 43 42
84 91 39 31 43
78 80 43 34 29
Solución..
¡
¡29
39 44 76 82
34 42 49 78 84
34 42 49 78 84
34 42 68 78 85
35 42 70 80 85
35 43 73 80 86
38 43 75 81 87
39 43 76 82 91
X =
∑x
i =1
= 2990 =59.80 50
MEDIANA –PERCENTIL 50
¡
Cálculo de la mediana ØPara datos no agrupados: Si n es impar: posición donde se
ubica la mediana es igual a (n+1)/2. Si n es par: (n+1)/2 no es entero, por lo
tanto la mediana será igual al promedio de las dos posiciones centrales. La forma
más general de calcular la mediana es la siguiente:
78 68 70 35 41
78 84 87 42 42
82 75 77 34 45
85 78 82 44 42
81 76 84 49 35
86 76 48 34 38
80 82 49 30 39
73 85 39 43 42
84 91 39 31 43
78 80 43 34 29
Solución: Ø Ordenar datos de menor a mayor:
29 39 44 76 82
30 39 45 77 82
31 41 48 78 84
34 42 49 78 84
34 42 49 78 84
34 42 68 78 85
35 42 70 80 85
35 43 73 80 86
38 43 75 81 87
39 43 76 82 91
Es una medida de tendencia central que se puede utilizar sea cual sea el tipo de
variable a estudiar. La moda de un conjunto de observaciones es el valor que más se
repite, aquel cuya frecuencia absoluta es máxima. Puede ser única (unimodal), que
haya más de una (bimodal o multimodal), o que no exista. Es la única medida de
tendencia central que se puede determinar para datos de tipo cualitativo. Para
datos no agrupados: es simplemente la observación que más se repite.
¡
¡
¡
Ejemplo: datos no agrupados
78 68 70 35 41
78 84 87 42 42
82 75 77 34 45
85 78 82 44 42
81 76 84 49 35
86 76 48 34 38
80 82 49 30 39
73 85 39 43 42
84 91 39 31 43
78 80 43 34 29
Solución: Ø Ordenar datos de menor a mayor:
29 39 44 76 82
30 39 45 77 82
31 41 48 78 84
34 42 49 78 84
34 42 49 78 84
34 42 68 78 85
35 42 70 80 85
35 43 73 80 86
38 43 75 81 87
39 43 76 82 91
78 68 70 35 41
78 84 87 42 42
82 75 77 34 45
85 78 82 44 42
81 76 84 49 35
86 76 48 34 38
80 82 49 30 39
73 85 39 43 42
84 91 39 31 43
78 80 43 34 29
Datos no estan ordenados
REPRESENTACIÓN DE DATOS
CURVAS
EJERCICIO: A continuación se presentan las calificaciones de 60 estudiantes en el
año 2009:
23 80 52 41 60 34
60 77 10 71 78 67
79 81 64 83 89 17
32 95 75 54 76 82
57 41 78 64 84 69
74 65 25 72 48 74
52 92 80 88 84 63
70 85 98 62 90 80
82 55 81 74 15 85
36 76 67 43 79 61
a)Ordenar los datos. b)Determine el valor mínimo y máximo de los datos. c)Encuentre
el rango de los datos. d)Calcule la media, mediana y moda de la distribución.
e)Construir el grafico que corresponda para la serie de datos.
ORGANIZACIÓN DE DATOS AGRUPADOS
l Una
Clase
fi
Fi
fri
FRi
¡
La Distribución de Frecuencias:
l Se
l Su
l Para
La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de
20), que la verdadera naturaleza de la distribución sea imposible de visualizar. La
amplitud de todas las clases deberá ser la misma. Se recomienda que los puntos
medios tengan la misma cantidad de cifras significativas que los datos en bruto.
Los límites de las clases deben tener una cifras significativas más que los datos
en bruto cuando sean reales.
¡
¡
Determinar:
l Punto
medio = (Li+Ls)/2. Li: limite inferior Ls: limite superior l Frecuencia absoluta de
la clase (fi).
l Frecuencia
(Fi).
acumulada de la clase
l Frecuencia
l Frecuencia
Ejemplo:
78 68 70 35 41
78 84 87 42 42
82 75 77 34 45
85 78 82 44 42
81 76 84 49 35
86 76 48 34 38
80 82 49 30 39
73 85 39 43 42
84 91 39 31 43
78 80 43 34 29
Solución: 1. Ordenar datos de menor a mayor:
29 39 44 76 82
30 39 45 77 82
31 41 48 78 84
34 42 49 78 84
34 42 49 78 84
34 42 68 78 85
35 42 70 80 85
35 43 73 80 86
38 43 75 81 87
39 43 76 82 91
2. Determinar el :
Valor mínimo (Vmin) = 29 Valor máximo (Vmax) = 91
3. Calcular el Rango (R) = Vmax – Vmin Rango (R) = 91 - 29= 62 Rango (R) = 62
4. Determinar el Número de clase (K) en las que se van a agrupar los datos.
l l
59
6. Determinar las fronteras o límites naturales de cada clase. Li: Limite
inferior --- Li = Vm = 29 Ls: Limite superior – Ls = Li + (A-1) Ls =29+ (9-1)
=37
INTERVALOS FRONTERAS DE CLASE LIMITE LIMITE SUPERIOR (I) INFERIOR (Li) (Ls)
I 1 2 3 4 5 6 7
FRONTERAS Li Ls
29 38 47 56 65 74 83 37 46 55 64 73 82 91
1 2 3
I 1 2 3 4 5 6 7
FRONTERAS Li Ls
28.5 37.5 46.5 55.5 64.5 73.5 82.5 <37.5 <46.5 <55.5 <64.5 <73.5 <82.5 <91.5
1 2 3
X X+A X+2A
29 39 44 76 82
I 1 2 3 4 5 6 7
30 39 45 77 82
31 41 48 78 84
fi
34 42 49 78 84
34 42 49 78 84
34 42 68 78 85
I 1 2 3 4 5 6 7
35 42 70 80 85
35 43 73 80 86
38 43 75 81 87
fi
39 43 76 82 91
LIMITES NATURALES
FRONTERAS Li Ls
LIMITES REALES
FRONTERAS Li Ls
29 38 47 56 65 74 83
37 46 55 64 73 82 91
8 14 3 0 3 14 8
8 14 3 0 3 14 8
Cálculo de la media
¡Para
datos agrupados:
xf ∑
i= 1 k i i
1 X =i = k
f i ∑
I
1 2 3 4 5 6 7
FRONTERAS
Li
29 38 47 56 65 74 83
Ls
37 46 55 64 73 82 91
fi
8 14 3 0 3 14 8
MARCA CLASE
Xi*fi
264 588 153 0 207 1092 696
Xi
33 42 51 60 69 78 87
X=
∑x f
i =1 k i
∑ fi
i =1
= 3000/50 = 60
Xi= (Li+Ls)/2
TOTAL
50
3,000
Cálculo de la mediana
Ø Datos agrupados: l La clase mediana es la que contiene a la observación que ocupa
la posición N/2.
¡
N − Faa Md = Li + ( 2 ) * Ic fm
destacar que es preferible el uso de la mediana como medida descriptiva del centro
cuando se quiere reducir o eliminar el efecto de valores extremos en un conjunto de
datos (muy grandes o muy pequeños).
Ejercicio: datos agrupados
¡
I
1 2 3 4 5 6 7
FRONTERAS
Li
28.5 37.5 46.5 55.5 64.5 73.5 82.5
Ls
fi
<46.5 14
<82.5 14 <91.5 8
Faa 8 22 25 25 28 42 50
N − Faa Md = Li + ( 2 ) * Ic fm
= 55.5
TOTAL
50
Solución:
1. Calcular el factor N/2 = 50/2 = 25 datos. 2. Observar en la tabla la columna de
Frecuencia absoluta acumulada e identificar la clase en que se encuentran 25.
Faa3 = Faa4 = 25 datos
Fi3= 3 y Fi4 = 0 I
2 3 4
FRONTERAS
FRECUENCIA ABSOLUTA FRECUENCIA ABSOLUTA ACUMULADA
1. 2.
Ls
fi
Faa 22 25 25
N − Faa M = + ( 2 d Li Ic )* fm
Ø Limite real inferior de la clase mediana o frontera de clase es: Li = 47 - 0.5 =
46.5 Ø Factor es: N/2 = número de datos/2 = N/2 = 50/2 = 25 Ø Frecuencia acumulada
de la clase anterior es: Faa = 22 Ø Frecuencia de la clase de la mediana o
frecuencia absoluta es: fm = fi = 3 Ø Ancho o amplitud de clase es: Ic = 9 Ø
Sustituyendo valores en la ecuacion se tiene que la mediana es: Md = 46.5 +
( 50/2 – 22 ) * 9 = 55.5 3 Ø
Cálculo de la moda
¡
∆1 Mo = Li + Ic ∆1 + ∆ 2
Donde: Li: límite inferior de la clase modal. ∆ 1: diferencia entre fi de la clase
modal y la anterior. ∆ 2: diferencia entre fi de la clase modal y la posterior. Ic:
amplitud de la clase modal (clase de mayor frecuencia).
Ejemplo: datos agrupados
¡
I
1 2 3 4 5 6 7
Li
28.5 37.5 46.5 55.5 64.5 73.5 82.5
Ls
Fi
∆1 Mo = Li + Ic ∆1 + ∆ 2
Mo2 = 40.7≈41 Mo6 = 79.3 ≈79
<46.5 14
<82.5 14 <91.5 8
TOTAL
50
∆1 Mo = Li + Ic ∆1 + ∆ 2
Ø El intervalo de clase donde mas se repiten los datos es en: Fi2 = Fi6=14 Ø Limite
real inferior de la clase modal es: Li2 = 38 - 0.5=37.5 Li6 = 74 – 0.5 =73.5 Ø
Diferencia entre la frecuencia de la clase modal y la clase pre modal es: Δ21 =14
- 8 = 6 Δ61 =14 - 3 = 11 Ø Diferencia entre la frecuencia de la clase modal y la
clase post modal es: Δ22 =14 - 3 = 11 Δ62 =14 - 8 = 6 Ø Ancho o amplitud de clase
es: Ic = 9 Ø Mo2= 37.5 + ( 6 )* 9 Mo6= 73.5 + (
11
)*9
6 + 11 Mo2= 40.7≈41
11 + 6 Mo6= 79.3≈79
REPRESENTACIÓN GRÁFICA DE LOS DATOS
¡
¡
REPRESENTACIÓN DE DATOS CUANTITATIVOS
Histograma
OJIVA
POLIGONO DE FRECUENCIAS
CURVAS
Continuación…. Construir para el ejercicio anterior, el grafico que corresponda,
considerando el tipo de datos.
29 38 47 56 65 74 83
37 46 55 64 73 82 91
29
38
47
56
65
74
83
92
RELACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA
Permiten estudiar la forma de la curva, dependiendo de cómo se agrupan los datos.
La media tiende a desplazarse hacia las valores extremos (colas). Las discrepancias
entre las medidas de centralización son indicación de asimetría.
¡
¡
79
Relación entre Tendencia Central y la Simetría de la distribución
Simetría Relación Simétrica o insesgada Moda = Mediana = Media sesgo positivo o a
la derecha sesgo negativo o a la izquierda Moda < Mediana < Media Moda > Mediana >
Media
La forma depende de la distribución de las frecuencias absolutas de los datos.
Algunas de las formas más comunes que puede adoptar son las siguientes:
SIMETRICA ó Campana de Gauss-Normal Asimétrica
Forma bimodal
Con anomalías
Forma en U
Sesgada a la derecha
Sesgada a la izquierda
¡
¡
Md = 55.5
29
38
47
56
65
74
83
92
Mo = 41
Mo = 79
X = 60
CONCLUSIÓN:
Comparación de los resultados obtenidos en las medidas de tendencia central
MEDIDAS DE TENDENCIA CENTRAL Media Aritmética(¯) Mediana (Md) Moda (Mo)
X
Conclusión:
EJERCICIO: A continuación se presentan las calificaciones de 60 estudiantes en el
año 2009:
23 80 52 41 60 34
60 77 10 71 78 67
79 81 64 83 89 17
32 95 75 54 76 82
57 41 78 64 84 69
74 65 25 72 48 74
52 92 80 88 84 63
70 85 98 62 90 80
82 55 81 74 15 85
36 76 67 43 79 61
Conclusión: