Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cartilla - S1
Cartilla - S1
OBJETIVOS
Tipos de estadísticas
Tipos de variables
1. Variable cualitativa o de atributos: la característica o variable que se estudia no es
numérica.
Ejemplos: género, afiliación religiosa, tipo de automóvil que se posee, lugar de
nacimiento, color de los ojos.
DATOS
discretos continuos
(número de hijos) (tiempo para resolver el examen)
Escalas de medición
1. Nivel nominal: los datos sólo se puede clasificar en categorías, no se pueden ordenar.
Ejemplos: color de los ojos, género, afiliación religiosa.
Mutuamente excluyente: un individuo, objeto o artículo, al ser incluido en una
categoría, debe excluirse de las demás.
Ejemplo: género, color de los ojos.
Colectivamente exhaustivo: cada persona, objeto o artículo debe clasificarse en al
menos una categoría.
EJEMPLO: afiliación religiosa.
2. Nivel ordinal: involucra datos que se pueden ordenar, pero no es posible determinar las
diferencias entre los valores de los datos o no tienen significado.
EJEMPLO: en una prueba de sabor de 4 refrescos de cola, el C se clasificó como número
1, el B como número 2, el A como 3 y el D como número 4.
3. Nivel de intervalo: similar al nivel ordinal, con la propiedad adicional de que se pueden
determinar cantidades significativas de las diferencias entre los valores. No existe un punto
cero natural y solo se pueden realizar las operaciones de suma y resta con sentido
Ejemplo: temperatura en la escala de grados Fahrenheit.
4. Nivel de razón: el nivel de intervalo con un punto cero inicial inherente. Las diferencias y
razones son significativas para este nivel de medición y se pueden realizar las cuatro
operaciones básicas con sentido.
Ejemplos: dinero, altura de los jugadores de básquetbol de la NBA.
Distribución de frecuencias
Distribución de frecuencias: agrupamiento de datos en categorías que muestran el
número de observaciones en cada categoría mutuamente excluyente.
Elaboración de una distribución de frecuencias
distribución
de frecuencias
Las categorías que se crean para agrupar los datos dependen del
tipo de variable que se tenga, es decir se debe primero identificar
la variable para determinar si es cualitativa o cuantitativa y en caso
de las cuantitativas si es discreta o continua.
EJEMPLO 1
Se realizó una encuesta a 200 deportistas para averiguar cuál era la marca preferida de
zapatos deportivos y se encontró lo siguiente:
EJEMPLO 2
A un grupo de 20 familias se les averiguó cuántos hijos tenían y se encontraron los
siguientes resultados:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Hijos 3 2 2 2 1 0 1 1 2 3 2 2 1 2 2 0 1 1 0 3
Considere las clases 8-12 y 13-17. Las marcas de clase son 10 y 15. El intervalo de clase es 5
(13 - 8).
Horas de estudio Marca de clase o Frecuencia
(Intervalo de clase) Punto medio absoluta
Yj-1 Yj Yi fi
8 - 12 (8+12)/2 = 10 1
13 - 17 (13+17)/2 = 15 12
18 - 22 (18+22)/2 = 20 10
23 - 27 (23+27)/2 = 25 5
28 - 32 (28+32)/2 = 30 1
33 - 37 (33+37)/2 = 35 1
TALLO HOJA
6 9
7 89
8 234568
9 126
14
12
Frecuencia
10
8
6
4
2
0
10 15 20 25 30 35
Horas de estudio
Polígono de frecuencias para las horas de estudio
14
12
10
Frecuencia
8
6
4
2
0
10 15 20 25 30 35
Horas de estudio
20
15
10
5
0
10 15 20 25 30 35
Horas de estudio
Gráfica de barras
Una gráfica de barras se puede usar para describir cualquier nivel de medición (nominal,
ordinal, de intervalo o de razón).
EJEMPLO 3: construya una gráfica de barras para el número de personas desempleadas
por cada 100 000 habitantes de ciertas ciudades en 1995.
Ciudad Número de desempleados por 100 000 habitantes
Barranquilla 7300
Cartagena 5400
Bucaramanga 6700
Medellín 8900
Cali 8200
Bogotá, D.C. 8900
8000 7300
6700
5400
6000
000
Gráfica circular
Una gráfica circular es en especial útil para desplegar una distribución de frecuencias
relativas. Se divide un círculo de manera proporcional a la frecuencia relativa y las
rebanadas representan los diferentes grupos.
EJEMPLO 4: se pidió a una muestra de 200 corredores que indicaran su tipo favorito
de zapatos para correr.
Dibuje una gráfica circular basada en la siguiente información.
Puma
Reebok
Otros
Nike
Adidas
Reebok
Adidas Puma
Otros
Nike
Media de la población
Para datos no agrupados, la media de la población es la suma de todos los valores en
ella dividida entre el número de elementos de la población
µ=∑ i
X
N
EJEMPLO 1
La familia Pérez posee cuatro carros. Las millas recorridas por cada uno son: 56 000,
23 000, 42 000 y 73 000. Encuentre el promedio de millas de los cuatro carros.
X=
∑X i
n
donde X denota la media muestral
EJEMPLO 2
Una muestra de cinco ejecutivos recibió la siguiente cantidad en bonos el año pasado:
$14 000, $15 000, $17 000, $16 000 y $15 000. Encuentre el promedio en bonos
para los cinco ejecutivos.
Como estos valores representan la muestra de 5 ejecutivos, la media de la muestra es :
X=
∑ Xi
n
(14 000 + 15 000 + 17 000 + 16 000 + 15 000) / 5 = $15 400.
Media ponderada
La media ponderada de un conjunto de números X1, X2, ..., Xn, con las ponderaciones
correspondientes w1, w2, ...,wn, se calcula con la fórmula:
Xw =
∑ X 1w1 + X 2 w2 + ... + X n wn
∑ wi
Xw =
∑X w
i i
∑w i
EJEMPLO 3
Durante un periodo de una hora en una tarde calurosa de un sábado, el cantinero Jaime
sirvió cincuenta bebidas. Calcule la media ponderada de los precios de las bebidas.
(Precio ($), cantidad vendida): (0.50, 5), (0.75, 15), (0.90, 15), (1.10, 15).
Xw =
∑ X 1w1 + X 2 w2 + ... + X n wn
∑ wi
o (0.50 x 5 +0.75 x 15 + 0.90 x 15 + 1.10 x 15) / (5 + 15 + 15 + 15) = $43.75/50
=$0.875
EJEMPLO 4
Considere el conjunto de valores: 3, 8 y 4. La media es 5. Para ilustrar la propiedad:
“la sumatoria de las desviaciones con respecto a al media es igual a cero se tiene: (3
- 5) + (8 - 5) + (4 - 5) = - 2 + 3 - 1 = 0. En otras palabras,
Σ( X i − X ) =
0
Mediana
Mediana: es el punto medio de los valores después de ordenarlos de menor a mayor, o
de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana
que por debajo de ella.
Nota: para un conjunto con un número par de observaciones, la mediana será el
promedio aritmético de las dos observaciones centrales.
EJEMPLO 5
Calcule la mediana para los siguientes datos.
La edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22.
Al ordenar los datos de manera ascendente quedan: 19, 20, 21, 22, 25. La mediana es
21, que es la observación central, ya que el número de observaciones es impar.
La altura, en pulgadas, de cuatro jugadores de básquetbol es 76, 73, 80 y 75.
Al ordenar los datos de manera ascendente quedan: 73, 75, 76, 80. La mediana es 75.5
que corresponde al promedio de las dos observaciones centrales, ya que el número de
observaciones es par.
Propiedades de la mediana
La mediana es única para cada conjunto de datos.
No se ve afectada por valores muy grandes o muy pequeños, y por lo tanto es una
medida valiosa de tendencia central.
Puede obtenerse para datos de nivel de razón, de intervalo y ordinal.
Puede calcularse para una distribución de frecuencias con una clase de extremo abierto,
si la mediana no se encuentra en una de estas clases.
Moda
La moda es el valor de la observación que aparece con más frecuencia.
EJEMPLO 5:
Las calificaciones de un examen de diez estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75,
81, 87. Como la calificación 81 es la que más ocurre, la calificación modal es 81.
Media geométrica
La media geométrica (MG) de un conjunto de n números positivos se define como la
raíz n-ésima del producto de los n valores. Su fórmula es:
EJEMPLO 7
El número total de estudiantes inscritos en colegios bogotanos aumentó de
755 000 en 1986 a 835 000 en 1995.
Aquí n = 10, así (n - 1) = 9.
MG = 9 835000 / 755000 − 1 = 0.0113.
Es decir, la media geométrica de la tasa de crecimiento anual es 1.13%.
EJEMPLO 8
Una muestra de diez cines en una gran área metropolitana dio el número total de
películas exhibidas la semana anterior. Calcule la media de las películas proyectadas.
Donde Yj-1 es el límite inferior de la clase que contiene a la mediana, Fj-1 es la frecuencia
acumulada que precede a la clase de la mediana, fj es la frecuencia de clase de la
mediana y Cj es la longitud del intervalo j, el de clase de la mediana.
EJEMPLO 9
Distribución simétrica
NOTA
Si se conocen dos promedios de una distribución de frecuencias con sesgo moderado,
el tercero se puede aproximar:
moda = media - 3(media - mediana)
media = [3(mediana) - moda]/2
mediana = [2(media) + moda]/3