DEPARTAMENTO DE MATEMÁTICAS
Asignatura: Estadística I
Tema: Distribución de frecuencias. Representación Gráfica de Datos estadísticos,
Medidas de Tendencia Central
Docente: Carolina Vargas Contreras
Fecha: Semana 1 ,2 y 3 Primer Corte 2021-2 Grupos: AR y ER
Dadas las siguientes expresiones escriba si son variables cuantitativas (discretas, continuas), o
variables cualitativas (dicotómicas o politómicas).
1) Total de correos recibidos en un día: VARIABLE CUANTITATIVA DISCRETA
2) Nombre de software educativo: VARIABLE CUALITATIVA POLITÓMICA
3) Peso de una tarjeta madre: VARIABLE CUANTITATIVA CONTINUA
4) ¿Posee usted balón gástrico en su organismo? VARIABLE CUALITATIVA DICOTÓMICA
5) Nombre de las piezas que conforman un automóvil VARIABLE CUALITATIVA POLITÓMICA
6) Valores de los indicadores económicos del día de ayer VARIABLE CUANTITATIVA CONTINUA
7) Total de chips defectuosos en el almacén de repuestos VARIABLE CUANTITATIVA DISCRETA
Distribución de Frecuencias
Una distribución de frecuencias, es una organización de todos los valores de la variable en una
tabla con intervalos o sin ellos, y en la que se asocian las frecuencias.
La siguiente es la descripción de cada una de las frecuencias:
- Frecuencia Absoluta (𝒇): es el número de veces que se repite una de las categorías o
valores de la variable.
- Frecuencia Absoluta Acumulada (𝒇𝒂) : es la suma de las frecuencias absolutas.
- Frecuencia Relativa (𝒇𝒓) : Es el cociente entre la frecuencia absoluta y el total de datos,
𝑓
se puede expresar como fracción o decimal. 𝑓𝑟 = 𝑛
- Frecuencia Relativa Acumulada (𝒇𝒓𝒂): Corresponde a la suma de las frecuencias
relativas. Es el cociente entre la frecuencia absoluta acumulada y el total de datos.
𝑓𝑎
𝑓𝑟𝑎 = 𝑛
- Frecuencia porcentual (%): se obtiene al multiplicar la frecuencia relativa por 100.
- Frecuencia porcentual acumulada: se obtiene al multiplicar la 𝑓𝑟𝑎 ∗ 100
Gráficas para datos categóricos: se muestran los datos estadísticos a través de representaciones
gráficas, se ha de adaptar el contenido a la información visual que se pretende transmitir.
Ojo explicación
100% 800
12,5% x
Gráficas para datos cuantitativos: Las variables cuantitativas miden una cantidad
en cada unidad experimental. Si la variable puede tomar sólo un número finito o contable de valores,
es una variable discreta. Una variable que puede tomar un número infinito de valores
correspondientes a puntos en un intervalo de recta se llama continua.
Un diagrama de puntos Una gráfica de puntos muestra cada elemento de un conjunto de datos
numéricos por encima de una recta numérica, o eje horizontal. Las gráficas de puntos facilitan ver los
espacios vacíos y los agrupamientos en un conjunto de datos, así como la manera en que se distribuyen
los datos a lo largo del eje.
El pulso varía de una persona a otra, pero por lo general, el pulso de una persona saludable en reposo
se mantiene entre ciertos valores. Una persona con un pulso muy rápido o muy lento podría necesitar
atención médica.
Ejemplo: Este conjunto de datos refleja los pulsos, expresados en pulsaciones por minuto (ppm), de
un grupo de 30 estudiantes: 68, 60 ,76, 68 ,64 ,80 ,72 ,76, 92, 68 ,56, 72 ,68 ,60 ,84, 72, 56, 88
,76 ,80, 68 ,80 ,84 ,64 ,80, 72 ,64 , 68, 76 y 72 .
Colecta los datos, organiza los datos en orden numérico, crea una línea horizontal, escribe un
sobre la línea horizontal cada vez que un dato se repita.
Gráfico de Tallos y Hojas: El diagrama "tallo y hojas" (Stem-and-Leaf Diagram) permite obtener
simultáneamente una distribución de frecuencias de la variable y su representación gráfica. Para
construirlo basta separar en cada dato el último dígito de la derecha (que constituye la hoja) del
bloque de cifras restantes (que formará el tallo).
Ejemplo
Histogramas: Es una herramienta usada para representar una distribución por medio de barras. La
altura de la barra está en función de la frecuencia (eje y) y el rango (eje x) de una variable continua.
Nos ofrece un vistazo general del comportamiento de las variables, donde logramos analizar aspectos
como distribución, dispersión, aleatoriedad y tendencia.
a) La Media Aritmética 𝑿̅ : también conocida como promedio aritmético es la sumatoria de cada una de
las observaciones entre el número de ellas. La media aritmética de una variable es simplemente el
promedio de los datos. Su cálculo depende si los datos están o no agrupados en una distribución
de frecuencia
Ventajas Desventajas
A medida que la distribución sea más simétrica No se puede calcular para tablas de frecuencias
mayor será la aproximación entre el valor medio con intervalos de clase abiertas
de los datos no agrupados y el valor medio de los
datos agrupados
b) La mediana 𝑴𝒅 : la mediana de un conjunto de datos es el valor del centro de los datos, una vez
que los mismos sean ordenados de menor a mayor. Esto es, la mediana es aquel valor por debajo
(encima) del cual se encuentra el 50% de los datos. Al igual que la media el cálculo de la
mediana depende de si los datos están o no agrupados en una distribución de frecuencias.
Ventajas Desventajas
c) Moda 𝑴𝒐 : es el valor más común entre los datos, en otras palabras es el valor que tiene
mayor frecuencia.
Ejemplo 1: Se han tomado como muestra las medidas de ocho cables usados en un arnés para lavadora,
las cuales son; 15,1 cm 15,0 15,3 15,2 15,3 15,8 15,4 y 15,3; determine las medidas de
tendencia central y concluya.
Solución:
̅
a) Media aritmética 𝑿
̅ = 15,3 cm
𝑿
El promedio de la longitud de los cables usados en un arnés para lavadora es de 15,3 cm.
b) Mediana 𝑴𝒅
Para hallar la mediana en datos no agrupados primero se ordenan los datos de menor a mayor. 𝑛 es el
total de los datos.
𝑛+1
➢ Si 𝑛 es impar se aplica la fórmula , el resultado me indicará la posición donde se encuentra
2
el dato central.
𝑛+1
➢ Si 𝑛 es par se aplica la fórmula , como el resultado es un número decimal siempre se
2
aproximará al anterior y siguiente entero, esos dos valores me indican la posición de los dos
valores centrales los cuales se promedian, y ese resultado será la mediana.
𝑛+1 8+1 9
Como 𝑛 es par aplico ; = 2 = 4,5
2 2
15,3+15,3
Por lo tanto la mediana es 𝑀𝑑 = = 15,3 𝑐𝑚
2
La longitud central de los cables usados en un arnés para lavadora es de 15,3 cm.
a) Moda 𝑴𝒐 𝑴𝒐 = 𝟏𝟓, 𝟑 𝒄𝒎
La longitud más frecuente de los cables usados en un arnés para lavadora es de 15,3 cm.
̅
𝑿 = 15,3 cm 𝑀𝑑 = 15,3 𝑐𝑚 𝑀𝑜 = 15,3 𝑐𝑚
Ejemplo 2: La siguiente gráfica de tallos y hojas registra las edades de grupo de pacientes.
674
𝑋̅ = = 30,64
22
El promedio de edad de los pacientes es de 31 años
➢ La mediana
- Se ubica la mediana dividiendo la muestra entre
𝑛
dos , luego ese valor lo busca en 𝑓𝑎 y encierra
2
el intervalo, observe la primera columna y el dato
que aparece ahí es el valor de la mediana.
𝑛 22
= = 11
2 2
➢ Moda: Mo
Los datos agrupados son aquellos datos que se encuentran dentro de un intervalo
de clase.
EJEMPLO : Los siguientes datos indican el peso en kilogramos de cuarenta niños entre los 2 y 4 años de
edad.
13,9 14,7 13,7 15,6 14,3 14,9 15 16,1 15,1 14,2 14,4 15,8 13,3 14,3 14,1 15,8 13,9 14,7 13,3 14,5
15,1 14,5 15,3 13,9 14,3 15 16 14,7 14,4 14,8 16,1 14,3 15,3 14,5 14 15,4 14,7 14,2 14,5 14,8
Tabla de frecuencias en datos agrupados: Es aquella que sus valores se presentan en intervalos. Se
utilizan únicamente con variables numéricas y cuando la variabilidad de los datos es muy amplia.
2.
13,3 13,3 13,7 13,9 13,9 13,9 14 14,1
14,2 14,2 14,3 14,3 14,3 14,3 14,4 14,4
14,5 14,5 14,5 14,5 14,7 14,7 14,7 14,7
14,8 14,8 14,9 15 15 15,1 15,1 15,3
15,3 15,4 15,6 15,8 15,8 16 16,1 16,1
3. 𝑅𝑎𝑛𝑔𝑜 = 16,1 − 13,3 = 2,8
4. 𝑚 = 1 + 3.33log (40);
𝑚 = 6,334859771
𝑚=6
2,8
5. 𝐴= 6
= 0,46~0,5
Tablas
6y7
Para hallar el intervalo tengo en cuenta la amplitud
13,3+0,5= 13,8
13,8+0,5= 14,3
14,3+0,5= 14,8 y así sucesivamente
∑ 𝑓𝑋
a) Media Aritmética: en datos agrupados se halla aplicando la siguiente fórmula 𝑋̅ = 𝑛
585,5
𝑋̅ = = 14,64
40
𝑛
a) Mediana : Para hallar la mediana en datos agrupados primero hallo ; el resultado obtenido lo
2
busco en 𝑓𝑎 y encierro el intervalo en el cual voy a trabajar, luego aplico la siguiente fórmula:
𝑛
− ∑ 𝑓𝑎
𝑀𝑑 = 𝐿𝑖 + ( 2 )∗𝐴
𝑓𝑛
2
𝐿𝑖 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
𝑛
𝑙𝑎 𝑚𝑖𝑡𝑎𝑑 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
2
∑ 𝑓𝑎 𝑙𝑎 𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎𝑠 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟𝑒𝑠
𝑓𝑛 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 (𝑜𝑗𝑜 𝑒𝑛 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑞𝑢𝑒 𝑒𝑛𝑐𝑒𝑟𝑟𝑎𝑚𝑜𝑠)
2
𝐴 𝑒𝑠 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑
n 40
= = 20
2 2
𝟐𝟎 − 𝟏𝟒
𝑴𝒅 = 𝟏𝟒, 𝟑𝟏 + ( ) ∗ 𝟎, 𝟓
𝟏𝟐
𝑴𝒅 = 𝟏𝟒, 𝟓𝟔
a) Moda
Para hallar la moda en datos agrupados encierro el intervalo con mayor frecuencia absoluta, y
aplico la siguiente fórmula:
∆1
𝑀𝑜 = 𝐿𝑖 + ( )∗𝐴
∆1 + ∆2
𝐿𝑖 = 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
∆1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑚𝑎𝑦𝑜𝑟 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
∆2 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑚𝑎𝑦𝑜𝑟 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒
𝐴 𝑒𝑠 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑
∆1 = 12 − 11 = 1
∆2 = 12 − 7 = 5
𝐴 = 0,5
1
𝑀𝑜 = 14,31 + ( ) ∗ 0,5
1+5
𝑀𝑜 = 14,39
Actividad
1..
2.El contenido de nicotina, en miligramos en 40 cigarrillos de cierta marca se registraron como sigue:
1,09 1,92 2,31 1,79 2,28 1,74 1,47 1,97 0,85 1,24
1,58 2,03 1,7 2,17 2,52 2,11 1,86 1,9 1,68 1,51
1,64 0,72 1,69 1,85 1,82 1,79 2,46 1,88 2,08 1,67
1,31 1,93 1,4 1,64 2,09 1,75 1,62 2,37 1,75 1,69