Está en la página 1de 14

UNIVERSIDAD DE PAMPLONA

DEPARTAMENTO DE MATEMÁTICAS
Asignatura: Estadística I
Tema: Distribución de frecuencias. Representación Gráfica de Datos estadísticos,
Medidas de Tendencia Central
Docente: Carolina Vargas Contreras
Fecha: Semana 1, 2 y 3 Primer Corte Grupos: AR y CR

Dadas las siguientes expresiones escriba si son variables discretas, continuas, dicotómicas o
politómicas.
1) Total de correos recibidos en un día: VARIABLE CUANTITATIVA DISCRETA
2) Nombre de software educativo: VARIABLE CUALITATIVA POLITÓMICA
3) Peso de una tarjeta madre: VARIABLE CUANTITATIVA CONTINUA
4) Posee usted balón gástrico en su organismo? VARIABLE CUALITATIVA DICOTÓMICA
5) Nombre de las piezas que conforman un automóvil VARIABLE CUALITATIVA POLITÓMICA
6) Valores de los indicadores económicos del día de ayer VARIABLE CUANTITATIVA CONTINUA
7) Total de chips defectuosos en el almacén de repuestos VARIABLE CUANTITATIVA DISCRETA

Distribución de Frecuencias
Una distribución de frecuencias, es una organización de todos los valores de la variable en una
tabla con intervalos o sin ellos, y en la que se asocian las frecuencias.
La siguiente es la descripción de cada una de las frecuencias:
- Frecuencia Absoluta (𝒇): es el número de veces que se repite una de las categorías o
valores de la variable.
- Frecuencia Absoluta Acumulada (𝒇𝒂) : es la suma de las frecuencias absolutas.
- Frecuencia Relativa (𝒇𝒓) : Es el cociente entre la frecuencia absoluta y el total de datos,
𝑓
se puede expresar como fracción o decimal. 𝑓𝑟 = 𝑛
- Frecuencia Relativa Acumulada (𝒇𝒓𝒂): Corresponde a la suma de las frecuencias
relativas. Es el cociente entre la frecuencia absoluta acumulada y el total de datos.
𝑓𝑎
𝑓𝑟𝑎 = 𝑛
- Frecuencia porcentual (%): se obtiene al multiplicar la frecuencia relativa por 100.
- Frecuencia porcentual acumulada: se obtiene al multiplicar la 𝑓𝑟𝑎 ∗ 100

Tener en cuenta las explicaciones de la docente


Explicación en Excel ojo.
Ejemplo 1para Datos Categóricos: Tabla de frecuencias de pacientes con trastornos psicológicos.
Ejemplo 2 para Datos Cuantitativos Discretos: La tabla expresa el número de elementos defectuosos
que contiene cada caja.
0, 1, 2,3, 3, 2, 4, 4, 2, 0, 1,3, 1, 4, 3, 3, 0, 0, 1, 1, 2, 3, 2, 4, 2, 2, 3, 3, 4, 4

Representación Gráfica de Datos Estadísticos


En los análisis estadísticos, es frecuente utilizar representaciones visuales complementarias de las
tablas que resumen los datos de estudio. Con estas representaciones, adaptadas en cada caso a la
finalidad informativa que se persigue, se transmiten los resultados de los análisis de forma rápida,
directa y comprensible para un conjunto amplio de personas.

Gráficas para datos categóricos: se muestran los datos estadísticos a través de representaciones
gráficas, se ha de adaptar el contenido a la información visual que se pretende transmitir.

1. Gráficos de sectores: circulares o de torta,


Trastornos psicológicos dividen un círculo en porciones proporcionales
según el valor de las frecuencias relativas.
de 800 pacientes
Para construir una gráfica de pastel, asigne un
Bipolaridad
12,50% 12,50% sector de círculo a cada categoría. El ángulo de
Esquizofrenia cada sector debe ser proporcional a la magnitud
T.D.A.H
de las mediciones (o frecuencia relativa) en esa
categoría.
31,25% T.O.C
43,75%
Como un círculo contiene 360°, se puede usar esta
ecuación para hallar el ángulo:
Ángulo= Frecuencia relativa por 360°.

Ojo explicación

100% 800
12,5% x

12,5% ∗ 800 10000


𝑥= = = 100
100% 100
2. Diagramas de barras: es un gráfico que se
utiliza para representar tablas estadísticas
que ofrezcan información de variables
cualitativas o cuantitativas discretas con
gran cantidad de datos. Muestran los valores
de las frecuencias absolutas sobre un sistema
de ejes cartesianos, cuando la variable es
discreta o cualitativa.

Gráficas para datos cuantitativos: Las variables cuantitativas miden una cantidad
en cada unidad experimental. Si la variable puede tomar sólo un número finito o contable de valores,
es una variable discreta. Una variable que puede tomar un número infinito de valores
correspondientes a puntos en un intervalo de recta se llama continua.

Un diagrama de puntos Una gráfica de puntos muestra cada elemento de un conjunto de datos
numéricos por encima de una recta numérica, o eje horizontal. Las gráficas de puntos facilitan ver los
espacios vacíos y los agrupamientos en un conjunto de datos, así como la manera en que se distribuyen
los datos a lo largo del eje.

El pulso varía de una persona a otra, pero por lo general, el pulso de una persona saludable en reposo
se mantiene entre ciertos valores. Una persona con un pulso muy rápido o muy lento podría necesitar
atención médica.

Ejemplo: Este conjunto de datos refleja los pulsos, expresados en pulsaciones por minuto (ppm), de
un grupo de 30 estudiantes: 68, 60 ,76, 68 ,64 ,80 ,72 ,76, 92, 68 ,56, 72 ,68 ,60 ,84, 72, 56, 88
,76 ,80, 68 ,80 ,84 ,64 ,80, 72 ,64 , 68, 76 y 72 .

Colecta los datos, organiza los datos en orden numérico, crea una línea horizontal, escribe un
sobre la línea horizontal cada vez que un dato se repita.

Si trabajas con dedicación


y amor,
todo te saldrá mejor
Diagrama Lineal o gráfico lineal: Se compone de una serie de datos representados por puntos, unidos
por segmentos lineales. Mediante este gráfico se puede comprobar rápidamente el cambio de
tendencia de los datos. El diagrama lineal se suele utilizar con variables cuantitativas, para ver su
comportamiento en el transcurso del tiempo. Por ejemplo, en las series temporales mensuales,
anuales, trimestrales, etc.
Los pasos para construir el gráfico de líneas son los siguientes:
- En el eje horizontal (eje de abcisas) se colocan los períodos de tiempo (meses, años, trimestres,…)
- En el eje vertical (eje de coordenadas) se colocan las frecuencias absolutas o relativas.
- Se señalan los puntos. A cada período de tiempo le corresponde un punto en el valor de su
frecuencia.
- Se unen mediante segmentos lineales los puntos consecutivos.

Gráfico de Tallos y Hojas: El diagrama "tallo y hojas" (Stem-and-Leaf Diagram) permite obtener
simultáneamente una distribución de frecuencias de la variable y su representación gráfica. Para
construirlo basta separar en cada dato el último dígito de la derecha (que constituye la hoja) del
bloque de cifras restantes (que formará el tallo).

¿Cómo construyo una gráfica de tallo y hoja?


1. Divida cada segmento en dos partes: el tallo y las hojas
2. Ponga en lista los tallos en una columna, con una línea vertical a su derecha.
3. Para cada medición, registre la parte de hoja en el mismo renglón como su tallo correspondiente.
4. Ordene las hojas de menor a mayor en cada tallo.
5. Dé una clave a su codificación de tallo y hoja para que el lector pueda recrear las mediciones
reales si es necesario.

Ejemplo
Histogramas: Es una herramienta usada para representar una distribución por medio de barras. La
altura de la barra está en función de la frecuencia (eje y) y el rango (eje x) de una variable continua.
Nos ofrece un vistazo general del comportamiento de las variables, donde logramos analizar aspectos
como distribución, dispersión, aleatoriedad y tendencia.

ACTIVIDAD: Consulta sobre: Polígono de frecuencias, Pictogramas, Pirámides de Población y has un


ejemplo para cada uno, realiza la actividad en tu cuaderno. Revisa en Excel cómo se hace un diagrama
de puntos, tallo de hojas y un histograma. Estimado estudiante, dedica tiempo para tus actividades.

MEDIDAS DE TENDENCIA CENTRAL


Medidas de Localización: También conocidas como medidas de tendencia central, son parámetros
alrededor de los cuales se distribuyen los datos de la distribución y se toman como el centro de la
misma. Algunas medidas de tendencia central son la media, la mediana y la moda.

a) La Media Aritmética 𝑿̅ : también conocida como promedio aritmético es la sumatoria de cada una de
las observaciones entre el número de ellas. La media aritmética de una variable es simplemente el
promedio de los datos. Su cálculo depende si los datos están o no agrupados en una distribución
de frecuencia

Ventajas Desventajas

Toma en cuenta todos los datos Es sensible a valores extremos

Fácil calcular y de operar algebraicamente No ofrece siempre una buena aproximación


cuando las distribuciones son asimétricas

A medida que la distribución sea más simétrica No se puede calcular para tablas de frecuencias
mayor será la aproximación entre el valor medio con intervalos de clase abiertas
de los datos no agrupados y el valor medio de los
datos agrupados
b) La mediana 𝑴𝒅 : la mediana de un conjunto de datos es el valor del centro de los datos, una vez
que los mismos sean ordenados de menor a mayor. Esto es, la mediana es aquel valor por debajo
(encima) del cual se encuentra el 50% de los datos. Al igual que la media el cálculo de la
mediana depende de si los datos están o no agrupados en una distribución de frecuencias.

Ventajas Desventajas

Es estable a los valores extremos No presenta todo el rigor matemático

Es recomendable para distribuciones muy Se emplea sólo en variables cuantitativas


asimétricas

c) Moda 𝑴𝒐 : es el valor más común entre los datos, en otras palabras es el valor que tiene
mayor frecuencia.

Características de la moda Propiedades de la moda Desventajas de la moda


estadística

• Una de las características de Por definición, la moda no es un Sensible a cualquier variación en


la moda es que no se ve valor único, sino que pueden la muestra, así como también
afectada por los factores existir más de dos valores que puede llegar a depender de la
extremos.
tengan la misma frecuencia en amplitud y el número de
• A diferencia de la media
aritmética, la moda no está cuyos casos se hablará de un intervalos cuando se refiere a
definida de forma algebraica. valor bimodal o polimodal. variables agrupadas en
• Se ve afectada por la intervalos.
designación de los métodos • La moda se destaca por un
de los intervalos de clase. sencillo cálculo
• Tiene una forma muy clara
de interpretarse No usa para su construcción
muchas observaciones, otro
inconveniente es que como
mencionamos antes pueden
existir varias modas y no
siempre está ubicada en el
centro de la distribución.

Siempre parece imposible hasta que se hace


(Nelson Mandela)
MEDIDAS DE TENDENCIA CENTRAL EN DATOS NO AGRUPADOS

Ejemplo 1: Se han tomado como muestra las medidas de ocho cables usados en un arnés para lavadora,
las cuales son; 15,1 cm 15,0 15,3 15,2 15,3 15,8 15,4 y 15,3; determine las medidas de
tendencia central y concluya.

Solución:

̅
a) Media aritmética 𝑿

15,1 + 15,0 + 15,3 + 15,2 + 15,3 + 15,8 + 15,4 + 15,3


̅
𝑿=
8
122,4
̅=
𝑿
8

̅ = 15,3 cm
𝑿
El promedio de la longitud de los cables usados en un arnés para lavadora es de 15,3 cm.

b) Mediana 𝑴𝒅
Para hallar la mediana en datos no agrupados primero se ordenan los datos de menor a mayor. 𝑛 es el
total de los datos.
𝑛+1
➢ Si 𝑛 es impar se aplica la fórmula , el resultado me indicará la posición donde se encuentra
2
el dato central.
𝑛+1
➢ Si 𝑛 es par se aplica la fórmula , como el resultado es un número decimal siempre se
2
aproximará al anterior y siguiente entero, esos dos valores me indican la posición de los dos
valores centrales los cuales se promedian, y ese resultado será la mediana.

15 15,1 15,2 15,3 15,3 15,3 15,4 15,8

𝑛+1 8+1 9
Como 𝑛 es par aplico ; = 2 = 4,5
2 2

15,3+15,3
Por lo tanto la mediana es 𝑀𝑑 = = 15,3 𝑐𝑚
2

La longitud central de los cables usados en un arnés para lavadora es de 15,3 cm.
a) Moda 𝑴𝒐 𝑴𝒐 = 𝟏𝟓, 𝟑 𝒄𝒎

La longitud más frecuente de los cables usados en un arnés para lavadora es de 15,3 cm.

̅
𝑿 = 15,3 cm 𝑀𝑑 = 15,3 𝑐𝑚 𝑀𝑜 = 15,3 𝑐𝑚

La distribución de este ejemplo es SIMÉTRICA


porque la media, la mediana y la moda son
iguales.

Ejemplo 2: La siguiente gráfica de tallos y hojas registra las edades de grupo de pacientes.

a.. Construir una tabla de frecuencias con la variable edad


b. Hallar las medidas de tendencia central.

➢ La media aritmética ̅ = ∑ 𝒇∗𝒙𝒊


𝑿 𝒏

674
𝑋̅ = = 30,64
22
El promedio de edad de los pacientes es de 31 años

➢ La mediana
- Se ubica la mediana dividiendo la muestra entre
𝑛
dos , luego ese valor lo busca en 𝑓𝑎 y encierra
2
el intervalo, observe la primera columna y el dato
que aparece ahí es el valor de la mediana.

𝑛 22
= = 11
2 2

Por lo tanto la edad que corresponde a esa frecuencia es la mediana de 22

El 50% de pacientes registran una edad de 22 años o menos.

➢ Moda: Mo

Como los datos están dentro de una tabla la moda


corresponde al dato en la primera columna donde se
encuentre la mayor frecuencia absoluta.

La edad más frecuente de los pacientes es de 41 años

Consulta sobre la media geométrica y has un ejemplo.


MEDIDAS DE TENDENCIA CENTRAL EN DATOS AGRUPADOS

Los datos agrupados son aquellos datos que se encuentran dentro de un intervalo
de clase.

EJEMPLO : Los siguientes datos indican el peso en kilogramos de cuarenta niños entre los 2 y 4 años de
edad.

13,9 14,7 13,7 15,6 14,3 14,9 15 16,1 15,1 14,2 14,4 15,8 13,3 14,3 14,1 15,8 13,9 14,7 13,3 14,5

15,1 14,5 15,3 13,9 14,3 15 16 14,7 14,4 14,8 16,1 14,3 15,3 14,5 14 15,4 14,7 14,2 14,5 14,8

I. Construye una distribución de frecuencias para datos agrupados.


II. Halla las medidas de tendencia central y concluya.
III. Representa los datos mediante un histograma de frecuencias absolutas.

Tabla de frecuencias en datos agrupados: Es aquella que sus valores se presentan en intervalos. Se
utilizan únicamente con variables numéricas y cuando la variabilidad de los datos es muy amplia.

Pasos para construir una distribución de frecuencias agrupada:


1. Recolectar los datos.
2. Ordenar los datos de menor a mayor.
3. Hallar el rango
. 𝑅𝑎𝑛𝑔𝑜 = 𝑑𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟
4. Determinar el número de intervalos (𝑚).
Regla de Sturges 𝑚 = 1 + 3.33log (𝑛);
𝑛 es el total de datos.
𝑚 lo aproxima a un valor entero.
𝑟𝑎𝑛𝑔𝑜
5. Determinar la amplitud o anchura del intervalo. 𝐴 =
𝑚
6. Hallar las frecuencias de clase
7. Calcular la marca de clase ( 𝑋 ) que es el valor medio o promedio de cada intervalo
𝐿𝑖 +𝐿𝑠
. 𝑋= 2
Solución

I. Construye una distribución de frecuencias para datos agrupados.


1. Los datos los proporciona el ejercicio.

2.
13,3 13,3 13,7 13,9 13,9 13,9 14 14,1
14,2 14,2 14,3 14,3 14,3 14,3 14,4 14,4
14,5 14,5 14,5 14,5 14,7 14,7 14,7 14,7
14,8 14,8 14,9 15 15 15,1 15,1 15,3
15,3 15,4 15,6 15,8 15,8 16 16,1 16,1
3. 𝑅𝑎𝑛𝑔𝑜 = 16,1 − 13,3 = 2,8

4. 𝑚 = 1 + 3.33log (40);
𝑚 = 6,334859771
𝑚=6

2,8
5. 𝐴= 6
= 0,46~0,5

Tablas
6y7

Para hallar el intervalo tengo en cuenta la amplitud


13,3+0,5= 13,8
13,8+0,5= 14,3
14,3+0,5= 14,8 y así sucesivamente

𝐿𝑖+𝐿𝑠 13,3+13,8 27,1


Marca de clase 𝑋 = = = = 13,55
2 2 2
13,3 13,3 13,7 13,9 13,9 13,9 14 14,1
14,2 14,2 14,3 14,3 14,3 14,3 14,4 14,4
14,5 14,5 14,5 14,5 14,7 14,7 14,7 14,7
14,8 14,8 14,9 15 15 15,1 15,1 15,3
15,3 15,4 15,6 15,8 15,8 16 16,1 16,1
Peso en Kg f fa fr fra X fX
[13,3 − 13,8] 3 3 0,075 0,075 13,55 40,65
(13,8 − 14,3] 11 14 0,275 0,35 14,05 154,55
(14,3 − 14,8] 12 26 0,3 0,65 14,55 174,6
(14,8 − 15,3] 7 33 0,175 0,825 15,05 105,35
(15,3 − 15,8] 4 37 0,1 0,925 15,55 62,2
(15,8 − 16,3] 3 40 0,075 1 16,05 48,15
Total .n=40 ∑ 𝑓𝑋 = 585,5
Ojo con la explicación en excel

II. Halla las medidas de tendencia central y concluya.

∑ 𝑓𝑋
a) Media Aritmética: en datos agrupados se halla aplicando la siguiente fórmula 𝑋̅ = 𝑛

585,5
𝑋̅ = = 14,64
40

El peso promedio de los niños entre 2 y 4 años es de 14,64 𝑘𝑔

𝑛
a) Mediana : Para hallar la mediana en datos agrupados primero hallo ; el resultado obtenido lo
2
busco en 𝑓𝑎 y encierro el intervalo en el cual voy a trabajar, luego aplico la siguiente fórmula:

𝑛
− ∑ 𝑓𝑎
𝑀𝑑 = 𝐿𝑖 + ( 2 )∗𝐴
𝑓𝑛
2
𝐿𝑖 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
𝑛
𝑙𝑎 𝑚𝑖𝑡𝑎𝑑 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
2
∑ 𝑓𝑎 𝑙𝑎 𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎𝑠 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟𝑒𝑠
𝑓𝑛 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 (𝑜𝑗𝑜 𝑒𝑛 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑞𝑢𝑒 𝑒𝑛𝑐𝑒𝑟𝑟𝑎𝑚𝑜𝑠)
2
𝐴 𝑒𝑠 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑

n 40
= = 20
2 2
𝑛
− ∑ 𝑓𝑎
𝑀𝑑 = 𝐿𝑖 + (2 )∗𝐴
𝑓𝑛
2
𝟐𝟎 − 𝟏𝟒
𝑴𝒅 = 𝟏𝟒, 𝟑𝟏 + ( ) ∗ 𝟎, 𝟓
𝟏𝟐
𝑴𝒅 = 𝟏𝟒, 𝟓𝟔

El peso central de los niños entre 2 y 4 años es de 14,56 𝑘𝑔.

a) Moda
Para hallar la moda en datos agrupados encierro el intervalo con mayor frecuencia absoluta 𝑓, y
aplico la siguiente fórmula:

∆1
𝑀𝑜 = 𝐿𝑖 + ( )∗𝐴
∆1 + ∆2
𝐿𝑖 = 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
∆1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑚𝑎𝑦𝑜𝑟 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
∆2 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑚𝑎𝑦𝑜𝑟 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒
𝐴 𝑒𝑠 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑

∆1 = 12 − 11 = 1
∆2 = 12 − 7 = 5
𝐴 = 0,5
∆1
𝑀𝑜 = 𝐿𝑖 + (∆ )∗𝐴
1 +∆2

1
𝑀𝑜 = 14,31 + (1+5) ∗ 0,5
𝑀𝑜 = 14,39

El peso más frecuente de los niños entre 2 y 4 años es de 14,39 𝑘𝑔.

𝑋̅ = 14,64 𝑘𝑔 𝑀𝑑 = 14,56 𝑘𝑔 𝑀𝑜 = 14,39 𝑘𝑔


Como 𝑋̅ > 𝑀𝑑 > 𝑀𝑜 𝑑𝑒𝑐𝑖𝑚𝑜𝑠 𝑞𝑢𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑠 𝑎𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎

Cuando la media es mayor que la mediana y la mediana es mayor


que la moda la distribución es asimétrica positiva.

Consulta: cuándo una distribución es asimétrica negativa?.


III.. Representa los datos mediante un histograma de frecuencias absolutas y
frecuencias relativas
Histograma de Frecuencias absolutas Histograma de frecuencias relativas.

Actividad
1..

2.El contenido de nicotina, en miligramos en 40 cigarrillos de cierta marca se registraron como sigue:

1,09 1,92 2,31 1,79 2,28 1,74 1,47 1,97 0,85 1,24
1,58 2,03 1,7 2,17 2,52 2,11 1,86 1,9 1,68 1,51
1,64 0,72 1,69 1,85 1,82 1,79 2,46 1,88 2,08 1,67
1,31 1,93 1,4 1,64 2,09 1,75 1,62 2,37 1,75 1,69

a). Determine: muestra, variable, tipo de variable


b). Construya una tabla de distribución de frecuencias para datos agrupados.
c). Calcule las medidas de tendencia central y concluya..
d) Representa los datos mediante un diagrama circular, histograma y ojiva

También podría gustarte