Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen: Los datos agrupados son datos que se juntan en intervalos para poder estu-
diarlos de manera conjunta. En este experimento mediante el lanzamiendo de 10 monedas
de la misma denominación y el registro de resultados que se obtienen de la probabilidad
que una moneda tiene de caer con la misma cara tras lanzarla repetidas veces, de dicho
experimento se pretende construir un histograma y calcular diversas medidas de los datos
agrupados.
1. Objetivos
Realizar un experimento donde se apliquen los conceptos aprendidos sobre datos agrupados.
Calcular medidas de tendencia central, dispersión, variabilidad y asimetrı́a para datos agru-
pados.
2. Marco Teórico
2.1. Tipos de Datos
Los datos pueden ser cualitativos y cuantitativos. Los cualitativos pueden corresponder
a dos categorı́as, llamados dicotómicos, o a más de dos categorı́as. Los cuantitativos pueden ser
continuos o discretos. Las escalas de medición se definen por las operaciones matemáticas que
pueden ser usadas en su manipulación.
1
2.2.1. Fórmula STURGES
La regla de Sturges es una regla que sirve para calcular el número clases o intervalos idóneo
en los que se debe dividir un conjunto de datos. La fórmula de la regla de Sturges establece que el
número de clases es igual a uno más el logaritmo en base dos del número total de datos.
Valor Máximo - Valor Mı́nimo
c= (1)
1 + (3, 32 ∗ log N )
[1]
2.3. Frecuencia
2.3.1. Frecuencia Absoluta
Es el número de veces que aparece un valor en un conjunto de datos. Es decir, la frecuencia
absoluta es la cantidad de veces que se repite un resultado. Por ejemplo, si en una encuesta siete
personas han respondido que su color favorito es el rojo, entonces la frecuencia absoluta del color
rojo es 7.
Por lo tanto, la suma de las frecuencias absolutas de todos los valores es igual al núme-
ro total de datos de la muestra estadı́stica. Para calcular está frecuencia no hace falta ninguna
fórmula.[1]
Hallar la frecuencia absoluta acumulada de cada valor, que se calcula sumando la frecuencia
absoluta del propio valor más las frecuencias absolutas de todos los valores menores.
[1]
2
hi es la frecuencia relativa.
fi es la frecuencia absoluta.
N es la frecuencia absoluta.
[1]
2.5.2. Histogramas
Es un tipo de diagrama estadı́stico en el que se representa un conjunto de datos estadı́sticos
mediante barras rectangulares, de manera que cada barra del histograma es proporcional a su
frecuencia correspondiente.
Los histogramas sirven para representar gráficamente variables continuas, como por ejem-
plo el peso de una muestra estadı́stica. Además, un histograma permite visualizar rápidamente la
forma que tiene una distribución. Cada barra de un histograma de frecuencias tiene una anchura
proporcional a la amplitud del intervalo y una altura proporcional a la frecuencia del intervalo.[1]
3
2.6.1. Moda
La moda no es más que el número, variable o respuesta que más se repite en un conjunto de
datos, pero como no se tienen números especı́ficos sino que intervalos, estos no se pueden contar uno
a uno, por lo tanto es muy probable que la moda que se termine calculando no sea un número que
esté en los datos recopilada, puede ser que en algunos casos la moda si que coincida con los datos,
pero esto no sucederá siempre porque el número que se calcula en la moda para datos agrupados
simplemente una estimación de un número que se aproxime al valor exacto de la moda. Y la fórmula
es:
△1
Moda = Li + ∗A (3)
△1 + △2
Donde:
△1 = fi − fi − 1
△2 = fi − fi + 1
fi es la frecuencia del intervalo que contiene la moda, fi − 1 es la frecuencia del intervalo
anterior al intervalo de la moda, y fi + 1 es la frecuencia del intervalo posterior a la moda y con
estos datos se pueden encontrar tanto △1 como △2 .
Li es el lı́mite inferior del intervalo de la clase moda.
A es la amplitud del intervalo[1]
2.6.2. Mediana
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la
mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que
se encuentre. Y la manera de calcularlo es:
(n/2) − fa anterior
Mediana = Li + ∗ Ic (4)
fi
[1]
2.6.3. Media
La media aritmética también se conoce como PROMEDIO, y básicamente se calcula como
la suma de todos los datos dividida entre el número total de datos.
P
Xi ∗ fi
µ= (5)
N
[1]
4
2.7.2. Desviación estándar
Mide la dispersión de una distribución de datos. Entre más dispersa está una distribución
de datos, más grande es su desviación estándar.
rP
(Xi − µ)2 ∗ fi
s= (7)
n−1
[1]
2.8.2. Deciles
Un decil escualquiera de los nueve valores que dividen a un grupo de datos ordenados en
diez partes iguales, de manera que cada parte representa 1/10 de la muestra o población.
(k ∗ n/10) − fa anterior
Dk = Li + ∗ Ic (10)
fi
[1]
2.8.3. Percentiles
El percentil es una medida estadı́stica la cual divide una serie de datos ordenados de menor
a mayor en cien partes iguales. Se trata de un indicador que busca mostrar la proporción de la serie
de datos que queda por debajo de su valor de los datos.
(k ∗ n/100) − fa anterior
Pk = Li + ∗ Ic (11)
fi
[1]
5
2.8.4. Coeficiente de Asimetrı́a
Es una medida estadı́stica utilizada para describir la forma como se encuentran distri-
buidas las frecuencias correspondientes a los diferentes valores de la variables en estudio. Esre
coeficiente permite medir la falta de simetrı́a de una distribución.
Esta se calcula con la formla de Pearson:
3 ∗ (µ − Mediana)
AP = (12)
s
[1]
3. Diseño experimental
3.1. Materiales y Montaje
Diez monedas de la misma denominación.
Cuaderno y lapicero para anotar datos.
3.2. Procedimiento
1. Lanzar 10 monedas y anotar el número de caras que caen, repetir 50 veces el procedimiento
y en cada lanzamiento anotar el número de caras.
2. Ordenar los datos de menor a mayor, y cuente cuantas veces aparece 0, 1, 2, ..., 10 caras(f ).
xi 0 1 2 3 4 5 6 7 8 9 10
Fi 0 1 0 6 11 8 15 5 4 0 0
6
3. Ordenar los datos en intervalos, utilizando fórmula STURGES.
4. La tabla de datos debe contener todas la columnas necesarias para los cálculos posteriores.
4. Resultados
Resultados obtenidos luego de lanzar 50 veces 10 monedas de la misma denominación
agrupados en clases calculadas con la fórmula de Sturges, con sus lı́mites reales, marca de clase y
todas sus frecuencias mencionadas en el apartado 2.3 del documento.
7
4.1. Histograma y Polı́gono de Frecuencias de los Lı́mites Teales
vs Frecuencia.
4.1.1. Histograma
El histograma muestra como las frecuencias se han distribuido, obteniendo las mayores
frecuencias en los lı́mites reales que se acercan a la Mediana y menos frecuencia en los lı́mites reales
que están mas alejados de la Mediana.
8
4.2. Moda, Mediana y Media Aritmética
La moda muestra que las caras de las monedas que más salieron fue entre 5 y 6 caras.
La mediana muestra el punto medio de los datos considerando la probabilidad que tienen
las monedas de caer con 0 caras o con 10 caras.
La media aritmética muestra una valor alto ya que el reparto del número de caras que
caı́an no fue similar en todos sus intérvalos.
Coeficiente de Variación
C.V = 30.19 %
9
5. Discusión de Resultados y Conclusiones
El histograma nos muestra como las frecuencias se han distribuido de la manera esperada,
debido a que los valores con mayor frecuencia se encuentran cerca de la Mediana. Debido a
que la probabilidad que 10 monedas tienen de caer con la misma cara es muy baja, de igual
manera para el número de monedas 9,8,2,1 y 0, la probabilidad es más baja que los valores
cerca de la Mediana.
El polı́gono de frecuencias muestra una frecuencia que cambia abruptamente entre una clase
y la siguiente, lo cual era el resultado esperado debido a que la probabilidad de las clases
cercas de la media es considerablemente más alta que las clases lejanas a ella.
En la Tabla 7 notamos que el coeficiente de variación nos dió 30.19 %, lo que significa que de
todas las veces que tiramos, un 69.81 % obtuvimos cara, mientras que el 30.19 % nos daba
escudo. Es decir, la distribución de las veces que salió cara es un 30.19 % heterogénea, y un
69.81 % homogénea.
6. Anexos
6.1. Cálculos para Tabla de Datos Agrupados
n=Σx = 50.
10−0
I.C= 1+(3.32 · log 50) = 1.51 ≈ 2.
10
Clase Fi Fr F% FA FAr FA % Xi Lı́mites Reales
0-1 1 1/50 1/50 · 100 1 (1/50) (1/50) · 100 (0 + 1.5)/2 0-1.5
2-3 6 6/50 6/50 · 100 7 7/50 (7/50) · 100 (1.5+3.5)/2 1.5-3.5
4-5 19 19/50 19/50 · 100 26 26/50 (26/50) · 100 (3.5+5.5)/2 3.5-5.5
6-7 20 20/50 20/50 · 100 46 46/2 (46/2) · 100 (5.5+7.5)/2 5.5+7.5
8-9 4 4/50 4/50 · 100 50 50/50 (50/50) · 100 (7.5-9.5)/2 7.5-9.5
10 0 0 0 50 1 100 9.75 9.5-10
20−19
Mo=5.5 + ( (20−19)+(20−4) · 2) = 5.62.
Me=3.5 + ( (50/2)−7
19 · 2) = 5.39
0+1+2+3+4+5+6+7+8+9+10
µ= 50 = 5.2
Varianza:
x 0 1 2 3 4 5 6 7 8 9 10
Fi 0 1 0 6 11 8 15 5 4 0 0
x · Fi 0 1 0 18 44 40 90 35 32 0 0
x−µ -5.2 -4.2 -3.2 -2.2 -1.2 -0.2 0.8 1.8 2.8 3.8 4.8
(x − µ)2 27,04 17.64 10.24 4.84 1.44 0.04 0.64 3.24 7.84 14.44 23.04
(x − µ)2 · F i 0 17.64 0 29.04 15.84 0.32 9.6 16.2 31.36 0 0
Σ((x − µ)2 · F i) 120
s2 = Σ((x−µ) · F i) →
2
120
= 2.45.
n−1 49
√
s= s2 = 1.57.
C.V= s
µ · 100 = 1.57
5.2 = 30.19 %.
AP= 3 · (µ−M
s
ed)
→ 3 · (5.2−5.39)
1.57 = 0.36.
7. Referencias
Referencias
[1] Victor Antonio Vegas R. Módulo Instruccional para Estadı́stica Descriptiva.
[2] Academia Valderix. 2022. url: https : / / www . probabilidadyestadistica . net /
asimetria-negativa/.
11