Está en la página 1de 11

Datos Agrupados

Escuela de Ciencias Fı́sicas y Matemáticas


Luis Diego López Pérez 202306217
Daniel Antonio Enrı́quez Pérez 202308323
Fı́sica Experimental
5 de septiembre de 2023

Resumen: Los datos agrupados son datos que se juntan en intervalos para poder estu-
diarlos de manera conjunta. En este experimento mediante el lanzamiendo de 10 monedas
de la misma denominación y el registro de resultados que se obtienen de la probabilidad
que una moneda tiene de caer con la misma cara tras lanzarla repetidas veces, de dicho
experimento se pretende construir un histograma y calcular diversas medidas de los datos
agrupados.

1. Objetivos
Realizar un experimento donde se apliquen los conceptos aprendidos sobre datos agrupados.

Construir un histograma a partir de los datos obtenidos y el análisis.

Calcular medidas de tendencia central, dispersión, variabilidad y asimetrı́a para datos agru-
pados.

2. Marco Teórico
2.1. Tipos de Datos
Los datos pueden ser cualitativos y cuantitativos. Los cualitativos pueden corresponder
a dos categorı́as, llamados dicotómicos, o a más de dos categorı́as. Los cuantitativos pueden ser
continuos o discretos. Las escalas de medición se definen por las operaciones matemáticas que
pueden ser usadas en su manipulación.

2.2. Ordenamiento de Datos Agrupados en Intervalos


El ordenamiento de datos agrupados se realiza cuando la cantidad de datos es grande
y/o la variable es continua. Básicamente consiste en agrupar los datos en intervalos de una misma
amplitud, denominados clases. A cada clase se le asignan valores de cada tipo de frecuencias.
A los intervalos también se les conoce como clases. Simplemente son las “categorı́as” en
las cuales vamos a encasillar nuestros datos. La forma de calcular la cantidad de intervalos se le
conoce como la fórmula de Sturges. [1]

1
2.2.1. Fórmula STURGES
La regla de Sturges es una regla que sirve para calcular el número clases o intervalos idóneo
en los que se debe dividir un conjunto de datos. La fórmula de la regla de Sturges establece que el
número de clases es igual a uno más el logaritmo en base dos del número total de datos.
Valor Máximo - Valor Mı́nimo
c= (1)
1 + (3, 32 ∗ log N )
[1]

2.3. Frecuencia
2.3.1. Frecuencia Absoluta
Es el número de veces que aparece un valor en un conjunto de datos. Es decir, la frecuencia
absoluta es la cantidad de veces que se repite un resultado. Por ejemplo, si en una encuesta siete
personas han respondido que su color favorito es el rojo, entonces la frecuencia absoluta del color
rojo es 7.
Por lo tanto, la suma de las frecuencias absolutas de todos los valores es igual al núme-
ro total de datos de la muestra estadı́stica. Para calcular está frecuencia no hace falta ninguna
fórmula.[1]

2.3.2. Frecuencia Acumulada


En estadı́stica, la frecuencia absoluta acumulada es la suma acumulativa de las frecuencias
absolutas. Es decir, la frecuencia absoluta acumulada de un valor es igual a la frecuencia absoluta
de dicho valor más las frecuencias absolutas de todos los valores menores que él.
Los pasos para calcular la frecuencia absoluta acumulada son los siguientes:
Hacer una tabla con todos los valores diferentes que aparecen en el conjunto de datos, es
decir, colocar cada valor diferente en una fila de una tabla.

Determinar la frecuencia absoluta de cada valor.

Hallar la frecuencia absoluta acumulada de cada valor, que se calcula sumando la frecuencia
absoluta del propio valor más las frecuencias absolutas de todos los valores menores.
[1]

2.3.3. Frecuencia Relativa


Es una medida que indica el número de veces que aparece un valor en una muestra de datos
en forma de proporción o porcentaje. En concreto, la frecuencia relativa es igual a la frecuencia
absoluta dividida por el número total de datos.
La fórmula de la frecuencia relativa es la siguiente:
fi
hi = (2)
N
Donde:

2
hi es la frecuencia relativa.

fi es la frecuencia absoluta.

N es la frecuencia absoluta.

[1]

2.3.4. Frecuencia Relativa Acumulada


Es la suma acumulativa de las frecuencias relativas. Es decir, la frecuencia relativa acu-
mulada de un valor es igual a la frecuencia relativa de dicho valor más las frecuencias relativas de
todos los valores menores que él.[1]

2.4. Distribución de Frecuencias


Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la
variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes,
etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que
contienen los datos.
En ella se colocan todas las frecuencias mencionadas en la subsección 2.3.[1]

2.5. Diagramas de Barras e Histogramas


2.5.1. Diagramas de Barras
Es un tipo de gráfico estadı́stico que se utiliza para representar gráficamente variables
discretas. En un diagrama de barras se representa en el eje X cada valor de la variable de estudio,
y para cada uno se dibuja una barra rectangular con una altura proporcional a su frecuencia que
nos sirve para comparar la cantidad de veces que se repiten los datos.[1]

2.5.2. Histogramas
Es un tipo de diagrama estadı́stico en el que se representa un conjunto de datos estadı́sticos
mediante barras rectangulares, de manera que cada barra del histograma es proporcional a su
frecuencia correspondiente.
Los histogramas sirven para representar gráficamente variables continuas, como por ejem-
plo el peso de una muestra estadı́stica. Además, un histograma permite visualizar rápidamente la
forma que tiene una distribución. Cada barra de un histograma de frecuencias tiene una anchura
proporcional a la amplitud del intervalo y una altura proporcional a la frecuencia del intervalo.[1]

2.6. Medidas de Centralización para Datos Agrupados


Las medidas de tendencia central, o medidas de centralización, son métricas estadı́sticas
que indican el valor central de una distribución. Es decir, las medidas de tendencia central sirven
para encontrar un valor representativo del centro de un conjunto de datos.
Las medidas de centralización son la media, la mediana y la moda.[1]

3
2.6.1. Moda
La moda no es más que el número, variable o respuesta que más se repite en un conjunto de
datos, pero como no se tienen números especı́ficos sino que intervalos, estos no se pueden contar uno
a uno, por lo tanto es muy probable que la moda que se termine calculando no sea un número que
esté en los datos recopilada, puede ser que en algunos casos la moda si que coincida con los datos,
pero esto no sucederá siempre porque el número que se calcula en la moda para datos agrupados
simplemente una estimación de un número que se aproxime al valor exacto de la moda. Y la fórmula
es:
△1
Moda = Li + ∗A (3)
△1 + △2
Donde:
△1 = fi − fi − 1
△2 = fi − fi + 1
fi es la frecuencia del intervalo que contiene la moda, fi − 1 es la frecuencia del intervalo
anterior al intervalo de la moda, y fi + 1 es la frecuencia del intervalo posterior a la moda y con
estos datos se pueden encontrar tanto △1 como △2 .
Li es el lı́mite inferior del intervalo de la clase moda.
A es la amplitud del intervalo[1]

2.6.2. Mediana
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la
mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que
se encuentre. Y la manera de calcularlo es:
(n/2) − fa anterior
Mediana = Li + ∗ Ic (4)
fi
[1]

2.6.3. Media
La media aritmética también se conoce como PROMEDIO, y básicamente se calcula como
la suma de todos los datos dividida entre el número total de datos.
P
Xi ∗ fi
µ= (5)
N
[1]

2.7. Medidas de Dispersión para Datos Agrupados


2.7.1. Varianza
Es una medida de dispersión que se utiliza para representar la variabilidad de un conjunto
de datos respecto de la media aritmética de los mismo.
(Xi − µ)2 ∗ fi
P
2
s = (6)
n−1
[1]

4
2.7.2. Desviación estándar
Mide la dispersión de una distribución de datos. Entre más dispersa está una distribución
de datos, más grande es su desviación estándar.
rP
(Xi − µ)2 ∗ fi
s= (7)
n−1
[1]

2.7.3. Coeficiente de variación


Se utiliza para comparar la dispersión (variación) de conjuntos de datos de medidas dife-
rentes o con medias aritméticas diferentes.
s
C.V = ∗ 100 (8)
µ
[1]

2.8. Medidas de Variabilidad y Asimetrı́a para Datos Agrupados


2.8.1. Cuartiles
Son valores que dividen una muestra de datos en cuatro partes iguales. Utilizando cuartiles
puede evaluar rápidamente la dispersión y la tendencia central de un conjunto de datos, que son
los pasos iniciales importantes para comprender sus datos.
(k ∗ n/4) − fa anterior
Qk = Li + ∗ Ic (9)
fi
[1]

2.8.2. Deciles
Un decil escualquiera de los nueve valores que dividen a un grupo de datos ordenados en
diez partes iguales, de manera que cada parte representa 1/10 de la muestra o población.
(k ∗ n/10) − fa anterior
Dk = Li + ∗ Ic (10)
fi
[1]

2.8.3. Percentiles
El percentil es una medida estadı́stica la cual divide una serie de datos ordenados de menor
a mayor en cien partes iguales. Se trata de un indicador que busca mostrar la proporción de la serie
de datos que queda por debajo de su valor de los datos.
(k ∗ n/100) − fa anterior
Pk = Li + ∗ Ic (11)
fi
[1]

5
2.8.4. Coeficiente de Asimetrı́a
Es una medida estadı́stica utilizada para describir la forma como se encuentran distri-
buidas las frecuencias correspondientes a los diferentes valores de la variables en estudio. Esre
coeficiente permite medir la falta de simetrı́a de una distribución.
Esta se calcula con la formla de Pearson:
3 ∗ (µ − Mediana)
AP = (12)
s
[1]

2.8.5. Coeficiente de Curtosis


El coeficiente de Curtosis, representea el grado de apuntamiento o altura de una distribu-
ción con respecto a la distribución normal. Una distribución de datos puede ser:
Leptocurtica: Apuntamiento Alto (Alta concentración de los datos en torno al centro de la
serie)
Mesocurtica: Apuntamiento Normal (Concentración media de los datos en torno al centro de
la serie)
Platicurtica: Apuntamiento Bajo (Baja concentración de los datos en torno al centro de la
serie)
Este coeficiente se calcula con la fórmula de Fischer:
(Xi − µ)4 ∗ fi
P
4
Cm = (13)
(n) ∗ (s)4
[1]

3. Diseño experimental
3.1. Materiales y Montaje
Diez monedas de la misma denominación.
Cuaderno y lapicero para anotar datos.

3.2. Procedimiento
1. Lanzar 10 monedas y anotar el número de caras que caen, repetir 50 veces el procedimiento
y en cada lanzamiento anotar el número de caras.
2. Ordenar los datos de menor a mayor, y cuente cuantas veces aparece 0, 1, 2, ..., 10 caras(f ).

xi 0 1 2 3 4 5 6 7 8 9 10
Fi 0 1 0 6 11 8 15 5 4 0 0

Cuadro 1: Número de Caras Ordenadas de Menor a Mayor con sus respectivas f .

6
3. Ordenar los datos en intervalos, utilizando fórmula STURGES.

Clases Fi Lı́mites Reales


0-1 1 0-1.5
2-3 6 1.5-3.5
4-5 19 3.5-5.5
6-7 20 5.5-7.5
8-9 4 7.5-9.5
10 0 9.5-10

Cuadro 2: Datos Ordenados en Intervalos bajo fórmula STURGES.

4. La tabla de datos debe contener todas la columnas necesarias para los cálculos posteriores.

Clases Fi Fr FR % FA FAr FA % Xi Lı́mites Reales


0-1 1 0-1.5
2-3 6 1.5-3.5
4-5 19 3.5-5.5
6-7 20 5.5-7.5
8-9 4 7.5-9.5
10 0 9.5-10
Σ 50

Cuadro 3: Tabla de Datos con Columnas necesarias para Cálculos Posteriores.

4. Resultados
Resultados obtenidos luego de lanzar 50 veces 10 monedas de la misma denominación
agrupados en clases calculadas con la fórmula de Sturges, con sus lı́mites reales, marca de clase y
todas sus frecuencias mencionadas en el apartado 2.3 del documento.

Clases Fi Fr FR % FA FAr FA % Xi Lı́mites Reales


0-1 1 0.02 2 1 0.02 2 0.75 0-1.5
2-3 6 0.12 12 7 0.14 14 2.5 1.5-3.5
4-5 19 0.38 38 26 0.52 52 4.5 3.5-5.5
6-7 20 0.4 40 46 0.92 92 6.5 5.5-7.5
8-9 4 0.08 8 50 1 100 8.5 7.5-9.5
10 0 0 0 50 1 100 9.75 9.5-10
Σ 50 1 100 %

Cuadro 4: Tabla de Datos Agrupados.

7
4.1. Histograma y Polı́gono de Frecuencias de los Lı́mites Teales
vs Frecuencia.
4.1.1. Histograma
El histograma muestra como las frecuencias se han distribuido, obteniendo las mayores
frecuencias en los lı́mites reales que se acercan a la Mediana y menos frecuencia en los lı́mites reales
que están mas alejados de la Mediana.

4.1.2. Polı́gono de frecuencias


El polı́gono muestra una frecuencia bastante grande con la que cambia nuestra variable,
en este caso, el número de caras que caen al lanzar 10 monedas 50 veces.

8
4.2. Moda, Mediana y Media Aritmética
La moda muestra que las caras de las monedas que más salieron fue entre 5 y 6 caras.
La mediana muestra el punto medio de los datos considerando la probabilidad que tienen
las monedas de caer con 0 caras o con 10 caras.
La media aritmética muestra una valor alto ya que el reparto del número de caras que
caı́an no fue similar en todos sus intérvalos.

Moda Mediana Media Aritmética


M o = 5.62 M e = 5.39 µ = 5.2

Cuadro 5: Moda, Mediana y Media Aritmética de los Datos Agrupados.

4.3. Varianza y Desviación Tı́pica


La varianza nos muestra en que medida los datos están en entorno a la media, en donde
presenta una varianza de 2.45
La desviación tı́pica nos muestra que tan dispersos estan los datos alrededor de un punto,
en la desviación tı́pica este punto es la media

Varianza Desviación Tı́pica


s2 = 2.45 s = 1.57

Cuadro 6: Varianza y Desviación Tı́pica.

4.4. Coeficiente de Variación


El coeficiente de variación nos muestra la dispersión de los datos con respecto a la media
y al mismo tiempo la dispersión que tienen todos los datos entre sı́.

Coeficiente de Variación
C.V = 30.19 %

Cuadro 7: Coeficiente de Variación.

4.5. Coeficiente de Asimetrı́a de Pearson


El coeficiente de asimetrı́a caracteriza el grado de asimetrı́a de la distribución con respecto
a su media, en este caso con el valor de 0.36 nos muestra una distribución casi simétrica.

Coeficiente de Asimetrı́a de Pearson


AP = 0.36

Cuadro 8: Coeficiente de Asimetrı́a de Pearson

9
5. Discusión de Resultados y Conclusiones
El histograma nos muestra como las frecuencias se han distribuido de la manera esperada,
debido a que los valores con mayor frecuencia se encuentran cerca de la Mediana. Debido a
que la probabilidad que 10 monedas tienen de caer con la misma cara es muy baja, de igual
manera para el número de monedas 9,8,2,1 y 0, la probabilidad es más baja que los valores
cerca de la Mediana.

El polı́gono de frecuencias muestra una frecuencia que cambia abruptamente entre una clase
y la siguiente, lo cual era el resultado esperado debido a que la probabilidad de las clases
cercas de la media es considerablemente más alta que las clases lejanas a ella.

En la Tabla 7 notamos que el coeficiente de variación nos dió 30.19 %, lo que significa que de
todas las veces que tiramos, un 69.81 % obtuvimos cara, mientras que el 30.19 % nos daba
escudo. Es decir, la distribución de las veces que salió cara es un 30.19 % heterogénea, y un
69.81 % homogénea.

Al obtener un coeficiente de asimetrı́a de 0.36 en la Tabla 8, tenemos una distribución cuasi-simétrica,


es decir, casi simétrica que, ahora, al comparar los valores obtenidos para nuestra moda, me-
diana y µ en la Tabla 5, podemos argumentar que: µ < M e < M o, por lo que tenemos una
asimetrı́a negativa.

Figura 1: Gráfica Asimetrı́a Negativa.[2]

6. Anexos
6.1. Cálculos para Tabla de Datos Agrupados
n=Σx = 50.
10−0
I.C= 1+(3.32 · log 50) = 1.51 ≈ 2.

Tabla Datos Agrupados:

10
Clase Fi Fr F% FA FAr FA % Xi Lı́mites Reales
0-1 1 1/50 1/50 · 100 1 (1/50) (1/50) · 100 (0 + 1.5)/2 0-1.5
2-3 6 6/50 6/50 · 100 7 7/50 (7/50) · 100 (1.5+3.5)/2 1.5-3.5
4-5 19 19/50 19/50 · 100 26 26/50 (26/50) · 100 (3.5+5.5)/2 3.5-5.5
6-7 20 20/50 20/50 · 100 46 46/2 (46/2) · 100 (5.5+7.5)/2 5.5+7.5
8-9 4 4/50 4/50 · 100 50 50/50 (50/50) · 100 (7.5-9.5)/2 7.5-9.5
10 0 0 0 50 1 100 9.75 9.5-10

Cuadro 9: Procedimiento Tabla Datos Agrupados

20−19
Mo=5.5 + ( (20−19)+(20−4) · 2) = 5.62.

Me=3.5 + ( (50/2)−7
19 · 2) = 5.39
0+1+2+3+4+5+6+7+8+9+10
µ= 50 = 5.2

Varianza:

x 0 1 2 3 4 5 6 7 8 9 10
Fi 0 1 0 6 11 8 15 5 4 0 0
x · Fi 0 1 0 18 44 40 90 35 32 0 0
x−µ -5.2 -4.2 -3.2 -2.2 -1.2 -0.2 0.8 1.8 2.8 3.8 4.8
(x − µ)2 27,04 17.64 10.24 4.84 1.44 0.04 0.64 3.24 7.84 14.44 23.04
(x − µ)2 · F i 0 17.64 0 29.04 15.84 0.32 9.6 16.2 31.36 0 0
Σ((x − µ)2 · F i) 120

Cuadro 10: Cálculo Varianza

s2 = Σ((x−µ) · F i) →
2
120
= 2.45.
n−1 49

s= s2 = 1.57.

C.V= s
µ · 100 = 1.57
5.2 = 30.19 %.

AP= 3 · (µ−M
s
ed)
→ 3 · (5.2−5.39)
1.57 = 0.36.

7. Referencias
Referencias
[1] Victor Antonio Vegas R. Módulo Instruccional para Estadı́stica Descriptiva.
[2] Academia Valderix. 2022. url: https : / / www . probabilidadyestadistica . net /
asimetria-negativa/.

11

También podría gustarte