Laboratorio 2, Datos Agrupados

Datos Agrupados
Escuela de Ciencias Fı́sicas y Matemáticas

Luis Diego López Pérez 202306217
Daniel Antonio Enrı́quez Pérez 202308323
Fı́sica Experimental
5 de septiembre de 2023
Resumen: Los datos agrupados son datos que se juntan en intervalos para poder estu-
diarlos de manera conjunta. En este experimento mediante el lanzamiendo de 10 monedas
de la misma denominación y el registro de resultados que se obtienen de la probabilidad
que una moneda tiene de caer con la misma cara tras lanzarla repetidas veces, de dicho
experimento se pretende construir un histograma y calcular diversas medidas de los datos
agrupados.
1. Objetivos
Realizar un experimento donde se apliquen los conceptos aprendidos sobre datos agrupados.
Construir un histograma a partir de los datos obtenidos y el análisis.
Calcular medidas de tendencia central, dispersión, variabilidad y asimetrı́a para datos agru-
pados.
2. Marco Teórico
2.1. Tipos de Datos
Los datos pueden ser cualitativos y cuantitativos. Los cualitativos pueden corresponder
a dos categorı́as, llamados dicotómicos, o a más de dos categorı́as. Los cuantitativos pueden ser
continuos o discretos. Las escalas de medición se definen por las operaciones matemáticas que
pueden ser usadas en su manipulación.
2.2. Ordenamiento de Datos Agrupados en Intervalos

El ordenamiento de datos agrupados se realiza cuando la cantidad de datos es grande
y/o la variable es continua. Básicamente consiste en agrupar los datos en intervalos de una misma
amplitud, denominados clases. A cada clase se le asignan valores de cada tipo de frecuencias.
A los intervalos también se les conoce como clases. Simplemente son las “categorı́as” en
las cuales vamos a encasillar nuestros datos. La forma de calcular la cantidad de intervalos se le
conoce como la fórmula de Sturges. [1]
1
2.2.1. Fórmula STURGES
La regla de Sturges es una regla que sirve para calcular el número clases o intervalos idóneo
en los que se debe dividir un conjunto de datos. La fórmula de la regla de Sturges establece que el
número de clases es igual a uno más el logaritmo en base dos del número total de datos.
Valor Máximo - Valor Mı́nimo
c= (1)
1 + (3, 32 ∗ log N )
[1]
2.3. Frecuencia
2.3.1. Frecuencia Absoluta
Es el número de veces que aparece un valor en un conjunto de datos. Es decir, la frecuencia
absoluta es la cantidad de veces que se repite un resultado. Por ejemplo, si en una encuesta siete
personas han respondido que su color favorito es el rojo, entonces la frecuencia absoluta del color
rojo es 7.
Por lo tanto, la suma de las frecuencias absolutas de todos los valores es igual al núme-
ro total de datos de la muestra estadı́stica. Para calcular está frecuencia no hace falta ninguna
fórmula.[1]
2.3.2. Frecuencia Acumulada

En estadı́stica, la frecuencia absoluta acumulada es la suma acumulativa de las frecuencias
absolutas. Es decir, la frecuencia absoluta acumulada de un valor es igual a la frecuencia absoluta
de dicho valor más las frecuencias absolutas de todos los valores menores que él.
Los pasos para calcular la frecuencia absoluta acumulada son los siguientes:
Hacer una tabla con todos los valores diferentes que aparecen en el conjunto de datos, es
decir, colocar cada valor diferente en una fila de una tabla.
Determinar la frecuencia absoluta de cada valor.
Hallar la frecuencia absoluta acumulada de cada valor, que se calcula sumando la frecuencia
absoluta del propio valor más las frecuencias absolutas de todos los valores menores.
[1]
2.3.3. Frecuencia Relativa

Es una medida que indica el número de veces que aparece un valor en una muestra de datos
en forma de proporción o porcentaje. En concreto, la frecuencia relativa es igual a la frecuencia
absoluta dividida por el número total de datos.
La fórmula de la frecuencia relativa es la siguiente:
fi
hi = (2)
N
Donde:
2
hi es la frecuencia relativa.
fi es la frecuencia absoluta.
N es la frecuencia absoluta.
[1]
2.3.4. Frecuencia Relativa Acumulada

Es la suma acumulativa de las frecuencias relativas. Es decir, la frecuencia relativa acu-
mulada de un valor es igual a la frecuencia relativa de dicho valor más las frecuencias relativas de
todos los valores menores que él.[1]
2.4. Distribución de Frecuencias

Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la
variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes,
etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que
contienen los datos.
En ella se colocan todas las frecuencias mencionadas en la subsección 2.3.[1]
2.5. Diagramas de Barras e Histogramas

2.5.1. Diagramas de Barras
Es un tipo de gráfico estadı́stico que se utiliza para representar gráficamente variables
discretas. En un diagrama de barras se representa en el eje X cada valor de la variable de estudio,
y para cada uno se dibuja una barra rectangular con una altura proporcional a su frecuencia que
nos sirve para comparar la cantidad de veces que se repiten los datos.[1]
2.5.2. Histogramas
Es un tipo de diagrama estadı́stico en el que se representa un conjunto de datos estadı́sticos
mediante barras rectangulares, de manera que cada barra del histograma es proporcional a su
frecuencia correspondiente.
Los histogramas sirven para representar gráficamente variables continuas, como por ejem-
plo el peso de una muestra estadı́stica. Además, un histograma permite visualizar rápidamente la
forma que tiene una distribución. Cada barra de un histograma de frecuencias tiene una anchura
proporcional a la amplitud del intervalo y una altura proporcional a la frecuencia del intervalo.[1]
2.6. Medidas de Centralización para Datos Agrupados

Las medidas de tendencia central, o medidas de centralización, son métricas estadı́sticas
que indican el valor central de una distribución. Es decir, las medidas de tendencia central sirven
para encontrar un valor representativo del centro de un conjunto de datos.
Las medidas de centralización son la media, la mediana y la moda.[1]
3
2.6.1. Moda
La moda no es más que el número, variable o respuesta que más se repite en un conjunto de
datos, pero como no se tienen números especı́ficos sino que intervalos, estos no se pueden contar uno
a uno, por lo tanto es muy probable que la moda que se termine calculando no sea un número que
esté en los datos recopilada, puede ser que en algunos casos la moda si que coincida con los datos,
pero esto no sucederá siempre porque el número que se calcula en la moda para datos agrupados
simplemente una estimación de un número que se aproxime al valor exacto de la moda. Y la fórmula
es:
△1
Moda = Li + ∗A (3)
△1 + △2
Donde:
△1 = fi − fi − 1
△2 = fi − fi + 1
fi es la frecuencia del intervalo que contiene la moda, fi − 1 es la frecuencia del intervalo
anterior al intervalo de la moda, y fi + 1 es la frecuencia del intervalo posterior a la moda y con
estos datos se pueden encontrar tanto △1 como △2 .
Li es el lı́mite inferior del intervalo de la clase moda.
A es la amplitud del intervalo[1]
2.6.2. Mediana
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la
mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que
se encuentre. Y la manera de calcularlo es:
(n/2) − fa anterior
Mediana = Li + ∗ Ic (4)
fi
[1]
2.6.3. Media
La media aritmética también se conoce como PROMEDIO, y básicamente se calcula como
la suma de todos los datos dividida entre el número total de datos.
P
Xi ∗ fi
µ= (5)
N
[1]
2.7. Medidas de Dispersión para Datos Agrupados

2.7.1. Varianza
Es una medida de dispersión que se utiliza para representar la variabilidad de un conjunto
de datos respecto de la media aritmética de los mismo.
(Xi − µ)2 ∗ fi
P
2
s = (6)
n−1
[1]
4
2.7.2. Desviación estándar
Mide la dispersión de una distribución de datos. Entre más dispersa está una distribución
de datos, más grande es su desviación estándar.
rP
(Xi − µ)2 ∗ fi
s= (7)
n−1
[1]
2.7.3. Coeficiente de variación

Se utiliza para comparar la dispersión (variación) de conjuntos de datos de medidas dife-
rentes o con medias aritméticas diferentes.
s
C.V = ∗ 100 (8)
µ
[1]
2.8. Medidas de Variabilidad y Asimetrı́a para Datos Agrupados

2.8.1. Cuartiles
Son valores que dividen una muestra de datos en cuatro partes iguales. Utilizando cuartiles
puede evaluar rápidamente la dispersión y la tendencia central de un conjunto de datos, que son
los pasos iniciales importantes para comprender sus datos.
(k ∗ n/4) − fa anterior
Qk = Li + ∗ Ic (9)
fi
[1]
2.8.2. Deciles
Un decil escualquiera de los nueve valores que dividen a un grupo de datos ordenados en
diez partes iguales, de manera que cada parte representa 1/10 de la muestra o población.
Dk = Li + ∗ Ic (10)
fi
[1]
2.8.3. Percentiles
El percentil es una medida estadı́stica la cual divide una serie de datos ordenados de menor
a mayor en cien partes iguales. Se trata de un indicador que busca mostrar la proporción de la serie
de datos que queda por debajo de su valor de los datos.
Pk = Li + ∗ Ic (11)
fi
[1]
5
2.8.4. Coeficiente de Asimetrı́a
Es una medida estadı́stica utilizada para describir la forma como se encuentran distri-
buidas las frecuencias correspondientes a los diferentes valores de la variables en estudio. Esre
coeficiente permite medir la falta de simetrı́a de una distribución.
Esta se calcula con la formla de Pearson:
3 ∗ (µ − Mediana)
AP = (12)
s
[1]
2.8.5. Coeficiente de Curtosis

El coeficiente de Curtosis, representea el grado de apuntamiento o altura de una distribu-
ción con respecto a la distribución normal. Una distribución de datos puede ser:
Leptocurtica: Apuntamiento Alto (Alta concentración de los datos en torno al centro de la
serie)
Mesocurtica: Apuntamiento Normal (Concentración media de los datos en torno al centro de
la serie)
Platicurtica: Apuntamiento Bajo (Baja concentración de los datos en torno al centro de la
serie)
Este coeficiente se calcula con la fórmula de Fischer:
(Xi − µ)4 ∗ fi
P
4
Cm = (13)
(n) ∗ (s)4
[1]
3. Diseño experimental
3.1. Materiales y Montaje
Diez monedas de la misma denominación.
Cuaderno y lapicero para anotar datos.
3.2. Procedimiento
1. Lanzar 10 monedas y anotar el número de caras que caen, repetir 50 veces el procedimiento
y en cada lanzamiento anotar el número de caras.
2. Ordenar los datos de menor a mayor, y cuente cuantas veces aparece 0, 1, 2, ..., 10 caras(f ).
xi 0 1 2 3 4 5 6 7 8 9 10
Fi 0 1 0 6 11 8 15 5 4 0 0
Cuadro 1: Número de Caras Ordenadas de Menor a Mayor con sus respectivas f .
6
3. Ordenar los datos en intervalos, utilizando fórmula STURGES.
Clases Fi Lı́mites Reales

0-1 1 0-1.5
2-3 6 1.5-3.5
4-5 19 3.5-5.5
6-7 20 5.5-7.5
8-9 4 7.5-9.5
10 0 9.5-10
Cuadro 2: Datos Ordenados en Intervalos bajo fórmula STURGES.
4. La tabla de datos debe contener todas la columnas necesarias para los cálculos posteriores.
Clases Fi Fr FR % FA FAr FA % Xi Lı́mites Reales

0-1 1 0-1.5
2-3 6 1.5-3.5
4-5 19 3.5-5.5
6-7 20 5.5-7.5
8-9 4 7.5-9.5
10 0 9.5-10
Σ 50
Cuadro 3: Tabla de Datos con Columnas necesarias para Cálculos Posteriores.
4. Resultados
Resultados obtenidos luego de lanzar 50 veces 10 monedas de la misma denominación
agrupados en clases calculadas con la fórmula de Sturges, con sus lı́mites reales, marca de clase y
todas sus frecuencias mencionadas en el apartado 2.3 del documento.
Clases Fi Fr FR % FA FAr FA % Xi Lı́mites Reales

0-1 1 0.02 2 1 0.02 2 0.75 0-1.5
2-3 6 0.12 12 7 0.14 14 2.5 1.5-3.5
4-5 19 0.38 38 26 0.52 52 4.5 3.5-5.5
6-7 20 0.4 40 46 0.92 92 6.5 5.5-7.5
8-9 4 0.08 8 50 1 100 8.5 7.5-9.5
10 0 0 0 50 1 100 9.75 9.5-10
Σ 50 1 100 %
Cuadro 4: Tabla de Datos Agrupados.
7
4.1. Histograma y Polı́gono de Frecuencias de los Lı́mites Teales
vs Frecuencia.
4.1.1. Histograma
El histograma muestra como las frecuencias se han distribuido, obteniendo las mayores
frecuencias en los lı́mites reales que se acercan a la Mediana y menos frecuencia en los lı́mites reales
que están mas alejados de la Mediana.
4.1.2. Polı́gono de frecuencias

El polı́gono muestra una frecuencia bastante grande con la que cambia nuestra variable,
en este caso, el número de caras que caen al lanzar 10 monedas 50 veces.
8
4.2. Moda, Mediana y Media Aritmética
La moda muestra que las caras de las monedas que más salieron fue entre 5 y 6 caras.
La mediana muestra el punto medio de los datos considerando la probabilidad que tienen
las monedas de caer con 0 caras o con 10 caras.
La media aritmética muestra una valor alto ya que el reparto del número de caras que
caı́an no fue similar en todos sus intérvalos.
Moda Mediana Media Aritmética

M o = 5.62 M e = 5.39 µ = 5.2
Cuadro 5: Moda, Mediana y Media Aritmética de los Datos Agrupados.
4.3. Varianza y Desviación Tı́pica

La varianza nos muestra en que medida los datos están en entorno a la media, en donde
presenta una varianza de 2.45
La desviación tı́pica nos muestra que tan dispersos estan los datos alrededor de un punto,
en la desviación tı́pica este punto es la media
Varianza Desviación Tı́pica

s2 = 2.45 s = 1.57
Cuadro 6: Varianza y Desviación Tı́pica.
4.4. Coeficiente de Variación

El coeficiente de variación nos muestra la dispersión de los datos con respecto a la media
y al mismo tiempo la dispersión que tienen todos los datos entre sı́.
Coeficiente de Variación
C.V = 30.19 %
Cuadro 7: Coeficiente de Variación.
4.5. Coeficiente de Asimetrı́a de Pearson

El coeficiente de asimetrı́a caracteriza el grado de asimetrı́a de la distribución con respecto
a su media, en este caso con el valor de 0.36 nos muestra una distribución casi simétrica.
Coeficiente de Asimetrı́a de Pearson

AP = 0.36
Cuadro 8: Coeficiente de Asimetrı́a de Pearson
9
5. Discusión de Resultados y Conclusiones
El histograma nos muestra como las frecuencias se han distribuido de la manera esperada,
debido a que los valores con mayor frecuencia se encuentran cerca de la Mediana. Debido a
que la probabilidad que 10 monedas tienen de caer con la misma cara es muy baja, de igual
manera para el número de monedas 9,8,2,1 y 0, la probabilidad es más baja que los valores
cerca de la Mediana.
El polı́gono de frecuencias muestra una frecuencia que cambia abruptamente entre una clase
y la siguiente, lo cual era el resultado esperado debido a que la probabilidad de las clases
cercas de la media es considerablemente más alta que las clases lejanas a ella.
En la Tabla 7 notamos que el coeficiente de variación nos dió 30.19 %, lo que significa que de
todas las veces que tiramos, un 69.81 % obtuvimos cara, mientras que el 30.19 % nos daba
escudo. Es decir, la distribución de las veces que salió cara es un 30.19 % heterogénea, y un
69.81 % homogénea.
Al obtener un coeficiente de asimetrı́a de 0.36 en la Tabla 8, tenemos una distribución cuasi-simétrica,

es decir, casi simétrica que, ahora, al comparar los valores obtenidos para nuestra moda, me-
diana y µ en la Tabla 5, podemos argumentar que: µ < M e < M o, por lo que tenemos una
asimetrı́a negativa.
Figura 1: Gráfica Asimetrı́a Negativa.[2]
6. Anexos
6.1. Cálculos para Tabla de Datos Agrupados
n=Σx = 50.
10−0
I.C= 1+(3.32 · log 50) = 1.51 ≈ 2.
Tabla Datos Agrupados:
10
Clase Fi Fr F% FA FAr FA % Xi Lı́mites Reales
0-1 1 1/50 1/50 · 100 1 (1/50) (1/50) · 100 (0 + 1.5)/2 0-1.5
2-3 6 6/50 6/50 · 100 7 7/50 (7/50) · 100 (1.5+3.5)/2 1.5-3.5
4-5 19 19/50 19/50 · 100 26 26/50 (26/50) · 100 (3.5+5.5)/2 3.5-5.5
6-7 20 20/50 20/50 · 100 46 46/2 (46/2) · 100 (5.5+7.5)/2 5.5+7.5
8-9 4 4/50 4/50 · 100 50 50/50 (50/50) · 100 (7.5-9.5)/2 7.5-9.5
10 0 0 0 50 1 100 9.75 9.5-10
Cuadro 9: Procedimiento Tabla Datos Agrupados
20−19
Mo=5.5 + ( (20−19)+(20−4) · 2) = 5.62.
Me=3.5 + ( (50/2)−7
19 · 2) = 5.39
0+1+2+3+4+5+6+7+8+9+10
µ= 50 = 5.2
Varianza:
x 0 1 2 3 4 5 6 7 8 9 10
Fi 0 1 0 6 11 8 15 5 4 0 0
x · Fi 0 1 0 18 44 40 90 35 32 0 0
x−µ -5.2 -4.2 -3.2 -2.2 -1.2 -0.2 0.8 1.8 2.8 3.8 4.8
(x − µ)2 27,04 17.64 10.24 4.84 1.44 0.04 0.64 3.24 7.84 14.44 23.04
(x − µ)2 · F i 0 17.64 0 29.04 15.84 0.32 9.6 16.2 31.36 0 0
Σ((x − µ)2 · F i) 120
Cuadro 10: Cálculo Varianza
s2 = Σ((x−µ) · F i) →
2
120
= 2.45.
n−1 49
√
s= s2 = 1.57.
C.V= s
µ · 100 = 1.57
5.2 = 30.19 %.
AP= 3 · (µ−M
s
ed)
→ 3 · (5.2−5.39)
1.57 = 0.36.
7. Referencias
Referencias
[1] Victor Antonio Vegas R. Módulo Instruccional para Estadı́stica Descriptiva.
[2] Academia Valderix. 2022. url: https : / / www . probabilidadyestadistica . net /
asimetria-negativa/.
11

Laboratorio 2, Datos Agrupados

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Laboratorio 2, Datos Agrupados

Cargado por

Copyright:

Formatos disponibles

Datos Agrupados

Escuela de Ciencias Fı́sicas y Matemáticas

Construir un histograma a partir de los datos obtenidos y el análisis.

2.2. Ordenamiento de Datos Agrupados en Intervalos

2.3.2. Frecuencia Acumulada

Determinar la frecuencia absoluta de cada valor.

2.3.3. Frecuencia Relativa

2.3.4. Frecuencia Relativa Acumulada

2.4. Distribución de Frecuencias

2.5. Diagramas de Barras e Histogramas

2.6. Medidas de Centralización para Datos Agrupados

2.7. Medidas de Dispersión para Datos Agrupados

2.7.3. Coeficiente de variación

2.8. Medidas de Variabilidad y Asimetrı́a para Datos Agrupados

2.8.5. Coeficiente de Curtosis

Cuadro 1: Número de Caras Ordenadas de Menor a Mayor con sus respectivas f .

Clases Fi Lı́mites Reales

Cuadro 2: Datos Ordenados en Intervalos bajo fórmula STURGES.

Clases Fi Fr FR % FA FAr FA % Xi Lı́mites Reales

Cuadro 3: Tabla de Datos con Columnas necesarias para Cálculos Posteriores.

Clases Fi Fr FR % FA FAr FA % Xi Lı́mites Reales

Cuadro 4: Tabla de Datos Agrupados.

4.1.2. Polı́gono de frecuencias

Moda Mediana Media Aritmética

Cuadro 5: Moda, Mediana y Media Aritmética de los Datos Agrupados.

4.3. Varianza y Desviación Tı́pica

Varianza Desviación Tı́pica

Cuadro 6: Varianza y Desviación Tı́pica.

4.4. Coeficiente de Variación

Cuadro 7: Coeficiente de Variación.

4.5. Coeficiente de Asimetrı́a de Pearson

Coeficiente de Asimetrı́a de Pearson

Cuadro 8: Coeficiente de Asimetrı́a de Pearson

Al obtener un coeficiente de asimetrı́a de 0.36 en la Tabla 8, tenemos una distribución cuasi-simétrica,

Figura 1: Gráfica Asimetrı́a Negativa.[2]

Tabla Datos Agrupados:

Cuadro 9: Procedimiento Tabla Datos Agrupados

Cuadro 10: Cálculo Varianza

También podría gustarte