Está en la página 1de 8

PROBABILIDAD Y ESTADÍSTICA

UNIDAD I “ESTADÍSTICA DESCRIPTIVA”

1.3 DATOS AGRUPADOS

Cuando la muestra cuenta con n ≥ 20 datos, lo aconsejable es agrupar los datos en clases y a partir
de estas determinar las características de la muestra y por consiguiente las de la población de donde
fue tomada.

Para agrupar los datos se llevan a cabo los siguientes pasos:

1. Determinar el Rango o recorrido de los datos:


𝑹 = 𝑽𝑴 − 𝑽𝒎
2. Establecer el número de clases (m o k) en que se van a agrupar los datos:
𝒎 = √𝒏
3. Determinar la amplitud o ancho de clase (H):
𝑹𝒂𝒏𝒈𝒐
𝑯=
𝒎
4. Formar las clases o intervalos.

Ejemplo:

Los siguientes datos se refieren al diámetro en pulgadas de un engrane:

6.75 7.00 7.00 6.75 6.50 6.50 7.15 7.00


6.50 6.50 6.50 6.25 6.25 6.50 6.65 7.00
7.25 6.70 6.00 6.75 6.00 6.75 6.75 7.10
7.00 6.70 6.50 6.75 6.25 6.65 6.75 7.10
7.25 6.75 6.25 6.25 7.00 6.75 7.00 7.15

a) Agrupe los datos


b) Obtenga Histograma, Polígono de Frecuencias, Ojiva y Distribución de probabilidad
c) Obtenga Media, Mediana, Moda y Desviación Estándar

a) Para agrupar los datos:

Calculamos el Rango, observamos que el valor mayor es 7.25 y el valor menor es 6.00

𝑅 = 𝑉𝑀 − 𝑉𝑚 = 7.25 − 6.00 = 1.25

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
Calculamos el número de clases

𝑚 = √𝑛 = √40 = 6.32 ≈ 6

Calculamos el ancho de clase

𝑅𝑎𝑛𝑔𝑜 1.25
𝐻= = = 0.2083 ≈ 0.21
𝑚 6
(para el ancho de clase se toman solo 2 decimales ya que nuestros números de la muestra tienen 2
decimales)

Para empezar a agrupar los datos, tendremos que llenar la siguiente tabla:

LI LS Frecuencia Marca de Límite real Límite real Frecuencia Frecuencia


clase inferior superior (LRS) relativa relativa
(LRI) acumulada
6.00 6.21 2 6.105 5.995 6.215 0.05 0.05
6.22 6.43 5 6.325 6.215 6.435 0.125 0.175
6.44 6.65 9 6.545 6.435 6.655 0.225 0.40
6.66 6.87 11 6.765 6.655 6.875 0.275 0.675
6.88 7.09 7 6.985 6.875 7.095 0.175 0.850
7.10 7.31 6 7.205 7.095 7.315 0.150 1.00
40

• En la primer clase o intervalo el límite inferior (LI) será el valor menor de nuestros datos
• Para obtener el límite superior (LS) sumamos al límite inferior el ancho de clase (H) (6.00 +
0.21 = 6.21)
• Para el siguiente intervalo o clase el límite inferior será el número siguiente al límite superior
de la clase anterior
• Siempre hay que fijarse que cuando tenemos el número de clases, en la última clase o
intervalo se pueda incluir el valor mayor de nuestros datos
• Ya que tenemos las clases o intervalos, obtenemos la frecuencia, (cuántos datos de nuestra
muestra caen en cada clase)
• Siempre la sumatoria de las frecuencias nos debe dar el total de datos en la muestra
• Para calcular la marca de clase obtenemos el promedio de los límites de cada clase
((6.00+6.21)/2) = 6.105
• Para obtener el límite real superior de la primer clase obtenemos el promedio del límite
superior de la primer clase y el límite inferior de la segunda clase ((6.21+6.22)/2) = 6.215
• Luego el límite real inferior de la siguiente clase será el límite real superior de la clase
anterior

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
• Para obtener la frecuencia relativa dividimos la frecuencia de cada clase entre el número
total de datos (2/40 = 0.05)
• Para obtener la frecuencia relativa acumulada, vamos sumando o acumulando las
frecuencias relativas de cada clase

b) Gráficas

Histograma
12 11

10 9

8 7
Frecuencia

6
6 5

4
2
2

0
6.105 6.325 6.545 6.765 6.985 7.205
Marca de clase

Polígono de Frecuencia
12

10

8
Frecuencia

0
6.105 6.325 6.545 6.765 6.985 7.205
Marca de clase

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
Ojiva
1.2

Frecuencia relativa acumulada


1

0.8

0.6

0.4

0.2

0
5.995 6.215 6.435 6.655 6.875 7.095
Límites reales

Distribución de probabilidad
0.3

0.25
Frecuencia relativa

0.2

0.15

0.1

0.05

0
6.105 6.325 6.545 6.765 6.985 7.205
Marca de clase

c)

MEDIDAS DE TENDENCIA CENTRAL

Media (x):

∑𝒏𝒊=𝟏 𝒙𝒊 ∗ 𝒇𝒊
𝒙=
𝒏

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
donde:
x es la media o promedio
xi es la marca de clase de cada intervalo
fi es la frecuencia de cada intervalo
n el número total de datos

∑𝑛𝑖=1 𝑥𝑖 ∗ 𝑓𝑖 (6.105 ∗ 2) + (6.325 ∗ 5) + ⋯


𝑥= = = 6.732
𝑛 40

Mediana ( Xmed):
𝒏
+ 𝑭𝒎𝒆−𝟏
𝑿𝒎𝒆𝒅 = 𝑳𝒊 + [𝟐 ]𝑨
𝒇𝒎𝒆

donde:

Xmed es la mediana

Li es el límite real inferior de la clase que contiene la mediana

n es el total de datos

Fme-1 es la sumatoria de las frecuencias anteriores a la clase que contiene la mediana

fme es la frecuencia de la clase que contiene la mediana

A es la amplitud de la clase que contiene la mediana:

𝑨 = 𝑳𝑹𝑺 − 𝑳𝑹𝑰

LRS es el límite real superior de la clase que contiene la mediana

LRI es el límite real inferior de la clase que contiene la mediana

Sabemos que la mediana es el dato central, por lo tanto, si tenemos 40 datos:

1 2 3 4 ….. 40 nuestra mediana se encuentra entre el dato 20 y 21, por lo que si vemos en
nuestra tabla de datos agrupados en la columna de frecuencia vemos que los datos 20 y 21 se
encuentran en la clase:

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
LI LS Frecuencia Marca de Límite real Límite real Frecuencia Frecuencia
clase inferior superior (LRS) relativa relativa
(LRI) acumulada
6.00 6.21 2 6.105 5.995 6.215 0.05 0.05
6.22 6.43 5 6.325 6.215 6.435 0.125 0.175
6.44 6.65 9 6.545 6.435 6.655 0.225 0.40
6.66 6.87 11 6.765 6.655 6.875 0.275 0.675
6.88 7.09 7 6.985 6.875 7.095 0.175 0.850
7.10 7.31 6 7.205 7.095 7.315 0.150 1.00

Por lo tanto:

Li = 6.655

Fme-1 = 16

Fme = 11

𝐴 = 𝐿𝑅𝑆 − 𝐿𝑅𝐼 = 6.875 − 6.655 = 0.22

𝑛 40
2 + 𝐹𝑚𝑒−1 + 16
𝑋𝑚𝑒𝑑 = 𝐿𝑖 + [ ] 𝐴 = 6.655 + [ 2 ] 0.22 = 7.375
𝑓𝑚𝑒 11

Moda (Xmod):

𝒅𝟏
𝑿𝒎𝒐𝒅 = 𝑳𝒊 + [ ]𝑨
𝒅𝟏 + 𝒅𝟐

donde:

Xmod es la moda

Li es el límite real inferior de la clase que contiene la moda

𝒅𝟏 = |𝒇𝒎𝒐 − 𝒇𝒎𝒐−𝟏 |

𝒅𝟐 = |𝒇𝒎𝒐 − 𝒇𝒎𝒐+𝟏 |

fmo es la frecuencia de la clase que contiene la moda


Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
fmo-1 es la frecuencia de la clase anterior a la que contiene la moda

fmo+1 es la frecuencia de la clase posterior a la que contiene la moda

A es la amplitud de la clase que contiene la moda

𝑨 = 𝑳𝑹𝑺 − 𝑳𝑹𝑰

LRS es el límite real superior de la clase que contiene la moda

LRI es el límite real inferior de la clase que contiene la moda

Sabemos que la moda es el dato que más se repite, así que si observamos nuestra tabla de datos
agrupados:

LI LS Frecuencia Marca de Límite real Límite real Frecuencia Frecuencia


clase inferior superior (LRS) relativa relativa
(LRI) acumulada
6.00 6.21 2 6.105 5.995 6.215 0.05 0.05
6.22 6.43 5 6.325 6.215 6.435 0.125 0.175
6.44 6.65 9 6.545 6.435 6.655 0.225 0.40
6.66 6.87 11 6.765 6.655 6.875 0.275 0.675
6.88 7.09 7 6.985 6.875 7.095 0.175 0.850
7.10 7.31 6 7.205 7.095 7.315 0.150 1.00

Por lo tanto:

Li = 6.655

fmo = 11

fmo-1 = 9

fmo+1 =7

𝑑1 = |𝑓𝑚𝑜 − 𝑓𝑚𝑜−1 | = |11 − 9| = 2

𝑑2 = |𝑓𝑚𝑜 − 𝑓𝑚𝑜+1 | = |11 − 7| = 4

𝐴 = 𝐿𝑅𝑆 − 𝐿𝑅𝐼 = 6.875 − 6.655 = 0.22

𝑑1 2
𝑋𝑚𝑜𝑑 = 𝐿𝑖 + [ ] 𝐴 = 6.655 + [ ] 0.22 = 6.7283
𝑑1 + 𝑑2 2+4

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
MEDIDAS DE DISPERSIÓN

Desviación estándar (s):

∑𝒏 (𝒙𝒊 − 𝒙)𝟐 ∗ 𝒇𝒊
𝒔 = √ 𝒊=𝟏
𝒏−𝟏

donde:

s es la desviación estándar

xi es la marca de clase de cada intervalo

x es la media

fi es la frecuencia de cada intervalo

n es el total de datos

∑𝑛 (𝑥𝑖 − 𝑥)2 ∗ 𝑓𝑖 (6.105 − 6.732)2 ∗ 2 + ⋯


𝑠 = √ 𝑖=1 = √ = 0.3093
𝑛−1 40 − 1

Y si queremos obtener la varianza (s²) = (0.3093)² = 0.9568

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando

También podría gustarte