Está en la página 1de 20

Paso 2 - Distribuciones muestrales y estimación

Presentado por
Carlos Andres Gomez

Presentado a.
Víctor Manuel Mendoza Rodríguez

Universidad Nacional Abierta y a Distancia – UNAD


Escuela de ciencias de la educación – ECEDU
Licenciatura en Matemáticas – LIMAT
Marzo, 2022
Parte A

1. Consultar la definición de cada uno de los siguientes conceptos, cuándo y para qué se

usan:

- Distribución de muestreo, distribución normal y distribución de probabilidad

- Desviación típica

- Distribución normal y distribución muestral


Parte B

Realizar los siguientes ejercicios y comparar cada uno de ellos con ayuda de un Software, con

GeoGebra, R o R-Studio, presentar evidencias del apoyo de este y justificar los resultados

presentados.

1. La demanda diaria, en unidades de un producto, durante 30 días de trabajo es:

78 56 46 58 76 48
55 66 65 53 78 79
45 67 68 57 54 56
48 43 52 61 65 73
46 58 57 60 45 48

a. Construya las distribuciones de frecuencia relativa, de frecuencia absoluta y

distribución acumulada.

Como primera medida, se organizan los datos de menor a mayor:

43 45 45 46 46 48
48 48 52 53 54 55
56 56 57 57 58 58
60 61 65 65 66 67
68 73 76 78 78 79

Luego se organizan los intervalos para trabajar en la tabla de frecuencias

Se halla el rango:

R=xmax −x min

Donde:

R : Rango del grupo de datos


x max: Numero mayor entre la cantidad de datos

x min : Numero menor entre la cantidad de datos

Se reemplazan los valores en la fórmula:

R=79−43

R=36

Luego, se calcula la cantidad de intervalos con los que se trabajara en la tabla de frecuencias,

utilizando la Regla de Sturges:

k =1+3.322∗log ⁡(N )

Donde:

k : Numero de intervalos

N : Numero total de dados de la muestra

Se reemplazan los valores en la fórmula:

k =1+3.322∗log ⁡(30)

k =1+3.322∗1.477

k =1+4.90

k =5.90

Para efectos del ejercicio, se trabajará como k =5 dado que se acostumbra a utilizar este valor

como numero primo

Posteriormente, se determina la amplitud de cada intervalo:


R
a=
k

Donde:

a : es la amplitud del intervalo

R : Rango del conjunto de datos

k :Numero de intervalos a trabajar

Se reemplazan los valores en la fórmula:

36
a=
5

a ≅8

Recordando que la frecuencia ( f i) es la cantidad de veces que la variable o para efectos del

ejercicio para datos agrupados son los datos que se encuentren en dicho intervalo repetidos o no

La marca de clase ( x i ) está representada como la media de los intervalos

La frecuencia acumulada ( F i ) está representada la sumatoria de las frecuencias (f i)

La frecuencia relativa (hi ) es la división entre la frecuencia (f i) y el total de datos N .

La frecuencia relativa acumulada (H i ) es la división entre (F i) y el total de datos N .


Tabla 1
Tabla de frecuencia con datos agrupados

Intervalos Marcas de Frecuencia Frecuencia Frecuenci Frecuencia


clase( x i) ( fi) acumulada a relativa relativa
(F i) (hi ) acumulada ( H i )
¿ 47.00 8 8 0.267 0.267
¿ 55.00 10 18 0.333 0.600
¿ 63.00 5 23 0.167 0.767
¿ 71.00 3 26 0.100 0.867
¿ 79.00 4 30 0.133 1
∑N 30

Nota. Autoría Propia. Gomez (2022)

Figura 1
Representación grafica de la frecuencia relativa acumulada

Nota. Gráfico realizado en el programa Excel. Autoría Propia. Gomez (2022)


b. Calcular la media, mediana, moda y desviación estándar.

- Cálculo de La Media:

Para datos no agrupados la media se calcula por medio de la siguiente expresión:

Datos
x=∑
N

Por lo tanto:

1761
x=
30

x=58.7

Para datos agrupados la media se calcula por medio de la siguiente expresión:

x=
∑ x i∗f i
N

Donde:

f i Frecuencia absoluta

x i :marca de clase o media de intervalos

N: Numero de datos total

Se utiliza el apoyo de la tabla de frecuencias:


Tabla 2
Tabla de frecuencias para datos agrupados

Intervalos Marcas de clase Frecuencia Frecuencia x i∗f i


( x i) (fi) acumulada (F i)

¿ 47.00 8 8 376.00
¿ 55.00 10 18 550.00
¿ 63.00 5 23 315.00
¿ 71.00 3 26 213.00
¿ 79.00 4 30 316.00
∑N 30 1770.00

Nota. Tabla para el cálculo de la media con datos agrupados. Autoría Propia. Gomez (2022)

Por lo tanto:

1770
x=
30

x=59

- Cálculo de La Mediana

Para el cálculo de la mediana con tablas de frecuencia se divide el número total de datos entre el

número 2 y este valor se compara con frecuencia acumulada descrita en la tabla, el primer valor

que supere este número es el valor mediano:

30
M e= =15
2
Según la distribución de la tabla de frecuencias el intervalo que supera al 50% de la frecuencia es

el intervalo [ 51−59 ) por tal motivo se considera como el intervalo mediano.

También se utiliza la siguiente fórmula para el cálculo de la mediana para datos agrupados:

N
−Fi −1
2
M e =Li + ∗a
fi

Siendo:

Li : Limite inferior o intervalo mediano menor

f i : Frecuencia del límite o intervalo mediano

F i−1 : Frecuencia acumulada que antecede a la frecuencia acumulada del límite o intervalo

mediano

a :Diferencia de los limites o intervalo mediano

N : Número total de datos

Se reemplaza los valores en la fórmula:

30
−8
2
M e =51+ ∗(8)
10

15−8
M e =51+ ∗(8)
10

7
M e =51+ ∗(8)
10

M e =51+0.7∗(8)
M e =51+5.6

M e =51+5.6

M e =56.6

El valor mediano es M e =5 6.6

- Cálculo de la moda

La moda es el valor que más se repite en los datos, por lo que la moda para este ejercicio es:

M o=48

- Cálculo de la desviación estándar

Para el cálculo de la desviación estándar se utiliza la siguiente expresión:

s=
√ ∑ ( x i− x)2∗f i
N

Donde:

s : desviación estándar

x i: Marca de clase o media de intervalos

x : La media calculada del conjunto de datos

f i: Frecuencia absoluta

N : Numero de datos

Se utiliza el apoyo de la tabla de frecuencias:


Tabla 3

Intervalos Marcas de Frecuencia Frecuencia x i∗f i ( x−x )2 ( x−x )2∗f


clase(x i) (fi) acumulada ( F i)

¿ 47.00 8 8 376.00 144.00 1152.00


¿ 55.00 10 18 550.00 16.00 160.00
¿ 63.00 5 23 315.00 16.00 80.00
¿ 71.00 3 26 213.00 144.00 432.00
¿ 79.00 4 30 316.00 400.00 1600.00
∑N 30 1770.00 3424.00
Tabla de frecuencias para datos agrupados

Nota. Tabla para el cálculo de la Desviación estándar con datos agrupados. Autoría Propia. Gomez (2022)

Por lo tanto:

s=
√ 3424
30

s=10.68

Se realiza verificación del ejercicio por medio del Software en línea GeoGebra:

https://www.geogebra.org/classic/darz8fz7
Figura 2
Representación de comprobación mediante software GeoGebra

Nota. Gráfico realizado en GeoGebra. Autoría Propia. Gomez (2022)

2. La tabla muestra volumen de ventas en millones de pesos de un total de 20 vendedores de

una empresa:

25.3 25.6 29.3 29.8 31.2


31.2 32.1 32.5 33.4 33.7
35.6 40.8 40.8 40.9 43.8
45.3 54.8 57.4 60.5 99.4

a. Calcular la media

b. Calcular la mediana

c. Calcular la desviación estándar

d. ¿Qué medias de tendencia central y de dispersión se elegirían y por qué?

Primero se ordenan los datos de menor a mayor:

25.3 25.6 29.3 29.8 31.2


31.2 32.1 32.5 33.4 33.7
35.6 40.8 40.8 40.9 43.8
45.3 54.8 57.4 60.5 99.4

Luego se organizan los intervalos para trabajar en la tabla de frecuencias

Se halla el rango:

R=xmax −x min

Donde:

R : Rango del grupo de datos

x max: Numero mayor entre la cantidad de datos

x min : Número menor entre la cantidad de datos

Se reemplazan los valores en la fórmula:

R=99.4−25.3

R=74.1

Luego, se calcula la cantidad de intervalos con los que se trabajara en la tabla de frecuencias,

utilizando la Regla de Sturges:

k =1+3.322∗log ⁡(N )

Donde:

k : Numero de intervalos

N : Numero total de dados de la muestra

Se reemplazan los valores en la fórmula:


k =1+3.322∗log ⁡(20)

k =1+3.322∗1. 301

k =1+4. 322

k =5.32

Para efectos del ejercicio, se trabajará como k =5 dado que se acostumbra a utilizar este valor

como numero primo

Posteriormente, se determina la amplitud de cada intervalo:

R
a=
k

Donde:

a : es la amplitud del intervalo

R : Rango del conjunto de datos

k :Numero de intervalos a trabajar

Se reemplazan los valores en la fórmula:

74.1
a=
5

a ≅15

Recordando que la frecuencia ( f i) es la cantidad de veces que la variable o para efectos del

ejercicio para datos agrupados son los datos que se encuentren en dicho intervalo repetidos o no

La marca de clase ( x i ) está representada como la media de los intervalos


La frecuencia acumulada ( F i ) está representada la sumatoria de las frecuencias (f i)

La frecuencia relativa (hi ) es la división entre la frecuencia (f i) y el total de datos N .

La frecuencia relativa acumulada (H i ) es la división entre (F i) y el total de datos N .

Tabla 4

Tabla de frecuencias sobre volumen de ventas

Intervalos Marcas de Frecuenci Frecuencia Frecuencia Frecuencia


clase( x i) a (fi) acumulada relativa relativa
( F i) (hi ) acumulada (H i )
¿ 32.80 11 11 0.550 0.550
¿ 47.80 6 17 0.300 0.850
¿ 62.80 2 19 0.100 0.950
¿ 77.80 0 19 0.000 0.950
¿ 92.80 1 20 0.050 1
∑N 20

Nota. Autoría Propia. Gomez (2022)

Figura 3
Representación gráfica de la frecuencia relativa acumulada

Nota. Gráfico realizado en el programa Excel. Autoría Propia. Gomez (2022)

- Cálculo de La Media:
Para datos no agrupados la media se calcula por medio de la siguiente expresión:

Datos
x=∑
N

Por lo tanto:

823.4
x=
20

x=41.17

Para datos agrupados la media se calcula por medio de la siguiente expresión:

x=
∑ x i∗f i
N

Donde:

f i Frecuencia absoluta

x i :marca de clase o media de intervalos

N: Numero de datos total

Se utiliza el apoyo de la tabla de frecuencias:

Tabla 5
Tabla de frecuencias para datos agrupados

Intervalos Marcas de Frecuencia Frecuencia x i∗f i


clase( x i) (fi) acumulada (F i)

¿ 32.80 11 11 360.80
¿ 47.80 6 17 286.80
¿ 62.80 2 19 125.60
¿ 77.80 0 19 0.00
¿ 92.80 1 20 92.80
∑N   20 866.00

Nota. Tabla para el cálculo de la media con datos agrupados. Autoría Propia. Gomez (2022)

Por lo tanto:

866
x=
20

x=43.3

- Cálculo de La Mediana

Para el cálculo de la mediana con tablas de frecuencia se divide el número total de datos entre el

número 2 y este valor se compara con frecuencia acumulada descrita en la tabla, el primer valor

que supere este número es el valor mediano:

20
M e= =10
2

Según la distribución de la tabla de frecuencias el intervalo que supera al 50% de la frecuencia es

el intervalo ¿por tal motivo se considera como el intervalo mediano.

Sin embargo y por efectos del ejercicio, se tomarán los 2 datos centrales y se dividan en 2:
33.7+35.6
M e=
2

M e =34.65

El valor mediano es M e =34.65

- Cálculo de la desviación estándar

Para el cálculo de la desviación estándar se utiliza la siguiente expresión:

s=
√ ∑ ( x i− x)2∗f i
N

Donde:

s : desviación estándar

x i: Marca de clase o media de intervalos

x : La media calculada del conjunto de datos

f i: Frecuencia absoluta

N : Numero de datos

Se utiliza el apoyo de la tabla de frecuencias:


Tabla 6
Tabla de frecuencias para datos agrupados

Intervalos Marcas de Frecuenci Frecuencia x i∗f i ( x−x )2 ( x−x )2∗f


clase(x i) a ( fi) acumulada
( F i)
¿ 32.80 11 11 360.80 110.25 1212.75
¿ 47.80 6 17 286.80 20.25 121.50
¿ 62.80 2 19 125.60 380.25 760.50
¿ 77.80 0 19 0.00 1190.25 0.00
¿ 92.80 1 20 92.80 2450.25 2450.25
∑ N    20 866.00 4545.00

Nota. Tabla para el cálculo de la Desviación estándar con datos agrupados. Autoría Propia. Gomez (2022)

Por lo tanto:

s=
√ 4545
20

s=15.07

Se realiza verificación del ejercicio por medio del Software en línea GeoGebra:

https://www.geogebra.org/classic/x8kdhymv

Figura 4
Representación de comprobación mediante software GeoGebra

Nota. Gráfico realizado en GeoGebra. Autoría Propia. Gomez (2022)

También podría gustarte