Documentos de Académico
Documentos de Profesional
Documentos de Cultura
México
Estadística I
Unidad 1
Actividad 2
Medidas de Dispersión
DESARROLLO
Actividad 1.
Para Salazar y del Castillo (2018), “la información que se obtiene de un estudio
estadístico, proviene de variables, las cuales están determinadas con el interés
que se tenga sobre los elementos de observación”.
Podemos clasificar a las variables en dos tipos, según estén relacionados con
datos que brindan información cualitativa o cuantitativa.
Las variables cualitativas, según Johnson y Kuby (2012), clasifican o describen a
un elemento de la población o muestra mientras que las variables cuantitativas
cuantifican a dichos elementos.
Por su parte, las variables cualitativas como se señaló anteriormente, son aquellas
que se refieren a características que no se pueden medir con números y las
podemos clasificar a su vez en variales cualitativas nominales y ordinales. Las
primeras, según Mario Triola (2013) se componen de datos que consisten en
nombres, etiquetas o categorías y que no se pueden acomodar en orden
ascendente o descendente y las variables cualitativas ordinales, son aquellas
variables que, aunque pueden representarse en algún orden, las diferencia entre
do rangos carece de significado.
A pesar de que era un concepto conocido por los griegos, la media aritmética no
fue generalizada a más de dos valores hasta el siglo XVI . La invención del sistema
decimal por Simón Stevin en 1585 parece haber facilitado estos cálculos. En sus
memorias – Un intento por mostrar la emergente ventaja de tomar la media de un
número de observaciones en astronomía práctica- preparada por Thomas
Simpson en 1755 (impreso en 1756) aplicaba por primera vez la teoría a la
discusión de errores en observaciones. La reimpresión (1757) de sus memorias
sostiene el axioma que errores positivos y negativos son igualmente probables. En
1815 un astrónomo alemán Frederik Wilhelm Bessel introduce el término error
probable (der wahrscheinliche Fehler) – la desviación media. La idea de la
mediana (valor que separa los datos a la mitad) se originó en el libro de
navegación de Edward Wright (Certaine Errors in Navigation) en 1599 en una
sección concerniente a la determinación de una localización con un compás.
Wright sintió que este valor era el que más probablemente estuviera correcto en
una serie de observaciones. Antoine Augustin Cournot en 1843 fue el primero en
usar el término mediana (valeur médiane) para el valor que divide la distribución
de probabilidad en dos mitades iguales[ CITATION His14 \l 1033 ].
Ronald Arnold Fisher la figura más influyente de la estadística, pues la situó como
una poderosa herramienta para la planeación y análisis de experimentos.
Contemporáneo de Pearson, desarrolló el análisis de varianza y fue pionero en el
desarrollo de numerosas técnicas de análisis multivariante y en la introducción del
método de máxima verosimilitud para la estimación de parámetros [ CITATION
Her05 \l 1033 ].
∑ x ' i ni
Vel11 \l 1033 ]. x́ ≈ i=1
n1 +…+ nk
∑ ( xi −x́ ) 2 f i
1033 ]. σ 2= i=1
N
Para una muestra:
n
∑ ( xi −x́)
s = i=1
2
n−1
Para una población:
n
∑ ( x ¿¿ i−μ)2
σ 2= i=1 ¿
N
Desviación La raíz cuadrada de la n
estándar varianza se
llama
poblacional
desviación
y
estándar
muestral,
σ=
√ ∑ ( x i− x́ )2 f i
i=1
N
respectivamente[ CITATION
Vel11 \l 1033 ].
Para una muestra:
s= √ s2
Para una población:
σ =√ σ 2
Coeficient Es una medida relativa que
e de toma en cuenta la dispersión
Variación con respecto a la magnitud
de la media.
Para una muestra:
s
CV = ∗100
|x́|
Para una población:
σ
CV = ∗100
|μ|
Las medidas de tendencia central se utilizan con bastante frecuencia para resumir
un conjunto de cantidades o datos numéricos a fin de describir los datos
cuantitativos que los forman. Son valores que se calculan para un grupo de datos
y que se utiliza para describirlos de alguna manera. Las medidas de tendencia
central miden el valor más representativo o típico de un grupo de datos, no es el
valor más pequeño o el más grande, sino un valor que está en algún punto
intermedio del grupo, más exactamente, se acerca a estar al centro de todos los
valores.
Por otra parte, la dispersión o variación es una característica importante de un
conjunto de datos porque intenta dar una idea de cuán esparcidos se encuentran
éstos.
Redacta una conclusión acerca del uso informativo del diagrama de caja y
bigotes.
De acuerdo con Severino (2021), los gráficos de cajas y bigotes son una excelente
forma de examinar rápidamente uno o más conjuntos de datos gráficamente.
Aunque parezcan primitivos en comparación con un Histograma o un Gráfico de
Densidad, tienen la ventaja de ocupar menos espacio, lo cual es útil cuando se
comparan distribuciones entre muchos grupos o conjuntos de datos. A
continuación se mencionan algunos tipos de observaciones que uno puede hacer
al ver un diagrama de cajas y bigotes:
Cuáles son los valores clave, tales como: el promedio, el percentil 25
medio, etc.
Si hay valores atípicos y cuáles son sus valores.
Si los datos son simétricos.
Cuán estrechamente se agrupan los datos.
Si los datos están sesgados y si es así, en qué dirección.
Unas de las variaciones más comúnmente utilizadas de los diagramas de cajas y
bigotes son: los diagramas de caja de anchura variable y los diagramas de caja
con muescas.
Cuáles son las características de una distribución normal.
Actividad 3.
Problema 1:
x 1+ x 2 +…+ x n
x́=
n
En este caso, la tabla contiene un total de 20 datos, por lo que sustituyendo los
valores en la fórmula, obtenemos lo siguiente:
En la tabla anterior, podemos verificar que el número que más veces se repite es
el 7, por lo tanto ese es el dato que corresponde a la moda de la distribución de
datos.
Mediana: Es el valor que divide en dos partes iguales una distribución de
frecuencias dejando igual número de datos del lado derecho y del lado izquierdo;
es decir, es el valor que se encuentra justamente en medio de los valores
ordenados ya sea en forma ascendente o descendente (UnADM, s.f.)
Para calcular la mediana, ordenamos nuestros datos de forma ascendente:
3,3,4,4,5,5,6,7,7 , 7,7 ,7,8,8,8,9,9,9,10,10
El total de nuestros datos es par, por lo que necesitamos calcular la media
aritmética de los dos valores que se encuentran justo en medio de nuestra
distribución de datos:
7+7 14
= =7
2 2
Por lo tanto, nuestra mediana es igual a 7.
Media recortada al 5% Es igual que la media aritmética, con la diferencia de que
para calcularla primero se reduce el 5% de los valores en el extremo superior y el
5% den el extremo inferior (UnADM, s.f.)
3,3,4,4,5,5,6,7,7,7,7,7,8,8,8,9,9,9,10,10
Para eliminar el 5% para cada uno de los extremos, determinamos cuánto es el
20 ∙5
5% de 13 datos: x= =1
100
Por tanto eliminamos un dato del extremo superior y uno del extremo inferior:
3 , 3,4,4,5,5,6,7,7,7,7,7,8,8,8,9,9,9,10, 10
3,4,4,5,5,6,7,7,7,7,7,8,8,8,9,9,9,10
Problema 2.
Se desea hacer un estudio sobre los gastos mensuales familiares, para lo cual se
toma una muestra representativa con lo que se obtuvieron los siguientes datos:
5,000 7,750 8,300 4,000 5,700 3,750 8,300 9,350 6,000 9,350 5,000 5,000 6,000
4,700 4,500 4,700 8,300 8,300 4,500 3,750 9,350 3,750 8,300 9,350 3,700 4,750
4,700 5,000 6,000 4,700 4,000 5,700 3,750 8,300 4,500 3,750
Realizar:
Organiza los datos en una tabla de frecuencias, puesto que varios valores
se repiten. (no los muestres por intervalos)
x́=
∑ x i∗f i = 211,850 =5885
N 36
Calcula la varianza
Hallamos la varianza:
2 2 2
2 ( x 1− x́ ) + ( x 2− x́ ) +…+ ( x n−x́ ) 137,069,097
σ = = =3,807,475
N 36
Problema 3:
Para la siguiente tabla de datos y frecuencias, calcular:
Marca de Frecuenci Frecuenci
a a
Salario semanal Clase Absoluta Acumulad
a
Clase Lim inf Lim sup Mc AMPLITU f F
D
1 9 22 15.5 13 12 12
2 22 35 28.5 13 18 30
3 35 48 41.5 13 27 57
4 48 61 54.5 13 34 91
5 61 74 67.5 13 47 138
6 74 87 80.5 13 28 166
7 87 100 93.5 13 13 179
8 100 113 106.5 13 8 187
187
Medida de posición no central integrada por tres valores que dividen el total de las
variables en cuatro partes iguales; por tanto, cada cuartíl representa el 25% del
total. (UnADM, s.f.)
kN
Qk =Li + (4
−F1−1
Fi−F i−1 )
A
Donde:
k =¿ Número de cuartil.
Li=¿ Limite real inferior de la clase del cuartil k.
N=¿ número de datos.
F i=¿ frecuencia acumulada de la clase del cuartil k.
F i−1 =¿ Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
A=¿ amplitud del intervalo.
kN 1 ∙187
Q 1= = =46.75
4 4
(1)(187)
Q1=35+ (4
57−30
−30
)
13=35+
46.75−30
27( )
13=35+0.6203 ∙13=43.06481
Esto significa que el 25% de los datos se encuentran por debajo de 43.06481.
kN 2 ∙187
Q 2= = =93.5
4 4
(2)(187)
Q2=61+ (4
138−91
−91
)
13=35+
93.5−91
47 ( )
13=61+ 0.05319148∙ 13=61.691489
kN 3 ∙187
Q 2= = =140.25
4 4
(3)(187)
Q3=74 + ( 4
166−138
−138
13=74 +)140.25−138
28( )
13=74+ 0.080357 ∙13=75.04464
Por tanto, el 75% de los datos se encuentran por debajo de 75.04464.
Rango intercuartil
Fórmula:
Ramgo intercuartil=Q3−Q1
Rango=75.04464−43.06481=31.97983
kN
Dk = Li +(10
−F1−1
Fi−F i−1)A
Donde:
k =¿ Número del decil.
Li=¿ Limite real inferior de la clase del decil k.
N=¿ número de datos.
F i=¿ frecuencia acumulada de la clase del decil k.
F i−1 =¿ Frecuencia acumulada de la clase que antecede a la clase del decil k.
A=¿ amplitud del intervalo.
Para calcular el tercer decil, primero tenemos que ubicar la clase que lo contiene a
partir de la siguiente operación:
kN 3 ∙ 187
D 3= = =56.1
10 10
(3)(187)
D3=35+ (
10
57−30
−30
13=35+)56.1−30
27( )
13=35+ 0.96 ∙13=47.56
Esto significa que el 30% de los datos están por debajo de 47.56.
Para calcular el sexto decil, primero tenemos que ubicar la clase que lo contiene a
partir de la siguiente operación:
kN 6 ∙ 187
D 6= = =112.2
10 10
(6)(187)
D6=61+ (
10
138−91
−91
13=61+)122.2−91
47( )
13=61+ 0.6638∙ 13=68.86
Esto significa que el 60% de los datos están por debajo de 68.86.
Para calcular el noveno decil, primero tenemos que ubicar la clase que lo contiene
a partir de la siguiente operación:
kN 9∙ 187
D 9= = =168.3
10 10
Esto significa que el 90% de los datos están por debajo de 89.3.
kN
Pk =Li + (
100
−F 1−1
Fi −Fi−1 )
A
Donde:
k =¿ Número del percentil.
Li=¿ Limite real inferior de la clase del percentil k.
N=¿ número de datos.
F i=¿ frecuencia acumulada de la clase del percentil k.
F i−1 =¿ Frecuencia acumulada de la clase que antecede a la clase del percentil k.
A=¿ amplitud del intervalo.
Para calcular el percentil trece, primero tenemos que ubicar la clase que lo
contiene a partir de la siguiente operación:
kN 13 ∙ 187
P13= = =24.31
100 100
Esto quiere decir que el 13% de los datos se encuentran por debajo de 30.8905.
Para calcular el percentil cuarenta y cuatro, primero tenemos que ubicar la clase
que lo contiene a partir de la siguiente operación:
kN 44 ∙187
P44 = = =82.28
100 100
( 44)(187)
P44 =48+ ( 100
91−57
−57
)
13=48+
82.28−57
(34 )
13=48+ 0.74352∙ 13=57.6658
Esto quiere decir que el 44% de los datos se encuentran por debajo de 57.6658.
Para calcular el percentil setenta y siete, primero tenemos que ubicar la clase que
lo contiene a partir de la siguiente operación:
kN 77 ∙ 187
P77= = =143.99
100 100
(77)(187)
P77=74 + (100
166−138
−138
)
13=74 +
143.99−138
(
28 )
13=74+ 0.21392∙ 13=76.78107
Esto quiere decir que el 77% de los datos se encuentran por debajo de 76.78107
(87)(187)
P87=74 + ( 100
166−138
−138
)
13=74+
162.69−138
( 28 )
13=74 +0.88178 ∙13=85.46321
IQR=75.04464−43.06481=31.97983
Calcular:
Cuartiles
Primero, hallamos la amplitud del cuartil:
N
=7.5
4
Posteriormente, hallamos los cuartiles:
Primer cuartil: Q1=x 7 +0.25 ( x 8−x 7 )=37.5
Segundo cuartil: Q2=x 15 +0.5 ( x 16−x15 ) =54
Tercer cuartil: Q3=x 22 +0.75 ( x 23−x22 )=63.5
Rango intercuartil
Construye una gráfica que represente la desviación estándar, de los datos del
problema 4, de la Actividad 1. Esta se representa por una campana de Gauss.
(Apóyate en los videos publicados)
Distribucion normal
0.04
0.03
0.03
0.02
0.02
0.01
0.01
0
17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62
Responde:
Qué parámetros usas para construir la gráfica de esta
distribución normal de frecuencias.
REFERENCIAS
Anderson, D., Sweeny, D., & Williams, T. (2008). Estadistica para administracion y
economia. Mexico: Cengage Learning.
Araujo, A., Martinez, L., & Flores, P. (2014). Historia de la Estadistica y la
Probabilidad. Ciudad Bolivar: Universidad Epedagogica Experimental
Libertador.
Benitez, A. (2021). Apuntes de Probabilidad y Estadistica. Obtenido de
Universidad Autonoma del Estado de Hidalgo:
http://cidecame.uaeh.edu.mx/lcc/mapa/PROYECTO/libro19/index.html
Bjorner, A., & Stanley, R. (2010). A Combnatorial Miscellany. Cambridge:
Massachusetts Institute of Technology Department of Mathematics.
Cruz, Ignacio; Terrazas, Irma; Rodea Colín, José Alberto (S.f.) Unidad 1. Estadística
Descriptiva e indicadores económicos. Universidad Nacional Autónoma de
México, Facultad de Economía. Sistema Universidad Abierta y Educación a
Distancia.