Está en la página 1de 31

Universidad Abierta y a Distancia de

México

Estadística I

Ciudad de México, Noviembre del 2021

Unidad 1
Actividad 2
Medidas de Dispersión

DOCENTE: CLAUDIO RAMÓN RODRÍGUEZ


MONDRAGÓN
UNIDAD I
ACTIVIDAD 2
INTRODUCCION

El presente trabajo se presenta como evidencia de aprendizaje para la Unidad I de


la asignatura Estadística I perteneciente al programa de Licenciatura en
Matemáticas de la UnADM. El objetivo de este trabajo es mostrar la adquisición de
conocimientos significativos en materia de conceptos sobre estadística y medidas
de tendencia central y dispersión.. La estructura del trabajo es la siguiente: Se
presentara los enunciados de los problemas propuestos, seguido de su solución y
el argumento para llegar al resultado obtenido. Por último, se enunciaran unas
breves conclusiones acerca del tema.

DESARROLLO

Actividad 1.

Define qué es un dato.

Un dato es aquella información que se reune, analiza y se resume a fin de poder


presentarla e interpretarla. Los datos se pueden clasificar en cualitativos y
cuantitativos según se pueden o no expresar de forma numérica; los primeros son
aquellos que comprenden etiquetas para identificar sus atributos y los segundos,
son aquellos cuyas características pueden ser expresadas de forma numérica a
través de escalas de medición de intervalo o de razón. Otra clasificación bastante
útil en estadística, es aquella que los divide en datos de sección transversal y de
series de tiempo. Los datos de sección transversal son los que se obtienen en el
mismo punto de tiempo; en cambio, los datos de series de tiempo son los que se
obtienen a través de varios periodos. (Anderson, Sweeny y Williams, 2008).
Según Jonhson y Kuby(2008) un dato “es el valor de la variable asociada a un
elemento de una población o muestra. Este valor puede ser un número, una
palabra o un símbolo.”

Un dato es el registro de una agrupación de cualquier cantidad de observacioens


relacionadas. Para que los datos sean útiles, estos deberán organizarse con el fin
de poder observar tendencias y llegar a conclusiones[ CITATION Qui19 \l 1033 ].

Define qué es una variable estadística en una muestra o en una población.

Una variable estadística es una característica de interés de una población o


muestra que puede adoptar diferentes valores. Una variable estadística, puede o
no adoptar una forma numérica. (López, 2020)

Para Salazar y del Castillo (2018), “la información que se obtiene de un estudio
estadístico, proviene de variables, las cuales están determinadas con el interés
que se tenga sobre los elementos de observación”.

Da cinco ejemplos de variable estadística.


1. Edad de las personas que pertenecen a la población económicamente
activa en México.
2. Edad de los alumnos que cursan la materia de Estadística I en la UnADM.
3. Sexo de los alumnos de la Licenciatura en Matemáticas de la UnADM.
4. El peso de una persona.
5. El tiempo utilizado para realizar la Actividad 2 de la Unidad I de Estadística.

Describe los diferentes tipos de variables estadística

Podemos clasificar a las variables en dos tipos, según estén relacionados con
datos que brindan información cualitativa o cuantitativa.
Las variables cualitativas, según Johnson y Kuby (2012), clasifican o describen a
un elemento de la población o muestra mientras que las variables cuantitativas
cuantifican a dichos elementos.

Tal y como lo señalan Anderson et al (2018), una variable cualitativa limita de


manera significativa el análisis estadístico ya que los datos se resumen contando
el número de observaciones o su proporción en cada categoría y las operaciones
aritméticas no tienen sentido. Sin embargo, tratándose de variables cuantitativas,
es posible sumar y dividir los datos para poder calcular un promedio que resulta un
herramienta útil para el análisis estadístico.

Asimismo, las variables cuantitativas se pueden clasificar en variables continuas y


discretas, según tomen un número finito o infinito de valores en un intervalo. Una
variable es discreta si su conjunto de valores es finito o se puede enumerar en una
sucesión infinita; a su vez una variable es continua si sus valores comprenden un
intervalo completo sobre la recta numérica. (Devore, 2008)

Por su parte, las variables cualitativas como se señaló anteriormente, son aquellas
que se refieren a características que no se pueden medir con números y las
podemos clasificar a su vez en variales cualitativas nominales y ordinales. Las
primeras, según Mario Triola (2013) se componen de datos que consisten en
nombres, etiquetas o categorías y que no se pueden acomodar en orden
ascendente o descendente y las variables cualitativas ordinales, son aquellas
variables que, aunque pueden representarse en algún orden, las diferencia entre
do rangos carece de significado.

Da cinco ejemplos de cada tipo de variable estadística.


Variables cuantitativas continuas:
1. Ingreso de cada habitante de la Ciudad de México.
2. El peso de una persona.
3. La altura de todos los jugadores de un equipo de basket ball.
4. Los litros de agua que consume una persona por día.
5. El tiempo que tarda un automóvil de ir de la Ciudad de México a la Ciudad
de Cuernavaca.
Variables cuantitativas discretas:
1. La población de la Ciudad de México.
2. El número de personas que integran una familia.
3. Las botellas de agua que consume una persona por día.
4. El número de libros de matemáticas que tiene un estudiante.
5. Número de dientes que tiene una persona.
Variables cualitativas nominales:
1. Color de cabello de un grupo de personas.
2. Ciudad donde vive cada estudiante de la Licenciatura en Matemáticas de la
UnADM.
3. La filiación política de los docentes de la UnADM.
4. Estado civil de las personas.
5. Profesión de un grupo de personas.
Variables cualitativas ordinales:
1. Las calificaciones de los alumnos de Estadística I de la Licenciatura en
Matemáticas de la UnADM.
2. El ranking de las mejores universidades públicas de México.
3. Encuesta de satisfacción de un servicio que lo evalúa como excelente,
bueno, regular o malo.
4. Grado de instrucción de un grupo de personas.
5. Clasificación de un producto según su grado de preferencia.
Actividad 2.

Investiga la historia de las medidas de dispersión.

A pesar de que era un concepto conocido por los griegos, la media aritmética no
fue generalizada a más de dos valores hasta el siglo XVI . La invención del sistema
decimal por Simón Stevin en 1585 parece haber facilitado estos cálculos. En sus
memorias – Un intento por mostrar la emergente ventaja de tomar la media de un
número de observaciones en astronomía práctica- preparada por Thomas
Simpson en 1755 (impreso en 1756) aplicaba por primera vez la teoría a la
discusión de errores en observaciones. La reimpresión (1757) de sus memorias
sostiene el axioma que errores positivos y negativos son igualmente probables. En
1815 un astrónomo alemán Frederik Wilhelm Bessel introduce el término error
probable (der wahrscheinliche Fehler) – la desviación media. La idea de la
mediana (valor que separa los datos a la mitad) se originó en el libro de
navegación de Edward Wright (Certaine Errors in Navigation) en 1599 en una
sección concerniente a la determinación de una localización con un compás.
Wright sintió que este valor era el que más probablemente estuviera correcto en
una serie de observaciones. Antoine Augustin Cournot en 1843 fue el primero en
usar el término mediana (valeur médiane) para el valor que divide la distribución
de probabilidad en dos mitades iguales[ CITATION His14 \l 1033 ].

¿Cuáles culturas de la antigüedad, realizaron estudios parecidos a la de


la varianza y desviación estándar?

Hacia el año 3000 a. de C. los babilonios utilizaban ya pequeñas tablillas de arcilla


para recopilar datos sobre la producción agrícola y los géneros vendidos o
cambiados mediante trueque. En el antiguo Egipto, los faraones lograron recopilar,
alrededor del año 3050 a. de C., prolijos datos relativos a la población y la riqueza
del país; de acuerdo con el historiador griego Heródoto, dicho registro de la
riqueza y la población se hizo con el propósito de preparar la construcción de las
pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el
objeto de verificar un nuevo reparto. En el antiguo Israel, la Biblia da referencia, en
el libro de los N ú m e r o s, de los datos estadísticos obtenidos en dos recuentos
de la población hebrea. El rey David, por otra parte, ordenó a Joab, general del
ejército, hacer un censo de Israel con la finalidad de conocer el número de
habitantes, y el libro C r ó n i c a s describe el bienestar material de las diversas
tribus judías. En China ya había registros numéricos similares con anterioridad al
año 2000 a. de C. Los griegos, hacia el año 594 a. de C., efectuaron censos
periódicamente con fines tributarios, sociales (división de tierras) y militares
(cálculo de recursos y hombres disponibles). La investigación histórica revela que
se realizaron 69 censos para calcular los impuestos, determinar los derechos de
voto y ponderar la potencia guerrera. Pero fueron los romanos, maestros de la
organización política, quienes mejor supieron emplear los recursos de la
estadística. Cada cinco años llevaban a cabo un censo de la población, y los
funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y
matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas
contenidas en las tierras conquistadas. En la época del nacimiento de Cristo
sucedía uno de estos empadronamientos de la población bajo la autoridad del
Imperio[ CITATION Her05 \l 1033 ].

¿Cuáles fueron los matemáticos en establecer y desarrollar los estudios de


la varianza y desviación estándar?

Ronald Arnold Fisher la figura más influyente de la estadística, pues la situó como
una poderosa herramienta para la planeación y análisis de experimentos.
Contemporáneo de Pearson, desarrolló el análisis de varianza y fue pionero en el
desarrollo de numerosas técnicas de análisis multivariante y en la introducción del
método de máxima verosimilitud para la estimación de parámetros [ CITATION
Her05 \l 1033 ].

Cuál es el objetivo del estudio de la varianza y de la desviación estándar


en contraste, ante la media. Puedes exponer cinco ejemplos.

La varianza y la desviación estándar son medidas de variación para las variables


de razón de intervalo . Describen cuánta variación o diversidad hay en una
distribución. Tanto la varianza como la desviación estándar aumentan o
disminuyen en función de qué tan cerca se agrupen las puntuaciones alrededor de
la media. La varianza se define como el promedio de las desviaciones cuadradas
de la media. Para calcular la varianza, primero resta la media de cada número y
luego eleva al cuadrado los resultados para encontrar las diferencias al cuadrado.
Luego, calcula el promedio de esas diferencias cuadradas. El resultado es la
varianza. Asimismo, la desviación estándar es una medida de cuán dispersos
están los números en una distribución. Indica cuánto, en promedio, cada uno de
los valores de la distribución se desvía de la media, o centro, de la distribución. Se
calcula tomando la raíz cuadrada de la varianza. La varianza y la desviación
estándar son importantes porque nos dicen cosas sobre el conjunto de datos que
no podemos aprender con solo mirar la media o el promedio, es decir la varianza y
la desviación estándar nos muestran cuánto varían los puntajes en una
distribución del promedio[ CITATION Fra06 \l 1033 ].

Cuál es el propósito del calcular el coeficiente de variación.

El coeficiente de variación, también denominado como coeficiente de variación de


Pearson, es una medida estadística que nos informa acerca de la dispersión
relativa de un conjunto de datos, es decir, nos informa al igual que otras medidas
de dispersión, de si una variable se mueve mucho, poco, más o menos que otra.
Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la
media del conjunto y por lo general se expresa en porcentaje para su mejor
comprensión[ CITATION Mar21 \l 1033 ].

El coeficiente de variación se utiliza para comparar conjuntos de datos


pertenecientes a poblaciones distintas. Si atendemos a su fórmula, vemos que
este tiene en cuenta el valor de la media. Por lo tanto, el coeficiente de variación
nos permite tener una medida de dispersión que elimine las posibles distorsiones
de las medias de dos o más poblaciones[ CITATION Mar21 \l 1033 ].

Construye una tabla de fórmulas para la varianza, desviaciones estándar


y media para Poblaciones y para Muestras.

Tabla 1. Medidas de dispersión para datos agrupados y no agrupados. Fuente:


Creación propia.

Medida Datos no Agrupados Datos Agrupados


Media x + …+ x n 1 n x n +…+ x k nk k
x́= 1 = ∑ xi x́= 1 1 =∑ f i xi
n n i=1 n1 +…+ nk i=1

Si el conjunto de datos Cuando la distribución de


corresponde a toda la valores se expresa en una
población la media aritmética tabla de intervalos de clase, la
se denota con μ. A μ también media ponderada se aproxima
se le llama media poblacional usando las marcas de
mientras que a x́ se le llama clase[ CITATION Vel11 \l 1033 ]:
media muestral[ CITATION k

∑ x ' i ni
Vel11 \l 1033 ]. x́ ≈ i=1
n1 +…+ nk

Varianza La varianza indica cómo De acuerdo con Veliz (2011),


están dispersos los datos la varianza para datos
respecto de su agrupados se calcula como:
media[ CITATION Vel11 \l n

∑ ( xi −x́ ) 2 f i
1033 ]. σ 2= i=1
N
Para una muestra:
n

∑ ( xi −x́)
s = i=1
2
n−1
Para una población:
n

∑ ( x ¿¿ i−μ)2
σ 2= i=1 ¿
N
Desviación La raíz cuadrada de la n

estándar varianza se
llama
poblacional
desviación
y
estándar
muestral,
σ=
√ ∑ ( x i− x́ )2 f i
i=1
N

respectivamente[ CITATION
Vel11 \l 1033 ].
Para una muestra:
s= √ s2
Para una población:
σ =√ σ 2
Coeficient Es una medida relativa que
e de toma en cuenta la dispersión
Variación con respecto a la magnitud
de la media.
Para una muestra:
s
CV = ∗100
|x́|
Para una población:
σ
CV = ∗100
|μ|

Describe, qué información podemos recoger de un diagrama de caja y


bigotes.
Un diagrama de cajas y bigotes es una manera conveniente de mostrar
visualmente grupos de datos numéricos a través de sus cuartiles. Las líneas que
se extienden paralelas a las cajas se conocen como «bigotes», y se usan para
indicar variabilidad fuera de los cuartiles superior e inferior. Los valores atípicos se
representan a veces como puntos individuales que están en línea con los bigotes.
Los diagramas de cajas y bigotes se pueden dibujar vertical u
horizontalmente[ CITATION Sev \l 1033 ].

Figura 1. Elementos de un diagrama de caja y bigotes. Fuente:


https://datavizcatalogue.com/ES/metodos/images/anatomy/SVG/diagrama_cajas_
y_bigotes.svg

Redacta una conclusión del uso de las medidas de tendencia central y


dispersión.
En Veliz (2019) se define a las medias de tendencia central o posición nos indican
donde se sitúa un dato dentro de una distribución de datos, asimismo las medidas
de dispersión, variabilidad o variación nos indican si esos datos están próximos
entre sí o sí están dispersos, es decir, nos indican cuán esparcidos se encuentran
los datos.

Las medidas de tendencia central se utilizan con bastante frecuencia para resumir
un conjunto de cantidades o datos numéricos a fin de describir los datos
cuantitativos que los forman. Son valores que se calculan para un grupo de datos
y que se utiliza para describirlos de alguna manera. Las medidas de tendencia
central miden el valor más representativo o típico de un grupo de datos, no es el
valor más pequeño o el más grande, sino un valor que está en algún punto
intermedio del grupo, más exactamente, se acerca a estar al centro de todos los
valores.
Por otra parte, la dispersión o variación es una característica importante de un
conjunto de datos porque intenta dar una idea de cuán esparcidos se encuentran
éstos.

En general, la diferencia principal entre ambos tipos de medidas es la forma en la


que se observa al dato como tal, es decir, el punto de vista desde el cual
analizamos los datos.

Redacta una conclusión acerca del uso informativo del diagrama de caja y
bigotes.
De acuerdo con Severino (2021), los gráficos de cajas y bigotes son una excelente
forma de examinar rápidamente uno o más conjuntos de datos gráficamente.
Aunque parezcan primitivos en comparación con un Histograma o un Gráfico de
Densidad, tienen la ventaja de ocupar menos espacio, lo cual es útil cuando se
comparan distribuciones entre muchos grupos o conjuntos de datos. A
continuación se mencionan algunos tipos de observaciones que uno puede hacer
al ver un diagrama de cajas y bigotes:
 Cuáles son los valores clave, tales como: el promedio, el percentil 25
medio, etc.
 Si hay valores atípicos y cuáles son sus valores.
 Si los datos son simétricos.
 Cuán estrechamente se agrupan los datos.
 Si los datos están sesgados y si es así, en qué dirección.
Unas de las variaciones más comúnmente utilizadas de los diagramas de cajas y
bigotes son: los diagramas de caja de anchura variable y los diagramas de caja
con muescas.
Cuáles son las características de una distribución normal.
Actividad 3.

Problema 1:

Se tomó una muestra representativa de alumnos de nivel universitario que cursan


el primer semestre, a los cuales se les preguntó la calificación máxima obtenida en
la asignatura de Matemáticas, cuyas repuestas fueron las siguientes:
9 7 7 4 8
5 5 7 3 7
4 9 8 10 10
6 7 9 3 8
Calcula:

Media: La media es la suma de los valores de un conjunto de datos recolectados


dividida entre el tamaño de la muestra (UnADM, s.f)

La fórmula para calcular la media es la siguiente:

x 1+ x 2 +…+ x n
x́=
n

Donde n es el número de datos.

En este caso, la tabla contiene un total de 20 datos, por lo que sustituyendo los
valores en la fórmula, obtenemos lo siguiente:

9+7+7 +4 +8+5+5+7 +3+7+ 4+ 9+8+10+10+6 +7+9+3+ 8 136


x́= = =6.8
20 20

Por tanto, el valor de la mediaes de 6.8


Moda: La moda es el “valor de la variable que se presenta con mayor frecuencia
en un conjunto de datos” (UnADM, s.f.)
Variable Frecuencia
3 2
4 2
5 2
6 1
7 5
8 3
9 3
10 2

En la tabla anterior, podemos verificar que el número que más veces se repite es
el 7, por lo tanto ese es el dato que corresponde a la moda de la distribución de
datos.
Mediana: Es el valor que divide en dos partes iguales una distribución de
frecuencias dejando igual número de datos del lado derecho y del lado izquierdo;
es decir, es el valor que se encuentra justamente en medio de los valores
ordenados ya sea en forma ascendente o descendente (UnADM, s.f.)
Para calcular la mediana, ordenamos nuestros datos de forma ascendente:
3,3,4,4,5,5,6,7,7 , 7,7 ,7,8,8,8,9,9,9,10,10
El total de nuestros datos es par, por lo que necesitamos calcular la media
aritmética de los dos valores que se encuentran justo en medio de nuestra
distribución de datos:
7+7 14
= =7
2 2
Por lo tanto, nuestra mediana es igual a 7.
Media recortada al 5% Es igual que la media aritmética, con la diferencia de que
para calcularla primero se reduce el 5% de los valores en el extremo superior y el
5% den el extremo inferior (UnADM, s.f.)

Ordenamos los valores en forma ascendente:

3,3,4,4,5,5,6,7,7,7,7,7,8,8,8,9,9,9,10,10
Para eliminar el 5% para cada uno de los extremos, determinamos cuánto es el

20 ∙5
5% de 13 datos: x= =1
100

Por tanto eliminamos un dato del extremo superior y uno del extremo inferior:

3 , 3,4,4,5,5,6,7,7,7,7,7,8,8,8,9,9,9,10, 10
3,4,4,5,5,6,7,7,7,7,7,8,8,8,9,9,9,10

3+4 +4 +5+5+6 +7+7+7+ 7+7+8+ 8+8+ 9+9+9+10 123


x́= = =6.83
18 28

Por tanto, la media recortada corresponde a 6.83 unidades.

Problema 2.

Se desea hacer un estudio sobre los gastos mensuales familiares, para lo cual se
toma una muestra representativa con lo que se obtuvieron los siguientes datos:

5,000 7,750 8,300 4,000 5,700 3,750 8,300 9,350 6,000 9,350 5,000 5,000 6,000
4,700 4,500 4,700 8,300 8,300 4,500 3,750 9,350 3,750 8,300 9,350 3,700 4,750
4,700 5,000 6,000 4,700 4,000 5,700 3,750 8,300 4,500 3,750

Realizar:

 Organiza los datos en una tabla de frecuencias, puesto que varios valores
se repiten. (no los muestres por intervalos)

La tabla de frecuencias queda de la siguiente manera:


xi fi f acum x i∗f i
3700 1 1 3700
3750 5 6 18750
4000 2 8 8000
4500 3 11 13500
4700 4 15 18800
4750 1 16 4750
5000 4 20 20000
5700 2 22 11400
6000 3 25 18000
7750 1 26 7750
8300 6 32 49800
9350 4 36 37400
36 211850
Calcula la media aritmética
Hallamos la media aritmética:

x́=
∑ x i∗f i = 211,850 =5885
N 36
Calcula la varianza
Hallamos la varianza:
2 2 2
2 ( x 1− x́ ) + ( x 2− x́ ) +…+ ( x n−x́ ) 137,069,097
σ = = =3,807,475
N 36

Calcula la desviación típica


Hallamos la desviación típica:
σ =√ 3,807,475=1,951
Calcula el coeficiente de variación
Hallamos el coeficiente de variación:
σ 1,951
CV = = =0.33
x́ 5,885
Rango intercuartil.
Primero, hallamos los cuartiles:
Primer Cuartil: 4,500
Segundo Cuartil: 5,000
Tercer Cuartil: 8,300
IQR=8,300−4,500=3,800

Grafica de caja y bigotes.


A continuación, presentamos el grafico de caja y bigotes para el ejercicio:

Problema 3:
Para la siguiente tabla de datos y frecuencias, calcular:
Marca de Frecuenci Frecuenci
a a
Salario semanal Clase Absoluta Acumulad
a
Clase Lim inf Lim sup Mc AMPLITU f F
D
1 9 22 15.5 13 12 12
2 22 35 28.5 13 18 30
3 35 48 41.5 13 27 57
4 48 61 54.5 13 34 91
5 61 74 67.5 13 47 138
6 74 87 80.5 13 28 166
7 87 100 93.5 13 13 179
8 100 113 106.5 13 8 187
187

Los cuartiles: Q1, Q2 y Q3

Medida de posición no central integrada por tres valores que dividen el total de las
variables en cuatro partes iguales; por tanto, cada cuartíl representa el 25% del
total. (UnADM, s.f.)

Para datos agrupados, la fórmula para obtener los cuartiles es la siguiente:

kN
Qk =Li + (4
−F1−1
Fi−F i−1 )
A

Donde:
k =¿ Número de cuartil.
Li=¿ Limite real inferior de la clase del cuartil k.
N=¿ número de datos.
F i=¿ frecuencia acumulada de la clase del cuartil k.
F i−1 =¿ Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
A=¿ amplitud del intervalo.

Para el primer cuartil, en primer lugar, buscamos la clase donde se encuentra el


valor de la posición de interés de entre las frecuencias acumuladas:

kN 1 ∙187
Q 1= = =46.75
4 4

Dicho valor se encuentra en la frecuencia acumulada de la clase 3; por lo tanto,


con los valores de dicha clase reemplazamos en la fórmula para calcular los
cuartiles de la siguiente manera:

(1)(187)
Q1=35+ (4
57−30
−30
)
13=35+
46.75−30
27( )
13=35+0.6203 ∙13=43.06481

Esto significa que el 25% de los datos se encuentran por debajo de 43.06481.

Para el segundo cuartil, buscamos la clase donde se encuentra el valor de la


posición de interés de entre las frecuencias acumuladas:

kN 2 ∙187
Q 2= = =93.5
4 4

Dicho valor se encuentra en la frecuencia acumulada de la clase 5; por lo tanto,


con los valores de dicha clase reemplazamos en la fórmula:

(2)(187)
Q2=61+ (4
138−91
−91
)
13=35+
93.5−91
47 ( )
13=61+ 0.05319148∙ 13=61.691489

Al segundo cuartil le corresponde el valor de 61.691489. Este valor coincide con la


mediana de los datos agrupados.

Para el tercer cuartil, buscamos la clase donde se encuentra el valor de la posición


de interés de entre las frecuencias acumuladas:

kN 3 ∙187
Q 2= = =140.25
4 4

Dicho valor se encuentra en la frecuencia acumulada de la clase 6; por lo tanto,


con los valores de dicha clase reemplazamos en la fórmula:

(3)(187)
Q3=74 + ( 4
166−138
−138
13=74 +)140.25−138
28( )
13=74+ 0.080357 ∙13=75.04464
Por tanto, el 75% de los datos se encuentran por debajo de 75.04464.

Rango intercuartil

Diferencia entre el valor máximo y el valor mínimo (UnADM, s.f.)

Fórmula:

Ramgo intercuartil=Q3−Q1

Rango=75.04464−43.06481=31.97983

Por tanto, el rango intercuartil es de 31.97983.

Los deciles: D3. D6, D9


Los deciles son los nueve valores que distribuyen la serie de datos en 10 tramos
iguales, cada uno de ellos concentra el 10% de los resultados (Cruz, Terrazas,
Arcos, Rodea y Alcántara, s.f.)
La fórmula para calcular los deciles es la siguiente:

kN
Dk = Li +(10
−F1−1
Fi−F i−1)A

Donde:
k =¿ Número del decil.
Li=¿ Limite real inferior de la clase del decil k.
N=¿ número de datos.
F i=¿ frecuencia acumulada de la clase del decil k.
F i−1 =¿ Frecuencia acumulada de la clase que antecede a la clase del decil k.
A=¿ amplitud del intervalo.

Para calcular el tercer decil, primero tenemos que ubicar la clase que lo contiene a
partir de la siguiente operación:

kN 3 ∙ 187
D 3= = =56.1
10 10

La posición del tercer decil la encontramos en la clase número tres, a partir de


esta información sustituimos la información necesaria en la fórmula:

(3)(187)
D3=35+ (
10
57−30
−30
13=35+)56.1−30
27( )
13=35+ 0.96 ∙13=47.56

Esto significa que el 30% de los datos están por debajo de 47.56.

Para calcular el sexto decil, primero tenemos que ubicar la clase que lo contiene a
partir de la siguiente operación:

kN 6 ∙ 187
D 6= = =112.2
10 10

La posición del sexto decil la encontramos en la clase número cinco, a partir de


esta información sustituimos la información necesaria en la fórmula:

(6)(187)
D6=61+ (
10
138−91
−91
13=61+)122.2−91
47( )
13=61+ 0.6638∙ 13=68.86

Esto significa que el 60% de los datos están por debajo de 68.86.

Para calcular el noveno decil, primero tenemos que ubicar la clase que lo contiene
a partir de la siguiente operación:

kN 9∙ 187
D 9= = =168.3
10 10

La posición del noveno decil la encontramos en la clase número siete, a partir de


esta información sustituimos la información necesaria en la fórmula:
(9)(187)
D9=87+ (10
179−166
−166
)
13=87+
168.3−166
13( )
13=87+0.1769 ∙ 13=89.3

Esto significa que el 90% de los datos están por debajo de 89.3.

Los percentiles: P13, P44, P77 y P87

Son 99 valores que distribuyen la serie de datos en 100 tramos iguales,


correspondiéndole a cada percentil el 1% de los resultados. (Cruz et al., s.f.)
La fórmula para calcular los percentiles es la siguiente:

kN
Pk =Li + (
100
−F 1−1
Fi −Fi−1 )
A

Donde:
k =¿ Número del percentil.
Li=¿ Limite real inferior de la clase del percentil k.
N=¿ número de datos.
F i=¿ frecuencia acumulada de la clase del percentil k.
F i−1 =¿ Frecuencia acumulada de la clase que antecede a la clase del percentil k.
A=¿ amplitud del intervalo.

Para calcular el percentil trece, primero tenemos que ubicar la clase que lo
contiene a partir de la siguiente operación:

kN 13 ∙ 187
P13= = =24.31
100 100

La posición del percentil la encontramos en la clase número dos, a partir de esta


información sustituimos la información necesaria en la fórmula:
(13)(187)
P13=22+ (
100
30−12
−12
)
13=22+
24.31−12
(
18 )
13=22+0.6838 ∙ 13=30.8905

Esto quiere decir que el 13% de los datos se encuentran por debajo de 30.8905.

Para calcular el percentil cuarenta y cuatro, primero tenemos que ubicar la clase
que lo contiene a partir de la siguiente operación:

kN 44 ∙187
P44 = = =82.28
100 100

La posición del percentil la encontramos en la clase número cuatro, a partir de


esta información sustituimos la información necesaria en la fórmula:

( 44)(187)
P44 =48+ ( 100
91−57
−57
)
13=48+
82.28−57
(34 )
13=48+ 0.74352∙ 13=57.6658

Esto quiere decir que el 44% de los datos se encuentran por debajo de 57.6658.

Para calcular el percentil setenta y siete, primero tenemos que ubicar la clase que
lo contiene a partir de la siguiente operación:

kN 77 ∙ 187
P77= = =143.99
100 100

La posición del percentil la encontramos en la clase número cuatro, a partir de


esta información sustituimos la información necesaria en la fórmula:

(77)(187)
P77=74 + (100
166−138
−138
)
13=74 +
143.99−138
(
28 )
13=74+ 0.21392∙ 13=76.78107

Esto quiere decir que el 77% de los datos se encuentran por debajo de 76.78107

Por último, calculamos el percentil 87:


kN 87 ∙187
P87= = =162.69
100 100

La posición del percentil la encontramos en la clase 6, conociendo esta


información, sustituimos en la fórmula de la siguiente manera:

(87)(187)
P87=74 + ( 100
166−138
−138
)
13=74+
162.69−138
( 28 )
13=74 +0.88178 ∙13=85.46321

El 87% de los datos se encuentra por debajo del valor 85.46321.

Los valores atípicos mínimos y máximos, si estos existieran:


Para calcular los valores atípicos necesitamos recordar nuestro rango intercuartil:

IQR=75.04464−43.06481=31.97983

El rango se utiliza para calcular los valores atípicos máximos y mínimos

Grafica de caja y bigotes.


A continuación, se muestra el grafico de caja y bigotes para la tabla de datos:
Problema 4:

Los siguientes datos representan el número de horas que un adolescente, de un


Bachillerato, pasa en Facebook, a la semana:
29 28 72
37 61 46
58 39 48
53 32 58
69 31 64
52 65 20
62 68 54
74 34 43
54 69 74
60 62 49

Calcular:
Cuartiles
Primero, hallamos la amplitud del cuartil:
N
=7.5
4
Posteriormente, hallamos los cuartiles:
Primer cuartil: Q1=x 7 +0.25 ( x 8−x 7 )=37.5
Segundo cuartil: Q2=x 15 +0.5 ( x 16−x15 ) =54
Tercer cuartil: Q3=x 22 +0.75 ( x 23−x22 )=63.5

Rango intercuartil

Hallamos el rango intercuartil:


IQR=63.5−37.5=26

Diagrama de caja y bigotes.


A continuación, se muestra el grafico de caja y bigotes para los datos de horas
semanales de un adolescente en redes sociales:
Problema 5:

Construye una gráfica que represente la desviación estándar, de los datos del
problema 4, de la Actividad 1. Esta se representa por una campana de Gauss.
(Apóyate en los videos publicados)

A continuación el grafico de ajuste a distribución normal:

Distribucion normal
0.04

0.03

0.03

0.02

0.02

0.01

0.01

0
17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62

Responde:
Qué parámetros usas para construir la gráfica de esta
distribución normal de frecuencias.

La marca de clase, la media aritmética y la desviación de estándar.


Calcular la probabilidad de que un alumno pase en el Tik Tok, menos de
45 horas a la semana.
P( x <45)
45−35.62
z= =0.81
11.53
El valor en la tabla de distribución normal es:
P ( x< 45 )=0.7910

Calcular la probabilidad de que un alumno pase en el Tik Tok, más de


55 horas a la semana.
P( x >55)
55−35.61
z= =1.68
11.53
El valor en la tabla de distribución normal es:
P ( x>55 )=1−0.9535=0.0465

Calcular la probabilidad de que un alumno pase en el Tik Tok, ente 45 y


55 horas a la semana.
P ( 45< x <55 ) =0.9535−0.7910=0.1625
CONCLUSIONES
A continuación, se enunciara una serie de argumentos a modo de conclusiones
sobre el tema:
 Una variable estadística es una característica de interés de una población o
muestra que puede adoptar diferentes valores.
 Las variables cuantitativas se pueden clasificar en variables continuas y
discretas, según tomen un número finito o infinito de valores en un intervalo.
 Las medidas de tendencia central se utilizan con bastante frecuencia para
resumir un conjunto de cantidades o datos numéricos a fin de describir los
datos cuantitativos que los forman.
 Las medidas de dispersión, variabilidad o variación nos indican si esos
datos están próximos entre sí o sí están dispersos
 La varianza y la desviación estándar son medidas de variación para las
variables de razón de intervalo, es decir, describen cuánta variación o
diversidad hay en una distribución.
 El coeficiente de variación, es una medida estadística que nos informa si
una variable se mueve mucho, poco, más o menos que otra.
 Un diagrama de cajas y bigotes es una manera conveniente de mostrar
visualmente grupos de datos numéricos a través de sus cuartiles.

REFERENCIAS
Anderson, D., Sweeny, D., & Williams, T. (2008). Estadistica para administracion y
economia. Mexico: Cengage Learning.
Araujo, A., Martinez, L., & Flores, P. (2014). Historia de la Estadistica y la
Probabilidad. Ciudad Bolivar: Universidad Epedagogica Experimental
Libertador.
Benitez, A. (2021). Apuntes de Probabilidad y Estadistica. Obtenido de
Universidad Autonoma del Estado de Hidalgo:
http://cidecame.uaeh.edu.mx/lcc/mapa/PROYECTO/libro19/index.html
Bjorner, A., & Stanley, R. (2010). A Combnatorial Miscellany. Cambridge:
Massachusetts Institute of Technology Department of Mathematics.

Cruz, Ignacio; Terrazas, Irma; Rodea Colín, José Alberto (S.f.) Unidad 1. Estadística
Descriptiva e indicadores económicos. Universidad Nacional Autónoma de
México, Facultad de Economía. Sistema Universidad Abierta y Educación a
Distancia.

Devore, J. (2008). Probabilidad y Estadistica para Ingenieria y Ciencias. Mexico:


Cengage Learning.
Frankfort, C., & Leon, A. (2006). Estadísticas sociales para una sociedad diversa.
Thousand Oaks, CA: Pine Forge Press.
Hernandez, S. (2005). Historia de la Estadistica. Ciencia y el Hombre.
Johnson, R., & Kuby, P. (2012). Estadistica Elemental. Mexico: Cengage Learning.
Marco-Sanjuan, F. (2021). Coeficiente de variacion. Obtenido de Economipedia:
https://economipedia.com/definiciones/coeficiente-de-variacion.html
Quispe, A., Calla, K., Yangali, J., & Rodriguez, J. (2019). Estadistica no
parametrica aplicada a la investigacion cientifica con software SPPS,
MINITAB y EXCEL. Colombia: Eidec.
Rendon Macias, M. E., Villasis Keeve, M., & Miranda Novales, M. G. (2016).
Estadistica descriptiva. Revista Alergia Mexico, 397-407.

Salazar, C., & Del Castillo, S. (2018). Fundamentos Básicos de Estadística.Quito,


Ecuador: sin editorial.

Severino, R. (2021). Diagrama Cajas y Bigotes. Obtenido de The Data


Visualization Catalogue:
https://datavizcatalogue.com/ES/metodos/diagrama_cajas_y_bigotes.html
Triola, F. (2013). Estadistica. Mexico: Pearson.
Veliz, C. (2011). Estadistica para la administracion y los negocios. Mexico:
Pearson Eduacacion.

También podría gustarte