Fase 4 Medidas Estadísticas

Fase 4 – Medidas estadísticas
Estadística Descriptiva
Luz Ángela Martínez Chaves – 1002836005
Darwin Riascos Hernández - 1059043605
Valentina Pérez Casas – 1005435249
Tutor: Laura Marcela Elles
Grupo: 511004_1
Universidad Nacional Abierta Y A Distancia – UNAD
Escuela De Ciencias De La Educación – ECEDU
Licenciatura En Matemáticas
24/06/ 2023
Introducción
Las medidas de la estadística descriptiva son herramientas muy útiles para resumir y
entender un conjunto de datos. En el presente trabajo se resuelven una serie de ejercicios
sobre las medidas de tendencia central, medidas de posición y medidas de dispersión, que
nos van a permitir analizar, aplicar y fortalecer el conocimiento práctico de todo lo
relacionado con este tema.
Desarrollo
1. Defina y de un ejemplo de:

a. Medidas de dispersión
Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar un
valor numérico que ofrezca información sobre el grado de variabilidad de una variable. Las
medidas de dispersión más conocidas son: el rango, la varianza, la desviación típica y el
coeficiente de variación.
Rango: El rango es un valor numérico que indica la diferencia entre el valor máximo y el
mínimo de una población o muestra estadística. Su fórmula es:
Donde:
R → Es el rango.
Máx. → Es el valor máximo de la muestra o población.
Mín. → Es el valor mínimo de la muestra o población estadística.
x → Es la variable sobre la que se pretende calcular esta medida.
Ejemplo: Supongamos que tenemos una empresa que produce microchips para luego
venderlos a las principales marcas de computadoras. Esta empresa encarga a un
economista que realice un estudio sobre la evolución de las ventas (últimos 4 años) para,
posteriormente, ofrecer consejos que mejoren los resultados empresariales. Entre otras
muchas métricas, se pide que se calcule el rango de producción de microchips. A
continuación, se muestra la siguiente tabla de datos:
El mes que más microchips produjo la empresa (MÁXIMO) fue el mes 32 con 49.079
microchips producidos. Por su parte, el momento que menos microchips produjo tuvo lugar
en el mes 16 con 10.124 microchips producidos. Por tanto, el rango estadístico que es la
diferencia (49.079-10.124) se sitúa en 38.955.
Varianza: La varianza es una medida de dispersión que representa la variabilidad de una

serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos
al cuadrado divididos entre el total de observaciones. Su fórmula es la siguiente:
Donde:
 X → Variable sobre la que se pretenden calcular la varianza

 xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.
 N → Número de observaciones.
 x̄ → Es la media de la variable X.
Ejemplo: La varianza es una medida de dispersión que representa la variabilidad de una

serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos
al cuadrado dividido entre el total de observaciones.
También se puede calcular como la desviación típica al cuadrado. Dicho sea de paso,
entendemos como residuo a la diferencia entre el valor de una variable en un momento y el
valor medio de toda la variable.
La unidad de medida de la varianza será siempre la unidad de medida correspondiente a los

datos, pero elevada al cuadrado. La varianza siempre es mayor o igual que cero. Al
elevarse los residuos al cuadrado es matemáticamente imposible que la varianza salga
negativa. Y de esa forma no puede ser menor que cero.
Por ejemplo, si tuviésemos datos sobre los salarios de un conjunto de personas en euros, el
dato que arroja la varianza sería en euros cuadrados. Para que tenga sentido la
interpretación calcularíamos la desviación típica y pasaríamos el dato a euros.
Ejemplo de cálculo de la varianza
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con
un salario diferente:
Juan: 1.500 euros
Pepe: 1.200 euros
José: 1.700 euros

Miguel: 1.300 euros
Mateo: 1.800 euros
La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 +
1.700 + 1.300 + 1.800) /5) 1.500 euros.
Dado que la fórmula de la varianza en su forma desglosada se formula como sigue:
Obtendremos que se debe calcular tal que:
El resultado es de 52.000 euros al cuadrado.
Coeficiente de variación: Su cálculo se obtiene de dividir la desviación típica entre el valor

absoluto de la media del conjunto y por lo general se expresa en porcentaje para su mejor
comprensión.
Donde:
 X → Variable sobre la que se pretenden calcular la varianza

 σx → Desviación típica de la variable X.
 | x̄ | → Es la media de la variable X en valor absoluto con x̄ ≠ 0
Ejemplo: Pensemos en una población de elefantes y otra de ratones. La población de
elefantes tiene un peso medio de 5.000 kilogramos y una desviación típica de 400
kilogramos. La población de ratones tiene un peso medio de 15 gramos y una desviación
típica de 5 gramos. Si comparáramos la dispersión de ambas poblaciones mediante la
desviación típica podríamos pensar que hay mayor dispersión para la población de elefantes
que para la de los ratones.
Sin embargo, al calcular el coeficiente de variación para ambas poblaciones, nos daríamos
cuenta que es justo, al contrario.
Elefantes: 400/5000=0,08
Ratones: 5/15=0,33
Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación para los
elefantes es de apenas un 8%, mientras que el de los ratones es de un 33%. Como
consecuencia de la diferencia entre las poblaciones y su peso medio, vemos que la
población con mayor dispersión no es la que tiene una mayor desviación típica.
b. medidas de posición
las medidas de posición son indicadores estadísticos que permiten resumir los datos en uno
solo, o dividir su distribución en intervalos del mismo tamaño. Las medidas de posición se
suelen dividir en dos grandes grupos: la de tendencia no central y las centrales.
 Las medidas de posición no centrales: son los cuantiles. Estos realizan una serie de
divisiones iguales en la distribución ordenada de los datos. De esta forma, reflejan los
valores superiores, medios e inferiores.
Los más habituales son:
 El cuartil: Es uno de los más utilizados y divide la distribución en cuatro partes

iguales. Así, existen tres cuartiles. Los valores inferiores de la distribución se sitúan
por debajo del primero (Q1). La mitad o mediana son los valores menores iguales al
cuartil dos (Q2) y los superiores son representados por el cuartil tres (Q3).
 El quintil: En este caso, divide la distribución en cinco partes. Por tanto, hay cuatro
quintiles. Además, no existe ningún valor que divida la distribución en dos partes
iguales. Es menos frecuente que el anterior.
 El decil: Estamos ante un cuantil que divide los datos en diez partes iguales. Existen
nueve deciles, de D1 a D9. El D5 se corresponde con la mediana. Por su lado, los
valores superiores e inferiores (equivalentes a los diferentes cuartiles) se sitúan en
puntos intermedios entre estos.
 El percentil: Por último, este cuantil divide la distribución en cien partes. Hay 99
percentiles. Tiene, a su vez, una equivalencia con los deciles y cuartiles.
Medias de posición central: Estas nos permiten resumir la distribución de los datos en un
solo valor central, alrededor del cual se sitúan; mientras que las segundas dividen la
distribución en partes iguales.
 La media aritmética, geométrica o armónica: Son tres medidas centrales que nos
indican un promedio ponderado de los datos. La primera es la más utilizada y la más
conocida de las tres. La geométrica se aplica en series que muestran crecimientos
porcentuales. Por su parte, la armónica es útil en el análisis de inversiones en bolsa.
 La mediana: En este caso, esta es la medida de posición central más reconocible.
Divide la distribución en dos partes iguales. De esta forma, expresa el valor mediano,
que no medio. Es muy útil en variables como los ingresos o salarios, a la vez que
está muy relacionada con la media y algunos de los cuantiles vistos.
 La moda: Estamos ante una medida central de los valores más frecuentes. Por
tanto, la moda nos informa sobre aquellos que se repiten en más ocasiones. Esta
medida es muy útil en los estudios de mercado cuando medimos una impresión
sobre un producto con una escala Likert.
c. Correlación lineal: La correlación, también conocida como coeficiente de correlación

lineal (de Pearson), es una medida de regresión que pretende cuantificar el grado de
variación conjunta entre dos variables. En una forma menos coloquial, la podemos definir
como el número que mide el grado de intensidad y el sentido de la relación entre dos
variables.
Siendo:
Cov (x;y): la covarianza entre el valor «x» e «y».

σ(x): desviación típica de «x».
σ(y): desviación típica de «y».
d. Regresión lineal
La regresión lineal es una técnica de análisis de datos que predice el valor de datos
desconocidos mediante el uso de otro valor de datos relacionado y conocido. Modela
matemáticamente la variable desconocida o dependiente y la variable conocida o
independiente como una ecuación lineal. Por ejemplo, supongamos que tiene datos sobre
sus gastos e ingresos del año pasado. Las técnicas de regresión lineal analizan estos datos
y determinan que tus gastos son la mitad de tus ingresos. Luego calculan un gasto futuro
desconocido al reducir a la mitad un ingreso conocido futuro.
e. Diagramas posibles en la regresión y correlación lineal

Valores que puede tomar el coeficiente de correlación lineal
ρ = -1 Correlación perfecta negativa
ρ = 0 No existe correlación
ρ = +1 Correlación perfecta positiva
Ejemplo:
Tipos de regresión lineal:
 Regresión lineal simple: El primer tipo es la regresión lineal simple, en la que solo se
utiliza un único predictor. Por ejemplo, puede usarse a la hora de predecir accidentes
mortales de tráfico en un país. La variable de respuesta Y sería el país y se compararía
con la población, que sería la variable predictora X.
Regresión lineal múltiple: La regresión lineal múltiple permite crear modelos que emplean
diferentes predictores, los cuales se usarán para dar una respuesta a Y.
Regresión lineal múltiple Fuente: la.mathworks.com
Podría utilizarse para predecir cuántos litros de gasolina consumirán varios coches, variable
de respuesta Y, en función del peso y la potencia que tengan, variable predictiva X.
. Regresión lineal multivariante: Con la regresión lineal multivariante es posible generar

modelos para dar respuesta a diferentes variables. En este caso, se cuenta con múltiples Y.
Se aplican varias fórmulas a la hora de expresarla. Así, se podría estimar la incidencia de la
gripe en nueve regiones de Estados Unidos, variables de respuesta Y basadas en la
semana del año, variable predictora X
Regresión lineal multivariante Fuente: la.mathworks.com
Por último, la regresión lineal múltiple multivariante se utiliza en modelos que cuentan con
varios predictores para múltiples variables de respuesta. Se podría emplear para calcular los
kilómetros por litro de gasolina que se usan en ciudad y autopista a partir de tres variables:
distancia entre ejes, peso en vacío y tipo de combustible.
2. A continuación, se presentan las puntuaciones de un examen de matemáticas

realizadas a 64 estudiantes de un determinado colegio:
65, 63, 65, 66, 69, 67, 53, 58, 69, 60, 61, 64, 65, 67, 62, 61, 55, 57, 60, 62, 64, 65, 64, 71,
68, 66, 56, 59, 61, 62, 63, 65, 63, 70, 67, 66, 57, 59, 61, 62, 64, 64, 63, 69, 67, 66, 58, 60,
61, 62, 50, 51, 67, 70, 54, 72, 65, 59, 60, 70, 66, 57, 71, 53
a. Realizar la tabla de frecuencia
PUNTUACIÓN Fi Fr % F
50 1 0,0156 1.56% 1
51 1 0,0156 1.56% 2
53 2 0,031 3.1% 4
54 1 0,0156 1.56% 5
55 1 0,0156 1.56% 6
56 1 0,0156 1.56% 7
57 3 0,0468 4.68% 10
58 2 0,031 3.1% 12
59 3 0,0468 4.68% 15
60 4 0,062 6.2% 19
61 5 0,078 7.8% 24
62 5 0,078 7.8% 29
63 4 0,062 6.2% 33
64 5 0,078 7.8% 38
65 6 0,0937 9.37% 44
66 5 0,078 7.8% 49
67 5 0,078 7.8% 54
68 1 0,0156 1.56% 55
69 3 0,0468 4.68% 58
70 3 0,0468 4.68% 61
71 2 0,031 3.1% 63
72 1 0,0156 1.56% 64
TOTAL 64 0,9971 99.71%
50,51,53,53,54,55,56,57,57,57,58,58,59,59,59,60,60,60,60,61,61,61,61,61,62,62,62,62,62,6
3,63 63,63,64,64,64,64,64,65,65,65,65,65, 65, 66,66,66,66,66,67,67,67,67,67,68,69,69,69,
70, 70 70,71,71,72
b. Hallar la media, moda y mediana.

MEDIA
x1 + x2 + x3 + x 4 +…+ x N
X̅ =
N
4017
X̅ =
64
X =62,76
MODA
Mo=65
MEDIANA
Me=n+1 /2
Me=63+63/2
Me=63
c. Hallar el primer y tercer cuantil.
PRIMER CUANTIL
i=(p/100) n
i= (25/100)64
i=0,25*100
i=16
Q₁=60
TERCER CUANTIL
i=(p/100) n
i= (75/100)64
i=0,75*64
i=48
Q₃=66
d. Hallar el cuarto decil.
D₄=4*64/10
D₄=256/10
D₄=25,6
D₄=26
D₄=62
e. Hallar el 70° percentil.
P₇₀=70*64/100
P₇₀=4480/100
P₇₀=44,8
P₇₀=45
P₇₀=66
3. Los siguientes datos representan la razón de precio-ganancia de un producto

determinado en una empresa
a. Realizar la tabla de frecuencia.
Primero se debe hallar el rango, donde se debe encontrar el valor mayor y el menor:
Rango: X max− X min
Rango: 10 . 34−2.81=7.53
Intervalos: es el número de casilla que tiene que haber, se calcula aplicando la Regla de
Sturges:
k =1+3,322 Logn
k =1+3,322 log ( 76 )=7,24 ≈ 8
R 7.53
Amplitud (a i ¿: a i= = =0.94
k 8
Ahora realizamos la tabla con los datos anteriores:
Intervalo Marca de Frecuencia Frecuencia Frecuencia

clase Absoluta (f) absoluta Relativa fr
x Acumulada
F
2.81 – 3.75 Marca de
3.75 – 4.69 clase: Se halla
4.69 – 5.63 la marca de
5.63 – 6.57 clase sumando
6.57– 7.51 los dos
7.51– 8.45 intervalos y
8.45 - 9.39 luego se divide
9.39 - 10.34 entre 2

2.81+3.75
x= =3.28
2
3.75+4.69
x= =4.22
2
4.69+5.63
x= =5.16
2
5.63+6.57
x= =6.1
2
6.57+7,51
x= =7.04
2
7.51+ 8.45
x= =7.98
2
8.45+9,39
x= =8.92
2
9,39+10,34
x= =9.86
2

x Acumulada
F
2.81 – 3.75 3.28 3 3 0.03
3.75 – 4.69 4.22 3 6 0.03
4.69 – 5.63 5.16 1 7 0.01

5.63 – 6.57 6.1 11 18 0.14
6.57– 7.51 7.04 22 40 0.28
7.51– 8.45 7.98 19 59 0.25
8.45 - 9.39 8.92 12 71 0.15
9.39 - 10.34 9.86 5 76 0.06
∑ 76
∑1
b. Hallar la moda y mediana.
Para calcular la mediana se debe verificar si el número de datos es par o impar. Cuando es
par se utiliza:
n 76
par = =38
2 2
Tenemos el número 38, el cual debemos buscar en la frecuencia absoluta acumulada, pero
generalmente no siempre esta ese número, entonces se trabaja con un número siguiente al
38, por lo que tenemos al número 40 con el cual se trabajara en ese intervalo que le
corresponde el 40

x Acumulada
6.57– 7.51 7.04 22 40
F 0.28
N
−f i−1
Ahora se trabaja dentro de la fórmula: 2
Me=Li + ai
fi
38−18
Me=6,57+ 0,94
22
20
∗0,94
22
Me=6,57+
1
Me=6.57+ 0,85
Me=7,42
f i −f i−1
Moda: La formula M 0=Li+ ∗ai
( f i−f i−1 )+( f i−f i+ 1)
Para calcular la moda utilizamos la frecuencia absoluta mayor, el cual es el número 24

x Acumulada
F
6.57– 7.51 7.04 22 40 0.28
22−11
M 0=6.57+ ∗0.94
( 22−11 )+ ( 22−19 )
11
M 0=6.57+ ∗0.94
14
11
∗0.94
14
M 0=6.57+
1
M 0=6.57+ 0.73
M 0=7,3
c. Hallar el primer cuartil.
( )
kn
−fi−1
4
Qk =Li + A
fi−fi−1
Como se está hablando de medidas de posición, entonces lo primero es hallar esto:
kn
Posición
4
1∗76
Q1 → =19
4
Entonces tenemos de posición el 19, el cual este se busca en la frecuencia absoluta
acumulada. Pero si no esta se trabaja con la frecuencia mayor siguiente:

x Acumulada
6.57– 7.51 7.04 22 40
F 0.28
Q1=6.57+ 0.94 ( 19−18
40−18 )
Q1=6.57+ 0.94∗0,04
Q1=6.57+ 0.03
Q1=6.6
d. Hallar el segundo cuartil.
Encontramos la posición:
2∗76
Q2 → =38
4
Como no está en la frecuencia absoluta acumulada se escoge el valor mayor, en este caso
40.

x Acumulada
6.57– 7.51 7.04 22 40
F 0.28
Se reemplaza dentro de la fórmula:
Q2=6.57+ 0.94 ( 38−18

40−18 )
Q 2=6.57+ 0.94∗0.45
Q2=6.57+ 0,423
Q2=6,993
e. Hallar el coeficiente de variación.
σ
La fórmula es Cv=
x
Entonces se debe hallar la desviación estándar y el promedio:
Primero se halla el promedio:
Intervalo Marca de Frecuenci x∗f (x−x )2 (x−x )2∗f

clase a
x Absoluta
(f)
2.81 – 3.28 3 9.84 16,4 49,2
3.75
3.75 – 4.22 3 12.66 9,67 29,01
4.69
4.69 – 5.16 1 5.16 4,70 4,70
5.63
5.63 – 6.1 11 67.1 1,51 16,61
6.57
6.57– 7.51 7.04 22 154,8 0,08 1,76
8
7.51– 8.45 7.98 19 151,6 0,42 7,98
2
8.45 - 9.39 8.92 12 107,0 2,52 30,24
4
9.39 - 9.86 5 49,3 6,40 32
10.34
∑ 76 557,6 171,5
557,6
x= =7,33 este es el promedio
76
Desviación estándar:
para hallar la desviación toca hallar la varianza:
v 2=
∑ ( x−x )2∗f
n
2 171,5 2
v= =2,2 5
76
La desviación estándar es solo sacar la raíz cuadrada de la varianza:
σ =√ 2,25
σ =1,5
Coeficiente de Variación:
1,5
Cv= =0,20
7,33
Pero si queremos el resultado en porcentaje se multiplica por 100.

0,20∗100=20 %
f. Compare los valores dados anteriormente en un Software (GeoGebra, Excel, R,

RStudio).
4. Una compañía asigna diferentes precios a un equipo de sonido particular en ocho
regiones diferentes del país. La tabla adjunta muestra el número de unidades
vendidas y los precios correspondientes (en miles de pesos).
Ventas 402 381 350 430 441 380 405 420 421
Precios 45 66 70 90 75 45 65 70 65
2
X Y X*Y X² Y
402 45 18090 161604 2025

381 66 25146 145161 4356
350 70 24500 122500 4900
430 90 38700 184900 8100
441 75 33075 194481 5625
380 45 17100 144400 2025
405 65 26325 164025 4225
420 70 29400 176400 4900
421 65 27365 177241 4225
∑ 3630 591 214555 1470712 40381
a. Estimar la ecuación de regresión lineal de las ventas sobre el precio que mejor se
ajuste.
y=ax+ b
y=0.2013 x +15.525
b. Determinar las ventas si el precio es de 55, 58, 68, y 70 miles de pesos.
Para 55 tenemos:
y=0,2013 ( 55 )+15.525
y=11.0715+15.525=26.5965
Para 58 tenemos:
y=0,2013 ( 58 )+15.525
y=11.67 +15.525=27.195
para 68 tenemos:
y=0,2013 ( 68 )+15.525
y=13.68+ 15.525=29.20
para 70 tenemos:
y=0,2013 ( 70 )+15.525
y=14.09+15.525=29.61
c. Determinar R y dar una interpretación.
R=¿0.41
Tiene una correlación positiva, las variables tienen una correlación mínima
5. Los datos de la siguiente tabla representan las alturas (X) cm. Y los pesos (Y) kg.
de varios hombres.
Y 40 51 53 56 53 58 62 82
X 185 152 186 155 162 196 172 187

Para resolver el ejercicio completamos la tabla con los datos siguientes: Producto
( X∗Y ) , potencia de X y sumatorias.
Dicho esto, tenemos:
X Y X∗Y X2
185 40 7400 34225
152 51 7752 23104
186 53 9858 34596
155 56 8680 24025
162 53 8586 26224
196 58 11368 38416
172 62 10664 29584
187 82 15334 34969
∑ 1395 455 79642 245143
n=8
a. Estimar la ecuación que mejor se ajuste de modo que el peso dependa de la altura
y=ax+ b
Para encontrar el valor de a y b procedemos de la siguiente forma:
n ∑ x i∗y i−∑ x i∗∑ y i

a= 2 2
n ∑ x i−(∑ x i )
8 (79642 ) −(1395∗455)
a= 2
8( 245143)−(1395)
2411
a= =0.1594
15119
Ahora calculamos el valor de b
∑y−a∑ x
b=
n
455−(0,1594)(1395)
b=
8
455−222.36
b=
8
232,64
b=
8
b=29,07
Luego la ecuación lineal que se aproxima a la relación entre el peso y la altura está
determinada por:
y=0,1594 x+29.07
b. Determinar el peso si la altura es de 150, 153 y 175 cm.

Para x=150 tenemos
y=0,1594 ( 150 ) +29,07
y=23,91+29,07=52,98 kg
Para x=153 tenemos
y=0,1594 ( 153 ) +29,07
y=24,38+ 29,07=53,45 kg
Para x=175 tenemos
y=0,1594 ( 175 ) +29,07
y=27,89+ 29,07=56,96 kg
c. Determinar R y dar una interpretación
X Y x−x y− y (x−x )2 ( y− y)2 ( x−x ) ( y− y)
185 40 10,62 -16,875 112,7844 284,765625 -179,2125
152 51 -22,37 -5,875 500,4169 34,515625 500,4169
186 53 11,62 -3,875 135,0244 15,015625 -45,0275

155 56 -19,37 -0,875 375,1959 0,765625 16,94875
162 53 -12,37 -3,875 153,0159 15,015625 47,93375
196 58 21,62 1,125 467,4244 1,265625 24,3225
172 62 -2,37 5,125 5,6169 26,265625 -12,14625
187 82 12,62 25,125 159,2644 631,265625 317,0775
∑ 1395 455 1908,7 1008,875 670,31315
Tenemos los siguientes datos: n=8
x=174,375
y=56,875
Calculamos r mediante la siguiente ecuación
∑ ( x−x ) ( y− y )
r= 2 2
√ ∑(x− x) √ ∑( y− y )
670,31315
r=
√ 1908,7∗√ 1008,875
670,31315
r=
43,68∗31,76
r =0,4831
El valor de r se encuentra entre 0 y 1 entonces, es una relación estadística con valor

positivo, además, es menos fuerte ya que está más cerca del cero
Referencias
González Támara, L. (2017). Estadística descriptiva y probabilidad. Universidad de Bogotá

Jorge Tadeo Lozano. http://hdl.handle.net/20.500.12010/1955
Monroy Saldívar, S. (2013). Estadística descriptiva. Instituto Politécnico Nacional.

https://dokumen.tips/documents/estadistica-descriptiva-salvador-monroy-saldivar-
freelibrosorg.html
Montero Lorenzo, J. M. (2017). Estadística descriptiva. Madrid, Spain: Paraninfo. https://link-

gale-com.bibliotecavirtual.unad.edu.co/apps/pub/3BCM/GVRL?u=unad&sid=GVRL
Montesinos R, L., Bayona S, Y., Cerna, E., Llanos M, K., Pajuelo R, S. (2016). Estadística
descriptiva y probabilidad: enfoque por competencias.
http://repositorio.usil.edu.pe/handle/USIL/8943
Lopez Francisco J. (27 septiembre 2019). Medidas de dispersión. Economipedia.

Recuperado de: https://economipedia.com/definiciones/medidas-de-dispersion.html
Rus Arias E. ( 1 febrero 2021). Medidas de posición. Economipedia. Recuperado de:
https://economipedia.com/definiciones/medidas-de-posicion.html
Alfonso ( 1 marzo 2020). Coeficiente de correlación lineal. Economipedia. Recuperado de:
https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html
Aws. ¿Qué es la regresión lineal? Amazon. Recuperado de:
https://aws.amazon.com/es/what-is/linear-regression/

Fase 4 Medidas Estadísticas

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Fase 4 Medidas Estadísticas

Cargado por

Copyright:

Formatos disponibles

Fase 4 – Medidas estadísticas

Luz Ángela Martínez Chaves – 1002836005

Darwin Riascos Hernández - 1059043605

Valentina Pérez Casas – 1005435249

Tutor: Laura Marcela Elles

Universidad Nacional Abierta Y A Distancia – UNAD

Escuela De Ciencias De La Educación – ECEDU

1. Defina y de un ejemplo de:

Máx. → Es el valor máximo de la muestra o población.

Mín. → Es el valor mínimo de la muestra o población estadística.

x → Es la variable sobre la que se pretende calcular esta medida.

Varianza: La varianza es una medida de dispersión que representa la variabilidad de una

 X → Variable sobre la que se pretenden calcular la varianza

Ejemplo: La varianza es una medida de dispersión que representa la variabilidad de una

La unidad de medida de la varianza será siempre la unidad de medida correspondiente a los

Ejemplo de cálculo de la varianza

Juan: 1.500 euros

Pepe: 1.200 euros

José: 1.700 euros

Mateo: 1.800 euros

Dado que la fórmula de la varianza en su forma desglosada se formula como sigue:

Obtendremos que se debe calcular tal que:

El resultado es de 52.000 euros al cuadrado.

Coeficiente de variación: Su cálculo se obtiene de dividir la desviación típica entre el valor

 X → Variable sobre la que se pretenden calcular la varianza

Los más habituales son:

 El cuartil: Es uno de los más utilizados y divide la distribución en cuatro partes

c. Correlación lineal: La correlación, también conocida como coeficiente de correlación

Cov (x;y): la covarianza entre el valor «x» e «y».

σ(y): desviación típica de «y».

e. Diagramas posibles en la regresión y correlación lineal

ρ = -1 Correlación perfecta negativa

ρ = +1 Correlación perfecta positiva

. Regresión lineal multivariante: Con la regresión lineal multivariante es posible generar

2. A continuación, se presentan las puntuaciones de un examen de matemáticas

a. Realizar la tabla de frecuencia

TOTAL 64 0,9971 99.71%

b. Hallar la media, moda y mediana.

c. Hallar el primer y tercer cuantil.

d. Hallar el cuarto decil.

e. Hallar el 70° percentil.

3. Los siguientes datos representan la razón de precio-ganancia de un producto

Ahora realizamos la tabla con los datos anteriores:

Intervalo Marca de Frecuencia Frecuencia Frecuencia

6.57– 7.51 los dos

7.51– 8.45 intervalos y

8.45 - 9.39 luego se divide

9.39 - 10.34 entre 2

Intervalo Marca de Frecuencia Frecuencia Frecuencia

4.69 – 5.63 5.16 1 7 0.01

Intervalo Marca de Frecuencia Frecuencia Frecuencia

Para calcular la moda utilizamos la frecuencia absoluta mayor, el cual es el número 24

6.57– 7.51 7.04 22 40 0.28

c. Hallar el primer cuartil.

Intervalo Marca de Frecuencia Frecuencia Frecuencia

d. Hallar el segundo cuartil.

Intervalo Marca de Frecuencia Frecuencia Frecuencia

Se reemplaza dentro de la fórmula:

Q2=6.57+ 0.94 ( 38−18

e. Hallar el coeficiente de variación.

Entonces se debe hallar la desviación estándar y el promedio:

Primero se halla el promedio:

Intervalo Marca de Frecuenci x∗f (x−x )2 (x−x )2∗f