Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Por
Octubre – 2023
Introducción
a. Medidas de dispersión
Según García, R. F. (1977) las medidas de dispersión miden el grado de dispersión de los
valores de la variable. Nos dicen que tanto difieren los datos entre sí, cuanto se distancian
unos de otros. Las medidas de dispersión son: rango, varianza, desviación estándar y
coeficiente de variación.
Rango: Es la diferencia que existe entre el mayor y el menor valor que toma la
variable.
Identificamos el valor mayor (141) y luego el menor (111) ; ahora hacemos la resta
141 – 111=30
Podemos decir entonces que el rango de la variable Altura es 30 cm. García, R. F. (1977)
Varianza:
desviación estándar:
coeficiente de variación:
S
Se calcula del siguiente modo: C v = ∗¿100
|X|
b. Medidas de posición
Lo que buscan estas medidas es “dividir el conjunto de datos en grupos con el mismo
número de valores”. García, R. F. (1977). Las medidas de posición son:
Cuartiles:
Estos estadísticos dividen la distribución de los valores de la variable en 4 partes, cada una
de las cuales engloba el 25 % de los mismos. Los símbolos de estas medidas son:
Q2 (segundo cuartil que deja a su izquierda el 50% de los datos y coincide con la mediana),
Q3 (tercer cuartil que deja a su izquierda el 75% de los datos). García, R. F. (1977)
Ejemplo:
N
Calcular el cuartil 2 que es la mediana, como N es par se utiliza la formula
2
18
Sería iguala a: =9
2
Es este caso se dividen en 2 los datos desde donde esta la flecha del Q2 en cada mitad hay 9
datos.
N +1 9+ 1 10
Para calcular el Q1 en la primera mitad de como n=9 (No es par) = = = =5
2 2 2
N +1 9+ 1 10
Para el cuartil 3 se hace lo mismo, pero ahora de la otra mitad = = =5 de la
2 2 2
segunda mitad que seria 16, en la posición donde está el 5. García, R. F. (1977)
Deciles
De manera similar que los cuartiles, éstos son 9 valores que distribuyen la serie de datos,
ordenada de forma creciente o decreciente, en diez grupos iguales de datos que representan,
cada uno, el 10% de los valores. García, R. F. (1977)
Percentiles:
Son 99 valores que distribuyen los datos, ordenados de forma creciente o decreciente, en
cien tramos iguales, concentrando cada uno de ellos el 1% de los datos. García, R. F. (1977)
Regresión Lineal:
Para Leal. (2019) “El análisis de regresión analiza la relación de variables, ya sea una
variable dependiente y una o varias variables independientes” y según Vila. (2004) En
aquellos casos en que el coeficiente de regresión lineal sea “cercano” a +1 o a – 1 , tiene
sentido considerar la ecuación de la recta que “mejor se ajuste” a la nube de puntos (recta
de mínimos cuadrados). Uno de los principales usos de dicha recta será el de predecir o
estimar los valores de Y que obtendríamos para distintos valores de X. Estos conceptos
quedarán representados en lo que llamamos diagrama de dispersión:
La ecuación de la recta de mínimos cuadrados (en forma punto-pendiente) es la siguiente:
Si queremos estudiar la relación existente entre ambas variables, siguiendo con el ejemplo
anterior referente a la relación entre las ventas de una empresa ( Vt ) y sus gastos en
publicidad GPt ¿ ), lo que podemos hacer es representar gráficamente el modelo
matemático lineal que podemos considerar para analizar dicha relación. Vila. (2004)
Vt=β1+β2∗GPt+ut
variable explicativa que vamos a utilizar para estudiar las ventas. En este modelo queremos
comprobar qué influencia tienen los gastos de publicidad sobre el volumen de facturación o
las ventas de la empresa. Para poder cuantificar dicha relación, debemos también
representar la recta de regresión que subyace en el modelo matemático que relaciona ambas
variables. Para cuantificar la relación entre ambas variables y tener una aproximación de la
magnitud de la influencia de los gastos en publicidad sobre las ventas de la empresa
debemos estimar el modelo por mínimos cuadrados ordinarios ( M .C . O . ) donde se
minimiza la suma de los cuadrados de los residuos. La recta en rojo (que aparece a
continuación en el gráfico), es la que mejor se ajusta a la nube de puntos que tenemos.
Dicho de otra forma, es la recta que hace que el error de estimación, definido como la
distancia entre el valor observado y el valor estimado de la variable endógena (en el
gráfico, es la distancia vertical señalada por la flecha en rojo), sea la mínima para cada una
de las observaciones (recta de mínimos cuadrados), esta recta será la que utilizaremos para
predecir o estimar los valores de Y que obtendremos para distintos valores de X . Cruz.
(2011)
d. Diagramas posibles en la regresión y correlación lineal.
Vila. (2004) Propone que en particular, nos interesa cuantificar la intensidad de la relación
lineal entre dos variables. El parámetro que nos da tal cuantificación es el coeficiente de
correlación lineal de Pearson r, cuyo valor oscila entre –1 y +1:
Frecuencia Marca de
Intervalos Frecuencia acumulada clase
50 - 53 2 2 51,5 103
53 - 56 4 6 54,5 218
56 - 59 6 12 57,5 345
59 - 62 12 24 60,5 726
62 - 65 14 38 63,5 889
65 - 68 16 54 66,5 1064
68 - 71 7 61 69,5 486,5
71 - 74 3 64 72,5 217,5
Total 64 4049
Moda:
Para ello se usa la siguiente fórmula.
fi−f i−1
Mo=Li+ ∗A
(f i −f i−1 )+(f i−f i+ 1)
16−14
Mo=65+ ∗3
(16−14)+(16−7)
2
Mo=65+ ∗3
2+9
2
Mo=65+ ∗3
11
Mo=18+0 , 54
Mo=18 , 54
Mediana:
Para calcular la mediana se utiliza la siguiente formula:
n
−(Fi−1)
2 n 64
Me=Li + A = =32
fi 2 2
32−24
Me=62+ .3
14
8
Me=62+ .3
14
Me=62+1 , 71
Me=63 , 71
Me=63 , 71 puntos
( )
kn
−F i−1
4
Qk =Li + A
F i−F i−1
Frecuencia Marca de
Intervalos Frecuencia acumulada clase
50 - 53 2 2 51,5 103
53 - 56 4 6 54,5 218
56 - 59 6 12 57,5 345
59 - 62 12 24 60,5 726
62 - 65 14 38 63,5 889
65 - 68 16 54 66,5 1064
68 - 71 7 61 69,5 486,5
71 - 74 3 64 72,5 217,5
Total 64 4049
Primer cuartil
Donde
Li=¿ 59
F i−1=¿ 12
F i=¿24
A=3
Qk =cuartil por encotrar
kn 1× 64
= =16
4 4
Q 1=59+3 ( 24−12
16−12
)
Q 1=59+3 ( 124 )
Q1=59+1
Q1=60
Tercer cuartil
Li=¿ 65
F i−1=¿ 37
F i=¿54
A=3
Qk =cuartil por encotrar
kn 3 ×64
= =48
4 4
Q3=65+ 3 ( 48−38
54−38 )
Q3=65+ 3 ( 1016 )
Q3=65+ 1,875
Q3=66,875
( )
kn
−F i−1
10
Dk = Li + A
Fi −Fi−1
Li=¿ 62
F i−1=¿ 24
F i=¿38
A=3
Dk = Decil por encotrar
kn 4 ×64
= =25 , 6
10 10
D4 =62+3 ( 2538−24
, 6−24
)
D4 =62+3 ( 114, 6 )
D4 =62+0 , 34
D4 =62 ,34
( )
kn
−F i−1
100
Pk =Li + A
Fi −Fi−1
Li=¿ 65
F i−1=¿ 37
F i=¿54
A=3
Pk =Percentil por encotrar
kn 70 × 64
= =44 , 8
100 10
P70=65+3 ( 4454−38
, 8−38
)
P70=65+3 ( 616, 8 )
P70=65+1 , 28
P70=66 , 28