Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentado por:
Angie Arango
Presentado a:
20 de noviembre, 2020
INTRODUCCION
A través de los tiempos el hombre ha sentido la necesidad de poder interpretar todos los
fenómenos que se desarrollan en su entorno para entenderlos y tener un control absoluto de cada
uno de ellos, lo cual lo ha llevado a desarrollar diferentes estudios e investigaciones que le han
Es por ello por lo que la estadística se ha convertido en una herramienta importante para
hombre aplica el uso de la Estadística en los casos que van desde el cálculo más sencillo hasta el
a) MEDIDAS DE DISPERSIÓN
Las medidas de dispersión son números que indican si una variable se mueve mucho,
poco, más o menos que otra. La razón de ser de este tipo de medidas es conocer de manera
resumida una característica de la variable estudiada. En este sentido, deben acompañar a las
medidas de tendencia central. Juntas, ofrecen información de un sólo vistazo que luego
R = Máx – Mínx
Donde:
R → Es el rango.
EJEMPLO:
Supongamos que tenemos una empresa que produce microchips para luego venderlos a
las principales marcas de computadoras. Esta empresa encarga a un economista que realice un
estudio sobre la evolución de las ventas (últimos 4 años) para, posteriormente, ofrecer consejos
que mejoren los resultados empresariales. Entre otras muchas métricas, se pide que se calcule el
R = Máx – Mínx
R = 44.347 – 12.445
R = 31.902
El mes que más microchips produjo la empresa (MÁXIMO) fue el Año 01 con 44.347
microchips producidos. Por su parte, el momento que menos microchips produjo tuvo lugar en el
Año 02 con 12.445 microchips producidos. Por tanto, el rango estadístico que es la diferencia
¿Cómo se interpreta esto? Esto quiere decir, que durante los últimos 4 años la variación
serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos al
EJEMPLO:
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con
un salario diferente:
La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 +
calculamos la varianza tenemos las unidades de medida al cuadrado. Para pasarlo a euros, en este
caso tendríamos que realizar la desviación típica. El resultado aproximado sería de 228 euros.
Esto quiere decir que, en media, la diferencia entre los salarios de las distintas personas será de
228 euros.
respecto a la media. Su cálculo es exactamente el mismo que la varianza, pero realizando la raíz
N → Número de observaciones.
EJEMPLO:
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con
un salario diferente:
La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 +
calculamos la varianza tenemos las unidades de medida al cuadrado. Para pasarlo a euros, en este
caso tendríamos que realizar la desviación típica. El resultado aproximado sería de 228 euros.
Esto quiere decir que, en media, la diferencia entre los salarios de las distintas personas será de
228 euros.
entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su
mejor comprensión.
Vamos a comprobar cómo, con cualquiera de las dos fórmulas expuestas, el resultado de
Tal como dictaba el cálculo intuitivo. La desviación media es de 1. Pero, ¿no habíamos
dicho que la fórmula del valor absoluto y de la desviación típica daban valores diferentes? Así
es, pero hay una excepción. El único caso en que la desviación estándar y la desviación respecto
de la media ofrecen el mismo resultado es el caso en que todas las desviaciones son igual a 1.
b) MEDIDAS DE POSICIÓN
Son indicadores usados para señalar que porcentaje de datos dentro de una distribución
de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se
encuentra en el centro de la distribución de frecuencia, por lo que también se les llama " Medidas
de Tendencia Central ". Pero estas medidas de posición de una distribución de frecuencias han de
cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a
la que resumen. Toda síntesis de una distribución se considerará como operativa si intervienen en
su determinación todos y cada uno de los valores de la distribución, siendo única para cada
describen las medidas de posición más comunes utilizadas en estadística, como lo son:
Cuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales: primero,
Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil). El
decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10
90% restante),
Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero a
El percentil supera al uno por ciento de los valores y es superado por el noventa y nueve
Esto significa que el 4° textil se encuentra localizado en el término número 21, es decir,
el que ocupa la 21° posición; el 8° decil se encuentra localizado entre el termino número 25° y
c) CORRELACIÓN LINEAL
una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos
variables. Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos
De una forma menos coloquial, la podemos definir como el número que mide el grado de
Siendo:
ρ = 0 No existe correlación
Hablamos de correlación positiva si siempre que el valor «x» sube, el valor «y» sube, y
además con la misma intensidad (+1). En el caso opuesto, si siempre que el valor «x» sube, y el
valor «y» baja, y además con la misma intensidad, entonces estamos hablando de correlación
negativa (-1). Es importante saber que esto no quiere decir que lo hagan en la misma proporción
No hay correlación:
Correlación perfecta negativa:
Consejo: en muchas ocasiones, no tenemos los medios o los datos suficientes para utilizar
esta fórmula. Por ello, si tenemos dos series de precios, podemos calcular el coeficiente de
precios y).
d) REGRESIÓN LINEAL
de los datos o intentar hacerlo. Es como el caballito de batalla en los métodos predictivos, en
Machine Learning (ML) es considerada como una de la técnica central del aprendizaje
supervisado.
Hago un ejemplo fácil con datos de la temperatura global. Los datos se pueden descargar
temperaturas.globales<-scan("data/globtemp.dat")
x=temperaturas.global[45:142]
t=1900:1997
plot(t,x,type="o",col="2",xlab="Años",ylab="Temperaturas globales",main="Ejemplo de
Regresión Lineal")
abline(fit)
LINEAL.
ingresos. Los resultados obtenidos sobre una muestra de 528 individuos se presentan en una tabla
de doble entrada:
Se pide:
65, 63, 65, 63, 69, 67, 53, 58, 60, 61, 64, 65, 64, 72, 68, 66, 55, 57, 60, 62, 64, 65, 64, 71,
68, 66, 56, 59, 61, 62, 63, 65, 63, 70, 67, 66, 57, 59, 61, 62, 64, 64, 63, 69, 67, 66, 58, 60, 61, 62,
50, 51, 67, 70, 54, 72, 65, 59, 60, 70, 66, 57, 71, 53
PUNTUAION F
EXAMEN
50 1
51 1
53 2
54 1
55 1
56 1
57 3
58 2
59 3
60 4
61 4
62 4
63 5
64 6
65 6
66 5
67 4
68 2
69 2
70 3
71 2
72 2
4025
RANGO INTERVALOS AMPLITUD
R =72 – 50 K = 1+3,322Log n A = 22/7
R = 22 K = 1+3,322 Log 64 A=4
K=7
PUNTUACIO X f fr F
N EXAMENES
50 54 52 4 0,062 4
54 58 56 6 0,093 10
58 62 60 13 0,203 23
62 66 64 21 0,328 44
66 70 68 13 0,203 57
70 74 72 7 0,109 64
74 78 76 0 0
TOTAL 64 1
Xi
Me = ∑ Me = N/2 DATO QUE MAS SE
n
4025
∑ Me = 64/2 REPITE 63
64
Me = 62,89 Me = 32
1∗64
=16 POSICION
4
F i -1 = 10 Li = 58
Fi = 23 A= 62 – 58 A=4
k .n
Qk =Li + A (4
−f i−1
f i −f i−1 )
Q 1=¿¿ 58+ 4 ( 16−10
23−10 )
Q
1=58+4 ( 136 )
Q 1=58+4∗0,461
Q 1=58+1,84
Q 1=59,8
Tercer cuartil
64
3* =48 POSICION
4
Fi -1 = 44 Li = 66
Fi = 57 A = 70 -66 A=4
k .n
Qk =Li + A
4
−f i−1
f i −f i−1 ( )
48−44
Q 3= 66+ 4 ( 57−44 )
Q 3=66 +4 ( 134 )
Q 3=66 +4∗0,30
Q 3=66 +1,2
Q 3=67,2
64
4* =25,6 POSICION
10
Fi – 1 = 44 Li = 66
Fi = 57 A=4
k .n
Dk = Li + A (
10
−f i−1
f i −f i −1 )
D 4 =66+ 4 ( 25,6−44
57−44 )
D 4 =66+ 4 ( 18,4
13 )
D4 =66+ 4∗1,41
D4 =66+5,64
D4 =71,64
e. HALLAR EL 70 PERCENTIL
64
70* = 44 POSICION
100
P10=LS
P10=¿66
3.46 8.90 8.64 3.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00 5.60
7.64 8.82 5.64 10.08 2.81 6.81 7.49 4.56 7.16 9.61 3.86 6.78 9.02 8.65 6.72 6.26 7.90 6.65 7.25
6.26 6.43 7.71 7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.77 6.25 7.63 6.73 7.60 8.14 6.93
7.82 6.76 7.75 7.36 8.52 7.23 7.63 6.95 7.78 10.34 6.65 6.86 7.74 6.67 7.12 8.10 4.01 6.00 7.98
10.00
R=10,34−2,81
R=7,53
K=1+ 3,322log 76
K=7,25≃ 7
K=7
Hallamos la amplitud
R
A=
K
7,53
A=
7
A=1,07
Li + L s
x i=
2
2,81+ 3,91
x i= =3,36
2
3,91+ 5,01
x i= =4.46
2
5,01+ 6,11
x i= =5,56
2
6,11+7,21
x i= =6,66
2
7,21+ 8,31
x i= =7,76
2
8,31+9,41
x i= =8.86
2
9,41+10,51
x i= =9.96
2
Clase
xi f fr F
Li Ls
2,81 3,91 3,36 4 0,05 4
3,91 5,01 4,46 2 0,03 6
5,01 6,11 5,56 7 0,09 13
6,11 7,21 6,66 22 0,29 35
7,21 8,31 7,76 24 0,32 59
8,31 9,41 8,86 12 0,16 71
9,41 10,51 9,96 5 0,07 76
∑ 76 1
x́=
∑ x1 . f
n
550,16
x́=
76
x́=7 , 24
Hallamos la moda
f i−f i−1
M o=Li + . Ai
( f i−f i−1 ) + ( f i−f i +1)
24−22
M o=7,21+ . 1,1
( 24−22 ) + ( 24−12 )
2
M o=7,21+ . 1,1
2+12
2
M o=7,21+ . 1,1
2+12
2
M o=7,21+ .1,1
14
M o=7,21+(0,14 . 1,1)
M o=7,21+0.15
M o=7,36
k .n
Posición
4
k .n 1 .76 76
p= ⟹ p= ⟹ p= ⟹ p=19
4 4 4
k .n
Qk =Li + A (4
−f i−1
f i −f i−1 )
f i−1=13
f 1=35
Li=6,11
A=Ls−Li=7,21−6,11=1,1
Q 1=6,11+ 0,3
Q1=6,41
k .n
Posición
4
k .n 2 .76 152
p= ⟹ p= ⟹ p= ⟹ p=38
4 4 4
k .n
Qk =Li + A (4
−f i−1
f i −f i−1 )
f i−1=35
f 1=59
Li=7,21
A=Ls−Li=8,31−7,21=1,1
Q 2=7,21+1,1 ( 38−35
59−35 )
Q 2=7,21+1,1 ( 243 )
Q 2=7,21+(1,1. 0,125)
Q 2=7,21+0,1375
Q 2=7,35
2 ∑ ( x−x́ )2 . f
S=
n−1
x́=
∑ x1 . f
n
550,16
x́=
76
x́=7 , 24
Clase
xi f fr F xi . f ( x− x́ )2 ( x− x́ )2 . f
Li Ls
2,81 3,91 3,36 4 0,05 4 13,44 15,05 60,22
3,91 5,01 4,46 2 0,03 6 8,92 7,73 15,46
5,01 6,11 5,56 7 0,09 13 38,92 2,82 19,76
146,5
6,11 7,21 6,66 22 35
0,29 2 0,34 7,40
186,2
7,21 8,31 7,76 24 59
0,32 4 0,27 6,49
106,3
8,31 9,41 8,86 12 71
0,16 2 2,62 31,49
9,41 10,51 9,96 5 0,07 76 49,8 7,40 36,99
550,1
∑ 76 1 6 177,81
2
S2=
∑ ( x−x́ ) . f
n−1
177,81
S2 =
76−1
177,81
S2 =
75
S2=2,37
S= √ S2
S= √2.37 ⟹ S=1,54
s
C v = .100
x́
1,54
C v= . 100
7,24
C v =0,2127 . 100
C v =21,27 %
Tabla
Precio 45 66 70 90 75 45 65 70 65
Fórmula
y=ax+ b
Tabla 2
Y X X*Y X2
402 45 18.090 2025
381 66 25.146 4356
350 70 24.500 4900
430 90 38.700 8100
441 75 33.075 5625
380 45 17.100 2025
405 65 26.325 4225
420 70 29.400 4900
421 65 27.365 4225
SUMATORIA 3.630 591 239.701 40.381
N: 9
Nota: Para completar la información se obtienen los siguientes valores ( x∗y ), ( x 2 ¿ y la
sumatoria.
fórmulas:
n ∑ xi y i−∑ x i ∑ y i
a= 2
n ∑ x 2i −( ∑ x i )
b=¿ ¿
Por lo que
n ∑ xi y i−∑ x i ∑ y i
a= 2
n ∑ x 2i −( ∑ x i )
9(239.701)−(591)(3,630)
a=
9 ( 40381 )−(591)2
2.157.309−2.145 .330
a=
363.429−349.281
11.979
a=
14.148
a=0.846692112
b=¿ ¿
(3.630)(40.381)−(591)(239.701)
b=
9 ( 40.381 )−( 591)2
146.583 .030−141.663.291
b=
363.429−349,281
4.919 .739
b=
14.148
b=347.73
y=ax+ b
y=0.846692112 x +347.73
MILES DE PESOS.
X =55
y=0.846692112(55)+ 347.73
y=394.2980662
X =58
y=0.846692112(58)+ 347.73
y=396.8381425
X =68
y=0.846692112(68)+347.73
y=405.3050636
X =70
y=0.846692112(70)+ 347.73
y=406.9984478
Y2
161.604
145.161
122.500
184.900
194.481
144.400
164.025
176.400
177.241
1.470.712
R=n ¿ ¿
11.979
R=
1.999575729
R=0.00000599077
Figura 1
5. Los datos de la siguiente tabla representan las alturas (X) cm. y los pesos (Y)
Organizando los datos en una gráfica nos muestra que los puntos se ubican cerca de una
Fórmula y=ax+ b
X O
Y
126 53,5 6741 15876 2862,25
152 51,5 7828 23104 2652,25
155 56,5 8757,5 24025 3192,25
172 62,5 10750 29584 3906,25
185 40 7400 34225 1600
185 53,5 9897,5 34225 2862,25
187 82 15334 34969 6724
196 58 11368 38416 3364
SUMATORI
fórmulas:
n ∑ xi y i − ∑ x i ∑ y i
a= 2
b=¿ ¿
n ∑ x 2i −( ∑ x i )
n ∑ xi y i−∑ x i ∑ y i 8(78076)−(1358)(457.5) 624608−621285 3323
a= 2 a= 2 a= a=
2
n ∑ x −( ∑ x i )
i
8 ( 234424 )−(1358) 1875392−1844164 31228
b=39.124
Ecuación lineal:
y=ax+ b
y=0.1064 x+39.124
624608−621285 3323
R= R=
√ 1875392−1844164 √ 1674450−209306.25 √ 30628 √ 1465143.75
3323 3323
R= R= R=0.5404
175.008∗1210.431 211835.108
REFERENCIA BIBLIOGRAFICA
Espejo, I., Fernández, F., López, M., Muñoz, M., Rodríguez, A., Sánchez, A., & Valero, C.
url=http://search.ebscohost.com/login.aspx?
direct=true&db=edsbas&AN=edsbas.D638568B&lang=es&site=eds-live&scope=site
ey Graña, C., & Ramil Díaz, M. (2007). Introducción a la estadística descriptiva. Netbiblo.
Recuperado de https://bibliotecavirtual.unad.edu.co/login?
url=http://search.ebscohost.com/login.aspx?
direct=true&db=edsbas&AN=edsbas.94806AF0&lang=es&site=eds-live&scope=site
Leal-Cornejo, F., López-García, R. E., Martínez-Montiel, M. G., Tapia-Castillo, D. I., & León-
org.bibliotecavirtual.unad.edu.co/10.29057/xikua.v7i13.3558
Gracia Cano, A., & González Herrera, A. (2018). Cálculo e interpretación del coeficiente de
url=http://search.ebscohost.com/login.aspx?
direct=true&db=edsbas&AN=edsbas.96DDFB2C&lang=es&site=eds-live&scope=site
de https://www.uaa.mx/centros/cem/dmf/wp-
content/uploads/2015/apuntes/4.%20Estadistica%20y%20Principios%20de
%20Probabilidad/Apuntes%20Estadistica.pdf
https://sites.google.com/site/iniciacionestadistica/introduccion/1-1-historia
https://www.monografias.com/trabajos84/definicion-estadistica/definicion-
estadistica.shtml