Está en la página 1de 36

TEMA 1: Descripción Estadística de una variable

EJEMPLOS USO ESTADISTICA


ENCUESTA

1
EJEMPLOS USO ESTADISTICA
ENCUESTA sobre estimación de escaños

2
EJEMPLOS USO ESTADISTICA
ESTUDIO CLÍNICO de la eficacia de la vacuna Covid-19 de Pfizer-BioNTech

3
DATOS 1:RESISTENCIA DE MATERIALES
BARRAS DE ACERO

RESISTENCIA: Oposición a la ROTURA

RIGIDEZ: Oposición a las


DEFORMACIONES

Aplicamos una FUERZA P a lo largo de una barra


y queremos saber la deformación que experimenta.
4
DATOS 1:RESISTENCIA DE MATERIALES
MÉTODO EXPERIMENTAL

Aplicamos una FUERZA P a lo largo de una barra y queremos saber la


deformación que experimenta.
El efecto de la fuerza depende de la sección de la barra.

ESFUERZO σ: La fuerza aplicada por unidad de área.


σ =P/A unidades Newton/m2 =Pascales

Medimos la deformación (alargamiento) total δ que sufre la


barra con esa fuerza y lo hacemos por unidad de longitud:
deformación unitaria ε=δ/l.

Objetivo: Establecer la relación entre


los esfuerzos aplicados a las barras y
las deformaciones unitarias producidas
5
DATOS 1:RESISTENCIA DE MATERIALES
GRÁFICA ESFUERZO-DEFORMACIÓN

Ley de Hooke: Proporcionalidad directa entre


los pesos aplicados y las deformaciones

Para un material general la gráfica


esfuerzo-deformación es del tipo:

Ley de Hooke: σ=Eε Donde E es un


valor característico de cada material y se
llama módulo de elasticidad o módulo de
Young
6
DATOS 1:RESISTENCIA DE MATERIALES
Se han tomado 65 barras de la misma longitud y
diámetro de tres tipos de acero para estudiar sus
propiedades de resistencia y elasticidad. De ellas 20
eran de acero al carbono, 15 de acero sin tratar y 30 de
acero al magnesio. Todas ellas se han sometido a un
determinado esfuerzo (Y) y se mide la deformación
que causó (X). Los datos se recogen en las tablas
siguientes donde figuran, para cada barra, el esfuerzo
a que se sometió Y (en Pascales por cm2), su
deformación X (en %) y el producto de ambas
cantidades (XY). Las barras están ordenadas por orden
creciente de deformación. En las dos últimas filas, en
negrita, aparecen la suma y la suma de cuadrados de
los datos de cada columna (para facilitar los cálculos). 7
DATOS 1:RESISTENCIA DE MATERIALES

8
TEMA I: Descripción Estadística de una variable

POBLACIÓN: Universo de objetos al que se refiere el estudio.


MUESTRA: Una parte de la población de la que tenemos datos.
VARIABLE: Un rasgo o característica observable en los elementos
de la población.

DATOS: Valores que toman las variables en los elementos de una


muestra.

ESTADÍSTICA DESCRIPTIVA O ANÁLISIS EXPLORATORIO


DE LOS DATOS: Descripción de los datos. Proceso de organización
de los datos poniendo de manifiesto sus características esenciales
usando métodos numéricos y gráficos
9
FRECUENCIAS: EJEMPLOS
1→ Variable: Color preferido. ni fi
Muestra: 20 personas. azul 6 0.3 Variable
Datos: Verde; azul; verde; verde; verde 12 0.6 cualitativa
verde; azul; verde; azul; verde; azul; rojo 2 0.1
rojo; verde; verde; verde; rojo; azul; 20 1
azul; verde; verde; verde.
ni fi Ni Fi
2→ Variable: Número de habitantes en 1 4 0.133 4 0.133 Variable
el domicilio. Muestra: 30 personas. 2 5 0.167 9 0.3 cuantitativa
Datos: 4; 5; 1; 2; 4; 1; 3; 2; 4; 4; 2; 5; 3 6 0.2 15 0.5 sin agrupar
3; 1; 4; 2; 4; 4; 1; 3; 4; 5; 3; 4; 4; 3; 2; 4 11 0.367 26 0.867
5 4 0.133 30 1
4; 5; 3.
30 1
3→ Variable: Altura de fresnos. xi ni fi Ni Fi
Muestra: 30 fresnos. Datos: 3.71; [0,1) 0.5 4 0.133 4 0.133
1.75; 0.54; 4.59; 2.47; 2.20; 3.29; [1,2) 1.5 6 0.2 10 0.333
1.62; 4.62; 2.60; 3.50; 2.96; 0.11; [2,3) 2.5 11 0.367 21 0.7
[3,4) 3.5 5 0.167 26 0.867
1.75; 4.37; 1.60; 2.55; 0.08; 2.09; [4,5] 4.5 4 0.133 30 1
1.48; 2.21; 4.01; 2.52; 3.79; 2.97; 30 1
1.47; 0.39; 2.08; 3.26; 2.62. Variable cuantitativa
10
con datos agrupados
FRECUENCIAS
NOTACIÓN:
• n: tamaño de la muestra (número de elementos observados)
• x1, x 2 ,..., x n : los n valores de la variable X observados en los n elementos de la
muestra (puede haber repeticiones)
• En variables cuantitativas x 1 , x 2 ,..., x k : los k valores diferentes observados de la
variable X, ordenados de forma creciente ( x i < x i +1 )
• ni: frecuencia absoluta del valor x i , es el número de veces que aparece dicho valor
en la muestra.
xi frec. frec. frec.abs.acum. frec.relat.acum.
abs. relat. Ni=n1+…+ni Fi=f1+…+fi Tabla de frecuencias
ni fi=ni/n xi punto medio del
x1 n1 f1 N1=n1 F1=f1
x2 n2 f2 N2=n1+n2 F2=f1+f2
intervalo, representante
… … … … … de clase
xk nk fk Nk=n1+…+nk=n Fk=f1+…+fk=1
n 1 L i + L i −1
[Li-1,Li] xi = ni Ni
2
Datos agrupados: A veces al estudiar (L0,L1] x1 n1 N1
variables continuas no se dispone de los (L1,L2] x2 n2 N2
datos originales sino de los datos … … … …
agrupados en clases (L0,L1]… (Lk-1,Lk]. (Lk-1,Lk] xk nk Nk 11
n
VARIABLES CUALITATIVAS: DIAGRAMAS DE FRECUENCIAS
EJEMPLO 1
frec. abs. frec. rel.
azul 6 0.3
verde 12 0.6
rojo 2 0.1
20 1

60
porcentaje 50
40
30
20
10
Diagrama de sectores 0
azul verde rojo
Moda: verde Diagrama de rectángulos
12
VARIABLES CUALITATIVAS: DIAGRAMAS DE FRECUENCIAS
frec. abs. frec. rel.
0.5
x1 n1 f1
x2 n2 f2
0.375
… … …
xk nk fk
n 1 0.25

0.125
B
A

D C A B C D
Diagrama de rectángulos

La moda es el valor de la variable con mayor


Diagrama de sectores frecuencia, es decir el que más veces se repite
=
en la muestra: Mo x= i si n i maxn j
j
13
Gráficos de barras para variables numéricas
–Diagramas barras para v. discretas (sin agrupar)
• Se deja un hueco entre barras para indicar los valores que no son
posibles
–Histogramas para v. continuas (agrupadas)
• El área de cada rectángulo indica la cantidad (porcentaje o
frecuencia) de individuos en el intervalo.
419
250
400 375

200

300

Recuento
255
Recuento

150

215
200
100

127

50
100

54
24 23 17
20 40 60 80

0 1 2 3 4 5 6 7 Ocho o más
Edad del encuestado
Número de hijos 14
VARIABLES CUANTITATIVAS: ¿CÓMO HACER EL HISTOGRAMA? :
3.71; 1.75; 0.54; 4.59; 2.47; 2.20; 3.29; 1.62; 4.62; 2.60; 3.50; 2.96; 0.11; 1.75; 4.37;
1.60; 2.55; 0.08; 2.09; 1.48; 2.21; 4.01; 2.52; 3.79; 2.97; 1.47; 0.39; 2.08; 3.26; 2.62.
Las clases tienen que abarcar todo el rango de los datos, no solaparse y
no dejar huecos. 3.- El histograma está formado por
1.- Elegir el número de clases y rectángulos, uno sobre cada clase con área
la amplitud de las mismas. igual a su frecuencia, es decir, la altura de
2.- Contar el número de cada rectángulo es la frecuencia de su clase
observaciones en cada clase dividida entre su amplitud.
(frecuencia absoluta)
xi frec. abs. frec. rel.
[0,1] 0.5 4 0.133
(1,2] 1.5 6 0.2
(2,3] 2.5 11 0.367
(3,4] 3.5 5 0.167
(4,5] 4.5 4 0.133
30 1

¿Cuántas clases? (de 5 a 15)


• k=1 + 3,332 ⋅ log10 n rango de los datos
¿Amplitud de clases?: A ≥ 15
• k= n k
VARIABLES CUANTITATIVAS: HISTOGRAMA

3.71; 1.75; 0.54; 4.59; 2.47;


2.20; 3.29; 1.62; 4.62; 2.60;
3.50; 2.96; 0.11; 1.75; 4.37;
1.60; 2.55; 0.08; 2.09; 1.48;
2.21; 4.01; 2.52; 3.79; 2.97;
1.47; 0.39; 2.08; 3.26; 2.62.

xi frec. abs. frec. rel.


[0,1] 0.5 4 0.133
(1,2] 1.5 6 0.2
(2,3] 2.5 11 0.367
(3,4] 3.5 5 0.167
(4,5] 4.5 4 0.133
30 1
k: número de clases = 5

16
VARIABLES CUANTITATIVAS: HISTOGRAMA
xi frec. abs. frec. rel.
3.71; 1.75; [0,0.5] 0.25 3 0.1 xi frec. abs. frec. rel.
0.54; 4.59; (0.5,1] 0.75 1 0.033 [-0.2,0.7] 0.25 4 0.133
(1,1.5] 1.25 2 0.067
2.47; 2.20; (1.5,2] 1.75 4 0.133
(0.7,1.6] 1.15 3 0.1
3.29; 1.62; (2,2.5] (1.6,2.5] 2.05 8 0.267
2.25 5 0.167
(2.5,3.4] 2.95 8 0.267
4.62; 2.60; (2.5,3] 2.75 6 0.2
(3.4,4.3] 3.85 4 0.133
(3,3.5] 3.25 3 0.1
3.50; 2.96; (3.5,4] 3.75 2 0.067 (4.3,5.2] 4.75 3 0.1
0.11; 1.75; (4,4.5] 4.25 2 0.067 30 1
4.37; 1.60; (4.5,5] 4.75 2 0.067 k=6
30 1
2.55; 0.08;
k = 10
2.09; 1.48;
2.21; 4.01;
2.52; 3.79;
2.97; 1.47;
0.39; 2.08;
3.26;
2.62.

17
EJERCICIO 1A

Acero al carbono Acero sin tratar Acero al magnesio


X Y XY X Y XY X Y XY
9,2 26,68 245,456 9,2 36,07 331,844 8,5 29,3 249,05
9,4 31,41 295,254 9,3 28,56 265,608 8,6 32,19 276,834
9,5 30,98 294,31 9,7 31,02 300,894 11,1 31,8 352,98
12,0 44,18 530,16 9,9 26,74 264,726 12,4 53,7 665,88
12,5 44,53 556,625 10,0 33,15 331,5 12,6 62,42 786,492
12,5 45,3 566,25 10,6 33,89 359,234 12,9 62,77 809,733
12,6 49,18 619,668 11,1 44,46 493,506 13,5 41,87 565,245
12,7 53,18 675,386 12,6 45,21 569,646 14,5 69,33 1005,285
12,8 51,93 664,704 13,2 59,56 786,192 14,8 92,24 1365,152
12,8 42,94 549,632 13,2 48,18 635,976 15,8 70,57 1115,006
12,8 53,4 683,52 13,2 50,58 667,656 17,3 65,17 1127,441
12,9 46,28 597,012 14,2 53,93 765,806 26,1 166,8 4353,48
13,0 49,94 649,22 28,2 265,9 7498,38
14,3 57,03 815,529
13,4 44,26 593,084 28,6 226,27 6471,322
14,6 67,25 981,85
14,0 53,95 755,3 28,7 219,4 6296,78
16,2 73,2 1185,84
32,6 429,09 13988,334
14,3 52,63 752,609 181,30 688,83 8.755,8070
36,5 441,95 16131,175
14,3 56,51 808,093 2.262,01 34.530,7875 50,5 968,57 48912,785
14,7 65,07 956,529
50,6 1005,7 50888,42
14,9 61,01 909,049
54,4 1302,99 70882,656
17,8 109,95 1957,11
59,5 1383,1 82294,45
258,10 1.013,31 13.658,9710
61,5 1518,83 93408,045
3.406,21 56.797,9841 62,3 1512,62 94236,226
62,9 1437,08 90392,332
63,5 1780,39 113054,765
Construir el diagrama de sectores y 65,3
66,8
1825,41
1741,12
119199,273
116306,816
70,0 1846,38 129246,6
de rectángulos (o barras) para la 79,6 2136,07 170031,172
88,5 3029,74 268131,99
variable “tipo de acero”. 1.158,10
62.479,09
23.848,77
39.520.238,0523
1.510.044,0990
18
VARIABLES CUANTITATIVAS. MEDIDAS DE CENTRALIZACIÓN:
MEDIA Y MODA
VALORES SIN AGRUPAR
n k

i ∑x ∑x i
ni k
Media=
: x =
M =
X
i 1= i 1
=
n n
= ∑x
i =1
i
fi

n
4; 5; 1; 2; 4; 1; 3; 2; 4; 4; 2; 5;
3; 1; 4; 2; 4; 4; 1; 3; 4; 5; 3; 4;
∑x i
4 + 5 + 1 + ... + 4 + 5 + 3 96
=
x i =1
= = = 3.2
4; 3; 2; 4; 5; 3. n 30 30

xi ni x i ni k
1
2
4
5
4
10
∑x i
ni
96
3 6 18 =
x i =1
= = 3.2
n 30
4 11 44
5 4 20
30 96 Moda = 4 19
VARIABLES CUANTITATIVAS. MEDIDAS DE CENTRALIZACIÓN:
MEDIA Y MODA
VALORES AGRUPADOS
n k

∑x i ∑x i
ni k

Media: =
x =
=
M
X
i 1= i
=
n
1

n
= ∑x
i =1
i
fi

3.71; 1.75; 0.54; 4.59; 2.47;


2.20; 3.29; 1.62; 4.62; 2.60;
n

∑x
3.50; 2.96; 0.11; 1.75; 4.37;
3.71 + 1.75 + ... + 3.26 + 2.62 73.2
i
1.60; 2.55; 0.08; 2.09; 1.48;
=x =
i =1
= = 2.44
2.21; 4.01; 2.52; 3.79; 2.97; n 30 30
1.47; 0.39; 2.08; 3.26; 2.62.
NO
xi ni x i ni k
[0,1) 0.5 4 2 ∑x n i i
74 
[1,2) 1.5 6 9 =
x i =1
= = 2.46
[2,3) 2.5 11 27.5 n 30
[3,4) 3.5 5 17.5
[4,5] 4.5 4 18 Clase modal: [2,3) 20

30 74
VARIABLES CUANTITATIVAS: MEDIANA
Mediana: Es aquel dato que cumple que
al menos la mitad de los datos son
menores o iguales que él y que al menos
la mitad de los datos son mayores o
iguales que él. Si existen dos datos que
cumplen lo anterior la mediana se define
como la media de ambos datos.

4; 5; 1; 2; 4; 1; 3; 2; 4; 4; 2; 5; 3; 1; 4; 2; 4; 4; 1; 3; 4; 5; 3; 4; 4; 3; 2; 4; 5; 3.
n=30 par
1; 1; 1; 1; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5.
3+ 4
15 y 16 Me = = 3.5
2
4; 5; 1; 2; 4; 1; 3; 2; 4; 4; 2; 5; 3; 1; 4; 2; 4; 4; 1; 3; 4; 5; 3; 4; 4; 3; 2; 4; 5; 3.
n=29 impar
1; 1; 1; 1; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5.
15 Me = 4 21
VARIABLES CUANTITATIVAS: MEDIANA
VALORES SIN AGRUPAR
Mediana: Ordenados los datos de menor a mayor x (1) ≤ x (2) ≤ ... ≤ x (n )

• Si n es impar: Me = x  n +1 
 
 2 
x (n / 2) + x (n / 2+1)
• Si n es par: Me =
2
x<i> ni Ni
n=30 par
1; 1; 1; 1; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 4; 4; 1 4 4
2 5 9
4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5. 3 6 15
n/2=15 4 11 26
3+ 4
=
Me = 3.5 15 y 16
5 4 30
2 30

n=29 impar x<i> ni Ni


1; 1; 1; 1; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 4; 4; 4;
1 4 4
4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5. 2 5 9
n/2=14.5 3 5 14
Me = 4 4 11 25
15 5 4 29
29
¿Queda clara la diferencia entre x i , x i y x (i) ? 22
VARIABLES CUANTITATIVAS: MEDIANA
VALORES SIN AGRUPAR, CON FRECUENCIAS
n x a + x a +1
• Si N a = ⇒ Me =
2 2
n
• Si N a −1 < < N a ⇒ Me = xa
2

x<i> ni Ni
x<i> Ni 1 4 4
n
… … 2 5 9 = 14.5
x a −1 Na-1<n/2
Me = x a 3 5 14 2
4 11 25
xa Na>n/2
5 4 29 Me = 4
… …
29

x<i> Ni x<i> ni Ni
… n
1 4 4
= 15

x a −1 Na-1<n/2 2 5 9 2
xa x a + x a +1 3 6 15
Me =
Na=n/2
4 11 26 3+ 4
x a +1 Na+1 2 5 4 30 =
Me = 3.5
… … 30
2

23
VARIABLES CUANTITATIVAS: PERCENTILES
Percentil de orden α (Pα): es aquel dato que cumple que al menos el α% de
los datos son menores o iguales que él y que al menos el (100-α)% de los
datos son mayores o iguales que él. Si existen dos datos que cumplen lo
anterior el percentil de orden α se define como la media de ambos datos.

VALORES SIN AGRUPAR


SIN FRECUENCIAS CON FRECUENCIAS
Para calcular el percentil Pα: Para calcular el percentil Pα:
nα nα
• Se calcula r = • Se calcula r =
100 100
x (r ) + x (r +1) x a + x a +1
• Si r ∈ N ⇒ Pα = • Si N a =r ⇒ Pα =
2 2
• Si r ∉ N ⇒ Pα = x ( E[r ]+1) • Si N a −1 < r < N a ⇒ Pα = xa

Primer Cuartil: Q1=P25


Segundo Cuartil: Q2=P50=Me
Tercer Cuartil: Q3=P75 24
VARIABLES CUANTITATIVAS. PERCENTILES: EJEMPLO
VALORES SIN AGRUPAR
1; 1; 1; 1; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5.
n=30
75n 3n
25n n
= = 7.5
50n n
= = 15 = = 22.5
100 4 100 2 100 4

Q1 = x (8)
x (15) + x (16) Q3 = x (23)
Q2 =
2
1; 1; 1; 1; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5.

x<i> ni Ni x<i> ni Ni x<i> ni Ni


1 4 4 1 4 4 1 4 4
2 5 9 2 5 9 2 5 9
3 6 15 3 6 15 3 6 15
4 11 26 4 11 26 4 11 26
5 4 30 5 4 30
5 4 30
30
30 30

Q1 = 2 3+ 4 Q3 = 4
=
Q 2 =
Me = 3.5
2 25
VARIABLES CUANTITATIVAS. PERCENTILES: EJEMPLO
VALORES SIN AGRUPAR, SIN FRECUENCIAS
3.71; 1.75; 0.54; 4.59; 2.47; 2.20; 3.29; 1.62; 4.62; 2.60; 3.50; 2.96; 0.11; 1.75;
4.37; 1.60; 2.55; 0.08; 2.09; 1.48; 2.21; 4.01; 2.52; 3.79; 2.97; 1.47; 0.39; 2.08;
3.26; 2.62.
n
= 7.5 ⇒ x (8)
4
n x (15) + x (16)
n=30 = 15 ⇒
2 2
3n
= 22.5 ⇒ x ( 23)
4

0.08; 0.11; 0.39; 0.54; 1.47; 1.48; 1.60; 1.62; 1.75; 1.75; 2.08; 2.09; 2.20;
2.21; 2.47; 2.52; 2.55; 2.60; 2.62; 2.96; 2.97; 3.26; 3.29; 3.50; 3.71; 3.79;
4.01; 4.37; 4.59; 4.62.

2.47 + 2.52
Q1 = 1.62 Q2 = = 2.495 Q3 = 3.29
2
26
VARIABLES CUANTITATIVAS. PERCENTILES: EJEMPLO
• ¿Cuántos individuos tienen Número de hijos
menos de 2 hijos?
Porcent. Porcent.
frec. indiv. sin hijos + frec. Frec. (válido) acum.
indiv. con 1 hijo= 419 +
0 419 27,8 27,8
255=674 indiv.
1 255 16,9 44,7
2 375 24,9 69,5 ≥50%
• ¿Qué porcentaje de individuos
3 215 14,2 83,8
tiene 6 hijos o menos? 97,3%
4 127 8,4 92,2
5 54 3,6 95,8
• ¿Qué cantidad de hijos es tal
6 24 1,6 97,3
que al menos el 50% de la
población tiene una cantidad 7 23 1,5 98,9
inferior o igual? Ocho+ 17 1,1 100,0
2 hijos es la mediana Total 1509 100,0
• ¿Cuál es la cantidad mínima de
hijos que tiene el 20% de las
familias que tienen más hijos?
Nos piden el percentil del 80%,
que son 3 hijos 27
EJERCICIO 1B
Acero al magnesio
Acero al carbono Acero sin tratar X Y XY
X Y XY X Y XY 8,5 29,3 249,05
9,2 26,68 245,456 9,2 36,07 331,844 8,6 32,19 276,834
9,4 31,41 295,254 9,3 28,56 265,608 11,1 31,8 352,98
9,5 30,98 294,31 9,7 31,02 300,894 12,4 53,7 665,88
12,0 44,18 530,16 9,9 26,74 264,726 12,6 62,42 786,492
12,5 44,53 556,625 10,0 33,15 331,5 12,9 62,77 809,733
12,5 45,3 566,25 10,6 33,89 359,234 13,5 41,87 565,245
12,6 49,18 619,668 11,1 44,46 493,506 14,5 69,33 1005,285
12,7 53,18 675,386 12,6 45,21 569,646 14,8 92,24 1365,152
12,8 51,93 664,704 13,2 59,56 786,192 15,8 70,57 1115,006
12,8 42,94 549,632 13,2 48,18 635,976 17,3 65,17 1127,441
12,8 53,4 683,52 13,2 50,58 667,656 26,1 166,8 4353,48
12,9 46,28 597,012 14,2 53,93 765,806 28,2 265,9 7498,38
13,0 49,94 649,22 14,3 57,03 815,529 28,6 226,27 6471,322
13,4 44,26 593,084 14,6 67,25 981,85 28,7 219,4 6296,78
14,0 53,95 755,3 16,2 73,2 1185,84 32,6 429,09 13988,334
14,3 52,63 752,609 181,30 688,83 8.755,8070 36,5 441,95 16131,175
14,3 56,51 808,093 2.262,01 34.530,7875 50,5 968,57 48912,785
14,7 65,07 956,529 50,6 1005,7 50888,42
14,9 61,01 909,049 54,4 1302,99 70882,656
17,8 109,95 1957,11 59,5 1383,1 82294,45
258,10 1.013,31 13.658,9710 61,5 1518,83 93408,045
3.406,21 56.797,9841 62,3 1512,62 94236,226
62,9 1437,08 90392,332
63,5 1780,39 113054,765
65,3 1825,41 119199,273
1. Calcular la media, la mediana, el primer y 66,8
70,0
1741,12
1846,38
116306,816
129246,6
el tercer cuartil y el percentil 66 de las 79,6
88,5
2136,07
3029,74
170031,172
268131,99
deformaciones (X) de las barras de acero 1.158,10
62.479,09
23.848,77
39.520.238,0523
1.510.044,0990

al carbono. 28
VARIABLES CUANTITATIVAS: MEDIDAS DE DISPERSIÓN

Rango (o recorrido): diferencia entre el máximo y el mínimo de los valores

Rango intercuartílico: diferencia entre el primer y el tercer cuartil: Q3-Q1.

Varianza:

∑n (x )
n n k k

∑(x − x) ∑x ∑n x
2 2
i
2
i i i
−x i
2
i
σ = V=
=
2
X X
i 1 =i 1= 2 i 1
= −x = =i 1
= − x2
n n n n

Desviación típica (o estándar)σ: es la raíz cuadrada positiva de la varianza

Coeficiente de variación: es el cociente entre la desviación típica y la media:


σ
CV =
x
29
VARIABLES CUANTITATIVAS: MEDIDAS DE DISPERSIÓN. EJEMPLO
1; 1; 1; 1; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5.
2 n=30
Rango: 5 − 1 = 4 x i n i N i x i n i x i ni
1 4 4 4 4
Rango intercuartílico:Q 3 − Q1 = 4 − 2 = 2 2 5 9 10 20
3 6 15 18 54
4 11 26 44 176
96
Media: =x = 3.2 5 4 30 20 100
30
30 96 354
2
354  96 
Varianza:σ = − = − = 11.8 − 10.24 = 1.56
2 2
 11.8 3.2
30  30 
n 2
s=2
σ= 1.61379
n −1
=
Desviación típica (o estándar): σ =
1.56 1.2490
= s = s 2 1.27035
1.2490 s
= CVP
Coeficiente de variación: = 0.3903 CV=
M = 0.3970
3.2 x 30
VARIABLES CUANTITATIVAS: MEDIDAS DE DISPERSIÓN.
EJEMPLO

3.71; 1.75; 0.54; 4.59; 2.47; 2.20; 3.29; 1.62; 4.62; 2.60; 3.50; 2.96; 0.11; 1.75; 4.37;
1.60; 2.55; 0.08; 2.09; 1.48; 2.21; 4.01; 2.52; 3.79; 2.97; 1.47; 0.39; 2.08; 3.26; 2.62.
0.08; 0.11; 0.39; 0.54; 1.47; 1.48; 1.60; 1.62; 1.75; 1.75; 2.08; 2.09; 2.20; 2.21; 2.47;
2.52; 2.55; 2.60; 2.62; 2.96; 2.97; 3.26; 3.29; 3.50; 3.71; 3.79; 4.01; 4.37; 4.59; 4.62.

Rango: 4.62 − 0.08 = 4.54 Rango intercuartílico: Q3 − Q1 = 3.29 − 1.62 = 1.67

0.08 + ... + 4.62


=
Media: x = 2.44
30
0.082 + ... + 4.622
Varianza: σ =
2
− 2.442= 7.47072 − 2.442= 1.51712
30
n 2
=
s2 σ= 1.56943
=
Desviación típica (o estándar): σ = 1.51712 1.23171 n − 1
=s = s 2 1.25277
1.23171
=
Coeficiente de variación: CVP = 0.5048 s
2.44 CV=M = 0.5134
x 31
MEDIDAS DE DISPERSIÓN: INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA

Dispersión aproximada en las distribuciones ‘normales’

0.05
0.05

0.04
0.04

0.03
0.03

0.02
0.02

0.01
0.01

x  2s
x s
95 %
68.5 %
0.00
0.00

150 160 170 180 190


150 160 170 180 190

32
VARIABLES CUANTITATIVAS: MEDIDAS DE FORMA

∑ ( xi − x )
3
x1, x 2 ,..., x n
Coeficiente de asimetría: g1 = i =1
ns3

g1 > 0 g1 ≈ 0 g1 < 0

Coeficiente de apuntamiento o Mesocúrtica (g2=0)


curtosis: Leptocúrtica (g2>0)

∑ ( xi − x )
4

i =1

g2 n −3
s4 Platicúrtica (g2<0)
33
RESUMEN SOBRE ESTADÍSTICOS

• Medidas de Centralización: media, mediana y moda


– Indican valores con respecto a los que los datos parecen agruparse.
• Medidas de Posición: percentiles, cuantiles, cuartiles, deciles
– Dividen un conjunto ordenado de datos en grupos con la misma cantidad
de individuos.
• Medidas de Dispersión: varianza, desviación típica, coeficiente de variación
– Indican la mayor o menor concentración de los datos con respecto a las
medidas de centralización.
• Medidas de Forma: coef. de asimetría, coef. de apuntamiento o curtosis

34
EJERCICIO 1C

Acero al carbono Acero al magnesio


X Y XY Acero sin tratar X Y XY
9,2 26,68 245,456 X Y XY 8,5 29,3 249,05
9,4 31,41 295,254 9,2 36,07 331,844 8,6 32,19 276,834
9,5 30,98 294,31 9,3 28,56 265,608 11,1 31,8 352,98
12,0 44,18 530,16 9,7 31,02 300,894 12,4 53,7 665,88
12,5 44,53 556,625 9,9 26,74 264,726 12,6 62,42 786,492
12,5 45,3 566,25 10,0 33,15 331,5 12,9 62,77 809,733
12,6 49,18 619,668 10,6 33,89 359,234 13,5 41,87 565,245
12,7 53,18 675,386 11,1 44,46 493,506 14,5 69,33 1005,285
12,8 51,93 664,704 12,6 45,21 569,646 14,8 92,24 1365,152
12,8 42,94 549,632 13,2 59,56 786,192 15,8 70,57 1115,006
12,8 53,4 683,52 13,2 48,18 635,976 17,3 65,17 1127,441
12,9 46,28 597,012 13,2 50,58 667,656 26,1 166,8 4353,48
13,0 49,94 649,22 14,2 53,93 765,806 28,2 265,9 7498,38
13,4 44,26 593,084 14,3 57,03 815,529 28,6 226,27 6471,322
14,0 53,95 755,3 14,6 67,25 981,85 28,7 219,4 6296,78
14,3 52,63 752,609 16,2 73,2 1185,84 32,6 429,09 13988,334
14,3 56,51 808,093 181,30 688,83 8.755,8070 36,5 441,95 16131,175
14,7 65,07 956,529 2.262,01 34.530,7875 50,5 968,57 48912,785
14,9 61,01 909,049 50,6 1005,7 50888,42
17,8 109,95 1957,11 54,4 1302,99 70882,656
258,10 1.013,31 13.658,9710 59,5 1383,1 82294,45
3.406,21 56.797,9841 61,5 1518,83 93408,045
62,3 1512,62 94236,226
62,9 1437,08 90392,332
63,5 1780,39 113054,765
65,3 1825,41 119199,273
Calcular el rango, la varianza, la desviación 66,8 1741,12 116306,816
70,0 1846,38 129246,6
típica y el coeficiente de variación de las 79,6 2136,07 170031,172
88,5 3029,74 268131,99
deformaciones (X) de las barras de acero al 1.158,10 23.848,77 1.510.044,0990
62.479,09 39.520.238,0523 35
carbono.
VARIABLES CUANTITATIVAS: TRANSFORMACIONES LINEALES

La media y los percentiles de unos datos


multiplicados por un valor a y a los que x1, x 2 ,..., x n y1, y 2 ,..., y n
sumamos un valor b es la media y los
percentiles de los datos originales yi = ax i + b
multiplicados por dicho valor a y g1,x = g1,y
y = ax + b
sumado el valor b.
La varianza de unos datos multiplicados σ y2 = a 2σ x2 g 2,x = g 2,y
por un valor a y a los que sumamos un
valor b es la varianza de los datos Qi, y = aQi, x + b
originales multiplicados por a2 x = 3.2 y = 7.4
Q1, x = 2 Q1, y = 5
Q 2, x = 3.5 Q 2, y = 8
xi:1;1;1;1;2;2;2;2;2;3;3;3;3;3;3;4;4;4;4;4;4;4;4;4;4;4;5;5;5;5
Q3, x = 4 Q3, y = 9
=
yi 2x i + 1 σ x2 = 1.56 σ y2 = 6.24
g1, x = −0.402 g1, y = −0.402
yi:3;3;3;3;5;5;5;5;5;7;7;7;7;7;7;9;9;9;9;9;9;9;9;9;9;9;11;11;11;11 g 2, x = −0.885 g 2, y = −0.885
36

También podría gustarte