Documentos de Académico
Documentos de Profesional
Documentos de Cultura
“ESTADÍSTICA”
Unidad Nº 2: “Análisis y medición de datos”
Son valores numéricos que tienden a informar en algún sentido el medio o centro de un conjunto de datos.
Si los datos constituyen una muestra, la media y la mediana serán llamadas estadísticas (varían según las
muestras). Si los datos son una población, entonces estas medidas serán llamadas parámetros (no varían, son
datos fijos).
o Media ó promedio ( x )
Serie simple
x
x : sumatoria
i
n
n: número de observaciones
Ejemplo 1:
5698757
x
7
47
x
7
x 6,71 P.
1
MATEMÁTICA
Serie de frecuencias
Es el cociente entre la sumatoria de los productos de cada valor de la variable por su frecuencia y el
número de observaciones.
x
x .f
i a
f a : frecuencia absoluta n: número de observaciones
n
xi fa fr f% Fa Fr Fr % xi . f a
150 2 0,05 5 2 0,05 5 300
154 1 0,025 2,5 3 0,075 7,5 154
155 1 0,025 2,5 4 0,1 10 155
156 2 0,05 5 6 0,15 15 312
157 2 0,05 5 8 0,2 20 314
158 3 0,075 7,5 11 0,275 27,5 474
159 2 0,05 5 13 0,325 32,5 318
160 5 0,125 12,5 18 0,45 45 800
161 1 0,025 2,5 19 0,475 47,5 161
163 2 0,05 5 21 0,525 52,5 326
164 5 0,125 12,5 26 0,65 65 820
165 3 0,075 7,5 29 0,725 72,5 495
166 2 0,05 5 31 0,775 77,5 332
167 3 0,075 7,5 34 0,85 85 501
168 1 0,025 2,5 35 0,875 87,5 168
169 2 0,05 5 37 0,925 92,5 338
170 2 0,05 5 39 0,975 97,5 340
171 1 0,025 2,5 40 1 100 171
Total 40 1 100 6479
6479
x 161, 975cm 162cm
40
Intervalos de clase
Se identifica cada intervalo con su punto medio que se llama marca de clase ( x ' ).
xinf xsup
x'
2
Se calcula la media de las marcas de clase provistas de las respectivas frecuencias de sus intervalos.
x
x .f
'
i a
x i' : punto medio del intervalo de clase f a : frecuencia absoluta
n
2
MATEMÁTICA
Volviendo a la tabla (pág. 6 de la unidad 1) queda de la siguiente manera:
xi fa fr f% Fa Fr Fr % x i' x i' . f a
150;155 3 0,075 7,5 3 0,075 7,5 152,5 457,5
155;160 10 0,25 25 13 0,325 32,5 157,5 1575
160;165 13 0,325 32,5 26 0,65 65 162,5 2112,5
165;170 11 0,275 27,5 37 0,925 92,5 167,5 1842,5
[170;175] 3 0,075 7,5 40 1 100 172,5 517,5
Total 40 1 100 6505
x
x .f '
i a
6505
x x = 162,625 cm
40
Observaciones de la media
* Es un valor que está comprendido dentro del campo de la variable en estudio (no se redondea).
* Se mide en las mismas unidades que la variable en estudio.
* Se ve influenciada por los valores extremos o aislados. Es sensible a valores extremos.
* Es representativa de la población cuando ésta es simétrica o moderadamente simétrica.
o Mediana (Me)
Serie simple
3
MATEMÁTICA
Serie de frecuencias
Me = 163 cm
Intervalos de clase
(0,5 Fr ).h
Me = Li +
fr
Observaciones de la mediana
4
MATEMÁTICA
Variable cualitativa
Variables cuantitativas
Serie simple
Serie de frecuencias
Intervalos de clase
1 .h
Mo = Li +
1 2
Mo= 163 cm
La mayoría de las estaturas de los alumnos es 163 cm.
Observaciones de la moda
Ejemplo: Los ingresos anuales de 5 familias de una misma zona: $ 12000; $ 12000; $ 30000; $ 90000;
$ 100000.
12000 12000 30000 90000 100000 244000
x $48800
5 5
Me = $ 30000
Mo = $ 12000 (f = 2)
En el ejemplo, la media, la mediana y la moda son distintas. Nos conducen a diferentes interpretaciones:
a) Si se quiere promocionar la zona como opulenta, se elije el ingreso medio.
b) Si se quiere una rebaja en los impuestos, se elije la moda.
c) Si se quiere representar el valor que está en el medio, se elije la mediana.
Si una distribución es simétrica, la media, la mediana y la moda coinciden o son muy próximas entre sí.
Si una distribución es asimétrica, la media, la mediana y la moda no coinciden.
6
MATEMÁTICA
Medidas de dispersión
Indican el alejamiento de las observaciones entre sí y respecto al valor central.
El rango o recorrido de la variable es la diferencia entre el mayor valor observado y el menor valor
observado.
R = xM xm
Depende exclusivamente de los valores extremos.
S2
(x i x)2. fa
S
(x i x)2. fa
n n
x i : variable x : promedio f a : frecuencia absoluta
S 2
(x '
i x)2. fa
S
(x '
i x)2. fa
n n
x i' : punto medio del intervalo de clase x : promedio f a : frecuencia absoluta
Variación promedio
x -S x x +S
A la izquierda se coloca la diferencia entre la media y la desviación estándar. En el centro se coloca la media. A
la derecha se coloca la suma entre la media y la desviación estándar.
Representa la mayor concentración de la variable en estudio.
7
MATEMÁTICA
Coeficiente de variación ( C v )
S
Cv = .100 %
x
Fractiles
Son parámetros que dividen los datos de la distribución en “PARTES”. Los más importantes son:
Cuartiles
Son tres valores que dividen las observaciones en cuatro partes iguales.
Quintiles
Son cuatro valores que dividen a las observaciones en cinco partes iguales. Se representan:
K1 , K 2 , K 3 , K 4
Deciles
Son nueve valores de la variable que dividen a las observaciones en diez partes iguales.
Se representan: D1 , D2 , D3 , D4 , D5 , D6 , D7 , D8 , D9
Percentiles
Son noventa y nueve valores de la variable que dividen a las observaciones en cien partes iguales. Se
representan: P1 , P2 ,.........., P99
Recorrido intercuartílico
Es la diferencia entre el tercer cuartil y el primer cuartil. Indica la amplitud del intervalo que contiene el
50 % de las observaciones centrales.
RQ Q3 Q1
8
MATEMÁTICA
Diagrama de Caja (Box Plot)
Ubica los valores Q1 , la mediana y Q 3 en la escala. Los valores determinan la parte de la “caja” en el
diagrama de caja. Los cuartiles determinan los extremos de la caja y se marca el valor de la mediana con una
línea dentro de la caja.
Dibuja dos líneas (llamadas bigotes) a partir de los extremos de la caja hasta los valores mínimo y máximo.
Mínimo Q1 Q2 Q3 Máximo
Mediana
xi fa fr f% Fa Fr Fr % x i' x i' . f a x
2
x . fa
'
i
Rango
R = 175 cm – 150 cm
R = 25 cm
Desviación estándar
S
(x '
i x)2. fa
n
1124 ,35
S
40
S 28,10
S 5,30 cm
Coeficiente de variación
S
Cv = .100 %
x
5,30
Cv = .100 %
162 ,625
C v 0,03 . 100 %
Cv 3 %
Recorrido intercuartílico
RQ Q3 Q1
Q1 Fr = 0,25
Se buscan las frecuencias relativas acumuladas anterior y posterior donde queda comprendida
Fr = 0,25 y se coloca el límite superior de cada intervalo.
10
MATEMÁTICA
Se establece una proporción.
Q 3 Fr = 0,75
Se buscan las frecuencias relativas acumuladas anterior y posterior donde queda comprendida
Fr = 0,75 y se coloca el límite superior de cada intervalo.
Q 3 166,82 cm
Diagrama de caja
11
MATEMÁTICA
ACTIVIDADES
12
MATEMÁTICA
13
MATEMÁTICA
14
MATEMÁTICA
15
MATEMÁTICA
16