Está en la página 1de 9

Transcripcin de Anlisis descriptivo de datos de una sola variable

ANLISIS DESCRIPTIVO DE DATOS DE UNA SOLA VARIABLE


Mo= 37.20
X = 37.18
Me= 36.46
Medidas de posicin
Medidas de tendencia central.
Medidas de tendencia no central
Medidas de Dispersin.
De tendencia central
De tendencia No central
Medidas de tendencia central
Cul es cul?
Mediana (Me):
La mitad de los datos son
menores y la mitad de los datos son mayores.
1.81 + 1.83
2
= 1.82
Moda (Mo):
La moda es el dato
que ms se repite.
Mo = 1.83
Media (X):
Es la suma de los datos dividido entre el nmero de datos.
1.69+1.73+1.75+1.81+1.83+1.83+1.94+2.01=
14.59
n=8
X=
14.59
8
= 1.82
Ejemplo:
Si tenemos las alturas (en metros) de 8 jugadores de futbl y queremos encontrar la
Media (X), la Moda (Mo), y la Mediana (Me) de la serie.
Datos ya ordenados
Tambin se le conoce como Promedio.
Me =
Las medidas de tendencia central informan sobre los valores medios del conjunto o serie
de datos.
Las medidas de tendencia central permiten analizar los datos en torno a un valor central.
Son indicadores usados para sealar que porcentaje de datos, dentro de una distribucin
de frecuencias, superan estas expresiones, cuyo valor representa el valor del dato que se
encuentra en el centro de la distribucin de frecuencias.
Ejercicio de comprobacin de conceptos
Ojo:
No hay que olvidar que previo a realizar cualquier clculo es necesario ordenar la serie
de datos en orden ascendente o descendente.
Si se tiene la estatura (en metros) de 6 jugadores de basketbol.
Por simple inspeccin indicar:
a) Cul es la Moda (Mo)

b) Cul es la Media (X)

c) Cul es la Mediana (Me)


Ejemplo:
X=
Ejercicio:
Indicar: cul es la media ( X )?
7,4, 16, 24, 1, 3
a) 9.2 b) 9.7
c) 55 d) 6
X

Como se calcula la media para datos agrupados en intervalos?


EJEMPLOS
/2 = 54.5
Listado con nmero impar de datos
}
}
Listado con nmero par de datos
0
0
Ejercicio:
Cul es la mediana?
a) 6, 8, 1, 7, 4, 9, 2, 6

b) 8, 11, 13, 16, 18, 22, 26


Como se calcula la Mediana para datos agrupados en intervalos?
Frecuencia acumulada
Ejemplo
Ejercicio:
Cual es la moda?
Cual es la moda?
o
10, 16, 23, 10, 8, 5, 8, 10, 16, 8
a) 10 b) 16 c) 5 d) 10 y 8
4, 24, 12, 36, 24, 48, 5, 12, 16, 24
a) 24 b) 12 c) 4 d) 24 + 48
Cuando existe ms de una Moda?
Mo =
Mo =
6, 7, 8
Como se calcula la Moda para datos agrupados en intervalos?
Ejemplo
Cantidad de computadoras que reportan daos diariamente en una oficina estatal,
durante un mes.
La moda se encuentra en la clase que tiene ms frecuencias. Se le llama CLASE
MODAL.
3
15 - 3 = 12
15 - 5 = 10
3
Mo = 3+
15-3
(15-3) + (15-5)
.3
Mo = 3+
12
12+10
.3
Mo = 3+1.64 = 4.64
Mo = 4.64
EJERCICIO2
Dada la siguiente Tabla de Distribucin de Frecuencias.
Se pide calcular:
a) La Media ( X )

b) La Mediana (Me)

c) La Moda (Mo)
Para calcular la posicin del dato central se puede utilizar la siguiente frmula:
( mediana de datos pares)
20
250
60
95
5
Medidas de tendencia No central
{
Las medidas de posicin No centrales permiten conocer otros puntos caractersticos de
la distribucin que no son los valores centrales.
Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en
tramos iguales.
Cuartiles
Primer cuartil
Tercer cuartil
Segundo cuartil
Q
Q
Q
1
2
3
Q2 = Mediana (Me)
Q1
Q2
Q3
Clculo de los cuartiles y Ejemplo
Ejemplo:
Encontrar los cuartiles del siguiente conjunto de datos:
7, 8, 12, 17, 29, 18, 4, 27, 30, 2, 4, 10, 21, 5, 18
Solucin:
Primero ordenar las observaciones.
2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, 27, 29, 30
n = 15 = impar
Q
Q

1
3
Clculo:
Posiciones:
Primer cuartil= 1* (15+1)/4 = 4
El dato que ocupa la cuarta posicin de la serie es el 5 Q1 = 5
Tercer cuartil = 3*( 15+1)/4 = 12
El dato 12 = 21 Q3 = 21
Ejercicio: Calcular Q2
Clculo de los cuartiles y Ejemplo
Para datos agrupados en intervalos
Pasos:
1. Posicionar el intervalo que contiene el cuartil buscado.
fi/4 * 1 ...................... Para el primer cuartil ( Q1 )
fi/4 * 2 ...................... Para el segundo cuartil ( Q2)
fi/4 * 3 ...................... Para el tercer cuartil (Q3)
$
$
Ejercicio:
Calcular:
Q2 y Q3
Ejemplo:
Percentiles
Existen algunos Percentiles (P) que se usan con ms frecuencia, por ejemplo:
Percentil 10 (P10) = Primer Decil (D1)
Percentil 25 (P25) = Primer Cuartil (Q1)
Percentil 50 (P50) = Segundo Cuartil (Q2)
Percentil 75 (P75) = Tercer Cuartil (Q3)
Percentil 90 (P90) = Noveno Decil (D9)
Clculo de los percentiles y Ejemplo
Para datos No agrupados
3, 4, 6, 7, 8, 9, 10, 11, 12, 15
P=6
30
EJERCICIO:
De la serie del ejemplo anterior. Calcular:
a) P
b) P
c) P
d) P
e) P
50
90
10
25
75
Clculo de los percentiles y Ejemplo
Para datos agrupados en intervalos
Paso 1: Ubicar el intervalo que contiene el percentil buscado. (Indice = p/100 * n)
55/100*40= 22
Ejercicio: Calcular P45 y P70
p = Indice = p/100*n
EJERCICIO2
Con los datos de la siguiente tabla de frecuencias. Calcular:
a) Q1, Q2 y Q3.

b) D3, D5, D6 y D9

c) P20, P50, P80


Clculo de los deciles y Ejemplo
Para datos No agrupados
D1
D4
D9
10, 11, 11, 12, 12, 13, 13, 13, 14, 15, 17, 18, 20
Ejercicio:
De la serie anterior. Calcular:
D3, D6 y D8
n = 13
Para los deciles con datos no agrupados se usa una frmula parecida a la de los
cuartiles, a saber:

Si se tiene una serie de valores X1, X2, X3... Xn


i*10%
(n+1)
i*10%
(n)
i = nmero de decil a calcular
1 2 3 4 5 6 7 8 9 10 11 12 13
10 11 11 12 12 13 13 13 14 15 17 18 20
Clculo de los Deciles y Ejemplo
Para datos agrupados en intervalos
Pasos:
1. Posicionar el intervalo que contiene el Decil buscado.
Ejercicio:
Calcular:
D7 y D9
Ejemplo:
$
Deciles
10
D
1
D:
D
1
)
50, 60
88
60, 70 10 18
70, 80 16 34
80, 90 14 48
90, 100 10 58
100, 110 5 63
110, 120 2 65
65
Clase fi FI
Calcular los Deciles 3 y 4 (D3 y D4) de la siguiente tabla de distribucin de frecuencias.
fi
10
*
Decil que se desea calcular
(1,2,3,4,5,6,7,8 o 9)
}
El resultado obtenido se localiza en la columna de Frecuencias acumuladas (FI) para
ubicar el intervalo que contiene el Decil buscado.
D = 70.94

D = 75
3
4
Deciles
Los deciles corresponden a 9 valores que dividen al conjunto de datos (ordenados) en
diez grupos iguales.
Cada uno de los diez tramos en que se divide el grupo de datos concentra el diez por
ciento (10 %) de los resultados.
}
El dato encontrado se busca en la columna de Frecuencias acumuladas para encontrar el
intervalo que contiene el cuartil buscado.
D1= 10.4
D4= 12.6
D9= 19.2
Medidas de Dispersin
Las medidas de dispersin nos sirven para cuantificar la separacin de los valores de
una distribucin.
RANGO
R = dato mayor - dato menor
Varianza(S)
Si elevamos al cuadrado las desviaciones, logramos que todas las desviaciones den
resultados positivos, luego si sumamos los cuadrados de las desviaciones y las
dividimos entre
n
, obtenemos la
varianza.
La varianza (S ) es la media aritmtica de los cuadrados de las desviaciones con
respecto
a la media aritmtica de la distribucin.
2
Desviacin Tpica o Estndar (S)
o
Esta medida de dispersin tiene las mismas unidades que los datos originales,
a diferencia de la varianza en la que las unidades estn expresadas por los cuadrados de
las unidades.
La desviacin estndar ( S ) se calcula obteniendo la raz cuadrada positiva de la
varianza.
2
Como se calcula el Rango
Para datos NO agrupados
Para datos agrupados en intervalos
Si se tiene la siguiente serie de datos:

10, 12,15, 17, 18, 20, 25, 28, 35, 40 y 46


Se ubica el dato mayor y el dato menor:
46= dato mayor 10= dato menor
Se aplica la frmula:
R= dato mayor - dato menor
R= 46 - 10 = 36
Si se tiene la siguiente tabla de frecuencias:
Se ubica el dato mayor y el dato menor:
5.8 = dato mayor 3.8 = dato menor
Se aplica la frmula:
R= dato mayor - dato menor
R= 5.8 - 3.8 = 2
Ejercicio:
Calcular el Rango de la siguiente serie de datos.
456, 476, 480, 450, 466, 566, 550, 545 y 400
La desviacin respecto a la media es la diferencia entre cada valor de la variable
estadstica y la Media Aritmtica.
D=X-X
i
La desviacin media es la media aritmtica de los
valores absolutos
de las desviaciones respecto a la media.
La desviacin media se representa por
D
x
Ejemplo:
Calcular la desviacin media de la siguiente distribucin:
9, 3, 8, 8, 9, 8, 9, 18
Primer paso: Calcular la media.
Segundo paso: Calcular la Desviacin Media aplicando la frmula.
0
6
1
1
0
1
0
9
18
8
=
2.25
Desviacin Media
Este resultado nos indica que 2.25 es el promedio de las distancias entre los datos y la
media.
Las rayas verticales de la frmula nos indican que se han de sumar los valores absolutos
de las desviaciones,
es decir que debemos sumar todos los valores sin tomar en cuenta el signo negativo.
Ejercicio:
Calcular la desviacin media de las siguientes distribuciones:
a) 3, 8, 5, 9 y 10 b) 8, 12, 20, 24, 28, 36, 40, 45 y 48
Calculo de la Varianza para datos NO agrupados

Frmula
S
S
=
=
2
2
Ejemplo:
Calcular la Varianza de la siguiente distribucin:
9, 3, 8, 8, 9, 8, 9, 18
Paso 1. Calcular la media.
Paso 2. Calcular la Varianza segn frmula.
Si calculamos las desviaciones y luego las elevamos al cuadrado, logramos que todas
las desviaciones den resultados positivos, luego si sumamos los cuadrados de las
desviaciones y las dividimos entre
n
, obtenemos la VARIANZA.
La Varianza nos sirve de base para calcular la Desviacin Estndar, que es la ms
importante de todas las medidas de dispersin.
Clculo de la Desviacin Estndar (S) para datos NO agrupados
Frmulas
S=
S=
Ejemplo:
Calcular la Desviacin Estndar de la siguiente distribucin:
9, 3, 8, 8, 9, 8, 9, 18
1. Primer Paso. Calcular la Media.
2. Paso. Calcular la Desviacin Estandr segn la frmula.
Ejercicio:
Calcular la Desviacin Estndar de las siguientes distribuciones:
a) 8, 12, 20, 24, 28, 36, 40, 45, 48 b) 2, 8, 10, 12, 3, 9, 12, 14, 7, 8, 16
EJERCICIO2
De la anterior tabla de distribucin de frecuencias, se pide calcular las siguientes
medidas de dispersin:
a) Rango.
b) Varianza
c) Desviacin Tpica o Estndar
Interpretar y comentar los resultados.
EJERCICIO1
Comparar los resultados siguientes de diez estudiantes en dos materias.
Matemticas
Historia
52 18 31 68 78 16 94 40 75 64
42 39 60 54 61 58 46 49 60 67
a) Cul es el Rango para cada materia?
b) Por qu se dice que los resultados de matemticas estn ms dispersos?
c) Cul es la Desviacin Estndar de cada materia.
EJERCICIO1
Comparar los resultados siguientes de diez estudiantes en dos materias.
Matemticas
Historia
52 18 31 68 78 16 94 40 75 64
42 39 60 54 61 58 46 49 60 67
a) Cul es la media (X) para cada materia?
b) Cul es la mediana (Me) para cada materia?
c) Cul es la moda (Mo) para cada materia?
EJERCICIO1
Comparar los resultados siguientes de diez estudiantes en dos materias.
Matemticas
Historia
52 18 31 68 78 16 94 40 75 64
42 39 60 54 61 58 46 49 60 67
a) Cul es la nota, para cada materia, que deja la cuarta parte de las notas por encima y
las tres cuartas partes por debajo?

b) A partir de que puntuacin, para cada materia, se encuentran el 15% de los


estudiantes con nota ms alta?

c) Si descontamos el 20% de los estudiantes con notas ms bajas y el 20% de notas ms


altas para ambas materias. En que intervalo de puntuacin se encuentran los restantes?
Clculo de la Varianza para datos agrupados en intervalos