Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Descriptiva Curso Completo
Estadística Descriptiva Curso Completo
La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer
Recogida de datos.
Anlisis de datos.
Obtencin de conclusiones.
Co nce p t o s d e Es t a d s t i ca
Poblacin
Una poblacin es el conjunto de todos los elementos a los que se somete a un estudio estadstico.
Individuo
Un
individuo
unidad
estadstica
es
cada
uno
de
los
Muestra
Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin.
Muestreo
El muestre o es la reuni n de datos que se desea estudiar, obtenidos poblacin. de una proporcin reducida y representativa de la
Valor
Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.
Dato
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadsti co. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz
Definicin de variable
Una variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin .
Ti p o s d e va r i a ble e s t a d s t i ca s
Va r i a b l e cua l i t at i va
Las variables cualitativas cualidades que no pueden ser se refieren a medidas con caractersticas o nmeros. Podemos
Una variable cualitativa nominal presenta modalidades no numricas que no admiten un criterio de orden. Por ejemplo:
El
estado
civil,
con
las
siguientes
modalidades:
soltero,
Una variable cualitativa ordinal presenta modalidades no nmericas, en las que existe un orden. Por ejemplo:
La
nota
en
un
examen:
suspenso,
aprobado,
notable,
sobresaliente.
Va r i a b l e cua nt i ta t i va
Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar o peraciones aritmticas con ella. Podemos distinguir dos tipos:
Variable discreta
Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores
Variable continua
Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros. Por ejemplo:
En
la
prctica
medimos
la
altura
con
dos
decimales,
pero
Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estad stico.
La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.
Para
indicar
resumidamente
estas
sumas
se
utiliza
la
letra
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos.
Frecuencia acumulada
La
es
la
suma de o
absolutas
valores
inferiores
considerado.
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 3 1, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En
la
primera
columna
de
la
tabla
colocamos
la
variable
ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
xi
Recuento
fi
Fi
ni
Ni
27
0.032
0.032
28
II
0.065
0.097
29
0.194
0.290
30
16
0.226
0.516
31
24
0.258
0.774
32
III
27
0.097
0.871
33
III
30
0.097
0.968
34
31
0.032
31
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su
frecuencia correspondiente .
Lmites de la clase
Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase .
Amplitud de la clase
La
amplitud
de
la
clase
es
la
diferencia
entre
el
lmite
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros.
Co ns t r ucci n d e una t a b l a d e da t o s a g r up a d o s
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1 Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48.
2 Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos
queramos establecer.
Se
forman
los
intervalos
teniendo
presente
que
el
lmite
inferior de una clase pertenece al intervalo, pero el lmite superior no pertenece intervalo, se cuenta en el siguiente interval o.
ci
fi
Fi
ni
Ni
[0, 5)
2.5
0.025
0.025
[5, 10)
7.5
0.025
0.050
40
D i a g r am a d e b ar r a s
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto .
Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas .
Los
datos
se
representan
mediante
barras
de
una
altura
proporcional a la frecuencia.
Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguneo ha dado el siguiente resultado:
Grupo fi sanguneo
AB
20
Po l g o no s d e f re cue nci a
Un polgono de frecuencias se forma uniendo los extremos de las barras mediante segmentos.
Tambin
se
puede
realizar
trazando
los
puntos
que
Ejemplo
Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes variaciones:
Hora
Temperatura
12
12
14
15
11
18
12
21
10
24
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables
cualitativas.
Los
datos
se
representan
en
un
crculo,
de
modo
que
el
El
diagrama
circular
se
construye
con
la
ayuda
de
un
transportador de ngulos.
Ejemplo
En practican
una la
clase
de
30 4
alumnos, al
12 ftbol
juegan y el
baloncesto, no
natacin,
juegan
resto
practica
ningn deporte.
Alumnos
ngulo
Baloncesto
12
144
Natacin
36
Ftbol
108
Sin deporte
72
Total
30
360
Un
histograma
es
una
representacin
grfica
de
una
Se
utilizan
para
variables
continuas
para
variables
En el eje abscisas se construyen unos rectngulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo.
Polgono de frecuencia
Para construir el polgono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectngulo.
Ejemplo
ci [50, 60) 55
fi 8
Fi 8
[60, 70)
65
10
18
[70, 80)
75
16
34
[80, 90)
85
14
48
[90, 100)
95
10
58
[100, 110)
110
63
[110, 120)
115
65
65
Hi s t o g r am a s con i nt e r va l o s d e a m p l i t ud di f er ent e
Para construir un histogramas con intervalo de amplitud diferente tenemos que calcular las alturas de los rectngulos del histograma.
Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos.
fi [0, 5) 15
hi 3
[5, 7)
20
10
[7, 9)
12
[9, 10)
50
Un parmetro estadstico es un nmero que se obtiene a partir de los datos de una distribucin estadstica.
Los
parmetros
estadsticos
sirven
para
sintetizar
la
Ti p o s d e p a r me t r o s e s t a d s t i co s
Hay tres tipos parmetros estadsticos :
De centralizacin.
De posicin
De dispersin.
M e d i d a s d e ce ntr a l i za ci n
Nos indican en torno a qu valor (centro) se distribuyen los datos.
Media aritmtica
Mediana
La mediana es la puntacin de la escala que separa la mitad superior de la distribucin y la inferior, es decir divide la serie de datos en dos partes iguales.
Moda
M e d i d a s d e p o s ici n
Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos.
Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor.
Cuartiles
Los iguales.
cuartiles dividen
la
serie
de
datos
en
cuatro
partes
Deciles
Percentiles
Los iguales.
percentiles
dividen
la
serie
de
datos
en
cien
partes
M e d i d a s d e d i s pe r s i n
Las
medidas
de
dispersin
nos
informan
sobre
cuanto
se
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.
Desviacin media
La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media.
Varianza
La varianza es la
media aritmtica
Desviacin tpica
Definicin de moda
Se
puede
hallar
la
moda
para
variables
cualitativas
cuantitativas.
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si mxima,
dos la
puntuaciones moda es el
adyacentes promedio de
tienen las
la
frecuencia puntuaciones
dos
adyacentes.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
fi--1
es
la
frecuencia
absoluta
inmediatamente
inferior
la
clase modal.
ai es la amplitud de la clase.
Ejemplo
Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:
fi [60, 63) 5
[63, 66)
18
[66, 69)
42
[69, 72)
27
[72, 75)
100
Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda.
fi [0, 5) 15
hi 3
[5, 7)
20
10
[7, 9)
12
[9, 10)
50
Definicin de mediana
Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor.
La
mediana
se
puede
hallar
slo
para
variables
cuantitativas.
Clculo de la mediana
1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un nmero impar de medidas la mediana
es la puntuacin central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
Si
la
serie
tiene
un
nmero
par
de
puntuaciones
la
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
Es
decir .
tenemos
que
buscar
el
intervalo
en
el
que
se
encuentre
Li
es
el
lmite
inferior
de
la
clase
donde
se
encuentra
la
mediana.
ai es la amplitud de la clase.
La
mediana
es
independiente
de
las
amplitudes
de
los
intervalos.
Ejemplo
Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla:
fi [60, 63) 5
Fi 5
[63, 66)
18
23
[66, 69)
42
65
[69, 72)
27
92
[72, 75)
100
100
100/2 = 50
La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de datos.
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la media es:
En obtenido
un las
test
realizado
un
grupo
de
42 la
personas tabla.
se
han la
puntuaciones
que
muestra
Calcula
puntuacin media.
xi [10, 20) 15
fi 1
xi fi 15
[20, 30)
25
200
[30,40)
35
10
350
[40, 50)
45
405
[50, 60
55
440
[60,70)
65
260
[70, 80)
75
150
42
1 820
La suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica 7.6 es igual a 0:
= 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0
1.
La
media
se
puede
hallar
slo
para
variables
cuantitativas.
La
media
es
igual
74
kg,
que
es
una
medida
de
fi 5
[63, 66)
64.5
18
[66, 69)
67.5
42
[69, 72)
70.5
27
[72, )
100
En este caso no es posible hallar la media porque no podemos calcular la marca de clase de ltimo intervalo
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
1 Ordenamos los datos de menor a mayor. 2 Buscamos el lugar que ocupa cada cuartil mediante la
expresin .
2, 5, 3, 6, 7, 4, 9
2, 5, 3, 4, 6, 7, 1, 9
En
primer
lugar
buscamos
la
clase
donde
se
encuentra
Li cuartil.
es
el
lmite
inferior
de
la
clase
donde
se
encuentra
el
Fi-1 cuartil.
es
la
frecuencia
acumulada
anterior
la
clase
del
ai es la amplitud de la clase.
Ejercicio de cuartiles
fi [50, 60) 8
Fi 8
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
En
primer
lugar
buscamos
la
clase
donde
se
encuentra
ai es la amplitud de la clase.
Ejercicio de deciles
fi [50, 60) 8
Fi 8
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
Li
es
el
lmite
inferior
de
la
clase
donde
se
encuentra
el
percentil.
Fi-1 percentil.
es
la
frecuencia
acumulada
anterior
la
clase
del
ai es la amplitud de la clase.
Ejercicio de percentiles
fi [50, 60) 8
Fi 8
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65
Percentil 35
Percentil 60
La desviacin respecto a la media es la diferencia en valor absoluto entre cada valor de la variable estadstica y la aritmtica. media
Di = |x - x|
D e s vi a ci n me di a
La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media .
Ejemplo
9, 3, 8, 8, 9, 8, 9, 18
D e s vi a ci n me di a p a r a d a to s ag r up a d o s
Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:
Ejemplo
|x - x| xi fi xi fi |x - x| fi
[30,
32.5
65
10.174
21.428
35)
21
457.5
98.57
La varianza es la media aritmtica del cuadrado de las desviaciones re spe cto a la media de una distribucin estadstica. La varianza se representa por .
Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las ante riores.
Ejercicios de varianza
9, 3, 8, 8, 9, 8, 9, 18
xi [10, 20) 15
fi 1
xi fi 15
xi2 fi 225
[20, 30)
25
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
405
18 225
[50, 60
55
440
24 200
[60,70)
65
260
16 900
[70, 80)
75
150
11 250
42
1 820
88 050
Pr o p i e d a d e s d e l a va r i a nza
Para
simplificar
el
clculo
vamos
utilizar
las
siguientes
9, 3, 8, 8, 9, 8, 9, 18
xi [10, 15 20)
fi
xi fi
xi2 fi
15
225
18 225
24 200
11 250
42
88
820
050
Pr o p i e d a d e s d e l a d e s vi a ci n t p i ca
1 La desviacin tpica ser siempre un valor positivo o
cero, en el caso de que las puntuaciones sean iguales.
Co e f i ci e nte d e va r i a ci n
El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media.
El
coeficiente
de
variacin
se
suele
expresar
en
porcentajes:
El
coeficiente de dos
de
variacin
permite
las sus
dispersiones
distribuciones
distintas,
Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre s.
Ejercicio
Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 25. Cul de las dos presenta mayor dispersin?
Punt ua ci o ne s t p i ca s
Puntuaciones diferenciales
Las puntuaciones diferenciales resultan de restarles a las puntuaciones directas la media aritmtica .
xi = Xi X
Puntuaciones tpicas
Las
puntuaciones
tpicas
son
el la
resultado
de
dividir tpica.
las Este
puntuaciones
diferenciales
entre
desviacin
Las puntuaciones tpicas son adimensionales, es decir, son independientes de las unidades utilizadas.
Las
puntuaciones
tpicas
se
utilizan
para
comparar
las
Ejemplo
En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 54.4 kg. Las
desviaciones tpicas de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de Jos es de 70 kg y el de Ana es 65 kg. Cul de ellos puede, dentro de l grupo de alumnos de su sexo, considerarse ms grueso?