Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Descriptiva
Estadistica Descriptiva
QU ES LA ESTADSTICA?
Estadstica descriptiva
La estadstica descriptiva es un conjunto de procedimientos que tienen por objeto
presentar masas de datos por medio de tablas, grficos y/o medidas de resumen.
De acuerdo a lo anterior, la estadstica descriptiva es la primera etapa a
desarrollar en un anlisis de informacin.
Tablas de Frecuencias:
Una forma de presentar ordenadamente un grupo de observaciones, es a travs
de tablas de distribucin de frecuencias. La estructura de estas tablas depende de
la cantidad y tipo de variables que se estn analizando, siendo las ms simples las
que se refieren a una variable.
NOTA
1,2
1,4
1,6
1,8
2,0
2,2
2,4
2,6
2,8
3,0
3,2
3,4
3,6
3,8
4,0
FRECUENCIA
NOTA
FRECUENCIA
1
2
3
8
15
18
19
22
25
26
28
31
35
38
45
4,2
4,4
4,6
4,8
5,0
5,2
5,4
5,6
5,8
6,0
6,2
6,4
6,6
6,8
7,0
46
48
52
58
60
56
54
51
50
46
44
40
32
31
18
Frecuencia Absoluta
Frecuencia Relativa
NOTA
1,2
1,4
1,6
1,8
2,0
2,2
2,4
2,6
2,8
3,0
3,2
3,4
3,6
3,8
4,0
4,2
4,4
4,6
4,8
5,0
5,2
5,4
5,6
5,8
6,0
6,2
6,4
6,6
6,8
7,0
TOTAL
FREC.
ABSOLUTA
1
2
3
8
14
18
19
22
25
26
27
31
35
38
45
46
48
52
58
60
56
54
51
50
46
44
40
32
31
18
FREC.
ABSOLUTA
ACUMULADA
FREC.
RELATIVA
FREC RELATIVA
ACUMULADA
1
3
6
14
28
46
65
87
112
138
165
196
231
269
314
360
408
460
518
578
634
688
739
789
835
879
919
951
982
1000
0,001
0,002
0,003
0,008
0,014
0,018
0,019
0,022
0,025
0,026
0,027
0,031
0,035
0,038
0,045
0,046
0,048
0,052
0,058
0,060
0,056
0,054
0,051
0,050
0,046
0,044
0,040
0,032
0,031
0,018
0,00
0,00
0,01
0,01
0,03
0,05
0,07
0,09
0,11
0,14
0,17
0,20
0,23
0,27
0,31
0,36
0,41
0,46
0,52
0,58
0,63
0,69
0,74
0,79
0,84
0,88
0,92
0,95
0,98
1
1000
Nota:
Si la frecuencia relativa y relativa acumulada la multiplicamos por 100, los
valores obtenidos representan porcentajes, lo que facilita la interpretacin de
los datos.
HISTOGRAMA
70
FRECUENCIAS
60
50
40
30
20
10
1,2
1,4
1,6
1,8
2
2,2
2,4
2,6
2,8
3
3,2
3,4
3,6
3,8
4
4,2
4,4
4,6
4,8
5
5,2
5,4
5,6
5,8
6
6,2
6,4
6,6
6,8
7
0
NOTAS
En el ejemplo se puede observar que se representan los 30 valores que toman las
notas. La frecuencia ms alta de alumnos la alcanza la nota 5,0
POLIGONO DE FRECUENCIA
70
FRECUENCIA
60
50
40
30
20
10
1,2
1,4
1,6
1,8
2
2,2
2,4
2,6
2,8
3
3,2
3,4
3,6
3,8
4
4,2
4,4
4,6
4,8
5
5,2
5,4
5,6
5,8
6
6,2
6,4
6,6
6,8
7
0
NOTAS
800
600
400
200
0
1,2
1,4
1,6
1,8
2
2,2
2,4
2,6
2,8
3
3,2
3,4
3,6
3,8
4
4,2
4,4
4,6
4,8
5
5,2
5,4
5,6
5,8
6
6,2
6,4
6,6
6,8
7
FRECUENCIA
1000
NOTAS
FREC.
ABSOLUTA
FREC.
ABSOLUTA
ACUMULADA
FREC.
RELATIVA %
FREC RELATIVA
ACUMULADA %
xi*ni
1,2
1,4
1,6
1,8
2,0
2,2
2,4
2,6
2,8
3,0
3,2
3,4
3,6
3,8
4,0
4,2
4,4
4,6
4,8
5,0
5,2
5,4
5,6
5,8
6,0
6,2
6,4
6,6
6,8
7,0
1
2
3
8
14
18
19
22
25
26
27
31
35
38
45
46
48
52
58
60
56
54
51
50
46
44
40
32
31
18
1
3
6
14
28
46
65
87
112
138
165
196
231
269
314
360
408
460
518
578
634
688
739
789
835
879
919
951
982
1000
0,1
0,2
0,3
0,8
1,4
1,8
1,9
2,2
2,5
2,6
2,7
3,1
3,5
3,8
4,5
4,6
4,8
5,2
5,8
6,0
5,6
5,4
5,1
5,0
4,6
4,4
4,0
3,2
3,1
1,8
0,1
0,3
0,6
1,4
2,8
4,6
6,5
8,7
11,2
13,8
16,5
19,6
23,1
26,9
31,4
36,0
40,8
46,0
51,8
57,8
63,4
68,8
73,9
78,9
83,5
87,9
91,9
95,1
98,2
100,0
1,2
2,8
4,8
14,4
28,0
39,6
45,6
57,2
70,0
78,0
86,4
105,4
126,0
144,4
180,0
193,2
211,2
239,2
278,4
300,0
291,2
291,6
285,6
290,0
276,0
272,8
256,0
211,2
210,8
126,0
TOTAL
1000
4717,0
x=
x
i =1
x=
x n
i
i =1
Donde:
ni
xi
n
x=
4717
= 4,717
1000
Observaciones:
1.
2.
Mediana:
n
2 ( N i )Me1
Me = Li +
a
(ni )Me
Donde:
Li
(Ni)Me-1
(ni)me
ni
a
:
:
:
:
:
2 460
Me = 4,8 +
0 = 4,8
518
Propiedades:
Moda:
MEDIDAS DE POSICIN
n
k
N i 1
100
Pk = Li +
*a
ni
con k= 1,2,3,... 99
Donde
Li
Ni-1
ni
P87
1000
87
835
100
* 0 = 6,2
= 6,2 +
44
Son los nueve valores que dividen al conjunto de datos ordenados en diez
porciones iguales, son tambin un caso particular de los percentiles, pues
corresponden a los percentiles 10, 20, 30, 40, 50, 60, 70, 80 y 90.
Para datos agrupados los deciles se calculan mediante la frmula.
n
k N i 1
10
*a
Dk = Li +
ni
con k= 1,2,3,... 9
Donde:
Li
Ni-1
ni
D4 = 4,4 +
* 0 = 4,4
48
Son los tres valores que dividen al conjunto de datos ordenados en cuatro
porciones iguales, son un caso particular de los percentiles, correspondiendo a los
percentiles 25, 50 y 75.
- El primer cuartil Q1 es el valor de la variable que deja a la izquierda el 25% de la
distribucin.
- El segundo cuartil Q2 (la mediana), es el valor de la variable que deja a la
izquierda el 50% de la distribucin.
- El tercer cuartil Q3 es el valor de la variable que deja a la izquierda el 75% de la
distribucin.
Para el ejemplo, se tienen los siguientes cuartiles
Q 1:
n
= 250 Primero N i n = 269 ; luego Q1 =3,8
4
4
2n
= 250 Primero N i 2n = 518 ; luego Q2 = 4,8
4
4
3n
= 250 Primero N i 3n = 789 ; luego Q3 = 5,8
4
4
El 75% de los alumnos obtuvieron una nota igual o inferior a 5,8, o bien, el 25% de
los alumnos tuvieron nota superior a 5,8.
Quintiles
Son los cuatro valores que dividen al conjunto de datos ordenados en cinco
porciones iguales, son un caso particular de los percentiles, correspondiendo a los
percentiles 20, 40, 60, 80.
El primer quintil es el valor de la variable que deja a la izquierda el 20% de la
distribucin.
El segundo quintil es el valor de la variable que deja a la izquierda el 40% de
la distribucin.
El tercer quintil es el valor de la variable que deja a la izquierda el 60% de la
distribucin.
El cuarto quintil es el valor de la variable que deja a la izquierda el 80% de la
distribucin.
n
k N i 1
5
K k = Li +
*a
ni
con k = 1, 2, 3, 4
Donde:
Li
: Nmero de datos.
Ni-1
ni
K 3 = 5,2 +
* 0 = 5,2
56
El 60% de los alumnos obtuvieron una nota igual o inferior a 5,2 o bien, el 40% de
los alumnos tuvieron nota superior a 5,2
MEDIDAS DE DISPERSIN
Una desviacin estndar grande indica que los puntos estn lejos de la media, y
una desviacin pequea indica que los datos estn agrupados cerca de la media.
S=
(x x )
i =1
n 1
S=
NOTA
1,2
1,4
1,6
1,8
2,0
2,2
2,4
2,6
2,8
3,0
3,2
3,4
3,6
3,8
4,0
4,2
4,4
4,6
4,8
5,0
5,2
5,4
5,6
5,8
6,0
6,2
6,4
6,6
6,8
7,0
TOTAL
FREC.
ABSOLUTA
1
2
3
8
14
18
19
22
25
26
27
31
35
38
45
46
48
52
58
60
56
54
51
50
46
44
40
32
31
18
1000
FREC.
ABSOLUTA
ACUMULADA
1
3
6
14
28
46
65
87
112
138
165
196
231
269
314
360
408
460
518
578
634
688
739
789
835
879
919
951
982
1000
ni x i
K
ni xi2 i =1
n
i =1
n 1
FREC.
RELATIVA %
FREC RELATIVA
ACUMULADA %
xi*ni
xi2*ni
0,1
0,2
0,3
0,8
1,4
1,8
1,9
2,2
2,5
2,6
2,7
3,1
3,5
3,8
4,5
4,6
4,8
5,2
5,8
6,0
5,6
5,4
5,1
5,0
4,6
4,4
4,0
3,2
3,1
1,8
0,1
0,3
0,6
1,4
2,8
4,6
6,5
8,7
11,2
13,8
16,5
19,6
23,1
26,9
31,4
36,0
40,8
46,0
51,8
57,8
63,4
68,8
73,9
78,9
83,5
87,9
91,9
95,1
98,2
100,0
1,2
2,8
4,8
14,4
28,0
39,6
45,6
57,2
70,0
78,0
86,4
105,4
126,0
144,4
180,0
193,2
211,2
239,2
278,4
300,0
291,2
291,6
285,6
290,0
276,0
272,8
256,0
211,2
210,8
126,0
1,44
3,92
7,68
25,92
56,00
87,12
109,44
148,72
196,00
234,00
276,48
358,36
453,60
548,72
720,00
811,44
929,28
1100,32
1336,32
1500,00
1514,24
1574,64
1599,36
1682,00
1656,00
1691,36
1638,40
1393,92
1433,44
882,00
4717,0
23970,12
S2 =
23970,12
999
4717 2
1000 = 1,72
S = S 2 = 1,3114
MEDIDAS DE FORMA
As =
3( x Me)
Sx
As =
3(4,717 4,8 )
= -0,1898
1,3114
Por lo tanto, las notas de los alumnos tienen una distribucin ligeramente
asimtrica negativa.
En el siguiente histograma se pueden observar las medidas de tendencia central
y posicin de nuestro ejemplo, adems, se puede ver fcilmente que la
distribucin es asimtrica negativa.
DISTRIBUCIN NORMAL
NORMALIZACIN
Ejemplo:
Si en la PSU de Lenguaje y Comunicacin, rendida en la Admisin 2007 por
212.723 postulantes, el 15,87 % de stos tienen 610 o ms puntos, esto significa
que 33.759 de ellos sacaron 610 o ms puntos y el resto obtuvo puntajes
menores.
Nota:
ANEXO
Xw =
x w n
w n
i
i i
i i
ponderaciones.
= NEM
LyC
MAT
CS
=
=
=
=
20%
25%
25%
30%
Puntajes
= NEM
LyC
MAT
CS
=
=
=
=
600
680
620
650
64.000
= 640 ptos.
100%
x=
x=
x=
Esta misma frmula se emplea para calcular el promedio de un grupo a partir del
conocimiento del promedio y de la cantidad de casos que hay en cada subgrupo
de l.
Un ejemplo de este caso es el clculo del promedio de notas en Educacin Media
a partir de los promedios de 1, 2, 3 y 4 ao medio.
Normalmente los postulantes suman los promedios de sus notas de enseanza
media y lo dividen por 4, ignorando la ponderacin de cada promedio por cuanto el
nmero de asignaturas de cada curso es distinto.
A continuacin, se describen otros conceptos de media de escasa utilizacin en
educacin.
Slo es relevante la media geomtrica si todos los nmeros son positivos. Si uno
de ellos es 0, entonces el resultado es 0. Si hay un nmero negativo (o una
cantidad impar de ellos) entonces la media geomtrica es, o bien negativa o bien
inexistente en los nmeros reales.
En muchas ocasiones se utiliza su trasformacin en el manejo estadstico de
variables con distribucin no normal.
La media geomtrica es relevante cuando varias cantidades son multiplicadas
para producir un total.
MEDIA ARMNICA: Es la inversa de la media aritmtica de los inversos de los
valores de la variable, se representa por H, y responde a la siguiente expresin:
H=
n
n
xii
Como ejemplo se muestra el caso de las edades de las tres personas 80, 55
y 30 aos.
H=
3
3
3
132000 3
=
=
=
1 +1 +1
1650 + 2400 + 4400 8450
8450
80
55
30
132000
132000
396000
= 46,86 aos
8450