Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MARZO 2007
INTRODUCCIN
La necesidad de fortalecer la produccin, el uso y la divulgacin de la informacin
estadstica, requerida por cada uno de los organismos e instituciones, se ha evidenciado
desde los inicios de la conformacin del Comit de Coordinacin de Estadsticas
Estadales y Municipales del Estado Vargas (CCEEM-Vargas), adems en las distintas,
reuniones, mesas de trabajo, talleres y particularmente durante la realizacin del Taller
de Construccin Colectiva del Plan de Accin del CCEEM 2007, dictado en el mes de
Octubre de 2006; donde en varias oportunidades los representantes de los organismos e
instituciones solicitaron capacitacin en el rea a la Gerencia Estadal de Estadsticas
Vargas.
En vista de lo anterior expuesto, la Gerencia Estadal de Estadstica Vargas decidi
emprender el proceso de capacitacin elaborando una gua de estudio de Estadstica
Bsica, la cual servir de base para el dictado del primer taller que ser por parte del
personal de dicha Gerencia. Con la finalidad de contribuir en el fortalecimiento de la
produccin de informacin estadstica, as como el uso de la misma, todo ello en aras
de fomentar la cultura estadstica en el Estado Vargas.
En el presente material se consideran los conocimientos bsicos necesarios para el
anlisis e interpretacin de los datos, abordando todos los aspectos bsicos de la
estadstica descriptiva como lo son la ordenacin y clasificacin de los datos,
presentacin en tablas, cuadros, tabulados y grficos. As como los estadsticos ms
utilizados: Totales, Media, Mediana, Desviacin Tpica, Proporciones y Razones.
Objetivo General
Brindar apoyo terico, conceptual y metodolgico a los participantes de los talleres
vinculados con la produccin estadstica, de acuerdo con las necesidades de los
organismos e instituciones a los cuales pertenecen.
Propsito
La Gua de Estudios de Estadstica Bsica, acompaada de una serie de talleres, dirigido
en principio a los participantes del CCEEM-Vargas, pretende mejorar la produccin, el
uso y la divulgacin de la informacin estadstica; as como el fortalecimiento de una
Cultura Estadstica necesaria e importante en la planificacin y la toma de decisiones de
los distintos organismos e instituciones que hacen vida en el Estado.
NDICE
NOCIONES BSICAS DE ESTADSTICA ............................................................................................................. 1
CONCEPTO DE ESTADSTICA .................................................................................................................................. 1
OBJETIVO DE LA ESTADSTICA ................................................................................................................................ 1
CLASIFICACIN DE LA ESTADSTICA ........................................................................................................................ 1
IMPORTANCIA DE LA INFORMACIN ESTADSTICA .................................................................................................. 2
CONCEPTOS BSICOS DE ESTADSTICA.......................................................................................................... 2
UNIVERSO ............................................................................................................................................................. 2
POBLACIN .......................................................................................................................................................... 2
MUESTRA .............................................................................................................................................................. 3
VARIABLE ESTADSTICA .......................................................................................................................................... 3
DATOS .................................................................................................................................................................. 3
ENCUESTA ............................................................................................................................................................. 3
CENSO .................................................................................................................................................................. 3
Tipos de Censo .............................................................................................................................................. 4
Censo de Derecho o de Jure..................................................................................................................................4
Censos de Hecho o de Facto.................................................................................................................................4
MUESTREO ............................................................................................................................................................ 4
VENTAJAS DEL MUESTREO ..................................................................................................................................... 4
UNIDAD DE ANLISIS ............................................................................................................................................ 5
UNIDAD DE OBSERVACIN ................................................................................................................................... 5
COBERTURA HORIZONTAL .................................................................................................................................... 5
COBERTURA VERTICAL .......................................................................................................................................... 5
ORGANIZACIN Y REPRESENTACIN DE LOS DATOS................................................................................ 8
TIPOS DE DATOS OBSERVABLES ............................................................................................................................. 8
ESCALAS DE MEDICIN ......................................................................................................................................... 8
REPRESENTACIN GRFICA DE LOS DATOS.................................................................................................. 9
GRFICO ............................................................................................................................................................... 9
OBJETIVOS DE LOS GRFICOS ESTADSTICOS........................................................................................................ 10
DISTRIBUCIN DE FRECUENCIA .................................................................................................................... 13
DEFINICIN DE DISTRIBUCIN DE FRECUENCIA ................................................................................................... 13
COMPONENTES DE UNA DISTRIBUCIN DE FRECUENCIA ..................................................................................... 13
MEDIDAS DE ANLISIS DE DATOS ................................................................................................................. 16
MEDIDAS DE TENDENCIA CENTRAL............................................................................................................... 17
PROMEDIO .......................................................................................................................................................... 17
MEDIA ARITMTICA.............................................................................................................................................. 17
Caso datos no agrupados ........................................................................................................................... 18
Caso datos agrupados ................................................................................................................................. 18
MEDIA PONDERADA ............................................................................................................................................ 19
MEDIANA ............................................................................................................................................................ 20
Caso datos no agrupados ........................................................................................................................... 20
Cuando n es impar (n = 2k +1) ...............................................................................................................................20
Cuando n es par (n = 2k) .........................................................................................................................................21
Objetivo de la Estadstica
La Estadstica tiene por objetivo obtener, agrupar, ordenar y clasificar de manera
adecuada la informacin que se deriva de los diferentes fenmenos que ocurren, tanto
en los propios de la naturaleza, como los derivados de la actividad del hombre, de
manera tal de analizarlos mediante los mtodos apropiados a fin de crear modelos que
nos orienten en la toma de decisiones, la prediccin e inferencia en universos
considerados y poder llegar a deducir las leyes que rigen dichos fenmenos.
Clasificacin de la Estadstica
La Estadstica se puede clasificar en descriptiva, cuando los resultados del anlisis no
pretenden ir ms all del conjunto de datos, e inductiva cuando el objetivo del estudio
es derivar las conclusiones obtenidas a un conjunto de datos ms amplio.
Estadstica descriptiva: Estudia unos determinados caracteres o aspectos referidos a
un colectivo de personas, objetos o elementos de una naturaleza especfica. En otras
palabras, la Estadstica descriptiva se ocupa de la recoleccin, clasificacin,
ordenacin, tabulaciones y representaciones grficas de los datos estadsticos que se
deriven de la medicin de las caractersticas objeto de estudio en los elementos
seleccionados.
fenmenos especficos.
Permite conocer los fenmenos en una perspectiva integral de relaciones entre los
procesos.
cabo.
Nos permite tener una visin clara para realizar los planes.
Poblacin
Es el conjunto de individuos, sujetos o elementos con una o varias caractersticas en
comn, que se pretende estudiar en una investigacin cientfica y de la cual se obtiene
una muestra.
Variable estadstica
Caracterstica de un elemento objeto de investigacin que puede ser medida. Ejemplo:
La Edad.
Datos
Son nmeros o medidas que han sido recopilados como resultados de observaciones.
Encuesta
Tcnica de investigacin dirigida al estudio cuantitativo o cualitativo de las opiniones y
comportamientos de conjuntos numerosos de personas.
Censo
Estudio de una zona determinada que da como resultado la enumeracin de toda la
poblacin y la recopilacin de la informacin demogrfica, social o econmica,
concerniente a dicha poblacin en un momento dado.
Tipos de Censo
Se empadrona a todas las personas con relacin a la vivienda en que estn presentes en
el momento censal.
Muestreo
El muestreo propiamente dicho consiste (evidentemente) en la obtencin efectiva de la
muestra, esto es, en la recoleccin de los elementos o datos que la constituyen. La
utilizacin de los distintos tipos y mtodos de muestreo estadstico depende siempre de
la investigacin que se est llevando a cabo y de las condiciones generales en la cual
sta se realiza, en efecto, no siempre es aconsejable la utilizacin del muestreo, pese a
la gran bondad que supone su aplicacin en el anlisis de poblaciones grandes.
Unidad de Anlisis
Corresponde a la unidad que se examina, es decir, de la que se busca la informacin y
su naturaleza depende de los objetivos del estudio. Esta unidad puede ser: el hogar, las
personas, parte del cuerpo de las personas, la granja, el establecimiento, etc. Las
unidades de anlisis reciben frecuentemente el nombre de Elementos de la poblacin.
Unidad de Observacin
Es la unidad a travs de la cual se obtiene la informacin, sta puede o no coincidir con
el elemento. Ejemplo: Supongamos que en cierta poblacin la unidad a investigar es un
establecimiento comercial, en donde la unidad de anlisis son los obreros, se puede
decir que la unidad de observacin son las fichas o el expediente de trabajo que se
encuentra en el archivo del personal de la empresa, si el mismo contiene toda la
informacin solicitada.
Cobertura Horizontal
Es el alcance geogrfico y est referido al espacio fsico donde se realizar el estudio.
Cobertura Vertical
Fija los niveles de desagregacin deseada de la informacin, es decir, los niveles de
detalles en que se requiere la informacin.
ANLISIS
PE RSONAS
UNIDADE S
PE RSONAS
MAY ORE S DE
OBSE RVACIN
15 AOS
SALME RON
Y
22 COMUNIDADE S
HORIZONTAL
COBE RTURA
VE RTICAL
PE RIODO DE
RE COLE CCIN
DE LOS DATOS
SE X O
GRUPOS DE E DAD
NIVE L E DUCATIVO
TIPO DE VIVIE NDA
PRODUCCIN AGRCOLA
NIVE L DE INGRE SO
20 DE FE BRE RO
AL
20 DE MARZO DE 2006
R euniones
para la
determinacin
de Objetivos
Determinacin
Asignacin
Cursos de
Adiestramiento
de Personal
de
Carga
Diseo de
Controles
Operativos
Codificacin
Comparacin
de
Cuestionarios
INE
E ncuesta
Piloto y
Correccin del
Cuestionario
E laboracin
Manuales
Aprobacin
del
Cuestionario
R eproduccin
R eproduccin
L evantamiento
de Mapas y
de Manuales y
Croquis
Cuestionarios
R eentrevista
Codificacin
de las Micro
reas
Municipales
Plan
de
objetivos
R esultados
y
Crtica
Preliminares
Programa
Anlisis y
de
T ranscripcin
Presentacin
de
de
Validacin
de R esultados
Discretas).
Datos continuos: Los datos continuos por su parte pueden tomar cualquier valor
dentro de un intervalo de valores. Ejemplo: las tallas o pesos de un grupo de estudiantes
(Variables Cuantitativas continuas).
En general, la regla de oro es que todas las variables que proceden de experimentos en
los que se cuenta son discretas y todas las variables que proceden de experimentos en
los que se mide son continuas.
B.- Datos Cualitativos: Vienen expresados en forma de letras o palabras, indicando una
medicin de nivel nominal. Ejemplo: Color del cabello, sexo, lugar de residencia, tipo
de residencia.
Escalas de Medicin
Una escala es un patrn convencional de medicin y bsicamente consiste en un
instrumento capaz de representar verbal, grfica o simblicamente el estado de una
variable. Existen diferentes tipos de escalas, pero veamos las ms conocidas:
Escala Nominal: Se usa una escala Nominal cuando se distribuyen conjuntos de
objetos, personas o elementos entre dos o ms categoras. Se utilizan nmeros o
smbolos con el fin de distinguir los elementos pertenecientes a una determinada
categora, estos nmeros o smbolos utilizados, constituyen una Escala Nominal.
Ejemplo: Si asignamos el o a cada hombre de un grupo y el 1 a cada mujer estamos
estableciendo una escala nominal que nos permite mediante su asignacin (arbitraria)
identificar los dos grupos.
Escala Ordinal: Se emplea este tipo de escala, cuando basado en ciertas normas se
asigna un conjunto de objetos, personas o elementos categoras ordenadas. Las
categoras de la escala se ordenan de acuerdo con la cantidad del rasgo o
caractersticas que representa cada una de ellas. Ejemplo: La tpica clasificacin de un
grupo de estudiantes de acuerdo con el rendimiento escolar, basado en la evaluacin
que se les aplique: 1 al de mayor rendimiento, 2 el que le sigue en rendimiento y as
sucesivamente. Tambin podemos clasificar las calificaciones de los estudiantes como
Excelente, Sobresaliente, Distinguido, Bueno, Satisfactorio, Deficiente y Muy
Deficiente.
Escala de Intervalo: Implica cuantificacin al igual que la escala ordinal, con la
caracterstica adicional de conocer la distancia entre dos nmeros cualesquiera.
Ejemplo: Las Escalas de temperatura Fahrenheit o Centgrada constituyen un ejemplo de
este tipo.
Escala de Razn: Esta escala tiene todas las caractersticas de la escala de intervalo
y adems tiene un punto cero (0) claramente definido. Esto hace posible ciertas
comparaciones entre los valores que la escala de intervalo no permite. Es decir, que la
proporcin de un punto cualquiera de la escala a otro es independiente de la unidad de
medida. Ejemplo: Si determinamos los pesos de dos objetos diferentes tanto en libras
como en gramos, encontramos que la diferencia medida en proporcin es exactamente
igual para los dos pesos, tanto en libras como en gramos.
apreciar
las
tendencias,
variaciones
anomalas
del
fenmeno
Grficos de Barras.
Polgonos de Frecuencia.
Grfico de Sectores.
10
11
El Grfico de Barras es similar a los histogramas con barras separadas para efecto visual.
Ejemplo: Grfico de Barras
40.000
30.000
20.000
10.000
80+
75 - 79
70 - 74
65 - 69
60 - 64
55 - 59
50 - 54
45 - 49
40 - 44
35 - 39
30 - 34
25 - 29
20 - 24
15 - 19
10 - 14
5-9
0
0-4
N de Personas
Grupos de Edad
Femenino
49%
Masculino
51%
12
Distribucin de Frecuencia
Cuando se tiene una cantidad grande de observaciones utilizamos un tipo de
tabulacin de frecuente aplicacin en estadstica, la cual se conoce como Distribucin
de Frecuencias, considerada como la distribucin para datos agrupados.
Nmero de intervalos
De 4 a 8
De 100 a 1.000
De 8 a 11
De 1.000 a 10.000
De 11 a 14
13
2. Una vez escogido el nmero de intervalos, se determina la longitud que deben tener
los intervalos. Esta se obtiene al utilizar la frmula:
Longitud = (Dato Mayor Dato Menor) / Nmero de intervalos
El nmero resultante de la diferencia entre el dato mayor y el dato menor se llama
amplitud.
3. El primer intervalo debe contener el menor de los datos y el ltimo el mayor. No
debe haber confusin acerca de en cul intervalo se halla determinado dato. En lo
posible, todos los intervalos deben tener la misma longitud o ancho.
4. Por conteo se determina la cantidad de datos que caen en cada intervalo, esto nos
da la frecuencia absoluta del intervalo.
14
mi =
[Li + Ls ]
2
Poblacin
Total
332.938
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+
30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824
15
Poblacin
(fi)
mi
hi
(%) hi
Fi
Hi
(%) Hi
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+
30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824
2
7
12
17
22
27
32
37
42
47
52
57
62
67
72
77
82
0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085
9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482
30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938
0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000
9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000
Total
332.938
1,0000
100,0000
Nota importante: Para el ltimo grupo de edad (80+) se tiene que mi= 82, ya que la
separacin entre los puntos medios se da con un incremento de cinco (5).
Sexo
Poblacin
(fi)
hi
(%) hi
Masculino
Femenino
168.340
164.598
0,5056
0,4944
50,5620
49,4380
Total
332.938
1,0000
100,0000
16
Promedio
Es un valor que resume la informacin de una serie de observaciones y que se
considera como representativo de estas. Existen varios tipos de promedios pero el ms
conocido y utilizado es la media aritmtica.
Media aritmtica
Es la medida de tendencia central por excelencia, es el valor tpico representativo del
conjunto de datos considerados. Se obtiene sumando el conjunto de valores observados
y se divide el resultado entre el nmero de observaciones.
Es el ms usado de los promedios, siempre y cuando la serie no presente valores
extremos, ya que esto distorsiona el valor de la media en este caso sera aconsejable
otra medida (la mediana por ejemplo).
17
X =
x
i =1
Leyenda:
n: Nmero de observaciones
xi : Valor que asume la variable en la i-sima observacin
: Sumatoria
X : Media aritmtica
Ejemplo del clculo de la Media Aritmtica para datos no agrupados
Supongamos que las edades de 15 estudiantes son: 12, 10, 13, 11, 10, 12, 9, 11, 13, 9,
11, 11,13, 12, 11.
n
X =
x
i =1
12 + 10 + 13 + 11 + 10 + 12 + 9 + 11 + 13 + 9 + 11 + 11 + 13 + 12 + 11
= 11,2 Aos
15
X=
fm
i =1
Leyenda:
n: Nmero de observaciones
k: Nmero de intervalos
mi : Punto Medio del i-simo intervalo
f i : Frecuencia absoluta del i-simo intervalo
: Sumatoria
X : Media aritmtica
18
Grupos de Edades
(ic)
Poblacin
(fi)
(mi)
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+
30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824
2
7
12
17
22
27
32
37
42
47
52
57
62
67
72
77
82
Total
332.938
(fi*mi)
61.138
209.685
356.400
517.752
665.544
778.113
828.576
881.044
953.484
943.666
875.004
778.278
632.834
501.696
404.208
314.776
231.568
9.933.766
X =
i =1
fimi
n
9 . 933 . 766
= 29 ,84 Aos
332 . 938
Media ponderada
Es el promedio obtenido al multiplicar el valor de las observaciones por su importancia
relativa (peso) entre la sumatoria total de los pesos.
x w
i =1
n
w
i =1
19
Leyenda:
n: Nmero de observaciones
xi : Valor que asume la variable en la i-sima observacin
wi : Peso de la i-sima observacin
2(4 ) + 3(5) 8 + 15 23
=
=
= 4,6 puntos
2+3
5
5
Mediana
Es el valor que divide un conjunto de observaciones ordenadas respecto de la magnitud
de los valores, de tal manera que el nmero de datos por encima de este sea igual al
nmero de datos por debajo de la misma.
Tal como sucede con la media, el mtodo de determinacin de la mediana depende de
si los datos son agrupados o no.
Caso datos no agrupados
Ejemplo del clculo de la mediana para datos no agrupados:
Cuando n es impar (n = 2k +1)
Continuando con el ejemplo de las edades de los 15 estudiantes, si ordenamos los
datos se obtiene lo siguiente: 9, 9, 10,10,11, 11, 11, 11, 11, 12, 12, 12, 13, 13, 13.
n + 1 15 + 1 16
=
= 8 , lo que indica que el lugar
=
2
2
2
posicional de la mediana es 8. Finalmente tenemos que la Md = 11 Aos.
Se debe cumplir que
k + 1 =
20
1
( X k + X k +1 ) , como sabemos que n = 2k, tenemos que k = n = 14 = 7 , por lo
2
2 2
1
1
22
tanto k+1 = 8, luego se tiene que la Md = ( X 7 + X 8 ) = (11 + 11) =
= 11Aos
2
2
2
Md =
F
i
( ant )
Md = Li + 2
* Aic
f
i
Leyenda
n: Nmero de observaciones
Li : Lmite inferior de la clase medianal
Fi (ant ) : Frecuencia absoluta acumulada hasta la clase anterior a la de la mediana
f i : Frecuencia absoluta de la clase medianal
Aic : Amplitud del intervalo de clase
21
Grupo de Edad
(ic)
Poblacin
(fi)
hi
(%) hi
Fi
Hi
(%) Hi
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+
30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824
0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085
9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482
30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938
0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000
9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000
Total
332.938
1,0000
100,0000
Clase Medianal
F
(
)
i
ant
166.469 150.932
Md = Li + 2
* Aic = 24,5 +
* 5 = 27,20 Aos
fi
28
.
819
Propiedades de la mediana
Slo se puede obtener a partir de datos previamente ordenados y no est
influenciada por los valores de la serie.
Su caracterstica bsica es que divide la serie en dos partes iguales.
Moda
Es el valor que aparece con mayor frecuencia. Si ningn nmero aparece ms de una
vez, entonces no existe moda. Es tambin posible, sin embargo, para un conjunto de
nmeros tener varias modas.
22
fi
2
2
5
3
3
D1
Mo = L i +
D1 + D 2
* Aic
Leyenda
Li : Lmite inferior de la clase modal (la clase modal ser la que posea mayor frecuencia
absoluta)
D1 : Diferencia entre la frecuencia absoluta de la clase modal y la clase anterior, en
valor absoluto
D2 : Diferencia entre la frecuencia absoluta de la clase modal y la clase siguiente, en
valor absoluto
Aic : Amplitud del intervalo de clase
23
Poblacin
(fi)
hi
(%) hi
Fi
Hi
(%) Hi
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+
30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824
0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085
9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482
30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938
0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000
9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000
Total
332.938
1,0000
100,0000
D1
Mo = Li +
D1 + D2
Clase Modal
30.569
* Aic = 0,5 +
* 5 = 4,40 Aos
31.183
Medidas de Posicin
Las medidas estadsticas que determinan una posicin dentro de una distribucin
ordenada, se les denomina medidas de posicin, por cuanto nos determinan cualquier
posicin que se requiera dentro de la distribucin.
24
Cuartiles
Son los valores que dividen la distribucin ordenada, en cuatro (4) partes iguales, tales
que cada una de ellas contiene un veinticinco por ciento (25%) de las observaciones.
Los Cuartiles son tres (3) y se representan por Q1, Q2, Q3. Cabe destacar que el Q2 se
corresponde a la mediana.
El primer cuartil (Q1): Valor de la variable que deja el 25% de la informacin por
El segundo cuartil (Q2): Valor de la variable que deja el 50% de la informacin por
El tercer cuartil (Q3): Valor de la variable que deja el 75% de la distribucin por
Q j = xi + ( x s xi ) * R
Leyenda
Q j : Cuartil j-simo
xi : Dato inferior al cuartil j-simo
x s : Dato superior al cuartil j-simo
R : Diferencia entre el lugar del cuartil j-simo y el lugar del dato inferior.
Ejemplo del clculo del segundo Cuartil Q2 para datos no agrupados:
Trabajando con el ejemplo de las edades de los 15 estudiantes:
1) Se ordenan los datos de menor a mayor:
25
9, 9, 10,10,11, 11, 11, 11, 11, 12, 12, 12, 13, 13, 13
2) Calculamos el lugar del cuartil buscado: Q2
Lugar =
j * n 2 *15
=
= 7,5
4
4
El segundo cuartil, est ubicado entre los datos que ocupan los lugares (7 y 8), el
primer y el segundo es 11, por lo que xi = 11 y x s = 11 .
3) Determinamos el valor de R = 7,5 7 = 0,5 .
4) Aplicando la frmula para calcular el segundo cuartil (Q2 ) :
Q2 = xi + (x s xi ) * R = 11 + (11 11) * 0,5 = 11Aos
A ambos lados del valor que ocupa el lugar 7,5 (Q2 = 11Aos ) , se encuentra el 50% de
los datos.
n*
4
Q j = Li +
j
Fi ( ant )
fi
* A
ic
; Donde j= 1, 2, 3.
Leyenda
n: Nmero de observaciones
Li : Lmite inferior de la clase que contiene al cuartil j-simo
Fi (ant ) : Frecuencia absoluta acumulada anterior a la clase que contiene al cuartil j-simo
f i : Frecuencia absoluta de la clase que contiene al cuartil j-simo
Aic : Amplitud del intervalo de clase
26
Poblacin
(fi)
hi
(%) hi
Fi
Hi
(%) Hi
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+
30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824
0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085
9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482
30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938
0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000
9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000
Total
332.938
1,0000
100,0000
n*3
Fi ( ant )
4
Q3 = Li +
fi
Clase Q3
332.938 * 3
229.456
4
* 5 = 43,96 Aos
* A = 39,5 +
ic
22.702
Aproximadamente el 75% de las personas tienen edades por debajo de 43,96 aos y el
25% por encima.
Deciles
Son los nueve (9) valores que dividen la distribucin ordenada en diez (10) partes
iguales, tales que cada una de ellas contiene el diez por ciento (10%) de las
observaciones. Se denotan por D1, D2, D9. Cabe destacar que el quinto decil (D5) se
corresponde a la mediana.
27
D j = x i + ( x s xi ) * R
Leyenda
D j : Decil j-simo
xi : Dato inferior al decil j-simo
x s : Dato superior al decil j-simo
R : Diferencia entre el lugar del decil j-simo y el lugar del dato inferior
Ejemplo del clculo del Quinto Decil
j * n 5 * 15
=
= 7,5
10
10
El quinto decil, est ubicado entre los datos que ocupan los lugares (7 y 8), el primer
y el segundo es 11, por lo que xi = 11 y x s = 11 .
3) Determinamos el valor de R = 7,5 7 = 0,5 .
4) Aplicando la frmula para calcular el quinto decil (D5 ) :
D5 = xi + ( x s xi ) * R = 11 + (11 11) * 0,5 = 11Aos
A ambos lados del valor que ocupa el lugar 7,5 (Q5 = 11Aos ) , se encuentra el 50% de
los datos.
28
n* j
Fi ( ant )
10
D j = Li +
fi
* A ; Donde j= 1, 2, 3, , 9.
ic
Leyenda
n: Nmero de observaciones
Li : Lmite inferior de la clase que contiene al decil j-simo
Fi (ant ) : Frecuencia absoluta acumulada anterior a la clase que contiene al decil j-simo
f i : Frecuencia absoluta de la clase que contiene al decil j-simo
Aic : Amplitud del intervalo de clase
Poblacin
(fi)
hi
(%) hi
Fi
Hi
(%) Hi
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+
30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824
0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085
9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482
30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938
0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000
9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000
Total
332.938
1,0000
100,0000
Clase D7
29
n*7
Fi ( ant )
10
D7 = Li +
fi
332.938 * 7
229.456
10
* A = 39,5 +
* 5 = 40,29 Aos
ic
22.702
El 70% de las personas tienen edad por debajo de 40,29 aos y el 30% por encima.
Percentiles
Son los noventa y nueve (99) valores que dividen la distribucin ordenada en cien (100)
partes iguales, tales que cada una de ellas contienen el uno por ciento (1%) de las
observaciones. Se denotan por P1, P2, P99. El percentil cincuenta (50) se corresponde
con la Mediana y el segundo cuartil; asimismo, P25 y P75 se corresponde con el primero
y el tercer cuartil, respectivamente.
Pj = xi + ( x s xi ) * R
Leyenda
Pj : Percentil j-simo
xi : Dato inferior al percentil j-simo
x s : Dato superior al percentil j-simo
R : Diferencia entre el lugar del percentil j-simo y el lugar del dato inferior
Ejemplo del clculo del percentil cincuenta (P50 ) para datos no agrupados:
Continuando con el ejemplo de las edades de los 15 estudiantes:
1) Se ordenan los datos de menor a mayor:
9, 9, 10,10,11, 11, 11, 11, 11, 12, 12, 12, 13, 13, 13
2) Calculamos el lugar del percentil buscado: P50
Lugar =
j * n 50 *15
=
= 7,5
100
100
30
El percentil 50, est ubicado entre los datos que ocupan los lugares (7 y 8), el primer
y el segundo es 11, por lo que xi = 11 y x s = 11 .
3) Determinamos el valor de R = 7,5 7 = 0,5 .
4) Aplicando la frmula para calcular el percentil 50 (P50 ) :
P50 = xi + ( x s xi ) * R = 11 + (11 11) * 0,5 = 11Aos
A ambos lados del valor que ocupa el lugar 7,5 (P50 = 11Aos ) , se encuentra el 50% de
los datos.
n* j
Fi ( ant )
100
Pj = Li +
fi
Leyenda
n: Nmero de observaciones
Li : Lmite inferior de la clase que contiene al percentil j-simo
Fi (ant ) : Frecuencia absoluta acumulada anterior a la clase que contiene al percentil
j-simo
f i : Frecuencia absoluta de la clase que contiene al percentil j-simo
Aic : Amplitud del intervalo de clase
31
Grupo de Edad
(ic)
Poblacin
(fi)
hi
(%) hi
Fi
Hi
(%) Hi
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+
30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824
0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085
9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482
30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938
0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000
9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000
Total
332.938
1,0000
100,0000
n * 40
Fi ( ant )
100
P40 = Li +
fi
Clase P40
332.938 * 40
120.680
100
* A = 19,5 +
* 5 = 21,57 Aos
ic
30.252
Aproximadamente el 40% de las personas tienen edades por debajo de 21,57 aos y el
60% por encima.
Medidas de Variabilidad
Una medida de variabilidad es un nmero que nos indica el grado de dispersin de un
conjunto de datos. Si este valor es pequeo (respecto de la unidad de medida) entonces
hay una gran uniformidad entre los datos. Por el contrario, un gran valor nos indica
poca uniformidad. Cuando es cero quiere decir que todos los datos son iguales.
Las medidas de variabilidad ms comunes son la amplitud o rango, la varianza y la
desviacin tpica o desviacin estndar.
32
Rango o amplitud
Es la diferencia entre el valor mximo y el mnimo de los datos. Formalmente, la
amplitud se define as: Si X M representa el dato mayor y X m el dato menor entonces la
amplitud A, est dada por: A = X M X m .
Cuando se trata de datos agrupados, la amplitud se toma como la diferencia entre el
lmite superior del ltimo intervalo y el inferior del primero.
La amplitud, debido a la forma matemtica que la define, es bastante sensible a los
valores extremos que se puedan presentar en una sucesin de datos. Adems al no
tomar en cuenta ninguna medida de posicin, no informa nada acerca de cmo se
comportan los datos respecto del centro.
La amplitud se utiliza cuando los datos son muy escasos o demasiado dispersos para
justificar el clculo de una medida de variabilidad ms precisa. Tambin se utiliza la
amplitud cuando slo se desea conocer los valores extremos o la dispersin total.
Varianza
Se define como el cuadrado de la desviacin tpica y viene dada por
poblacin y S
2 para la
(x
n
i =1
Leyenda:
n: Nmero de observaciones
xi : Valor que asume la variable en la i-sima observacin
X : Media aritmtica
: Sumatoria
33
S2 =
0,64 + 1,44 + 3,24 + 0,04 + 1,44 + 0,64 + 4,84 + 0,04 + 3,24 + 4,84 + 0,04 + 0,04 + 3,24 + 0,64 + 0,04
15
S2 =
24,4
= 1,626666667
15
f (m
K
i =1
Leyenda:
n: Nmero de observaciones
k: Nmero de intervalos
mi : Punto Medio del i-simo intervalo
X : Media aritmtica
f i : Frecuencia absoluta del i-simo intervalo
: Sumatoria
34
(m
) (m
Grupos de Edades
(ic)
Poblacin
(fi)
mi
0-4
5-9
10 - 14
30.569
29.955
29.700
2
7
12
-27,84
-22,84
-17,84
775,07
521,67
318,27
23.692.980,33
15.626.493,05
9.452.488,32
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824
17
22
27
32
37
42
47
52
57
62
67
72
77
82
-12,84
-7,84
-2,84
2,16
7,16
12,16
17,16
22,16
27,16
32,16
37,16
42,16
47,16
52,16
164,87
61,47
8,07
4,67
51,27
147,87
294,47
491,07
737,67
1034,27
1380,87
1777,47
2224,07
2720,67
5.021.146,71
1.859.457,33
232.442,53
120.806,38
1.220.736,47
3.356.844,85
5.912.280,32
8.263.160,85
10.072.086,10
10.556.748,98
10.339.921,61
9.978.691,88
9.091.980,17
7.683.159,65
Total
332.938
Recordemos que:
fi * m i X
132.481.425,53
X = 29 ,84 Aos
Desviacin estndar
Es la medida de variabilidad ms utilizada por ser la ms estable de todas, se basa en
los desvos de los datos originales con respecto a la media, pero se toma en cuenta el
signo de estos desvos. Se denota como para la poblacin y S para la muestra.
(x
n
S=
i =1
35
Leyenda:
n: Nmero de observaciones
xi : Valor que asume la variable en la i-sima observacin
X : Media aritmtica
: Sumatoria
S=
0,64 + 1,44 + 3,24 + 0,04 + 1,44 + 0,64 + 4,84 + 0,04 + 3,24 + 4,84 + 0,04 + 0,04 + 3,24 + 0,64 + 0,04
15
S=
24,4
= 1,626666667 = 1,275408431
15
f (m
k
S=
i =1
36
Leyenda:
n: Nmero de observaciones
k: Nmero de intervalos
mi : Punto Medio del i-simo intervalo
X : Media aritmtica
f i : Frecuencia absoluta del i-simo intervalo
: Sumatoria
Ejemplo del clculo de la Desviacin Estndar para datos agrupados:
Utilizando los resultados obtenidos en el caso de la varianza logramos el siguiente
resultado:
S=
132.481.425,53
= 397,916205 = 19,9478371
332.938
Proporciones y Razones
Proporcin
Las proporciones expresan en trminos porcentuales la cantidad de elementos que
poseen una caracterstica o categora de esta dentro de una poblacin, con respecto al
total de esta. Estas nos dan una idea ms clara y precisa de la estructura o composicin
de una poblacin. En otras palabras podemos decir que la proporcin, es la porcin de
elementos de la poblacin que poseen ciertos atributos con respecto al total. Es
frecuente que se desee conocer la proporcin de una condicin o caracterstica dada
en una poblacin. Un ejemplo es cuando se desea conocer la proporcin de aprobados
o reprobados en una poblacin estudiantil.
Frmula para calcular la Proporcin:
Pr oporcin =
a
(a + b )
Leyenda:
a : Total de elementos que poseen la caracterstica
b : Total de elementos que NO poseen la caracterstica
(a + b) : Total de elementos en la poblacin
37
Total
Proporcin de Masculino
Respecto al total (%)
Proporcin de Femenino
Respecto al total (%)
Proporcin segn
Grupo de Edad (%)
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+
15.613
15.265
15.155
15.549
15.491
14.703
13.145
12.066
11.533
10.220
8.472
6.813
4.980
3.562
2.602
1.907
1.264
14.956
14.690
14.545
14.907
14.761
14.116
12.748
11.746
11.169
9.858
8.355
6.841
5.227
3.926
3.012
2.181
1.560
30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824
4,69
4,58
4,55
4,67
4,65
4,42
3,95
3,62
3,46
3,07
2,54
2,05
1,50
1,07
0,78
0,57
0,38
4,49
4,41
4,37
4,48
4,43
4,24
3,83
3,53
3,35
2,96
2,51
2,05
1,57
1,18
0,90
0,66
0,47
9,18
9,00
8,92
9,15
9,09
8,66
7,78
7,15
6,82
6,03
5,05
4,10
3,07
2,25
1,69
1,23
0,85
Total
168.340
164.598
332.938
50,56
49,44
100,00
Existe un 4,69% de personas del sexo masculino con edades comprendidas entre 0
Existe un 4,49% de personas del sexo femenino con edades comprendidas entre 0 y
Existe un 9,18% de las personas que tienen edades comprendidas entre 0 y 4 aos
38
Razn =
a
b
Leyenda:
a : Total de elementos del tipo a
b : Total de elementos del tipo b
Ejemplo del clculo de la Razn:
Grupo de Edad
(ic)
Masculino
Femenino
Razn de
Masculinidad
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+
15.613
15.265
15.155
15.549
15.491
14.703
13.145
12.066
11.533
10.220
8.472
6.813
4.980
3.562
2.602
1.907
1.264
14.956
14.690
14.545
14.907
14.761
14.116
12.748
11.746
11.169
9.858
8.355
6.841
5.227
3.926
3.012
2.181
1.560
1,04
1,04
1,04
1,04
1,05
1,04
1,03
1,03
1,03
1,04
1,01
1,00
0,95
0,91
0,86
0,87
0,81
Total
168.340
164.598
1,02
Luego, interpretando la primera fila tenemos que: por cada mujer con edades
comprendidas entre 0 y 4 aos existen 1,04 hombres.
39
Bibliografa
-
40