Está en la página 1de 45

GERENCIA ESTADAL DE ESTADSTICA VARGAS

SUBSISTEMA ESTADSTICO ESTADAL Y MUNICIPAL

MARZO 2007

INTRODUCCIN
La necesidad de fortalecer la produccin, el uso y la divulgacin de la informacin
estadstica, requerida por cada uno de los organismos e instituciones, se ha evidenciado
desde los inicios de la conformacin del Comit de Coordinacin de Estadsticas
Estadales y Municipales del Estado Vargas (CCEEM-Vargas), adems en las distintas,
reuniones, mesas de trabajo, talleres y particularmente durante la realizacin del Taller
de Construccin Colectiva del Plan de Accin del CCEEM 2007, dictado en el mes de
Octubre de 2006; donde en varias oportunidades los representantes de los organismos e
instituciones solicitaron capacitacin en el rea a la Gerencia Estadal de Estadsticas
Vargas.
En vista de lo anterior expuesto, la Gerencia Estadal de Estadstica Vargas decidi
emprender el proceso de capacitacin elaborando una gua de estudio de Estadstica
Bsica, la cual servir de base para el dictado del primer taller que ser por parte del
personal de dicha Gerencia. Con la finalidad de contribuir en el fortalecimiento de la
produccin de informacin estadstica, as como el uso de la misma, todo ello en aras
de fomentar la cultura estadstica en el Estado Vargas.
En el presente material se consideran los conocimientos bsicos necesarios para el
anlisis e interpretacin de los datos, abordando todos los aspectos bsicos de la
estadstica descriptiva como lo son la ordenacin y clasificacin de los datos,
presentacin en tablas, cuadros, tabulados y grficos. As como los estadsticos ms
utilizados: Totales, Media, Mediana, Desviacin Tpica, Proporciones y Razones.
Objetivo General
Brindar apoyo terico, conceptual y metodolgico a los participantes de los talleres
vinculados con la produccin estadstica, de acuerdo con las necesidades de los
organismos e instituciones a los cuales pertenecen.

Propsito
La Gua de Estudios de Estadstica Bsica, acompaada de una serie de talleres, dirigido
en principio a los participantes del CCEEM-Vargas, pretende mejorar la produccin, el
uso y la divulgacin de la informacin estadstica; as como el fortalecimiento de una
Cultura Estadstica necesaria e importante en la planificacin y la toma de decisiones de
los distintos organismos e instituciones que hacen vida en el Estado.

NDICE
NOCIONES BSICAS DE ESTADSTICA ............................................................................................................. 1
CONCEPTO DE ESTADSTICA .................................................................................................................................. 1
OBJETIVO DE LA ESTADSTICA ................................................................................................................................ 1
CLASIFICACIN DE LA ESTADSTICA ........................................................................................................................ 1
IMPORTANCIA DE LA INFORMACIN ESTADSTICA .................................................................................................. 2
CONCEPTOS BSICOS DE ESTADSTICA.......................................................................................................... 2
UNIVERSO ............................................................................................................................................................. 2
POBLACIN .......................................................................................................................................................... 2
MUESTRA .............................................................................................................................................................. 3
VARIABLE ESTADSTICA .......................................................................................................................................... 3
DATOS .................................................................................................................................................................. 3
ENCUESTA ............................................................................................................................................................. 3
CENSO .................................................................................................................................................................. 3
Tipos de Censo .............................................................................................................................................. 4
Censo de Derecho o de Jure..................................................................................................................................4
Censos de Hecho o de Facto.................................................................................................................................4

MUESTREO ............................................................................................................................................................ 4
VENTAJAS DEL MUESTREO ..................................................................................................................................... 4
UNIDAD DE ANLISIS ............................................................................................................................................ 5
UNIDAD DE OBSERVACIN ................................................................................................................................... 5
COBERTURA HORIZONTAL .................................................................................................................................... 5
COBERTURA VERTICAL .......................................................................................................................................... 5
ORGANIZACIN Y REPRESENTACIN DE LOS DATOS................................................................................ 8
TIPOS DE DATOS OBSERVABLES ............................................................................................................................. 8
ESCALAS DE MEDICIN ......................................................................................................................................... 8
REPRESENTACIN GRFICA DE LOS DATOS.................................................................................................. 9
GRFICO ............................................................................................................................................................... 9
OBJETIVOS DE LOS GRFICOS ESTADSTICOS........................................................................................................ 10
DISTRIBUCIN DE FRECUENCIA .................................................................................................................... 13
DEFINICIN DE DISTRIBUCIN DE FRECUENCIA ................................................................................................... 13
COMPONENTES DE UNA DISTRIBUCIN DE FRECUENCIA ..................................................................................... 13
MEDIDAS DE ANLISIS DE DATOS ................................................................................................................. 16
MEDIDAS DE TENDENCIA CENTRAL............................................................................................................... 17
PROMEDIO .......................................................................................................................................................... 17
MEDIA ARITMTICA.............................................................................................................................................. 17
Caso datos no agrupados ........................................................................................................................... 18
Caso datos agrupados ................................................................................................................................. 18
MEDIA PONDERADA ............................................................................................................................................ 19
MEDIANA ............................................................................................................................................................ 20
Caso datos no agrupados ........................................................................................................................... 20
Cuando n es impar (n = 2k +1) ...............................................................................................................................20
Cuando n es par (n = 2k) .........................................................................................................................................21

Caso datos agrupados ................................................................................................................................. 21


Propiedades de la mediana........................................................................................................................ 22
MODA ................................................................................................................................................................ 22

Caso datos no agrupados ........................................................................................................................... 23


Caso datos agrupados ................................................................................................................................. 23
MEDIDAS DE POSICIN.................................................................................................................................... 24
CUARTILES .......................................................................................................................................................... 25
Caso datos no agrupados ........................................................................................................................... 25
Caso datos agrupados ................................................................................................................................. 26
DECILES............................................................................................................................................................... 27
Caso datos no agrupados ........................................................................................................................... 28
Caso datos agrupados ................................................................................................................................. 29
PERCENTILES ........................................................................................................................................................ 30
Caso datos no agrupados ........................................................................................................................... 30
Caso datos agrupados ................................................................................................................................. 31
MEDIDAS DE VARIABILIDAD ........................................................................................................................... 32
RANGO O AMPLITUD........................................................................................................................................... 33
VARIANZA ........................................................................................................................................................... 33
Caso datos no agrupados ........................................................................................................................... 33
Caso datos agrupados ................................................................................................................................. 34
DESVIACIN ESTNDAR....................................................................................................................................... 35
Caso datos no agrupados ........................................................................................................................... 35
Caso datos agrupados ................................................................................................................................. 36
PROPORCIONES Y RAZONES ........................................................................................................................... 37
PROPORCIN ...................................................................................................................................................... 37
RAZN ............................................................................................................................................................... 38
BIBLIOGRAFA..................................................................................................................................................... 40

Nociones Bsicas de Estadstica


Concepto de Estadstica
La Estadstica se ocupa de los mtodos y procedimientos para recopilar, clasificar,
resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e
incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias
a partir de ellos, con la finalidad de ayudar a la toma de decisiones y formular
predicciones. En pocas palabras podramos, definir la estadstica como la ciencia que
estudia cmo debe emplearse la informacin y cmo dar una gua de accin en
situaciones prcticas que entraan incertidumbre.

Objetivo de la Estadstica
La Estadstica tiene por objetivo obtener, agrupar, ordenar y clasificar de manera
adecuada la informacin que se deriva de los diferentes fenmenos que ocurren, tanto
en los propios de la naturaleza, como los derivados de la actividad del hombre, de
manera tal de analizarlos mediante los mtodos apropiados a fin de crear modelos que
nos orienten en la toma de decisiones, la prediccin e inferencia en universos
considerados y poder llegar a deducir las leyes que rigen dichos fenmenos.

Clasificacin de la Estadstica
La Estadstica se puede clasificar en descriptiva, cuando los resultados del anlisis no
pretenden ir ms all del conjunto de datos, e inductiva cuando el objetivo del estudio
es derivar las conclusiones obtenidas a un conjunto de datos ms amplio.
 Estadstica descriptiva: Estudia unos determinados caracteres o aspectos referidos a
un colectivo de personas, objetos o elementos de una naturaleza especfica. En otras
palabras, la Estadstica descriptiva se ocupa de la recoleccin, clasificacin,
ordenacin, tabulaciones y representaciones grficas de los datos estadsticos que se
deriven de la medicin de las caractersticas objeto de estudio en los elementos
seleccionados.

 Estadstica inductiva: Apoyndose en el clculo de probabilidades y a partir de


datos muestrales, efecta estimaciones, predicciones u otras generalizaciones sobre un
conjunto mayor de datos.
Importancia de la Informacin Estadstica

Se obtienen resultados que cubren distintas reas de inters.

Permite cuantificar y ubicar necesidades.

Nos permite identificar potencialidades y conocer tendencias o comportamientos de

fenmenos especficos.

Proporciona elementos para formular programas de inversin.

Permite conocer los fenmenos en una perspectiva integral de relaciones entre los

factores involucrados, lo cual facilita su interpretacin y prediccin.

Nos permite obtener estndares de calidad para establecer controles en los

procesos.

Permite monitorear las polticas sociales y econmicas que se estn llevando a

cabo.

Nos permite tener una visin clara para realizar los planes.

Conceptos Bsicos de Estadstica


Universo
Es el conjunto de unidades fsicas (personas o elementos) con una o varias
caractersticas en comn, las cuales son susceptibles de ser investigadas. Ejemplo: Los
nmadas (indigentes) residentes en el Estado Vargas.

Poblacin
Es el conjunto de individuos, sujetos o elementos con una o varias caractersticas en
comn, que se pretende estudiar en una investigacin cientfica y de la cual se obtiene
una muestra.

Poblacin finita: se componen por un nmero limitado de elementos, Ejemplo:


Los agentes de la polica del Estado.
Poblacin infinita: son aqullas que se consideran formadas por un nmero
ilimitado de elementos. Ejemplo: Los peces del mar.
Muestra
La muestra estadstica es una parte de la poblacin, o sea, un nmero de individuos u
objetos seleccionados cientficamente, cada uno de los cuales es un elemento del
universo. La muestra es obtenida con el fin de investigar, a partir del conocimiento de
sus caractersticas particulares, las propiedades de toda la poblacin. La muestra debe
ser representativa del universo de procedencia, es decir, que contenga todos los
elementos en la misma proporcin en que existen en el universo del cual se obtuvo.

Variable estadstica
Caracterstica de un elemento objeto de investigacin que puede ser medida. Ejemplo:
La Edad.

Datos
Son nmeros o medidas que han sido recopilados como resultados de observaciones.

Encuesta
Tcnica de investigacin dirigida al estudio cuantitativo o cualitativo de las opiniones y
comportamientos de conjuntos numerosos de personas.

Censo
Estudio de una zona determinada que da como resultado la enumeracin de toda la
poblacin y la recopilacin de la informacin demogrfica, social o econmica,
concerniente a dicha poblacin en un momento dado.

Tipos de Censo

Censo de Derecho o de Jure

Se empadrona a todas las personas que normalmente residen en un determinado lugar,


independientemente si estn presentes o no, en el momento de efectuarse el Censo.

Censos de Hecho o de Facto

Se empadrona a todas las personas con relacin a la vivienda en que estn presentes en
el momento censal.
Muestreo
El muestreo propiamente dicho consiste (evidentemente) en la obtencin efectiva de la
muestra, esto es, en la recoleccin de los elementos o datos que la constituyen. La
utilizacin de los distintos tipos y mtodos de muestreo estadstico depende siempre de
la investigacin que se est llevando a cabo y de las condiciones generales en la cual
sta se realiza, en efecto, no siempre es aconsejable la utilizacin del muestreo, pese a
la gran bondad que supone su aplicacin en el anlisis de poblaciones grandes.

Ventajas del Muestreo


Cuando la poblacin sea infinita o tan grande que resulte inconveniente la
enumeracin completa de cada uno de los elementos o unidades.
Cuando la poblacin sea suficientemente homognea donde una muestra sea una
imagen aceptablemente representativa de la misma poblacin.
Cuando el proceso de medidas o investigacin de las caractersticas de cada
elemento resulte destructivo.
Economa de tiempo y dinero en las etapas de una operacin estadstica.
Ampliacin del alcance de una investigacin.
Mejor entrenamiento, formacin y control del personal que interviene en la
investigacin.
Mayor rapidez y eficiencia en el procesamiento y publicacin de los datos.
Menor demanda de personal y de otros recursos.

Mayor confiabilidad y precisin en los datos obtenidos.

Unidad de Anlisis
Corresponde a la unidad que se examina, es decir, de la que se busca la informacin y
su naturaleza depende de los objetivos del estudio. Esta unidad puede ser: el hogar, las
personas, parte del cuerpo de las personas, la granja, el establecimiento, etc. Las
unidades de anlisis reciben frecuentemente el nombre de Elementos de la poblacin.

Unidad de Observacin
Es la unidad a travs de la cual se obtiene la informacin, sta puede o no coincidir con
el elemento. Ejemplo: Supongamos que en cierta poblacin la unidad a investigar es un
establecimiento comercial, en donde la unidad de anlisis son los obreros, se puede
decir que la unidad de observacin son las fichas o el expediente de trabajo que se
encuentra en el archivo del personal de la empresa, si el mismo contiene toda la
informacin solicitada.

Cobertura Horizontal
Es el alcance geogrfico y est referido al espacio fsico donde se realizar el estudio.

Cobertura Vertical
Fija los niveles de desagregacin deseada de la informacin, es decir, los niveles de
detalles en que se requiere la informacin.

E jemplo: E squema de una investigacin estadstica


 VIVIE NDAS
 HOGARE S

ANLISIS

 PE RSONAS

UNIDADE S
PE RSONAS
MAY ORE S DE

OBSE RVACIN

15 AOS

SALME RON
Y
22 COMUNIDADE S

HORIZONTAL

COBE RTURA

VE RTICAL

PE RIODO DE
RE COLE CCIN
DE LOS DATOS

 SE X O
 GRUPOS DE E DAD
 NIVE L E DUCATIVO
 TIPO DE VIVIE NDA
 PRODUCCIN AGRCOLA
NIVE L DE INGRE SO

20 DE FE BRE RO
AL
20 DE MARZO DE 2006

E jemplo: F ases de una investigacin estadstica

R euniones
para la
determinacin
de Objetivos

Determinacin

Asignacin

Cursos de
Adiestramiento
de Personal

de
Carga

Diseo de
Controles
Operativos

Codificacin

Comparacin
de
Cuestionarios
INE

E ncuesta
Piloto y
Correccin del
Cuestionario

E laboracin

Manuales

Aprobacin
del
Cuestionario

R eproduccin

R eproduccin

L evantamiento

de Mapas y

de Manuales y

Croquis

Cuestionarios

R eentrevista

Codificacin
de las Micro
reas
Municipales

Plan

de
objetivos

R esultados

y
Crtica

Preliminares

Programa

Anlisis y

de
T ranscripcin

Presentacin

de

de
Validacin

de R esultados

Organizacin y Representacin de los Datos


Tipos de Datos Observables
A.- Datos Cuantitativos: estn expresados mediante nmeros y representan
observaciones producto de mediciones ordinales, de intervalo o de razn.
Se pueden clasificar en:
 Datos discretos: Los datos discretos adquieren solamente un nmero finito de
valores.

Ejemplo: nmero de hijos de un grupo familiar (Variables Cuantitativas

Discretas).
 Datos continuos: Los datos continuos por su parte pueden tomar cualquier valor
dentro de un intervalo de valores. Ejemplo: las tallas o pesos de un grupo de estudiantes
(Variables Cuantitativas continuas).
En general, la regla de oro es que todas las variables que proceden de experimentos en
los que se cuenta son discretas y todas las variables que proceden de experimentos en
los que se mide son continuas.
B.- Datos Cualitativos: Vienen expresados en forma de letras o palabras, indicando una
medicin de nivel nominal. Ejemplo: Color del cabello, sexo, lugar de residencia, tipo
de residencia.
Escalas de Medicin
Una escala es un patrn convencional de medicin y bsicamente consiste en un
instrumento capaz de representar verbal, grfica o simblicamente el estado de una
variable. Existen diferentes tipos de escalas, pero veamos las ms conocidas:
 Escala Nominal: Se usa una escala Nominal cuando se distribuyen conjuntos de
objetos, personas o elementos entre dos o ms categoras. Se utilizan nmeros o
smbolos con el fin de distinguir los elementos pertenecientes a una determinada
categora, estos nmeros o smbolos utilizados, constituyen una Escala Nominal.
Ejemplo: Si asignamos el o a cada hombre de un grupo y el 1 a cada mujer estamos

estableciendo una escala nominal que nos permite mediante su asignacin (arbitraria)
identificar los dos grupos.
 Escala Ordinal: Se emplea este tipo de escala, cuando basado en ciertas normas se
asigna un conjunto de objetos, personas o elementos categoras ordenadas. Las
categoras de la escala se ordenan de acuerdo con la cantidad del rasgo o
caractersticas que representa cada una de ellas. Ejemplo: La tpica clasificacin de un
grupo de estudiantes de acuerdo con el rendimiento escolar, basado en la evaluacin
que se les aplique: 1 al de mayor rendimiento, 2 el que le sigue en rendimiento y as
sucesivamente. Tambin podemos clasificar las calificaciones de los estudiantes como
Excelente, Sobresaliente, Distinguido, Bueno, Satisfactorio, Deficiente y Muy
Deficiente.
 Escala de Intervalo: Implica cuantificacin al igual que la escala ordinal, con la
caracterstica adicional de conocer la distancia entre dos nmeros cualesquiera.
Ejemplo: Las Escalas de temperatura Fahrenheit o Centgrada constituyen un ejemplo de
este tipo.
 Escala de Razn: Esta escala tiene todas las caractersticas de la escala de intervalo
y adems tiene un punto cero (0) claramente definido. Esto hace posible ciertas
comparaciones entre los valores que la escala de intervalo no permite. Es decir, que la
proporcin de un punto cualquiera de la escala a otro es independiente de la unidad de
medida. Ejemplo: Si determinamos los pesos de dos objetos diferentes tanto en libras
como en gramos, encontramos que la diferencia medida en proporcin es exactamente
igual para los dos pesos, tanto en libras como en gramos.

Representacin Grfica de los Datos


Grfico
Es una representacin que resume un conjunto numeroso de datos, permitiendo
observar mejor el comportamiento y las tendencias de las variables que en el mismo se
han dibujado. Los grficos estadsticos tienen como finalidad, facilitar la observacin de
la informacin que se representa.

Objetivos de los Grficos Estadsticos


 Los Grficos son tiles para dar una rpida idea de la situacin general, pero no de
los detalles.
 Permite reconocer a simple vista la existencia de una relacin entre las variables
representadas.
 Permite

apreciar

las

tendencias,

variaciones

anomalas

del

fenmeno

representado, as como las relaciones entre dos ms series superpuestas.


A continuacin vamos a considerar los distintos tipos de grficos estadsticos ms
frecuentemente utilizados:
 Histogramas de Frecuencias.

 Grficos de Barras.

 Polgonos de Frecuencia.

 Grfico de Sectores.

El Histograma de Frecuencias tiene las siguientes caractersticas:


Bases sobre el eje X con centro en las marcas de clase y longitud igual al tamao de
los intervalos de clase.
Superficie proporcional a las frecuencias de cada clase, esto nos define la altura de
los rectngulos que forman el histograma.
Se suele tomar un nmero de intervalos en el eje de las ordenadas que sea el 75%
de los intervalos del eje X (puede ser otra proporcin) y el nmero de frecuencias o
puntajes en cada unidad del eje Y, se determina dividiendo la frecuencia mayor
entre el nmero de intervalos formados sobre Y.
Al unir los puntos centrales de la parte superior de los rectngulos que forman el
histograma obtenemos el polgono de frecuencias. Este se traza por los puntos que
representan las marcas de clase.

10

Ejemplo: Histogramas de Frecuencias

Ejemplo: Polgonos de Frecuencia

11

El Grfico de Barras es similar a los histogramas con barras separadas para efecto visual.
Ejemplo: Grfico de Barras

40.000
30.000
20.000
10.000
80+

75 - 79

70 - 74

65 - 69

60 - 64

55 - 59

50 - 54

45 - 49

40 - 44

35 - 39

30 - 34

25 - 29

20 - 24

15 - 19

10 - 14

5-9

0
0-4

N de Personas

Proyecciones de Poblacin, segn Grupos de Edad


Estado Vargas, 2007

Grupos de Edad

En el Grfico de Sectores se reparte el rea del crculo, proporcional al nmero de


elementos en la muestra o poblacin que poseen la caracterstica considerada o
categoras de esta; y es expresado en trminos porcentuales.

Ejemplo: Grfico de Sectores


Proyecciones de Poblacin, segn Sexo
Estado Vargas, 2007

Femenino
49%

Masculino
51%

12

Distribucin de Frecuencia
Cuando se tiene una cantidad grande de observaciones utilizamos un tipo de
tabulacin de frecuente aplicacin en estadstica, la cual se conoce como Distribucin
de Frecuencias, considerada como la distribucin para datos agrupados.

Definicin de Distribucin de Frecuencia


Tabla de datos, referentes a una variable en cuestin, en la que se exponen varias
categoras de la misma, junto con sus frecuencias o nmero de veces que se repite en la
muestra. La tabla puede tener diferentes formatos y es llamada tabla de distribucin de
frecuencias.

Componentes de una Distribucin de Frecuencia


 Intervalo de Clase: Son los lmites establecidos entre los cuales se encuentran un
conjunto de datos. A continuacin ofrecemos ciertas reglas que pueden ser utilidad en
la determinacin del nmero de intervalos y las pautas para la construccin de una
tabla de frecuencias:
1. El nmero de intervalos debe escogerse de acuerdo con el nmero de datos, como
se indica a continuacin:
Nmero de datos
De 10 a 100

Nmero de intervalos
De 4 a 8

De 100 a 1.000

De 8 a 11

De 1.000 a 10.000

De 11 a 14

El nmero de intervalos que se aconseja (pero no siempre resulta adecuado) tomar de


acuerdo con el nmero de datos es el dado por la frmula de Sturges:
Nmero de intervalos = 1 + 3,322log10(n); en donde n es el nmero de datos.

13

2. Una vez escogido el nmero de intervalos, se determina la longitud que deben tener
los intervalos. Esta se obtiene al utilizar la frmula:
Longitud = (Dato Mayor Dato Menor) / Nmero de intervalos
El nmero resultante de la diferencia entre el dato mayor y el dato menor se llama
amplitud.
3. El primer intervalo debe contener el menor de los datos y el ltimo el mayor. No
debe haber confusin acerca de en cul intervalo se halla determinado dato. En lo
posible, todos los intervalos deben tener la misma longitud o ancho.
4. Por conteo se determina la cantidad de datos que caen en cada intervalo, esto nos
da la frecuencia absoluta del intervalo.

 Frecuencia Absoluta (fi): Es el nmero de datos u observaciones que caen en cada


uno de los intervalos estructurados.
 Frecuencia Absoluta Acumulada (Fi): Nmero de elementos contenidos en la
distribucin hasta el nivel de cada clase.
 Frecuencia Relativa (hi): Es el cociente entre la frecuencia absoluta de cada clase y
el nmero total de datos observados en el estudio (fi = n).
 Porcentaje Frecuencia Relativa (% hi): Es la frecuencia relativa multiplicada por
100.
 Frecuencia Relativa Acumulada (Hi): Es la frecuencia absoluta acumulada dividida
entre el nmero total de datos observados en el estudio.
 Porcentaje Frecuencia Relativa Acumulada (% Hi): Es la frecuencia relativa
acumulada multiplicada por 100.
 Marca de clase o punto medio (mi): Es el resultado de efectuar la suma del lmite
inferior de la clase con el lmite superior de esta, resultado que luego debe ser dividido
entre dos (2).

14

mi =

[Li + Ls ]
2

A continuacin se presentan las frecuencias absolutas correspondientes a distintos


grupos de edades:
Proyecciones de Poblacin, segn Grupos de Edad
Estado Vargas, 2007
Grupos de Edad

Poblacin

Total

332.938

0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+

30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824

Fuente: Instituto Nacional de Estadstica (INE)

15

Ejemplos: Distribucin de Frecuencia.


Grupo de Edad
(ic)

Poblacin
(fi)

mi

hi

(%) hi

Fi

Hi

(%) Hi

0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+

30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824

2
7
12
17
22
27
32
37
42
47
52
57
62
67
72
77
82

0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085

9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482

30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938

0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000

9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000

Total

332.938

1,0000

100,0000

Nota importante: Para el ltimo grupo de edad (80+) se tiene que mi= 82, ya que la
separacin entre los puntos medios se da con un incremento de cinco (5).

Sexo

Poblacin
(fi)

hi

(%) hi

Masculino
Femenino

168.340
164.598

0,5056
0,4944

50,5620
49,4380

Total

332.938

1,0000

100,0000

Medidas de Anlisis de Datos


Son aquellas medidas que nos permiten analizar la Distribucin de Frecuencias de los
datos con nmeros que reflejen las caractersticas ms importantes de la data, por
ejemplo la media, moda o mediana.

16

Medidas de Tendencia Central


Para definir una distribucin de datos se precisa de un tipo de medida alrededor de la
cual tiendan a agruparse la mayor cantidad de valores de la serie, es decir, que
centraliza la distribucin, una especie de valor representativo del grupo, una medida as
definida se conoce como medida de tendencia central.
Existen varios tipos de medidas de tendencia central, las ms conocidas o utilizadas
son:
 La media aritmtica.
 Media ponderada.
 La mediana.
 La moda.
Nota Importante: El mtodo de determinacin de cada medida depende si los datos
estn agrupados no.

Promedio
Es un valor que resume la informacin de una serie de observaciones y que se
considera como representativo de estas. Existen varios tipos de promedios pero el ms
conocido y utilizado es la media aritmtica.

Media aritmtica
Es la medida de tendencia central por excelencia, es el valor tpico representativo del
conjunto de datos considerados. Se obtiene sumando el conjunto de valores observados
y se divide el resultado entre el nmero de observaciones.
Es el ms usado de los promedios, siempre y cuando la serie no presente valores
extremos, ya que esto distorsiona el valor de la media en este caso sera aconsejable
otra medida (la mediana por ejemplo).

17

Caso datos no agrupados


Frmula para calcular la Media Aritmtica para datos no agrupados:
n

X =

x
i =1

Leyenda:
n: Nmero de observaciones
xi : Valor que asume la variable en la i-sima observacin
: Sumatoria

X : Media aritmtica
Ejemplo del clculo de la Media Aritmtica para datos no agrupados
Supongamos que las edades de 15 estudiantes son: 12, 10, 13, 11, 10, 12, 9, 11, 13, 9,
11, 11,13, 12, 11.
n

X =

x
i =1

12 + 10 + 13 + 11 + 10 + 12 + 9 + 11 + 13 + 9 + 11 + 11 + 13 + 12 + 11
= 11,2 Aos
15

Caso datos agrupados


Frmula para calcular la Media Aritmtica para datos agrupados:

X=

fm
i =1

Leyenda:
n: Nmero de observaciones
k: Nmero de intervalos
mi : Punto Medio del i-simo intervalo
f i : Frecuencia absoluta del i-simo intervalo
: Sumatoria

X : Media aritmtica

18

Ejemplo del clculo de la Media Aritmtica para datos agrupados

Grupos de Edades
(ic)

Poblacin
(fi)

(mi)

0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+

30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824

2
7
12
17
22
27
32
37
42
47
52
57
62
67
72
77
82

Total

332.938

(fi*mi)
61.138
209.685
356.400
517.752
665.544
778.113
828.576
881.044
953.484
943.666
875.004
778.278
632.834
501.696
404.208
314.776
231.568
9.933.766

X =

i =1

fimi
n

9 . 933 . 766
= 29 ,84 Aos
332 . 938

Media ponderada
Es el promedio obtenido al multiplicar el valor de las observaciones por su importancia
relativa (peso) entre la sumatoria total de los pesos.

Frmula para calcular la Media Ponderada:


n

x w
i =1
n

w
i =1

19

Leyenda:
n: Nmero de observaciones
xi : Valor que asume la variable en la i-sima observacin
wi : Peso de la i-sima observacin

Ejemplo del clculo de Media Ponderada


Supongamos que las calificaciones obtenidas por un estudiante estn relacionadas con
la modalidad de asignacin de crditos a cada una de las asignaturas cursadas. Si la
asignatura A tiene dos (2) crditos y la asignatura B tres (3) crditos. Entonces, para
un estudiante que haya obtenido una calificacin de cuatro (4) puntos en la asignatura
A y de cinco (5) en la asignatura B, tendra una nota promedio ponderada de:

2(4 ) + 3(5) 8 + 15 23
=
=
= 4,6 puntos
2+3
5
5

Mediana
Es el valor que divide un conjunto de observaciones ordenadas respecto de la magnitud
de los valores, de tal manera que el nmero de datos por encima de este sea igual al
nmero de datos por debajo de la misma.
Tal como sucede con la media, el mtodo de determinacin de la mediana depende de
si los datos son agrupados o no.
Caso datos no agrupados
Ejemplo del clculo de la mediana para datos no agrupados:
Cuando n es impar (n = 2k +1)
Continuando con el ejemplo de las edades de los 15 estudiantes, si ordenamos los
datos se obtiene lo siguiente: 9, 9, 10,10,11, 11, 11, 11, 11, 12, 12, 12, 13, 13, 13.

n + 1 15 + 1 16
=
= 8 , lo que indica que el lugar
=
2
2
2
posicional de la mediana es 8. Finalmente tenemos que la Md = 11 Aos.
Se debe cumplir que

k + 1 =

20

Cuando n es par (n = 2k)


Supongamos ahora que se tienen las siguientes edades ordenadas de 14 estudiantes: 9,
9, 10,10,11, 11, 11, 11, 11, 12, 12, 12, 13, 13.
La mediana ser el promedio de los dos valores centrales, es decir:

1
( X k + X k +1 ) , como sabemos que n = 2k, tenemos que k = n = 14 = 7 , por lo
2
2 2
1
1
22
tanto k+1 = 8, luego se tiene que la Md = ( X 7 + X 8 ) = (11 + 11) =
= 11Aos
2
2
2
Md =

Caso datos agrupados


Frmula para calcular la mediana para datos agrupados:

F
i
( ant )

Md = Li + 2
* Aic
f
i

Leyenda
n: Nmero de observaciones
Li : Lmite inferior de la clase medianal
Fi (ant ) : Frecuencia absoluta acumulada hasta la clase anterior a la de la mediana
f i : Frecuencia absoluta de la clase medianal
Aic : Amplitud del intervalo de clase

21

Ejemplo del clculo de la mediana para datos agrupados:

Grupo de Edad
(ic)

Poblacin
(fi)

hi

(%) hi

Fi

Hi

(%) Hi

0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+

30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824

0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085

9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482

30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938

0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000

9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000

Total

332.938

1,0000

100,0000

Clase Medianal

F
(
)
i
ant

166.469 150.932
Md = Li + 2
* Aic = 24,5 +
* 5 = 27,20 Aos
fi
28
.
819

Propiedades de la mediana
 Slo se puede obtener a partir de datos previamente ordenados y no est
influenciada por los valores de la serie.
 Su caracterstica bsica es que divide la serie en dos partes iguales.
Moda
Es el valor que aparece con mayor frecuencia. Si ningn nmero aparece ms de una
vez, entonces no existe moda. Es tambin posible, sin embargo, para un conjunto de
nmeros tener varias modas.

22

En el caso de datos agrupados, la clase o clases para la cual la frecuencia es la mayor,


se llama clase modal.
Aun cuando la moda es un valor sencillo y til, slo se aplica cuando nos conformamos
con una idea superficial de la tendencia central de la distribucin. Es un valor muy
inestable y su uso no es recomendable en los casos en los que se requiera efectuar un
anlisis estadstico ms profundo; en estos casos, es preferible optar por alguna de las
otras medidas de tendencia central antes consideradas.

Caso datos no agrupados


Ejemplo del clculo de la moda para datos no agrupados:
En el caso de las edades de los 15 estudiantes (12, 10, 13, 11, 10, 12, 9, 11, 13, 9, 11,
11,13, 12, 11) claramente se puede observar que la moda es igual a 11, ya que es el
valor que ms se repite en la serie de datos.
Xi
9
10
11
12
13

fi
2
2
5
3
3

Caso datos agrupados


Frmula para calcular la Moda para datos agrupados:

D1
Mo = L i +
D1 + D 2

* Aic

Leyenda
Li : Lmite inferior de la clase modal (la clase modal ser la que posea mayor frecuencia
absoluta)
D1 : Diferencia entre la frecuencia absoluta de la clase modal y la clase anterior, en
valor absoluto
D2 : Diferencia entre la frecuencia absoluta de la clase modal y la clase siguiente, en
valor absoluto
Aic : Amplitud del intervalo de clase

23

Ejemplo del clculo de la moda para datos agrupados:


Grupo de Edad
(ic)

Poblacin
(fi)

hi

(%) hi

Fi

Hi

(%) Hi

0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+

30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824

0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085

9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482

30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938

0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000

9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000

Total

332.938

1,0000

100,0000

D1
Mo = Li +
D1 + D2

Clase Modal

30.569
* Aic = 0,5 +
* 5 = 4,40 Aos
31.183

Donde D1 = 30.569 0 = 30.569


D2 = 30.569 29.955 = 614
D1 + D2 = 30.569 + 614 = 31.183

Medidas de Posicin
Las medidas estadsticas que determinan una posicin dentro de una distribucin
ordenada, se les denomina medidas de posicin, por cuanto nos determinan cualquier
posicin que se requiera dentro de la distribucin.

24

Analicemos las principales medidas que dividen a la distribucin en cuatro (4)


(Cuartiles), diez (10) (Deciles), cien (100) (Centiles o Percentiles) partes iguales.

Cuartiles
Son los valores que dividen la distribucin ordenada, en cuatro (4) partes iguales, tales
que cada una de ellas contiene un veinticinco por ciento (25%) de las observaciones.
Los Cuartiles son tres (3) y se representan por Q1, Q2, Q3. Cabe destacar que el Q2 se
corresponde a la mediana.

El primer cuartil (Q1): Valor de la variable que deja el 25% de la informacin por

debajo de l, y el 75% por encima.

El segundo cuartil (Q2): Valor de la variable que deja el 50% de la informacin por

debajo de l, y el 50% por encima.

El tercer cuartil (Q3): Valor de la variable que deja el 75% de la distribucin por

debajo de l, y el 25% por encima.

En particular, los Cuartiles coinciden con los Percentiles 25, 50 y 75.

Caso datos no agrupados


Frmula para calcular los Cuartiles para datos no agrupados:

Q j = xi + ( x s xi ) * R
Leyenda
Q j : Cuartil j-simo
xi : Dato inferior al cuartil j-simo
x s : Dato superior al cuartil j-simo

R : Diferencia entre el lugar del cuartil j-simo y el lugar del dato inferior.
Ejemplo del clculo del segundo Cuartil Q2 para datos no agrupados:
Trabajando con el ejemplo de las edades de los 15 estudiantes:
1) Se ordenan los datos de menor a mayor:

25

9, 9, 10,10,11, 11, 11, 11, 11, 12, 12, 12, 13, 13, 13
2) Calculamos el lugar del cuartil buscado: Q2
Lugar =

j * n 2 *15
=
= 7,5
4
4

El segundo cuartil, est ubicado entre los datos que ocupan los lugares (7 y 8), el
primer y el segundo es 11, por lo que xi = 11 y x s = 11 .
3) Determinamos el valor de R = 7,5 7 = 0,5 .
4) Aplicando la frmula para calcular el segundo cuartil (Q2 ) :
Q2 = xi + (x s xi ) * R = 11 + (11 11) * 0,5 = 11Aos

A ambos lados del valor que ocupa el lugar 7,5 (Q2 = 11Aos ) , se encuentra el 50% de
los datos.

Caso datos agrupados


Frmula para calcular los Cuartiles para datos agrupados:

n*

4
Q j = Li +

j
Fi ( ant )

fi

* A
ic

; Donde j= 1, 2, 3.

Leyenda
n: Nmero de observaciones
Li : Lmite inferior de la clase que contiene al cuartil j-simo
Fi (ant ) : Frecuencia absoluta acumulada anterior a la clase que contiene al cuartil j-simo
f i : Frecuencia absoluta de la clase que contiene al cuartil j-simo
Aic : Amplitud del intervalo de clase

26

Ejemplo del clculo del tercer cuartil (Q3):


Grupo de Edad
(ic)

Poblacin
(fi)

hi

(%) hi

Fi

Hi

(%) Hi

0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+

30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824

0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085

9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482

30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938

0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000

9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000

Total

332.938

1,0000

100,0000

n*3

Fi ( ant )
4

Q3 = Li +

fi

Clase Q3

332.938 * 3

229.456
4

* 5 = 43,96 Aos
* A = 39,5 +
ic

22.702

Aproximadamente el 75% de las personas tienen edades por debajo de 43,96 aos y el
25% por encima.

Deciles
Son los nueve (9) valores que dividen la distribucin ordenada en diez (10) partes
iguales, tales que cada una de ellas contiene el diez por ciento (10%) de las
observaciones. Se denotan por D1, D2, D9. Cabe destacar que el quinto decil (D5) se
corresponde a la mediana.

27

Caso datos no agrupados


Frmula para calcular los Deciles para datos no agrupados:

D j = x i + ( x s xi ) * R
Leyenda
D j : Decil j-simo
xi : Dato inferior al decil j-simo
x s : Dato superior al decil j-simo

R : Diferencia entre el lugar del decil j-simo y el lugar del dato inferior
Ejemplo del clculo del Quinto Decil

(D5 ) para datos no agrupados:

Continuamos con el ejemplo de las edades de los 15 estudiantes:


1) Se ordenan los datos de menor a mayor:
9, 9, 10,10,11, 11, 11, 11, 11, 12, 12, 12, 13, 13, 13
2) Calculamos el lugar del decil buscado: D5
Lugar =

j * n 5 * 15
=
= 7,5
10
10

El quinto decil, est ubicado entre los datos que ocupan los lugares (7 y 8), el primer
y el segundo es 11, por lo que xi = 11 y x s = 11 .
3) Determinamos el valor de R = 7,5 7 = 0,5 .
4) Aplicando la frmula para calcular el quinto decil (D5 ) :
D5 = xi + ( x s xi ) * R = 11 + (11 11) * 0,5 = 11Aos

A ambos lados del valor que ocupa el lugar 7,5 (Q5 = 11Aos ) , se encuentra el 50% de
los datos.

28

Caso datos agrupados


Frmula para calcular los Deciles para datos agrupados:

n* j

Fi ( ant )
10

D j = Li +

fi

* A ; Donde j= 1, 2, 3, , 9.
ic

Leyenda
n: Nmero de observaciones
Li : Lmite inferior de la clase que contiene al decil j-simo
Fi (ant ) : Frecuencia absoluta acumulada anterior a la clase que contiene al decil j-simo
f i : Frecuencia absoluta de la clase que contiene al decil j-simo
Aic : Amplitud del intervalo de clase

Ejemplo del clculo del decil 7 (D7):


Grupo de Edad
(ic)

Poblacin
(fi)

hi

(%) hi

Fi

Hi

(%) Hi

0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+

30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824

0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085

9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482

30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938

0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000

9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000

Total

332.938

1,0000

100,0000

Clase D7

29

n*7

Fi ( ant )
10

D7 = Li +

fi

332.938 * 7

229.456
10

* A = 39,5 +
* 5 = 40,29 Aos
ic

22.702

El 70% de las personas tienen edad por debajo de 40,29 aos y el 30% por encima.

Percentiles
Son los noventa y nueve (99) valores que dividen la distribucin ordenada en cien (100)
partes iguales, tales que cada una de ellas contienen el uno por ciento (1%) de las
observaciones. Se denotan por P1, P2, P99. El percentil cincuenta (50) se corresponde
con la Mediana y el segundo cuartil; asimismo, P25 y P75 se corresponde con el primero
y el tercer cuartil, respectivamente.

Caso datos no agrupados


Frmula para calcular los Percentiles para datos no agrupados:

Pj = xi + ( x s xi ) * R
Leyenda
Pj : Percentil j-simo
xi : Dato inferior al percentil j-simo
x s : Dato superior al percentil j-simo

R : Diferencia entre el lugar del percentil j-simo y el lugar del dato inferior
Ejemplo del clculo del percentil cincuenta (P50 ) para datos no agrupados:
Continuando con el ejemplo de las edades de los 15 estudiantes:
1) Se ordenan los datos de menor a mayor:
9, 9, 10,10,11, 11, 11, 11, 11, 12, 12, 12, 13, 13, 13
2) Calculamos el lugar del percentil buscado: P50
Lugar =

j * n 50 *15
=
= 7,5
100
100

30

El percentil 50, est ubicado entre los datos que ocupan los lugares (7 y 8), el primer
y el segundo es 11, por lo que xi = 11 y x s = 11 .
3) Determinamos el valor de R = 7,5 7 = 0,5 .
4) Aplicando la frmula para calcular el percentil 50 (P50 ) :
P50 = xi + ( x s xi ) * R = 11 + (11 11) * 0,5 = 11Aos

A ambos lados del valor que ocupa el lugar 7,5 (P50 = 11Aos ) , se encuentra el 50% de
los datos.

Caso datos agrupados


Frmula para calcular los Percentiles para datos agrupados:

n* j

Fi ( ant )
100

Pj = Li +

fi

* A ; Donde j=1, 2, 3, , 99.


ic

Leyenda
n: Nmero de observaciones
Li : Lmite inferior de la clase que contiene al percentil j-simo
Fi (ant ) : Frecuencia absoluta acumulada anterior a la clase que contiene al percentil
j-simo
f i : Frecuencia absoluta de la clase que contiene al percentil j-simo
Aic : Amplitud del intervalo de clase

31

Ejemplo del clculo del percentil 40 (P40):

Grupo de Edad
(ic)

Poblacin
(fi)

hi

(%) hi

Fi

Hi

(%) Hi

0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+

30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824

0,0918
0,0900
0,0892
0,0915
0,0909
0,0866
0,0778
0,0715
0,0682
0,0603
0,0505
0,0410
0,0307
0,0225
0,0169
0,0123
0,0085

9,1816
8,9972
8,9206
9,1476
9,0864
8,6560
7,7771
7,1521
6,8187
6,0306
5,0541
4,1011
3,0657
2,2491
1,6862
1,2279
0,8482

30.569
60.524
90.224
120.680
150.932
179.751
205.644
229.456
252.158
272.236
289.063
302.717
312.924
320.412
326.026
330.114
332.938

0,0918
0,1818
0,2710
0,3625
0,4533
0,5399
0,6177
0,6892
0,7574
0,8177
0,8682
0,9092
0,9399
0,9624
0,9792
0,9915
1,0000

9,1816
18,1788
27,0993
36,2470
45,3334
53,9893
61,7665
68,9185
75,7372
81,7678
86,8219
90,9229
93,9887
96,2377
97,9239
99,1518
100,0000

Total

332.938

1,0000

100,0000

n * 40

Fi ( ant )
100

P40 = Li +

fi

Clase P40

332.938 * 40

120.680
100

* A = 19,5 +
* 5 = 21,57 Aos
ic

30.252

Aproximadamente el 40% de las personas tienen edades por debajo de 21,57 aos y el
60% por encima.

Medidas de Variabilidad
Una medida de variabilidad es un nmero que nos indica el grado de dispersin de un
conjunto de datos. Si este valor es pequeo (respecto de la unidad de medida) entonces
hay una gran uniformidad entre los datos. Por el contrario, un gran valor nos indica
poca uniformidad. Cuando es cero quiere decir que todos los datos son iguales.
Las medidas de variabilidad ms comunes son la amplitud o rango, la varianza y la
desviacin tpica o desviacin estndar.

32

Rango o amplitud
Es la diferencia entre el valor mximo y el mnimo de los datos. Formalmente, la
amplitud se define as: Si X M representa el dato mayor y X m el dato menor entonces la
amplitud A, est dada por: A = X M X m .
Cuando se trata de datos agrupados, la amplitud se toma como la diferencia entre el
lmite superior del ltimo intervalo y el inferior del primero.
La amplitud, debido a la forma matemtica que la define, es bastante sensible a los
valores extremos que se puedan presentar en una sucesin de datos. Adems al no
tomar en cuenta ninguna medida de posicin, no informa nada acerca de cmo se
comportan los datos respecto del centro.
La amplitud se utiliza cuando los datos son muy escasos o demasiado dispersos para
justificar el clculo de una medida de variabilidad ms precisa. Tambin se utiliza la
amplitud cuando slo se desea conocer los valores extremos o la dispersin total.

Varianza
Se define como el cuadrado de la desviacin tpica y viene dada por
poblacin y S

2 para la

para la muestra. La varianza de una variable mide la dispersin de sus

valores respecto al valor central . El principal problema de la varianza es que se


expresa en unidades cuadrticas que no siempre tienen una interpretacin clara.

Caso datos no agrupados


Frmula para calcular la Varianza para datos no agrupados:

(x
n

i =1

Leyenda:
n: Nmero de observaciones
xi : Valor que asume la variable en la i-sima observacin

X : Media aritmtica
: Sumatoria

33

Ejemplo para calcular la Varianza para datos no agrupados:


Supongamos que las edades de 15 estudiantes son: 12, 10, 13, 11, 10, 12, 9, 11, 13, 9,
11, 11,13, 12, 11.
Sabemos que: X = 11,2 (Valor calculado en el ejemplo de media aritmtica para datos
no agrupados). Adems tenemos que:
(9 - 11,2)2 = 4,84
(10 - 11,2)2 = 1,44
(11 - 11,2)2 = 0,04
(12 - 11,2)2 = 0,64
(13 - 11,2)2 = 3,24
Luego desarrollando la frmula de la varianza para datos simples se obtiene lo
siguiente:

S2 =

0,64 + 1,44 + 3,24 + 0,04 + 1,44 + 0,64 + 4,84 + 0,04 + 3,24 + 4,84 + 0,04 + 0,04 + 3,24 + 0,64 + 0,04
15

Finalmente tenemos que:

S2 =

24,4
= 1,626666667
15

Caso datos agrupados


Frmula de la Varianza para datos agrupados:

f (m
K

i =1

Leyenda:
n: Nmero de observaciones
k: Nmero de intervalos
mi : Punto Medio del i-simo intervalo

X : Media aritmtica
f i : Frecuencia absoluta del i-simo intervalo
: Sumatoria

34

Ejemplo del clculo de la Varianza para datos agrupados:

(m

) (m

Grupos de Edades
(ic)

Poblacin
(fi)

mi

0-4
5-9
10 - 14

30.569
29.955
29.700

2
7
12

-27,84
-22,84
-17,84

775,07
521,67
318,27

23.692.980,33
15.626.493,05
9.452.488,32

15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+

30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824

17
22
27
32
37
42
47
52
57
62
67
72
77
82

-12,84
-7,84
-2,84
2,16
7,16
12,16
17,16
22,16
27,16
32,16
37,16
42,16
47,16
52,16

164,87
61,47
8,07
4,67
51,27
147,87
294,47
491,07
737,67
1034,27
1380,87
1777,47
2224,07
2720,67

5.021.146,71
1.859.457,33
232.442,53
120.806,38
1.220.736,47
3.356.844,85
5.912.280,32
8.263.160,85
10.072.086,10
10.556.748,98
10.339.921,61
9.978.691,88
9.091.980,17
7.683.159,65

Total

332.938

Recordemos que:

fi * m i X

132.481.425,53

X = 29 ,84 Aos

132 .481 . 425 ,53


= 397 ,916205
332 .938

Desviacin estndar
Es la medida de variabilidad ms utilizada por ser la ms estable de todas, se basa en
los desvos de los datos originales con respecto a la media, pero se toma en cuenta el
signo de estos desvos. Se denota como para la poblacin y S para la muestra.

Caso datos no agrupados


Frmula para calcular la Desviacin Estndar para datos no agrupados:

(x
n

S=

i =1

35

Leyenda:
n: Nmero de observaciones
xi : Valor que asume la variable en la i-sima observacin

X : Media aritmtica
: Sumatoria

Ejemplo para calcular la Desviacin Estndar para datos no agrupados:


Continuando con el ejemplo de los 15 estudiantes con las siguientes edades: 12, 10,
13, 11, 10, 12, 9, 11, 13, 9, 11, 11,13, 12, 11.
Sabemos que: X = 11,2 (Valor calculado en el ejemplo de media aritmtica para datos
no agrupados). Adems tenemos que:
(9 - 11,2)2 = 4,84
(10 - 11,2)2 = 1,44
(11 - 11,2)2 = 0,04
(12 - 11,2)2 = 0,64
(13 - 11,2)2 = 3,24
Luego desarrollando la frmula de la desviacin estndar para datos simples se obtiene
lo siguiente:

S=

0,64 + 1,44 + 3,24 + 0,04 + 1,44 + 0,64 + 4,84 + 0,04 + 3,24 + 4,84 + 0,04 + 0,04 + 3,24 + 0,64 + 0,04
15

Finalmente tenemos que:

S=

24,4
= 1,626666667 = 1,275408431
15

Caso datos agrupados


Para datos agrupados la Desviacin Estndar se calcula al utilizar la frmula:

f (m
k

S=

i =1

36

Leyenda:
n: Nmero de observaciones
k: Nmero de intervalos
mi : Punto Medio del i-simo intervalo

X : Media aritmtica
f i : Frecuencia absoluta del i-simo intervalo
: Sumatoria
Ejemplo del clculo de la Desviacin Estndar para datos agrupados:
Utilizando los resultados obtenidos en el caso de la varianza logramos el siguiente
resultado:
S=

132.481.425,53
= 397,916205 = 19,9478371
332.938

Proporciones y Razones
Proporcin
Las proporciones expresan en trminos porcentuales la cantidad de elementos que
poseen una caracterstica o categora de esta dentro de una poblacin, con respecto al
total de esta. Estas nos dan una idea ms clara y precisa de la estructura o composicin
de una poblacin. En otras palabras podemos decir que la proporcin, es la porcin de
elementos de la poblacin que poseen ciertos atributos con respecto al total. Es
frecuente que se desee conocer la proporcin de una condicin o caracterstica dada
en una poblacin. Un ejemplo es cuando se desea conocer la proporcin de aprobados
o reprobados en una poblacin estudiantil.
Frmula para calcular la Proporcin:
Pr oporcin =

a
(a + b )

Leyenda:
a : Total de elementos que poseen la caracterstica
b : Total de elementos que NO poseen la caracterstica
(a + b) : Total de elementos en la poblacin

37

Ejemplo del clculo de la Proporcin:


Grupo de Edad
Masculino Femenino
(ic)

Total

Proporcin de Masculino
Respecto al total (%)

Proporcin de Femenino
Respecto al total (%)

Proporcin segn
Grupo de Edad (%)

0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+

15.613
15.265
15.155
15.549
15.491
14.703
13.145
12.066
11.533
10.220
8.472
6.813
4.980
3.562
2.602
1.907
1.264

14.956
14.690
14.545
14.907
14.761
14.116
12.748
11.746
11.169
9.858
8.355
6.841
5.227
3.926
3.012
2.181
1.560

30.569
29.955
29.700
30.456
30.252
28.819
25.893
23.812
22.702
20.078
16.827
13.654
10.207
7.488
5.614
4.088
2.824

4,69
4,58
4,55
4,67
4,65
4,42
3,95
3,62
3,46
3,07
2,54
2,05
1,50
1,07
0,78
0,57
0,38

4,49
4,41
4,37
4,48
4,43
4,24
3,83
3,53
3,35
2,96
2,51
2,05
1,57
1,18
0,90
0,66
0,47

9,18
9,00
8,92
9,15
9,09
8,66
7,78
7,15
6,82
6,03
5,05
4,10
3,07
2,25
1,69
1,23
0,85

Total

168.340

164.598

332.938

50,56

49,44

100,00

Luego interpretando la primera fila se tiene que:




Existe un 4,69% de personas del sexo masculino con edades comprendidas entre 0

y 4 aos con respecto al total.




Existe un 4,49% de personas del sexo femenino con edades comprendidas entre 0 y

4 aos con respecto al total.




Existe un 9,18% de las personas que tienen edades comprendidas entre 0 y 4 aos

con respecto al total.


Razn
La razn es una medida estadstica que nos indica la relacin existente entre dos
elementos de una misma poblacin, en referencia a la presencia de uno de estos por
unidades del otro. Es decir, expresa la relacin de cuantos elementos existen en una
poblacin dada la presencia de otro.

38

Frmula para calcular la Razn:

Razn =

a
b

Leyenda:
a : Total de elementos del tipo a
b : Total de elementos del tipo b
Ejemplo del clculo de la Razn:
Grupo de Edad
(ic)

Masculino

Femenino

Razn de
Masculinidad

0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80+

15.613
15.265
15.155
15.549
15.491
14.703
13.145
12.066
11.533
10.220
8.472
6.813
4.980
3.562
2.602
1.907
1.264

14.956
14.690
14.545
14.907
14.761
14.116
12.748
11.746
11.169
9.858
8.355
6.841
5.227
3.926
3.012
2.181
1.560

1,04
1,04
1,04
1,04
1,05
1,04
1,03
1,03
1,03
1,04
1,01
1,00
0,95
0,91
0,86
0,87
0,81

Total

168.340

164.598

1,02

Luego, interpretando la primera fila tenemos que: por cada mujer con edades
comprendidas entre 0 y 4 aos existen 1,04 hombres.

39

Bibliografa
-

GONZLEZ, Alexis. El mtodo de la investigacin cientfica, Contexto editores,


Caracas, 1997.

SABINO, Carlos. El proceso de investigacin, Editorial Panapo, Caracas, 2000.

FERRN, Magdalena. SPSS para Windows, Editorial McGRAW-HILL, Espaa,


2001.

VSQUEZ M y RAMREZ G. Introduccin al Anlisis de Datos, Material de


apoyo, UCV, Caracas, 2002.

CHAO, Lincoln L. Estadstica para las Ciencias Administrativas. Tercera Edicin,


Mc Graw Hill. Santaf de Bogot, Enero 1999.

HAMDAN G. Nijad. Mtodos Estadsticos en Educacin. UCV. Ediciones de la


Biblioteca, Caracas, 1994.

CHOURIO, Jos H. Estadstica I. Editorial Biosfera, Caracas, 1987.

COCHRAN, William G. Tcnicas de muestreo. Compaa Editorial Continental,


S. A. de C. V, Mxico, 1977.

Gua de Estudio de Estadstica Bsica, Gerencia Estadal de Estadstica del Distrito


Capital. INE, 2006.

40

También podría gustarte