Está en la página 1de 116

ESTADSTICA

TECNOLOGA EN GESTIN PBLICA AMBIENTAL


TECNOLOGA EN GESTIN PBLICA FINANCIERA
TECNOLOGA EN GESTIN PBLICA CONTABLE




ORLANDO MOSCOTE FLREZ









ESCUELA SUPERIOR DE ADMINISTRACIN PBLICA







ESCUELA SUPERIOR DE ADMINISTRACIN PBLICA





Director
HONORIO MIGUEL HENRIQUEZ PINEDO


Subdirector acadmico
CARLOS ROBERTO CUBIDES OLARTE


Decano de pregrado
JAIME ANTONIO QUICENO GUERRERO


Coordinador Nacional de A.P.T
JOSE PLACIDO SILVA RUIZ





ESCUELA SUPERIOR DE ADMINISTRACIN PBLICA
ORLANDO MOSCOTE FLREZ

Bogot D.C., Enero de 2008






CONTENIDO

Del trabajo del tutor
1 INTRODUCCIN A LA ESTADSTICA
1.1 Presentar la Estadstica como ciencia
1.2 Usos de la estadstica
1.3 Trminos frecuentes en estadstica
1.4 El muestreo y el censo
1.5 Clases de variables
1.6 Tipos de datos.
2 DISTRIBUCIONES DE FRECUENCIAS
2.1 Definicin de una distribucin de frecuencias
2.2 Distribucin para datos cualitativos
2.3 Distribucin para variables cuantitativas discretas
2.4 Distribucin para variables cuantitativas continuas
2.5 Datos cronolgicos
3 MEDIDAS DE TENDENCIA CENTRAL
3.1 Introduccin
3.2 Media aritmtica
3.3 Media Geomtrica
3.4 Mediana
3.5 Moda
4 MEDIDAS DE DISPERSIN
4.1 Introduccin
4.2 Rango o Recorrido
4.3 Varianza
4.4 Desviacin estndar
4.5 Coeficiente de variacin
5 ANLISIS DE REGRESIN
5.1 Introduccin
5.2 Diagrama de dispersin
5.3 Estimacin de la ecuacin lineal de mnimos cuadrados
5.4 Error estndar de estimacin
5.5 Coeficiente de determinacin
5.6 Coeficiente de correlacin
6 SERIES DE TIEMPO
6.1 Introduccin
6.2 Definicin de una serie de tiempo
6.3 Componentes de una serie de tiempo
6.4 Anlisis de tendencia
6.5 Pronsticos con las series de tiempo
7 NMEROS NDICES
7.1 Introduccin
7.2 Definicin de un nmero ndice
7.2.1 ndices para un solo bien
7.2.2 ndices de base fija
7.2.3 ndices de base variable
7.3 ndices compuestos
7.3.1 ndices de agregativos simple
7.3.2 ndices de promedios de relativos
7.4 ndices ponderados
7.4.1 ndice de Laspeyres
7.4.2 ndice de Paasche.
7.4.3 ndice de Fisher
7.5 Cambio de base
7.5.1 De una base fija a otra base fija
7.5.2 De una base variable a una base fija o a la inversa
7.6 Uso de los nmeros ndices
7.7 Definicin de un nmero ndice



DEL TRABAJO DEL TUTOR


El tutor tendr libertad de ctedra en cuanto a su posicin terica o ideolgica
frente a los contenidos del mdulo, pero el desarrollo de los contenidos de los
mdulos son de obligatorio cumplimiento por parte de los tutores. Los Tutores
podrn complementarlos los mdulos con lecturas adicionales, pero lo obligatorio
para el estudiante frente a la evaluacin del aprendizaje son los contenidos de los
mdulos; es decir, la evaluacin del aprendizaje deber contemplar nicamente
los contenidos de los mdulos. As mismo, la evaluacin del Tutor deber
disearse para dar cuenta del cubrimiento de los contenidos del mdulo.
El Tutor debe disear, planear y programar con suficiente anticipacin las
actividades de aprendizaje y los contenidos a desarrollar en cada sesin de tutora
(incluyendo la primera). Tambin debe disear las estrategias de evaluacin del
trabajo del estudiante que le permita hacer seguimiento del proceso de
autoaprendizaje del estudiante. Por cada crdito, 16 horas son de tutora
presencial o de encuentro presencial y 32 horas son de autoaprendizaje (y este
tiempo de trabajo del estudiante debe ser objeto de seguimiento y evaluacin por
parte del tutor). Las asignaturas (mdulos) de APT son de 2, 3 y 4 crditos.





























ESTADSTICA






















UNIDAD I
INTRODUCCIN A LA
ESTADSTICA




OBJ ETIVOS


1. PRESENTAR LA ESTDSTICA COMO CIENCIA
2. DAR A CONOCER ALGUNOS USOS DE LA ESTADSTICA
3. PRESENTAR ALGUNOS TRMINOS FRECUENTES EN ESTADSTICA.
4. DEFINIR LOS CONCEPTOS DE MUESTREO Y CENSO
5. CLASIFICAR LOS TIPOS DE VARIABLES
6. DEFINIR LOS TIPOS DE DATOS.

1.1 ORIGEN Y DESARROLLO DE LA ESTADSTICA

La palabra Estadstica es ampliamente utilizada a diario, generalmente
refirindose a hechos numricos. En sus inicios, efectivamente la estadstica
se utiliz en trminos de contar hechos o fenmenos que ocurran en una
poblacin. Para los gobernantes era necesario disponer de informacin acerca
de las actividades que ocurran en sus Estados, como por ejemplo, conocer el
nmero de habitantes que lo conformaban, el nmero de hombres disponibles
para la guerra, el nmero de personas que moran de una determinada
enfermedad.

Si bien, estos fueron los inicios rudimentarios de la Estadstica, aun hoy ese
uso sigue dndose como una simple recopilacin de datos numricos para
analizar un fenmeno, como puede ser una recopilacin de datos acerca de la
produccin de bienes y servicios, las cuentas nacionales de un pas, recuentos
demogrficos o de salubridad que pueden implicar un proceso laborioso y de
alta tcnica que incluyen principios tericos de microeconoma,
macroeconoma o bioestadstica, tambin pueden referirse a recuentos ms
sencillos o cotidianos como las estadsticas que se relacionan con un partido
de football o de baseball.

Sin embargo, durante el siglo XVII, Blas Pascale y Pierre de Feermat, a partir
de algunas inquietudes relacionadas con los juegos de azar sentaron las
bases de lo que posteriormente se conocera como Clculo de Probabilidades,
pero solamente hasta finales del siglo XIX y principalmente a principios del
siglo XX, Francis Galton, William Gosset, Karl Pearson y sobre todo Ronald
Fisher, crearon lo que hoy es la Estadstica Moderna: ms que una simple
recopilacin de datos, es un proceso sistemtico de principios cientficos que
pueden ser aplicados en muchas otras ciencias para contribuir a la toma de
decisiones en condiciones de riesgo o incertidumbre.

1.2 USO DE LA ESTADSTICA

Algunos ejemplos del uso de la Estadstica en diferentes campos son :
establecer cul de varios procedimientos o tratamientos es el mejor ; probarse
una droga es ms efectiva que otra en el tratamiento de una enfermedad ;
elaborar modelos acerca del comportamiento del inventario de una materia
prima, para determinar el tamao ptimo del lote que se requiere pedir, y
lapsos de reaprovisionamiento ; realizar estudios de colas en un banco o en un
supermercado con el propsito de establecer el nmero de cajas que se
requieren para atender a los clientes.

Los anteriores son algunos ejemplos que pueden ser aplicados en campos tan
diversos como la Ingeniera, la Medicina, la Administracin. Pero todos tienen
en comn un hecho: se acude al estudio de algunos casos, una muestra, con
el fin de realizar generalizaciones para ayudar en la toma de decisiones, y
justamente, el Administrador de Empresas es el Profesional que
frecuentemente se enfrenta a la toma de decisiones, pues tiene diferentes
alternativas entre las cuales debe elegir con el propsito de maximizar la
administracin Empresarial. En el estudio de Administracin de Salarios, el la
Investigacin de Operaciones, en el Control de Calidad, en la Investigacin de
Mercados, en Comercializacin son campos en los cuales el Administrador de
Empresas se suele mover frecuentemente y en los cuales ser necesario que
deba acudir a sus conocimientos de Estadstica.

Adems de las anteriores consideraciones, la Estadstica como ciencia de
origen Matemtico le ayudar en la obtencin de un proceso de racionamiento
lgico en la organizacin de conjuntos de datos numricos que le permitirn
con mayor eficiencia enfrentar decisiones en su vida estudiantil o profesional.
Dentro de este contexto, es entonces, que la Estadstica se considera una
poderosa herramienta que le permitir utilizar procedimientos y tcnicas
necesarias como soporte de la toma de decisiones a nivel empresarial.


1.3 DEFINICIN DE ESTADSTICA

La Estadstica puede definirse como: Ciencia que trata de los procedimientos para
recolectar, procesar, interpretar y analizar conjuntos de datos numricos obtenidos
de una poblacin o de una muestra con el fin de extraer conclusiones acerca de
un fenmeno que se estudia y apoyar la toma de decisiones.

La estadstica se divide en dos ramas:
1. Estadstica descriptiva, que permite describir las caractersticas que
presentan los elementos de una poblacin o de una muestra.
2. Estadstica inferencial, que estudia una muestra y a partir de ella trata de
obtener conclusiones vlidas para la poblacin de la cual se extrajo la
muestra.
La muestra debe ser representativa de la poblacin.

ERROR EN LA INFERENCIA.

En los procedimientos de inferencia estadstica se pueden presentar dos tipos de
errores:
1. Error no muestral. Este error usualmente se presenta, no por el hecho de
estudiar solo una muestra, sino por los procedimientos de recoleccin y
procesamiento de los datos. Algunos de estos errores pueden ser:
preguntas mal formuladas, malas respuestas, error en los clculos
realizados
Este error no se puede medir pero se puede controlar a partir de buenos
procedimientos de recoleccin de los datos.
2. Error muestral. Es el error que se presenta por el simple hecho de estudiar
una poblacin mediante una muestra y no con toda la poblacin. Este error
se puede medir y adems se puede controlar mediante un buen diseo del
procedimiento muestral, como es el de seleccionar adecuadamente el tipo
de muestreo a utilizar y un adecuado tamao de muestra.

1.4 FUENTES DE DATOS.

La recoleccin de los datos se puede realizar a partir de tres fuentes:
1. Datos internos de las empresas o de entidades pblicas o privadas. Las
empresas como parte de sus actividades rutinarias generan y conservan
datos que un investigador puede utilizar. Por ejemplo las empresas tienen
datos de sus empleados, de las ventas, del origen de sus materias primas
de sus fuentes de financiacin. Estos datos pueden ser utilizados para
realizar estudios sobre la administracin, mercadeo u otras funciones de las
empresas. Igualmente las entidades pblicas llevan tambin datos sobre
sus actividades. Adems, existen entidades pblicas encargadas de llevar
datos sobre diferentes actividades del pas y que son materia prima de
muchos estudios e investigaciones. En Colombia la entidad encargada de
llevar datos sobre muchas caractersticas es el DANE (Departamento
Administrativo Nacional de Estadstica). All se encuentran muchos datos
sobre estudios demogrficos, precios, comercio exterior, etc. Otras
entidades que tienen datos tiles son el DNP (Departamento Nacional de
Planeacin), el Banco de la Repblica, Cmaras de Comercio,
Asociaciones o Agremiaciones que tienen datos disponibles sobre las
actividades de sus asociados y a las cuales es posible acceder para realizar
algunos estudios.
2. Los experimentos diseados. Estos datos surgen de la manipulacin
deliberada de algunas variables por parte de un investigador .Es decir, el
investigador realiza una serie de actividades sobre sujetos experimentales
con el fin de medir la respuesta que surge de la manipulacin de ciertas
variables, llamadas variables independientes. Tales experimentos son muy
frecuentes en la agricultura o en, donde se pueden utilizar diferentes tipos
de abonos (variables independientes) y luego medir la magnitud de la
cosecha obtenida (variable respuesta o variable dependiente); en medicina,
y en la industria es muy comn realizar este tipo de experimentos.
3. La tercera fuente de datos son las encuestas. En este caso el investigador
no puede realizar manipulacin de variables sino que se enfrenta a
situaciones que ya son dadas. En las encuestas se obtienen datos
directamente de los individuos. Son muy utilizadas en estudios de
mercados, estudios de preferencias electorales, estudios sociales y
econmicos.

Las encuestas se pueden realizar bsicamente a partir de tres formas:
3.1 Por correo.
3.2 Telfono.
3.3 Mediante entrevistas personales.



1.5 MTODOS RECOLECCIN.

1. Censo.
2. Muestreo.

TIPOS DE MUESTREO.
1. MUESTREO NO PROBABILSTICO.
2. MUESTREO PROBABILSTICO.

En el censo se requiere estudiar todos los elementos que conforman una
poblacin. Sin embargo, en la mayora de los estudios no es posible estudiar todos
los elementos de la poblacin, pues estas tienden a ser muy grandes lo que
implica mucha demora en la recoleccin de los datos y sobre todo altos costos.

El estudio por muestreo persigue los siguientes fines:
1. Seleccionar las unidades de la poblacin que se incluirn en el estudio.
2. Interpretar los resultados del estudio con el fin de estimar los parmetros de
poblacin a partir de los datos de la muestra y probar hiptesis, generalmente
para comparar dos o ms poblaciones o con respecto a ciertos valores esperados
para uno o ms parmetros o en una poblacin para establecer si un valor
supuesto para un parmetro puede ser validado a partir de la informacin
muestral.

El desarrollo de la Estadstica ha hecho que su objetivo sea realizar inferencias
acerca de una poblacin con base en la informacin obtenida a partir de una
muestra. La inferencia estadstica puede realizarse mediante la estimacin de un
parmetro o mediante la prueba de hiptesis acerca del valor de un parmetro
poblacional. Los parmetros ms usuales son la media aritmtica ( ) y la
proporcin (P).

Cuando se selecciona un elemento de una poblacin, ste elemento contiene
cierta cantidad de informacin acerca del parmetro de inters. La seleccin de
cada elemento tiene un costo, de tal manera que se debe determinar cuntos
elementos se deben seleccionar.

El problema lo centraremos en esta situacin: Cuntos elementos debemos
seleccionar en una muestra de tal manera que nuestras estimaciones contengan
la menor cantidad de error posible y el costo sea mnimo. Se comprende que estos
dos objetivos son contrapuestos.


1.6 SELECCIN DE UNA MUESTRA


El objetivo del muestreo es estimar un parmetro de una poblacin. Al seleccionar
una muestra, debemos tener presente que la muestra no nos proporcionar
informacin completa sobre una poblacin. La diferencia entre un valor real del
parmetro en la poblacin y el valor estimado a partir de la muestra para ese
parmetro se llama error de muestreo. Este error siempre estar presente en el
muestreo pero puede ser controlado mediante un buen diseo del muestreo:
seleccin de un adecuado tamao de muestra y utilizacin del tipo de muestreo
que sea ms adecuado para la poblacin bajo estudio.
Sin embargo, en cualquier estudio tendremos otro tipo de error que se puede
introducir y es llamado error de no muestreo, que principalmente se debe a :
a. Imposibilidad de localizar a los informantes.
b. Negativa de los informantes a dar las repuestas.
c. Malas respuestas intencionales de los informantes.
d. Dificultad de los informantes en recordar las respuestas.
e. Mal entendimiento de las preguntas debido a una deficiente redaccin de ellas,
f. Manipulacin por parte del entrevistador.
g. Errores de anotacin por parte del entrevistador.
h. Errores en la codificacin o procesamiento de la informacin.
Estos errores pueden ser minimizados a travs de un buen diseo del proyecto de
investigacin. La utilizacin de una PRUEBA PILOTO puede ser un buen
instrumento para corregir algunos de estos errores de no muestreo.


MUESTREO Y CENSO.

Una muestra usualmente comprende el estudio de una parte de los elementos de
una poblacin, mientras que el censo consiste en estudiar todos los elementos de
sta.
En teora puede ser ms conveniente estudiar la poblacin completa, en la
prctica ocurre todo lo contrario: es mejor realizar un muestreo que un censo,
Las principales razones para realizar un muestreo son:
1. La poblacin tericamente puede ser infinita, en cuyo caso sera imposible
realizar un censo.
2. Una muestra puede ser ms oportuna que un censo. Cuando se requiere
rpidamente informacin sobre una poblacin, su estudio completo puede requerir
tanto tiempo que su utilidad sera poca. Tambin puede darse el caso de que
ciertas poblaciones tienden a cambiar rpidamente con el tiempo, por ejemplo la
mayora de los estudios de opinin requieren hacerse durante un tiempo muy
corto.
3. En algunos casos el estudio de los elementos requieren la utilizacin de
ensayos destructivos.
4. El costo de efectuar un censo suele ser muy alto.
5. La exactitud puede verse afectada cuando se realiza un censo de una poblacin
grande. Cuando es necesario procesar gran cantidad de datos es posible que se
introduzcan errores no deseables.
6. Se puede realizar una mejor planeacin y controlen el diseo de la
investigacin.
7. Se puede realizar un estudio ms detallado sobre la poblacin.

Sin embargo, pueden existir algunas circunstancias que hacen ms ventajoso la
utilizacin de un censo, por ejemplo:
1. Cuando la poblacin de inters sea tan pequea que un costo y tiempo
adicional en el estudio de la poblacin est plenamente justificado.
2. si el tamao de la muestra requerido es relativamente grande comparado con el
tamao de la poblacin.
3. Si se requiere una exactitud completa en la informacin, el censo sera la nica
va de obtenerla.

DISEO DEL MUESTREO.

El diseo de un estudio por muestro comprende:
1. Establecer detalladamente cul es la poblacin de inters, de tal manera que se
pueda establecer si un elemento pertenece o no a ella, esto depender de los
objetivos que persiga el estudio.
2. Establecer los parmetros de inters, es decir las medidas de la poblacin que
nos interesa estimar o contrastar.
3. Seleccionar el marco de muestreo. El marco de muestreo es una lista o algn
procedimiento que permite identificar todos los elementos de la poblacin.
Determinar el tipo de muestreo que se utilizar, es decir qu procedimiento
aleatorio se utilizar para seleccionar los elementos de la muestra.
4. Establecer el tamao de muestra que ser necesaria.
5. Anlisis de los datos.

1.7 TIPOS DE MUESTREO

Existen dos tipos bsicos de muestreo: El muestreo No probabilstico y el
muestreo probabilstico.

El muestreo no probabilstico llamado tambin muestreo circunstancial se
caracteriza por que los elementos a ser incluidos en la muestra no tienen
especificada una probabilidad o ella no se conoce, si la tienen, de ser incluidos en
la muestra y por que el error de muestreo no puede ser medido. Los principales
tipos de muestreo no probabilstico son:

1. MUESTREO POR CONVENIENCIA. En el cual se deja la seleccin de los
elementos primordialmente a los entrevistadores. En general, los elementos se
seleccionaran por su facilidad de acceso o su conveniencia.

2. MUESTREO POR CRITERIO. Implica seleccionar los elementos que a juicio de
quien selecciona la muestra sean los ms representativos de la poblacin.

3. MUESTREO POR CUOTA. Un muestreo muy utilizado en investigacin de
mercados, cuando se desea tener algn conocimiento sobre la opinin de un
grupo de consumidores potenciales sobre un determinado producto. La muestra
se estructura de tal manera que incluya nmeros especficos de elementos con
caractersticas que se sabe o se cree que afectan el tema de investigacin.

A pesar de las dificultades tericas que presenta el muestreo no probabilstico,
principalmente por el hecho de no poder ser utilizado para realizar inferencias, es
extensamente utilizado en investigacin de mercados en estudios de tipo
exploratorio, prueba de productos, entrevistas por detencin en centros
comerciales, discusiones de grupo, panel de consumidores. Pero un cuidadoso
diseo de una muestra no probabilstico puede generar resultados satisfactorios.

En el muestro probabilstico los elementos son seleccionados por cualquier
procedimiento de azar, teniendo cada muestra posible una probabilidad conocida
de ser seleccionada. Sus resultados pueden ser utilizados para realizar inferencias
sobre los parmetros poblacionales, y adems, es posible medir el error de
muestreo. Los principales tipos de muestreo probabilsticos son:

MUESTREO ALEATORIO SIMPLE. Es el tipo ms sencillo de muestreo
probabilstico y base para los otros tipos de muestreo probabilsticos. Se utiliza en
poblaciones cuyos elementos son homogneos en las caractersticas de inters.
Cuando los elementos son homogneos (presentan una varianza pequea), la
muestra tiende a ser representativa de la poblacin. Los elementos son
seleccionados mediante cualquier procedimiento de azar.

MUESTREO ALEATORIO ESTRATIFICADO. Se utiliza cuando la poblacin en
estudio presenta gran heterogeneidad en sus caractersticas. Los elementos se
separan formando subgrupos (llamados estratos), de tal forma que cada uno de
los estratos presente homogeneidad interna, pero que presenten gran
heterogeneidad con respecto a los dems estratos. En general, en el muestreo
estratificado se requiere la utilizacin de una variable auxiliar para realizar la
estratificacin. La muestra, entonces, se toma de cada uno de los estratos.

MUESTREO SISTEMATICO. En este muestreo, los elementos se seleccionan de
la poblacin dentro de un intervalo uniforme con respecto al tiempo, al orden o al
espacio, aunque puede ser inapropiado cuando los elementos presentan un patrn
secuencial, presenta una gran sencillez en la forma de seleccin de los elementos.

MUESTREO POR CONGLOMERADOS. En este tipo de muestreo se divide la
poblacin en grupos, llamados conglomerados, y luego se toma una muestra
aleatoria de conglomerados. En el muestreo por conglomerados, cada uno de los
conglomerados se espera que cada conglomerado sea internamente
heterogneo, es decir, que los elementos presenten una gran variabilidad en sus
caractersticas.

La principal ventaja de los muestreos probabilsticos es su precisin, pues con
ellos se logra una muestra que sea representativa de la poblacin en estudio.
Debido a ello son ampliamente utilizados.




1.8 VARIABLE. TIPOS DE VARIABLES.

La Estadstica se desarrolla a partir del concepto de variable. Una variable se
puede definir como cualquier smbolo(X, Yetc.) que puede tomar diferentes
valores de un conjunto dado. Las variables representan las caractersticas que
tienen los elementos que se estudian.
Cada elemento que se estudia presenta unas caractersticas que interesa conocer.
Si los elementos que se estudian son personas, por ejemplo, nos interesara
conocer de ellas su gnero, su edad, su ingreso mensual, su estado civil, etc. Si
los elementos que nos interesa estudiar son empresas, de ellas nos interesara
conocer de ellas, por ejemplo, el sector econmico donde desarrolla su actividad,
el tipo de sociedad, el nmero de empleados que tiene, las ventas realizadas por
ellas el mes pasado, etc.. Cada una de estas caractersticas son las que nos
interesa estudiar y constituyen las variables, pues cambian de persona a persona
o de empresa a empresa.

Las variables pueden clasificarse en dos tipos.
1. VARIABLES CUALITATIVAS. Son aquellas que representan caractersticas
observables o atributos que presentan los elementos. Por ejemplo, en las
personas el gnero, el estado civil, el lugar de nacimiento son variables de
tipo cualitativo.
2. VARIABLES CUANTITATIVAS. Son aquellas que expresan la magnitud de
una caracterstica, es decir se pueden medir o contar. Por ejemplo en las
personas podemos tener inters en estudiar su ingreso mensual, el nmero
de personas que tiene a cargo. Esta caractersticas de las personas
constituyen variables de tipo cuantitativo, pues son susceptibles de ser
expresadas numricamente.
Las variables cuantitativas se suelen, a su vez, clasificar en dos tipos:
1. VARIABLES CUANTITATIVAS DISCRETAS. Son aquellas que toman un
nmero finito de valores posibles. Estas variables suelen asumir solo
valores enteros. Por ejemplo el nmero de hijos de una persona solo admite
valores enteros. En general sus valores se obtienen mediante procesos de
conteo.
2. VARIABLES CUANTITATIVAS CONTINUAS. Son aquellas que pueden
tomar cualquier valor real. En general corresponden a variables que se
obtienen a partir de procesos de medicin. Peso, estatura longitud, ingreso,
son algunos ejemplos de variables cuantitativas continuas.
Esta clasificacin es importante puesto que existen procedimientos diferentes para
su tratamiento estadstico segn sea el tipo de variable que se analice.


1.1 TIPO DE DATOS.

Los datos constituyen registro de los valores de las variables en los elementos
que se estudian. Los procedimientos estadsticos se aplican a conjuntos de
datos que son obtenidos de una poblacin o de una muestra de elementos. Los
datos, segn las variables que se estudien, se pueden clasificar en:

1. DATOS CUALITATIVOS. Son un conjunto de registros que se refieren a un
conjunto de elementos que en un momento dado se han clasificado segn
una cualidad o atributo. Los datos cualitativos o categricos admiten pocos
procedimientos estadsticos, tales como procedimientos de conteo o de
asociacin.
2. DATOS CUANTITATIVOS. Son un conjunto de registros que se refieren a
un conjunto de elementos, que en un momento dado, se han clasificado
segn la magnitud de una caracterstica. Los datos cuantitativos permite
utilizar con ellos una gran variedad de procedimientos estadsticos, tales
como medidas que permiten caracterizar a todo el conjunto de elementos
estudiados.
3. DATOS CRONOLOGICOS O DE SERIES DE TIEMPO. Son conjuntos de
registros que se refieren a un elemento que se ha medido en diferentes
pocas o periodos, generalmente a intervalos iguales de tiempo. Los datos
cronolgicos son datos de tipo cuantitativos pero solamente se considera
un elemento en diferentes momentos.

El material que sigue trata fundamentalmente de los procedimientos estadsticos
utilizados para resumir un conjunto de datos. Supondremos que los datos
provienen de una muestra.

El procedimiento ms simple, pero fundamental en el tratamiento de los datos es
su resumen mediante tablas o grficos, llamadas distribuciones de frecuencias,
que ser el tema del siguiente captulo. En los captulos siguientes se trabajar
sobre las medidas ms usuales. Los dos ltimos captulos se dedican a los datos
de tipo cronolgicos o series de tiempo.



BIBLIOGRAFA

LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMA. Pearson Educcin, 2004.

MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMIA. Editorial alfaomega. 2005.

MARTINEZ BENCARDINO, Ciro. ESTADSTICA. Editorial ECOE. 2006

SCHEAFFER,Richard L., MENDENHALL, William, OTT,Lyman. ELEMENTOS DE
MUESTREO. Grupo Editorial Iberoamrica. 1992.













UNIDAD II
DISTRIBUCIONES DE
FRECUENCIAS


OBJ ETIVOS.
1. RESUMIR UN CONJ UNTO DE DATOS.
2. PRESENTAR LOS DATOS MEDIANTE TABLAS DE DISTRIBUCION DE
FRECUENCIAS
3. REALIZAR LA PRESENTACIN GRFICA DE LOS DATOS.
4. INTERPRETAR ADECUADAMENTE LOS ELEMENTOS DE LAS TABLAS DE
DISTRIBUCIN DE FRECUENCIAS.
5. UTILIZAR LOS DATOS RESUMIDOS EN DISTRIBUCIONES DE FRECUENCIA
EN LA TOMA DE DECISIONES.


INTRODUCCIN


Los datos recolectados en cualquier tipo de estudio son datos brutos que
requieren de su procesamiento para que transmitan algn sentido. El primer y ms
sencillo procedimiento que se realiza con los datos es su ordenamiento y
resumen. Este ordenamiento se realiza resumiendo los datos en una tabla de
distribucin de frecuencias.

Otra forma diferente de mostrar los datos es mediante su representacin grfica.
Un grfico es una representacin pictrica que muestra la misma informacin que
una tabla, pero permite ver ms fcilmente algunos detalles que puedan sobresalir
en los datos y que no se muestren con tanta claridad en las tablas, adems son
visualmente ms atractivas en su presentacin que las tablas.

2.1 DEFINICIN DE UNA DISTRIBUCIN DE FRECUENCIAS
Una distribucin de frecuencias es un ordenamiento de un conjunto de datos
obtenidos de una poblacin o de una muestra en donde los elementos estudiados
son clasificados en grupos o clases mutuamente excluyentes expresando el
nmero y/o porcentaje de elementos que pertenecen a cada grupo o categora.
El objetivo de una distribucin de frecuencias es resumir en una tabla (llamada
tabla de distribucin de frecuencias) los datos recolectados de tal forma que se
facilite su interpretacin y anlisis.
Las tablas de distribucin de frecuencias tienen distinta forma, segn el tipo de
datos de que se disponga. A continuacin se presentan las distintas tablas.

2.2 DISTRIBUCIN DE FRECUENCIAS PARA DATOS CUALITATIVOS.
Cuando la variable de anlisis es de tipo cualitativo, cada grupo, clase o categora
se forma con cada uno de los diferentes valores que toma la variable,
generalmente ordenados en forma alfabtica.
EJ EMPLO 1. A una muestra de cuarenta hogares se pregunt la forma de
tenencia de la vivienda en donde residan. Las respuestas obtenidas fueron:
(A: Arriendo; F: Familiar; P: Propia; NE: No especificada)

P A A P F NE A P F A
NE A A F F P A P A F
A F NE F A F A A A F
F A A A F F A P P P

Los datos recolectados se organizan en una tabla de distribucin de frecuencias
que tiene la siguiente forma:





TABLA NMERO 1. DISTRIBUCIN DE LOS HOGARES SEGN TENENCIA DE
LA VIVIENDA
DISTRIBUCIN DE LOS HOGARES SEGN
TENENCIA DE LA VIVIENDA
FORMA DE
TENENCIA DE
LA VIVIENDA
NMERO
DE
HOGARES
PORCENTAJ E
DE HOGARES
ARRIENDO 17 42.5
FAMILIAR 12 30.0
PROPIA 8 20.0
NO
ESPECIFICADA
3 7.5
TOTAL 40 100.0
Fuente:

La tabla presenta en forma resumida los 40 datos recolectados de tal manera que
facilita analizar cul es el comportamiento de la tenencia de la vivienda en los 40
hogares estudiados.
En la primera columna se presentan las cualidades o categoras que tiene la
variable, ordenadas alfabticamente, excepto la categora no especificada, que
usualmente se coloca al final (en algunas ocasiones aparece como OTRO)
En la segunda columna se presenta la cantidad de elementos (hogares) que
tienen cada una de las cualidades de la variable (se conocen con el nombre de
FRECUENCIAS).
En la tercera columna se presenta el porcentaje de elementos (hogares) que
toman cada uno de las cualidades de la variable. Se obtienen dividiendo el nmero
de hogares con cada cualidad entre el total de hogares, multiplicado por 100(se
conocen con el nombre de FRECUENCIAS RELATIVAS).
La tabla siempre se presenta con un ttulo que expresa su contenido.
Tambin se suele indicar como pie de pgina del grfico la fuente, es decir de
donde se obtuvieron los datos.

GRFICOS.
Los datos resumidos en una tabla de distribucin de frecuencias, suelen
presentarse en forma grfica.
Los grficos son representaciones pictricas que permiten, a veces, observar
rpidamente de un golpe de vista el comportamiento de la variable que se estudia
y sus caractersticas ms sobresalientes.
Los grficos apropiados para representar variables cualitativas son los da barra y
los de sectores (circular o pastel).
GRFICOS DE BARRAS
Los grficos de barra pueden ser horizontales o verticales. En los grficos de
barras verticales se representa en el eje horizontal la variable y en el eje vertical el
nmero de elementos que tiene cada cualidad o categora de la variable (las
frecuencias).






GRFICO NMERO 1: GRFICO DE BARRAS VERTICALES
El grfico de barras horizontales se construye colocando los ejes en forma inversa,
es decir, la variable se representa en el eje vertical y las frecuencias en el eje
horizontal. Se utiliza principalmente cuando la variable es de tipo geogrfico.





GRFICO NMERO 2: BARRAS HORIZONTALES.

GRAFICO DE SECTORES.
El grfico de sectores (circular o pastel) se utiliza para representar el porcentaje de
elementos que pertenecen a cada una de las categoras de la variable. El crculo
se divide en cien partes (100%) y se divide segn el porcentaje correspondiente a
cada categora.

GRFICO NMERO 3: GRFICO DE SECTORES

EJ EMPLO 2. De los empleados de un municipio se seleccion aleatoriamente una
muestra de sesenta de ellos y se les pregunt el nivel educativo que tenan. Las
respuestas obtenidas fueron:

PI SI BC BC UI UC PC UI BC PC
PC PC SC SI SC UC SC SC SC SC
PI PC SC SC PI SC SC SC PC SC
SC PI SC PC SC SI PC PC SC SC
UI SC SC PC PC SC PC SC SC UC
SC SI PC SC UI UC SI SC UC SC
(PC: Primaria completa; PI: Primaria incompleta; SC: Secundaria completa;
Secundaria Incompleta; UC: Universitaria completa; UI: universitaria incompleta.)

a. Cul es el elemento de estudio?
b. Cul es la poblacin?
c. Cul es la muestra?
d. Cul es la variable y de qu tipo es?
e. Ordene los datos en una tabla de distribucin de frecuencias.
f. Presente los datos mediante un grfico de sectores.
g. Presente los datos mediante un grfico de barras.
h. Haga un anlisis de los datos obtenidos.


DISTRIBUCIN CONJ UNTA DE DOS VARIABLES CUALITATIVAS
En muchas ocasiones se desea representar en una misma tabla los datos
obtenidos para dos variables (o incluso ms de dos). Este tipo de ordenamiento
permite establecer la forma en que podran estar relacionadas las dos variables.
EJ EMPLO 3. En una encuesta se les pidi a las personas que dijeran su gnero y
su aficin favorita. Los datos recolectados fueron los siguientes:

PERSONA GNERO
AFICIN
FAVORITA PERSONA GNERO
AFICIN
FAVORITA
1 FEMENINO CINE 21 MASCULINO MSICA
2 MASCULINO DEPORTES 22 MASCULINO DEPORTES
3 FEMENINO CINE 23 MASCULINO LECTURA
4 FEMENINO DEPORTES 24 MASCULINO MSICA
5 MASCULINO DEPORTES 25 FEMENINO CINE
6 MASCULINO LECTURA 26 FEMENINO DEPORTES
7 FEMENINO DEPORTES 27 FEMENINO LECTURA
8 FEMENINO CINE 28 MASCULINO LECTURA
9 MASCULINO DEPORTES 29 FEMENINO MSICA
10 FEMENINO CINE 30 FEMENINO MSICA
11 MASCULINO DEPORTES 31 FEMENINO LECTURA
12 FEMENINO MSICA 32 MASCULINO DEPORTES
13 MASCULINO DEPORTES 33 MASCULINO DEPORTES
14 FEMENINO CINE 34 MASCULINO DEPORTES
15 MASCULINO DEPORTES 35 MASCULINO MSICA
16 FEMENINO MSICA 36 MASCULINO DEPORTES
17 FEMENINO CINE 37 MASCULINO MSICA
18 FEMENINO CINE 38 FEMENINO MSICA
19 MASCULINO CINE 39 FEMENINO LECTURA
20 MASCULINO DEPORTES 40 MASCULINO CINE

Las respuestas dadas por las personas se pueden organizar en una tabla de
distribucin de frecuencias conjunta para las dos variables. La tabla se conoce con
los nombres de distribucin conjunta o tabla de contingencia o tabla de doble
entrada o tabla bidimensional.
Este tipo de tablas se dispone por filas y columnas. Se selecciona una cualquiera
de las dos variables para representarla por fila (en el ejemplo el GNERO) y la
otra por columna (en el ejemplo la AFICIN FAVORITA) y se establece el nmero
de elementos( personas) que conjuntamente toman una categora de cada
variable.





TABLA NMERO 2
AFICIN FAVORITA GNERO
CINE DEPORTES LECTURA MSICA
TOTAL
FEMENINO 8 3 3 5 19
MASCULINO 2 12 3 4 21
TOTAL 10 15 6 9 40

Los valores internos de la tabla se llaman FRECUENCIAS CONJ UNTAS. Por
ejemplo, el primer valor (8) significa que en la muestra se encontraron 8 personas
que eran de gnero femenino y que su aficin favorita era el cine.
Los totales representan la suma por fila (gnero) o columna (aficin favorita) y se
llaman frecuencias marginales. Representan el total de elementos de elementos
de cada una de las categoras de una variable (marginan a la otra variable. Por
ejemplo, El valor 19 significa que en la encuesta se entrevistaron a 19 personas
de gnero femenino (no dice nada sobre la aficin). El valor 10 significa que 10
entrevistados tienen como aficin el cine (no dice nada sobre el gnero).
La tabla anterior adems de mostrar en forma aislada el comportamiento de cada
variable separadamente, tambin permite establecer entre ellas la existencia de
relacin, si existe, en este caso puede observarse que las personas de gnero
femenino tienden ms a tener como aficin favorita el cine y los hombres haca el
deporte, mientras que las otras aficiones tienden a ser muy semejantes entre los
gneros masculino y femenino.
Este tipo de tablas tambin se suelen representar en forma porcentual. Se podran
representar tres diferentes tipos de porcentajes: con respecto al total de
elementos, con respecto al total por filas (con respecto a cada gnero) o con
respecto al total por columnas (con respecto a las aficiones favoritas).

TABLA NMERO 3
AFICIN FAVORITA GNERO
CINE DEPORTES LECTURA MSICA
TOTAL
FEMENINO 8
(20.0)
(42.1)
(80.0)
3
(7.5)
(15.8)
(20.0)
3
(7.5)
(15.8)
(50.0)
5
(12.5)
(26.3)
(55.6)
19
(45.0)
(100.0)

MASCULINO 2
(5.0)
(9.5)
(20.0)
12
(30.0)
(57.1)
(80.0)
3
(7.5)
(14.3)
(50.0)
4
(10.0)
(19.1)
(44.4)
21
(100.0)
TOTAL 10
(25.0)
(100.0)
15
(37.5)
(100.0)
6
(15.0)
(100.0)
9
(22.5)
(100.0)
40
(100.0)

Los porcentajes correspondientes aparecen dentro de parntesis en cada una de
las casillas de la tabla. Los primeros corresponden al porcentaje con respecto al
total de personas; los segundos con respecto al gnero y los terceros con respecto
a la aficin favorita.
GRFICOS. Este tipo de distribucin se puede representar grficamente mediante
alguno de tres tipos de grficos: barras agrupadas, barras compuestas y barras
compuestas porcentuales.
GRFICO DE BARRAS AGRUPADAS. Para construir un grfico se selecciona
una de las dos variables para ser representadas en el eje horizontal, y cada una
de las cualidades de esta variable se divide para representar cada una de las
cualidades de la otra variable. En el eje vertical se representan las frecuencias
absolutas, correspondientes a cada cualidad representada. Este grfico permite
comparar como se comportan las dos variables en los elementos.


GRAFICO NMERO 3: BARRAS AGRUPADAS

GRFICO DE BARRAS COMPUESTAS. Este tipo de grficos se construye en
forma semejante a la anterior, solo que las barras para las cualidades de una
variable no se agrupan una al lado de la otra sino una encima de la otra, adems
de permitir comparar las dos variables generan el total de elementos en cada una
de las cualidades.

















GRAFICO NMERO 4: BARRAS COMPUESTAS

GRFICO DE BARRAS COMPUESTAS PORCENTUALES. Se construye
seleccionando una de las dos variables como principal, la cual a su vez se divide
segn los porcentajes correspondientes a la otra variable que son los porcentajes
que aparecen en la tabla, por filas o columnas)



GRFICO NMERO 5: BARRAS COMPUESTAS PORCENTUALES




DATOS CUANTITATIVOS.

Anteriormente se han clasificado las variables cuantitativas en DISCRETAS y
CONTINUAS. Muchas variables discretas toman pocos valores diferentes,
mientras que por el contrario, las variables continuas pueden tomar muchos
(incuso infinitos) valores diferentes, por esta razn el tratamiento de los datos para
los dos tipos de variable suele ser diferente.
2.4 DISTRIBUCION DE FRECUENCIAS PARA VARIABLES DISCRETAS
Cada grupo o categora se forma con cada uno de los diferentes valores que toma
la variable. La tabla de distribucin de frecuencias para los datos recolectados
para este tipo de variable se suele construir utilizando cinco columnas cuyos
elementos son los siguientes:
1. Los valores de la variable ordenados en forma ascendente. Los valores de
la variable se suelen simbolizar por (i=1, 2,3, ; donde representa la
cantidad de valores diferentes que toma la variable).
2. Las frecuencias absolutas (simbolizadas ) que representan el nmero de
elementos que toman cada uno de los valores de la variable. Se obtienen
por conteo directamente sobre los datos recolectados.
3. Las frecuencias relativas (simbolizadas ) que representan la
proporcin o el porcentaje de elementos que toman
cada uno de los valores de la
4. Las frecuencias absolutas acumuladas (simbolizadas que representan
el nmero de elementos que toman un valor menor o igual al
valor de la variable. Se obtienen por sumas sucesivas sobre las
frecuencias absolutas.
5. Las frecuencias relativas acumuladas (simbolizadas que
representan la proporcin o porcentaje de elementos que toman un valor
menor o igual al valor de la variable. Se obtienen por sumas
sucesivas sobre las frecuencias relativas.
EJ EMPLO 4. En una muestra de cuarenta hogares se pregunt el nmero de
personas que lo conformaban y se obtuvieron los siguientes datos:

4 3 2 5 3 1 2 4 7 2 4 4 5 3 2 4 3
4 3 4
5 4 5 4 3 2 4 3 1 5 3 5 4 4 4 3 2
5 4 3

Los datos se pueden ordenar en una tabla de distribucin de frecuencias que
tendr la siguiente forma:


TABLA NMERO 6. DISTRIBUCIN DE LOS HOGARES SEGN EL
NMERO DE PERSONAS QUE LOS CONFORMAN.

NMERO
DE
PERSONAS


NMERO
DE
HOGARES


PORCENTAJ E
DE HOGARES


NMERO
ACUMULADO
DE
HOGARES

PORCENTAJ E
ACUMULADO
DE HOGARES

1
2
3
4
5
7
2
6
10
14
7
1

5.0
15.0
25.0
35.0
17.5
2.5
2
8
18
32
39
40
5.0
20.0
45.0
80.0
97.5
100.0

Los datos resumidos en la anterior tabla pueden ser representados
grficamente para cada una de las frecuencias, as:
1. Para las frecuencias absolutas (grfico de lneas). En el eje horizontal se
representan los valores observados en los datos para la variable y en el eje
vertical se representan las frecuencias absolutas. Para cada valor de la
variable se traza una lnea vertical de altura la frecuencia respectiva. (El
grfico es un grfico de lneas, justamente para indicar que la variable no
toma valores intermedios entre dos valores, por ser una variable discreta)





GRFICO NMERO 6: de lneas

2. Para las frecuencias relativas (grfico de lneas). Se construye de igual
forma que el anterior, pero representando en el eje vertical las frecuencias
relativas (porcentajes)




GRFICO NMERO 7: DE LINEAS

3. Para las frecuencias absolutas acumuladas (grfico escalonado). En el eje
horizontal se representan los diferentes valores que toma la variable y en el
eje vertical las frecuencias acumuladas. Para cada valor de la variable se
toma altura correspondiente a la frecuencia acumulada.


GRFICO NMERO 8: escalonado

4. Para las frecuencias relativas acumuladas (grfico escalonado)



GRFICO NMERO 9: escalonado


2.5 DISTRIBUCIONES DE FRECUENCIAS PARA VARIABLES CONTINUAS,

Las variables continuas suelen tomar muchos valores diferentes, por lo cual sus
valores se ordenan mediante intervalos que contengan un conjunto de valores de
la variable. Cada intervalo constituye un grupo o clase de elementos. El
procedimiento para construir este tipo de tabla de distribucin de frecuencias es el
siguiente:
1. Se establece arbitrariamente el nmero de intervalos, grupos o clases
(simbolizado por que se desean construir con los valores de la variable. A
pesar de ser arbitrario, el nmero de intervalos debe depender del nmero de
datos que se tengan disponibles para ordenar; entre menos datos se
dispongan se pueden construir pocos intervalos, por el contrario, cuando se
dispone de muchos datos se pueden construir ms intervalos, pero se
recomienda que mnimo se construyan 5 intervalos y mximo 20 .
2. Se calcula la amplitud, ancho o tamao que tendrn cada uno de los
intervalos (simbolizados por , que se calcula mediante:

La amplitud se debe calcular con la misma precisin que tengan los datos
recolectados, aproximando por exceso, cuando sea necesario, desechar cifras
significativas.
3. Se construyen los intervalos (Los lmites inferiores de los intervalos se
simbolizan por y los lmites superiores por , para ). El
lmite inferior del primer intervalo se hace igual al menor de los datos
recolectados. El lmite superior del primer intervalo se obtiene sumndole la
amplitud al lmite inferior. El lmite inferior del segundo intervalo se hace igual
al lmite superior del primer intervalo; y as sucesivamente hasta completar
los intervalos.
4. Se obtienen los puntos medios o marcas de clase de cada uno de los
intervalos (se simbolizan por ), sumando los lmites inferior y superior de
cada intervalo, y dividiendo por dos.
5. Se obtienen las frecuencias absolutas de cada intervalo, contando el
nmero de elementos que pertenecen a cada uno de ellos. La forma de
construccin de los intervalos anteriormente explicada, lleva a que el valor del
lmite superior de un intervalo coincida con el valor del lmite inferior del
intervalo siguiente por lo cual se considera que los intervalos son abiertos en
su lmite superior, excepto en el ltimo si es necesario.
6. Se obtienen las dems frecuencias: las frecuencias relativas , las
frecuencias absolutas acumuladas y frecuencias relativas acumuladas
( , de la misma forma explicada para las variables cuantitativas discretas.
EJ EMPLO 6. En un estudio realizado para establecer el nmero de empleados
necesarios para la atencin de los usuarios de un servicio se midi el tiempo, en
minutos, que se requera para su atencin cuarenta clientes. Se recolectaron los
siguientes datos:

18.5 15.3 16.7 22.4 20.5 20.8 17.2 18.9 12.8 11.3
17.1 21.5 14.8 12.9 14.6 16.6 19.5 13.8 16.1 15.9
17.6 24.8 16.2 21.4 20.1 23.5 17.7 16.4 18.8 13.9
15.8 17.4 17.3 22.9 19.9 18.2 16.9 15.2 16.8
12.6

Queremos ordenar estos datos en una tabla de distribucin de frecuencias que
tenga seis intervalos.
Una vez definido el nmero de intervalos o grupos que se desean construir se
determina la amplitud o tamao que tendrn cada uno d los intervalos:
=
Ahora se construye la distribucin de frecuencias







TABLA NMERO 7. DISTRIBUCIN DE LOS USUARIOS SEGN EL TIEMPO
DE ATENCIN.

TIEMPO
DE
ATENCIN


TIEMPO
MEDIO


NMERO
DE
USUARIOS


PORCENTAJ E
DE
USUARIOS


NMERO
ACUMULADO
DE
USUARIOS

PORCENTAJ E
ACUMULADO
DE
USUARIOS

11.3 - 13.6
13.6 - 15.9
15.9 - 18.2
18.2 - 20.5
20.5 - 22.8
22.8 - 25.1
12.45
14.75
17.05
19.35
21.65
23.95

4
7
14
7
5
3
10.0
17.5
35.0
17.5
12.5
7.5
4
11
25
32
37
40
10.0
27.5
62.5
80.0
92.5
100.0

GRFICOS
Los datos resumidos en la anterior tabla pueden ser representados grficamente
de la siguiente forma:
1. Las frecuencias absolutas se representan mediante el grfico llamado
HISTOGRAMA DE FRECUENCIAS. Se construye tomando en el eje
horizontal los lmites de los intervalos y en el eje vertical las frecuencias.
Est formado por rectngulos que tienen por base la amplitud del intervalo y
por altura la frecuencia absoluta respectiva.


GRFICO NMERO 10.HISTOGRAMA DE FRECUENCIAS

2. Para las frecuencias relativas, el grfico correspondiente se llama
HISTOGRAMA DE FRECUENCIAS RELATIVAS. Se construye de forma
similar al histograma de frecuencias, pero en el eje vertical se representan
las respectivas frecuencias relativas.

GRFICO NMERO 10

3. Las frecuencias absolutas se pueden tambin representar mediante un
grfico conocido como POLIGONO DE FRECUENCIAS. Se construye
tomando en el eje horizontal las MARCAS DE CLASE de cada intervalo, y
en el eje vertical las frecuencias absolutas de cada intervalo.
.

GRAFICO NMERO 11: POLIGONO DE FRECUENCIAS

4. Para las frecuencias relativas, tambin se puede utilizar el POLIGONO DE
FRECUENCIAS RELATIVAS, que se construye de igual forma que el
anterior per tomando en el eje vertical las frecuencias relativas.



GRFICO NMERO 12: POLIGONO DE FRECUENCIAS RELATIVAS.

5. Las frecuencias absolutas acumuladas se representan mediante un grfico
llamado OJ IVA en donde en el eje horizontal se representan los lmites de
los intervalos y el vertical las frecuencias absolutas acumuladas.


GRFICO NMERO 13: OJ IVA

6. Las frecuencias relativas acumuladas se representan en un grfico llamado
OJ IVA PORCENTUAL, en la cual se representan en el eje horizontal los
lmites de los intervalos y en el eje vertical las frecuencias relativas
acumuladas.


GRFICA NMERO 13: OJ IVA PORCENTUAL

EJ EMPLO NMERO 8.

En 50 viviendas de un sector se midi el consumo de energa (Kw) que tuvieron el
mes pasado, obteniendo los siguientes datos:
125 134 215 187 225 172 80 95 115 212
196 145 160 87 147 270 200 189 163 157
143 108 182 275 201 194 98 101 112 158
162 174 245 182 215 224 234 191 114 138
164 177 180 160 120 173 118 237 241 166
a. Cul es la poblacin? Cul es la muestra? Cul es la variable? De qu tipo es
la variable?
b. Organizar los datos en una tabla de distribucin de frecuencias que tenga siete
intervalos de igual amplitud.
c. A partir de la distribucin, interpretar:
Segunda frecuencia absoluta.
Tercera frecuencia relativa.
Cuarta frecuencia acumulada.
Quinta frecuencia relativa acumulada.







d. A partir de la distribucin de frecuencias establecer el porcentaje de viviendas
que el mes pasado tuvieron consumo:
Menor a 136 Kw
Al menos de 192 Kw
Entre 108 y 220 Kw
e. Representar los datos mediante:
Histograma de frecuencias relativas.
Polgono de frecuencias absolutas.

2.4 DATOS CRONOLGICOS.

Los datos cronolgicos son registros de una variable que, en un elemento, se han
medido en diferentes pocas o periodos.
Para la recoleccin de los datos cronolgicos debe seleccionarse la frecuencia con
la cual se registra la variable (das, mese, trimestres, aos, etc.) y el nmero de
periodos que se desean analizar. Por ejemplo, deseamos estudiar el
comportamiento de las exportaciones colombianas en el periodo 1994-2006, para
ello se registra su valor en cada uno de estos aos, en la siguiente forma:

TOTAL EXPORTACIONES COLOMBIANAS, 1994-2006
(En millones de dlares FOB)
AOS TOTAL
EXPORTACIONES
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
8.538
10201
10648
11549
10866
11617
13158
12330
11975
13129
16788
21190
24391
Fuente: DANE
GRFICOS.

Los datos cronolgicos se suelen representar en una de las siguientes formas:
GRFICO DE BARRAS. Los diferentes periodos se representan en el eje
horizontal y la magnitud de la variable en el eje vertical.

GRFICO NMERO 14: GRFICO DE BARRAS.

GRFICO LINEAL. Es el ms comn de los grficos utilizados para representar
datos cronolgicos. Se representan en el eje horizontal y en el eje vertical los
valores de la variable en cada periodo, mediante un punto. Los puntos obtenidos
se unen por trazos rectos.

GRFICO NMERO 15: GRFICO LINEAL




GLOSARIO.

DATOS: Registros de las observaciones de una o ms variables en los elementos
estudiados.

DATOS BRUTOS O SIN PROCESAR: Los datos tal como se recolectan antes de
ser organizados mediante algn procedimiento.

DISTRBUCIN DE FRECUENCIAS: Forma de presentar los datos en una forma
organizada donde se muestra el nmero de observaciones del conjunto de datos
que pertenecen a cada una de las clases definidas.

HISTOGRAMA: Grfico formado por un conjunto de rectngulos con base, el
ancho de cada intervalo o clase y altura, la frecuencia del intervalo o clase.

OJ IVA: Grfico en el cual se representan las frecuencias acumuladas.

POLIGONO DE FRECUENCIAS: Grfico que se construye uniendo los puntos
medios del histograma de frecuencias en sus techos.

TABLA DE CONTINGENCIA o bidimensional o de doble entrada: Tabla de
distribucin de frecuencias en la cual se representan simultneamente dos
variables.



BIBLIOGRAFA

LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMA. Pearson Educcin,2004.

MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMIA. Editorial alfaomega. 2005.

MARTINEZ BENCARDINO, Ciro. ESTADSTICA. Editorial ECOE. 2006










EJ ERCICIOS

1. En una encuesta se pregunt en 40 viviendas de estrato II el nmero de
dormitorios que tenan y se obtuvieron las siguientes respuestas.
2 1 1 4 3 2 2 2 3 4 1 3 2 5 3 4 2 3 2 5 3 7 5 3 2 4 4 3 2 1 1 2 3
2 3 4 1 2 2 2
a. Organizar estos datos en una distribucin de frecuencias.
b. De la anterior distribucin, interpretar: 1. tercera frecuencia. 2. segunda
frecuencia relativa. 3. cuarta frecuencia acumulada.
c. En un slo grfico representar frecuencias y frecuencias relativas.
2. A una muestra de pequeas empresas dedicadas a la produccin de calzado en
Bogot se les observ el nmero de trabajadores que tenan contratados. Se
obtuvo:
3 4 2 5 3 1 4 2 4 3 4 2 4 5 3 1 4 2 5 5 2 5 1 4 6 3 4 4 5 3 3 2 3
4 2 1 4 3 2 5
a. Ordenar los datos en una tabla de distribucin de frecuencias.
b. Construir un grfico para representar las frecuencias relativas acumuladas.
c. Construir un grfico para representar las frecuencias absolutas.

3. El costo variable unitario($) de producir un artculo en 30 fbricas es el siguiente
29.2 27.0 32.1 31.6 31.4 33.2 32.4 25.8 34.7 30.1 36.4 30.8 24.8
34.6 31.1 29.5 32.0 28.4 31.2 30.6 35.1 33.6 28.1 29.4 37.2 26.6
31.7 37.9 29.9 33.6
a. Ordenar los datos en una tabla de distribucin de frecuencias que tenga 6
intervalos de igual amplitud
b. Interpretar n
3
,h
2
,N
4
,H
3
c. en cuntas fbricas se tienen costos variables unitarios de
i. por lo menos $29.2
ii. menores a $35.8
iii. por lo menos $27.0 pero menos de $33.6

4. En 40 entidades financieras se pregunt la tasa anual efectiva de colocacin a
corto plazo, que tena cada una de ellas. Se obtuvieron los siguientes datos
0.35 0.39 0.32 0.35 0.44 0.28 0.24 0.40 0.45 0.48 0.37 0.26 0.31
0.36 0.37 0.41 0.52 0.42 0.39 0.40 0.42 0.41 0.40 0.38 0.41 0.50
0.28 0.36 0.37 0.42 0.44 0.36 0.30 0.27 0.26 0.31 0.38 0.41 0.40
0.45
a. Ordenar los datos en una tabla de distribucin de frecuencias que tenga 6
intervalos.
b. A partir de la distribucin anterior interpretar n
2
, h
3
, N
4
y H
5
c. A partir de la distribucin establecer el nmero de entidades que tienen tasa de
colocacin
i. menor al 44%
ii. entre 34% y 49%
iii. por lo menos del 39%
iv. construir en un solo grfico la ojiva y la ojiva porcentual

5. El auditor de una empresa selecciona una muestra de 40 cuentas que han sido
declaradas como incobrables y encuentra que el valor de esas cuentas ( en miles$
) son :
40.2 52.8 90.8 120.2 24.8 100.0 90.1 72.6 64.8 47.9 36.6 123.4 88.4 75.1
58.4 107.3 87.6 65.1 48.3 28.0 31.2 99.0 66.1 101.0 110.0 104.8 115.9
49.6 57.8 60.1 84.2 56.1 54.2 60.2 75.3 84.2 79.6 74.1 63.6 56.4
a. Ordenar estos datos en una distribucin de frecuencias que tenga seis
intervalos de igual amplitud.
b. Interpretar n
3
, h
2
,H
4
N
3
.
c. A partir de la distribucin establecer el porcentaje de cuentas incobrables que
tienen un valor : 1. por lo menos de 90.8 miles$; 2. menor a 74.3 miles$; 3.
comprendido entre 57.8 y 107.3 miles$.
d. Representar en un slo grfico las frecuencias acumuladas y las frecuencias
relativas acumuladas.
6. Una encuesta realizada entre 30 personas poseedoras de automvil mostr las
siguientes respuestas acerca de la marca del auto que posean.
F S CH S R R R M R M F F R M O R M CH O S R M CH R CH
CH M R CH M

a. La poblacin es ...
b. La muestra es ...

c. La variable es ....
d. La variable es de tipo ...
e. Ordenar las respuestas en una tabla de distribucin de frecuencias.
f. Representar la informacin de la tabla anterior en un grfico apropiado.
7. El ndice de rotacin durante el ao pasado de 25 artculos que se disponen en
el inventario del almacn de materias primas de una fbrica fue :
6.1 5.8 7.2 9.0 8.6 7.6 5.3 6.7 7.0 7.6 6.0 8.1 6.2 6.8 6.3 6.9
7.8 6.1 6.6 6.2 6.9 7.4 7.9 8.5 6.4
a. Organizar los datos en una distribucin de frecuencias que tenga cinco
intervalos
b. De la anterior distribucin de frecuencias interpretar una frecuencia de cada
tipo.
c. En un solo grfico representar las frecuencias acumuladas y las relativas
acumuladas
8. Durante la rueda de ayer en la Bolsa de Valores de Colombia se negociaron los
siguientes papeles

PAPEL VALOR TRANSADO
( millones$)
C.D.T. 14000
ACCIONES 2500
ACEPTACIONES 4000
OTROS 2000
Representar esta informacin mediante dos grficos diferentes que sean
apropiados.

9. En un estudio en medianas empresas industriales, se seleccion una muestra
de 400 de ellas, y se observ el valor del inventario a 31 de diciembre del ao
pasado, obteniendo la siguiente informacin : El mnimo inventario encontrado fue
de 8 millones$ y el mximo fue de 62 millones$; El 8% de las empresas
encuestadas tena inventario inferior a 17 millones$; El 15% tena inventario
comprendido entre 17 y 26 millones$; el 50% tena inventario menor a 35
millones$; el 25% tena inventario entre 35 y 44 millones$; el 95% tena inventario
por menos de 53 millones$.
a. Ordenar esta informacin en una tabla de distribucin de frecuencias.
b. Representar en un solo grfico las frecuencias acumuladas y las relativas
acumuladas.







































UNIDAD III
MEDIDAS DE TENDENCIA
CENTRAL




OBJ ETIVOS:
1. Resumir los datos en una medida nica
2. Identificar cuando es ms apropiado un promedio que otro.





3.1 INTRODUCCIN

Las medidas de tendencia central, tambin conocidas con la denominacin de
promedios, son medidas que tratan de caracterizar a todos los elementos
estudiados, en un solo valor. Existen diferentes promedios, de los cuales solo
consideraremos cuatro. La media aritmtica es el promedio ms utilizado de ellos,
por su facilidad de clculo, sin embargo deben considerarse los otros, pues no
siempre la media aritmtica es un promedio adecuado.


3.2 MEDIA ARITMTICA

La media aritmtica de un conjunto de valores se define como la sumatoria de
todos los valores dividida por la cantidad de valores, generalmente se simboliza
por

EJ EMPLO 3.1
El ingreso mensual, en millones$, de 10 personas es:
2.5 1.8 1.4 15.0 1.5 1.2 2.2 2.0 2.4 1.6
La media aritmtica del ingreso mensual de estas personas es:

La media aritmtica se interpreta como: El ingreso medio (promedio) de estas diez
personas es de 3.16 millones de $.
A partir de este valor se puede realizar un anlisis respecto de la magnitud de este
valor, dependiendo del grupo de referencia.
En los datos anteriores se puede observar que una persona (la cuarta) tiene un
ingreso mensual muy superior a las dems personas (este valor se conoce como
un valor atpico o extremo), lo cual hace que el promedio del grupo sea muy alto y
por lo tanto no represente adecuadamente a todo el grupo, por lo tanto puede ser
ms adecuado utilizar otro promedio para representar el ingreso de todas las
personas.
Cuando los datos ya se encuentren tabulados en una distribucin de frecuencias,
para el clculo de la media aritmtica es necesario tener en cuenta la frecuencia
que tiene cada valor o intervalo de valores, por ello la media aritmtica para este
caso se define como:

Donde:
: representa los valores de la variable, si ella es discreta o las marcas de clase o
puntos medios de los intervalos, si la variable es de tipo continuo.
: representa las frecuencias que tiene cada valor o intervalo.


EJ EMPLO 3.2

Para una muestra de ochenta viviendas de un sector, se obtuvieron los siguientes
datos sobre el nmero de personas que residen en cada una:
TABLA 1.
NMERO DE
RESIDENTES
( )
NMERO DE
VIVIENDAS
( )
2
3
4
5
6
7
8
15
20
17
14
6

TOTAL 80

Los datos se pueden organizar en la misma tabla, agregando una columna para el
producto de los valores de la variable por su frecuencia,

NMERO DE
RESIDENTES
( )
NMERO DE
VIVIENDAS
( )

2
3
4
5
6
7
8
15
20
17
14
6

16
45
80
85
84
42
TOTAL 80 352

La media aritmtica ser:
=
Es decir, el nmero medio de personas por vivienda es de 4.4
EJ EMPLO 3.3
El consumo de agua, en metros cbicos, durante el mes pasado se midi en una
muestra de 200 hogares de un sector, obteniendo los siguientes datos:







TABLA 2.

CONSUMO(
)
( )
NMERO DE
HOGARES
(
CONSUMO
MEDIO
(


4-6
6-8
8-10
10-12
12-14
14-16
18
38
80
48
12
4

5
7
9
11
13
15
90
266
720
528
156
60
TOTAL 200 1820

Observar que a las dos primeras columnas, que son las bsicas de la distribucin
de frecuencias, se le han agregado dos columnas: la de las marcas de clase o
puntos medios de los intervalos y la del producto de las marcas de clase por las
frecuencias, entonces la media aritmtica del consumo es:
=

MEDIA ARITMTICA PONDERADA

Cuando a los diferentes valores que toma una variable se le asigna pesos o
ponderaciones que indique la importancia que se le asigna a cada valor, se define
la media aritmtica ponderada como:

Donde:
son los diferentes valores que toma la variable.
: son los pesos o ponderaciones que se le asignan a cada uno de los valores
de la variable.

EJ EMPLO 3.4
Una empresa llev a cabo la siguiente poltica de aumentos de salarios para este
ao: A los trabajadores que devengaban salarios menores a $1000000, se les
aument el 8%; a los que tenan salario entre $1000000 y $2000000, el aumento
fue del 5%; a los que tenan salarios superiores a $2000000, el aumento fue del
4%. Cul fue el aumento promedio porcentual que realiz la empresa a todos sus
trabajadores si el 50% devenga menos de $1000000, el 40% devenga entre
$1000000 y 2000000 y el 10% devenga ms de $2000000?
Para este caso los pesos o ponderaciones son los porcentajes de trabajadores
que se encuentran en cada categora salarial. As que, el aumento porcentual
promedio fue:


PROPIEDADES DE LA MEDIA ARITMTICA

1. La media aritmtica es el promedio ms conocido y utilizado, por su
facilidad de clculo y de interpretacin.
2. En su clculo intervienen todos los valores que toma la variable.
3. Se ve fuertemente afectada por valores extremos de la variable. Valores
muy pequeos o muy grandes influyen fuertemente sobre la media
aritmtica, haciendo que no represente adecuadamente a todos los
elementos.
4. No se puede utilizar cuando los datos han sido ordenados en una tabla de
distribucin de frecuencias que tenga intervalos abiertos.
5. No es recomendable utilizar la media aritmtica cuando los datos se
encuentren ordenados en una distribucin de frecuencias que presente
intervalos de amplitud variable.

MEDIA GEOMETRICA

La media geomtrica de un conjunto de valores se define como la raz n-sima del
producto de los valores, generalmente se simboliza por .

Cuando los datos ya se encuentren ordenados en una tabla de distribucin de
frecuencias, la media geomtrica se define como:

EJ EMPLO 3.5
El nmero de empleados que tienen ocho empresas es: 3 6 11 26 50 95 200 y
380
Estos datos se encuentran en forma bruta, por lo cual la media geomtrica sera:
= =
Empleados.

EJ EMPLO 3.6

PROPIEDADES DE LA MEDIA GEOMTRICA.

1. En su clculo intervienen todos los valores que toma la variable.
2. Es un promedio que se afecta menos que la media aritmtica por valores
atpicos o extremos de la variable.
3. No se puede utilizar cuando la variable toma el valor cero o negativos.
4. Es el promedio ms adecuado para promediar cantidades que tienen forma
de progresin geomtrica( vase el ejemplo 3.5), por ejemplo, los
siguientes valores forman una progresin geomtrica : 2, 6, 18, 54, 162,
486 y 1458
En este caso el promedio ms adecuado es la media geomtrica



No se requiere que los valores constituyan exactamente una progresin
geomtrica, slo es necesario que adopten una forma similar.
5. La media geomtrica es el promedio que debe ser utilizado para promediar
tasas de crecimiento o variables que presentan variacin a travs del
tiempo. Pero debe tenerse en cuenta que no se promedian directamente las
tasas de crecimiento sino los factores de crecimiento.
Si representa la tasa de crecimiento, entonces representa la tasa de
crecimiento.

EJ EMPLO 3.7
Los ingresos operacionales que ha tenido una empresa en el periodo 2001-
2007 han sido:
TABLA 4.
AOS INGRESOS
OPERACIONALES
(MILLARDOS)
FACTOR DE
CRECIMIENTO
DEL INGRESO
OPERACIONAL
2001
2002
2003
2004
2005
2006
2007
4.5
5.3
5.0
5.6
5.8
6.9
7.8
-
1.229
0.943
1.12
1.036
1.19
1.13

En las dos primeras columnas se presentan los registros histricos de los
ingresos operacionales y en la tercera columna se presentan los factores de
crecimiento( Se divide el valor de la variable en un periodo entre el valor de
la variable en el periodo inmediatamente anterior). El promedio geomtrico
de los factores de crecimiento es:


Este es el promedio geomtrico de los factores de crecimiento. La tasa
promedio de crecimiento se obtiene restndole 1 al factor de crecimiento



Esto significa que durante el periodo 2001-2007 los ingresos operacionales
de la empresa han crecido a una tasa promedio de o del

6. La media geomtrica se utiliza para realizar proyecciones. Si una variable
toma un valor al inicio de un periodo y crece a una tasa promedio
constante por periodo, despus de periodos el nmero de elementos
ser:


EJ EMPLO 3.8
La poblacin colombiana en 2007 es de 44 millones de habitantes. Si la
poblacin colombiana crece a una tasa promedio de 0. 014 anual, puede
estimarse que la poblacin colombiana dentro de 10 aos ser:


3.3 MEDIANA

La mediana de un conjunto de valores se define como el valor central de la
variable.
La mediana es un valor tal que divide a los elementos en dos grupos: la
mitad (o el 50%) de los elementos tomarn un valor menor o igual a la
mediana y la otra mitad (o el 50%) de los elementos tomarn un valor
menor o igual a la mediana.

La mediana se suele simbolizar por

CLCULO DE LA MEDIANA.

Para el clculo de la mediana consideraremos varias situaciones, de
acuerdo con el tipo de datos.
1. Para los datos brutos o no tabulados, se consideran dos situaciones.
EL NMERO DE DATOS ES IMPAR. Los datos se ordenan en forma creciente o
decreciente de magnitud y la mediana ser el valor visualmente central.

EJ EMPLO 3.9
El salario mensual (miles de $) de una muestra de trabajadores de una
empresa es:
770 580 950 600 700 650 900 680 1000 650 550
Los valore se ordenan en forma creciente:
550 580 600 650 650 680 700 770 900 950 1000
Se observa que el valor que ocupa la posicin central es 680, luego este valor es
la mediana

Esto significa que la mitad de los operarios tiene salario mensual de $680000 o
menos y la otra mitad tiene salario mensual de $680000 o ms.
Cuando el NMERO DE DATOS ES PAR, la mediana se toma como la media
aritmtica de los dos valores centrales, estando ya los datos ordenados en forma
creciente o decreciente.
EJ EMPLO 3.10
La rentabilidad de los accionistas el ao pasado, para una muestra de empresas
industriales fue( en porcentaje):
5.6 8.2 13.6 14.2 7.5 6.5 6.0 18.8 4.5 9.2 12.4 16.3 8.8 12.0
Los valores se ordenan en forma ascendente:
4.5 5.6 6.0 6.5 7.5 8.2 8.8 9.2 12.0 12.4 13.6 14.2 16.3 18.8
Los dos valores que ocupan la posicin central son 8.8 y 9.2, luego la mediana
ser la media aritmtica de estos dos valore.

Esto significa que la mitad de las empresas tuvieron el ao pasado una
rentabilidad para los accionistas de 9.0% o menos y la otra mitad tuvo una
rentabilidad de 9.0% o ms.

2. Cuando los datos estn tabulados, es decir ya han sido ordenados en una tabla
de distribucin de frecuencias, es necesario considerar dos situaciones, cuando la
variable es discreta y cuando la variable es continua o los valores se han
clasificado por intervalos.
Cuando la variable es discreta, el procedimiento para ubicar la mediana es el
siguiente:
Debe disponerse de la distribucin con sus frecuencias acumuladas.
Se calcula el valor de
Se ubica la menor frecuencia acumulada que supere a Esta frecuencia
se suele simbolizar por donde indica la posicin de esta
frecuencia.
Se compara la frecuencia acumulada anterior, es decir con . Al
realizar esta comparacin pueden ocurrir uno de los dos casos: Que
sea menor que En este caso la mediana ser el valor de la
variable que ocupe la posicin O que sea igual a En este caso
la mediana ser la media aritmtica de los valores de la variable que
ocupan las posiciones
EJ EMPLO 3.11

Un grupo de personas present una prueba de aptitud. El nmero de respuestas
incorrectas que tuvieron se muestra en la siguiente tabla:
NMERO DE
RESPUESTAS
INCORRECTAS
( )
NMERO
DE
PERSONAS
( )
NMERO
ACUMULADO
DE PERSONAS

0
1
2
3
4
5
6
7
3
7
20
30
15
10
3
2
3
10
30
60
75
85
88
90
TOTAL 90

A la tabla se le ha aadido la tercera columna, correspondiente a las frecuencias
acumuladas.
Primero se calcula
Se ubica la menor frecuencia acumulada que supera a . En este caso es la
cuarta frecuencia acumula(60)
Se compara la frecuencia acumulada anterior co n , o sea, la tercera, que
en este caso es 30. Como 30 es menor que 45, la mediana ser el valor de
la variable que se encuentra en la cuarta posicin, esto es 3. Luego,
Lo cual significa que la mitad (o el 50%) de las personas tuvieron 3 o menos de 3
respuestas incorrectas y la otra mitad(o el 50%) tuvieron 3 o ms respuestas
incorrectas.

EJ EMPLO 3.12

El nmero de empleados que tiene una muestra de pequeas empresas, se
muestra en la siguiente tabla:


NMERO DE
EMPLEADOS
( )

NMERO DE
EMPRESAS
( )
NMERO ACUMULADO
DE EMPRESAS

3
4
5
6
7
8
9
10
4
12
20
24
30
15
8
7
4
16
36
60
90
105
113
120
120

Primero se calcula
Se ubica la menor frecuencia acumulada que supera a En este caso es la
quinta frecuencia acumulada (90).
Se compara la frecuencia acumulada anterior con O sea, la cuarta
frecuencia acumulada, que en este caso es 60. Como es igual a o sea
tambin 60, la mediana ser la media aritmtica de los valores de la
variable que estn en las posiciones cuarta y quinta. Luego,
empleados.
Lo cual significa que la mitad(o el 50%) de las empresas tienen 6.5 empleados o
menos y la otra mitad (o el 50%)tiene 6.5 empleados o ms.
Cuando los datos corresponden a una variable continua el procedimiento para
obtener la mediana Debe tenerse la distribucin de frecuencias con las
frecuencias acumuladas.
Se calcula
Se ubica la menor frecuencia acumulada que supere a Esta frecuencia se
simboliza por Donde indica la posicin del intervalo en donde se
encuentra la frecuencia acumulada que supera a .
La mediana puede ser ubicada mediante la siguiente expresin:

Donde:
Es el lmite inferior del intervalo .
Es el ancho o amplitud del intervalo .
Es la frecuencia acumulada anterior a la que supera a
Es la frecuencia del intervalo

EJ EMPLO 3.13

La siguiente tabla muestra gasto (miles $) efectuado el mes pasado en
mantenimiento por una muestra de los buses de una empresa transportadora:

GASTO EN
MANTENIMIENTO


NMERO DE
BUSES

NMERO
ACUMULADO
DE BUSES

100 200
200 300
300 400
400 500
500 600
600 700
3
7
18
12
8
2
3
10
28
40
48
50
TOTAL 50

A la tabla bsica se le ha agregado la tercera columna, correspondiente a las
frecuencias acumuladas. El procedimiento para el clculo de la mediana es el
siguiente:
Se calcula
Se ubica la menor de las frecuencias acumuladas que supere a 25. En este
caso es la tercera frecuencia acumulada(28), es decir
Se calcula la mediana utilizando la frmula anterior.
El lmite inferior del tercer intervalo es 300( ; la amplitud del tercer
intervalo es 100 ( ; La frecuencia acumulada del intervalo anterior es
10( ; la frecuencia del tercer intervalo es 18( . Entonces, la mediana
ser:


Este valor significa que la mitad( o el 50%) de los buses gastaron en
mantenimiento 383.3 mil$ o menos y la otra mitad ( o el otro 50%) gast
383.3 mil$ o ms.





PROPIEDADES DE LA MEDIANA.

1. No es un promedio matemtico, pues no est definida por una frmula
algebraica sino por un procedimiento para su localizacin.
2. En su clculo no intervienen todos los valores que toma la variable,
nicamente intervienen los valores centrales.
3. No se ve afectada por valores extremos o atpicos de la variable.
4. Es el promedio ms adecuado cuando se dispone de una distribucin de
frecuencias con intervalos de amplitud variable.
5. Tambin es adecuado como promedio cuando se tienen los datos
ordenados en una distribucin de frecuencias con intervalos de amplitud
variable.

3.3 MODA

La Moda de un conjunto de valores se define como el valor que se presenta con
mayor frecuencia. La moda representa el valor que es tpico o representativo de
los elementos estudiados.
Se simboliza por .

CLCULO DE LA MODA.

1. Cuando los datos se encuentran en forma bruta o no tabulados, la moda
ser el valor de la variable que ms veces se repite.
EJ EMPLO 3.14
A una muestra de hogares se les midi el consumo de gas que haban tenido el
mes pasado ( en metros cbicos):
22 32 34 25 18 25 24 42 7 45 25 34 23 25 27 30 25 28 25 27 25
33 31 25
Una inspeccin visual muestra que el valor que ms veces se repite es 25, luego
este valor es la moda.

Este valor significa que el consumo ms frecuente en los hogares es de 25 metros
cbicos o que el hogar tpico es aquel que tiene un consumo mensual de gas de
25 metros cbicos.

EJ EMPLO 3.15

La edad de un grupo de personas es :
18 27 20 22 34 25 22 28 20 33 19 20 27 22 19 37 22 17 55
Como puede observarse, los valores 20 y 22 son los que ms se repiten. Por lo
tanto estos dos valores son la moda. Se dice, en este caso que los datos son
bimodales.

2. Cuando los datos se encuentran tabulados en una tabla de distribucin de
frecuencias, hay que considerar dos situaciones, si la variable es discreta o
es continua.
Si la variable es discreta, la moda ser el valor de la variable que presenta
la mayor frecuencia.

EJ EMPLO 3.16

El nmero de das que fallaron a su trabajo, por diversas causas, los
empleados de una empresa durante el ao pasado se presenta en la
siguiente tabla:
NMERO DE
DAS
QUE FALLARON


NMERO DE
EMPLEADOS

0
1
2
3
4
5
6
7
6
25
19
8
7
5
3
2
TOTAL 75

Como se observa en la tabla la mayor frecuencia (25) la tiene el valor 1.
Luego, este valor es la moda.
1 da.

Cuando la variable es continua, es decir, sus valores se han agrupado por
intervalos, la moda puede obtenerse utilizando la siguiente frmula de
interpolacin:



Donde:
Es el lmite inferior del intervalo que tiene la mayor frecuencia.
Es la amplitud del intervalo que tiene la mayor frecuencia.
Es la mayor frecuencia (frecuencia modal)
Es frecuencia ubicada inmediatamente antes de la mayor frecuencia
(frecuencia premodal).
Es la frecuencia ubicada inmediatamente despus de la mayor
frecuencia (frecuencia postmodal).


EJ EMPLO 3.17

Para una muestra de viviendas de un sector residencial, se obtuvieron los
siguientes datos sobre el valor pagado por impuesto predial, en miles de
pesos, este ao:
IMPUESTO
PAGADO


NMERO DE
VIVIENDAS
(
70 120
120 170
170 220
220 270
270 320
320 370
4
15
21
17
2
1
TOTAL 60

La mayor frecuencia se encuentra en el tercer intervalo (21: ); la
frecuencia inmediatamente anterior a esta es 15( ; la inmediatamente
posterior es 17( ; la amplitud del tercer intervalo es 50( ; el lmite
inferior del tercer intervalo es 170( . Entonces la moda ser:



Lo cual significa que el valor ms frecuente pagado por las viviendas fue de
200 mil $.

PROPIEDADES DE LA MODA.

1. La moda es un promedio de posicin, pues no est definida por una
frmula algebraica.
2. En el clculo de la moda no intervienen todos los valores que toma la
variable, pues solo intervienen los valores ms frecuentes.
3. No se afecta por la presencia de valores atpicos.
4. No es recomendable utilizarla en distribuciones de frecuencias que
tengan intervalos de amplitud variable.
5. Es til cuando se desea determinar el valor que es tpico o caracterstico
de un grupo.
6. Es el promedio ms adecuado cuando se encuentre que un valor
presenta una frecuencia grande comparada con las dems.

CUL PROMEDIO UTILIZAR?
Cada uno de los promedios vistos tienen una caracterstica especial de tal manera
que cada uno de ellos se debe utilizar de acuerdo con el tipo de datos de que se
dispongan. En las propiedades enunciadas de cada uno de los promedios se
puede encontrar una gua de cuando utilizarse y cuando no utilizarse. Sin
embargo, la media aritmtica es el promedio que ms se utiliza.











GLOSARIO


MEDIA ARITMTICA: Medida de tendencia central, definida como la suma de
todos los valores dividida por el nmero de valores. Es el promedio ms utilizado.

MEDIA ARITMTICA PONDERADA: Es un promedio aritmtico de un conjunto de
valores teniendo en cuenta la importancia que se le asigne a cada valor.

MEDIA GEOMTRICA: Promedio que se utiliza frecuentemente para estudiar la
tasa de crecimiento. Se define como la raz n del producto de los n valores.

MEDIANA: Valor central de los datos. Divide a los datos en dos partes iguales.

MODA: El valor que se presenta con mayor frecuencia.

MEDIDA DE TENDENCIA CENTRAL: Medidas que representan a un conjunto de
valores y que se ubican en la parte central de los datos.


BIBLIOGRAFA


LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMA. Pearson Educcin,2004.

MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMIA. Editorial alfaomega. 2005.



EJ ERCICIOS

1. A una muestra de amas de casa se le pregunt el nmero de veces que en la
semana acudan al supermercado ms cercano. Las respuestas se ordenaron en
la siguiente distribucin:
NUMERO DE VECES 1 2 3 4 5
NUMERO DE AMAS DE CASA 15 25 40 18 12
Obtener e interpretar media aritmtica, mediana y moda.

2. La utilidad de una empresa ha presentado el siguiente registro :
AOS 1999 2000 2001 2002 2003 2004 2005
2006 2007
UTILIDAD (MILLON$) 400 480 600 680 720 850 970
1050 1120
a. A qu tasa media anual han crecido las utilidades de la empresa en es
periodo?
b. Si la anterior tasa promedio se mantiene haca el futuro qu utilidad esperara
tener la empresa en 2008? en 2009?

3. La siguiente distribucin se refiere al tiempo ( minutos ) necesarios para que
una muestra de clientes de un banco lleven a cabo una transaccin
TIEMPO (MINUTOS) 1.5 - 3.5 3.5 - 5.5 5.5 - 7.5 7.5 - 9.5 9.5 - 11.5 11.5 -
13.5
NUMERO CLIENTES 6 13 25 11 9 5
Obtener e interpretar media aritmtica, mediana y moda
4. Obtener la media, mediana , moda y media geomtrica de los siguientes datos :
3 6 10 18 30 58 100
Establecer cul de las anteriores medidas es la ms conveniente. Porqu?

5. La distribucin de los salarios mensuales ( miles$ ) de los empleados de dos
empresas se da a continuacin :
EMPRESA A EMPRESA B
SALARIOS NUMERO DE SALARIOS NUMERO DE
(MILES$) EMPLEADOS (MILES$) EMPLEADOS
700 - 900 10 300 - 500 15
900 - 1100 20 500 - 700 25
1100 - 1300 25 700 - 900 35
1300 - 1500 10 900-1100 10
1500- 1700 5 1100 - 1500 5
a. Obtener el salario medio de los trabajadores de cada empresa.
b. Obtener el salario medio para los trabajadores de las dos empresas en
conjunto.
c. Obtener la media geomtrica de los salarios de los trabajadores de la empresa
A.
d. Obtener la mediana de los salarios de los trabajadores de la empresa B.

6. Se deseaba medir la eficiencia de unos operarios. Para ello se registr el tiempo
que cada operario tardaba en realizar una tarea, obtenindose la siguiente
informacin: El 12% de los operarios tardaban 12 minutos en realizar la tarea; el
13% tardaba 14 minutos en realizarla; el 9% tardaba 14.5 minutos; el 20%
tardaba 16 minutos; el 19% tardaba 18 minutos; y el 27% tardaba 19 minutos.
Cul es el tiempo medio de ejecucin de la tarea por parte de los trabajadores ?.


















UNIDAD IV
MEDIDAS DE DISPERSIN




OBJ ETIVOS


1. ESCRIBIR UNA VARIABLE MEDIANTE LA VARIACIN DE SUS
VALORES.
2. EXAMINAR EL GRADO DE HOMOGENEIDAD QUE PRESENTA UN
GRUPO DE ELEMENTOS.








4.1 INTRODUCCIN.

Observar los siguientes conjuntos de datos:
I II III
200 210 200
200 190 100
200 180 300
200 220 50
200 200 350
Una ligera inspeccin visual de los tres conjuntos de datos nos revelan que en los
tres conjuntos los valores se encuentran alrededor de 200(es la media aritmtica
para cada uno de los tres grupos), pero en el primer conjunto los valores estn
justamente concentrados en este valor; en el segundo conjunto los valores se
encuentran cercanos a 200 mientras que en el tercer conjunto los valores tienden
a estar bastante alejados de 200.
Las medidas de dispersin cuantifican el grado de dispersin o variacin que
presenta un conjunto de valores entre s o con respecto a un promedio,
generalmente la media aritmtica, que es el promedio ms utilizado. Por lo tanto
las medidas de dispersin pueden utilizarse para establecer la uniformidad u
homogeneidad de un grupo con respecto a una variable.
A continuacin se describen las medidas de dispersin ms utilizadas.

4.2 RANGO o RECORRIDO. (

Se define como la diferencia entre el mayor y menor valor que toma la variable.



El rango es una medida de dispersin muy simple, pues mide la amplitud que
presentan las observaciones. Como medida tiene el inconveniente de que no tiene
en cuenta todos los valores que toma la variable, pues solo toma en cuenta el
mayor y el menor valor de la variable.}

EJ EMPLO 4.1
El costo de produccin de un artculo en 10 fbricas es ($):
2400 2450 2380 2520 2700 2470 2670 2550 2390 2510
El rango del costo de produccin del artculo en las diez fbricas es:



Esto simplemente indica que la diferencia entre la fbrica que tiene mayor costo
de produccin y la que tiene menos costo de produccin es de $320

Las medidas de dispersin ms utilizadas son la varianza y la desviacin estndar.
J unto con la media aritmtica constituyen las medidas que representan mejor el
comportamiento de una variable en un conjunto de elementos.

4.3 VARIANZA (

La varianza de un conjunto de datos se define como el promedio de las
diferencias al cuadrado entre los valores que toma la variable y su media
aritmtica.

Donde:
: son los diferentes valores que toma la variable, y la media aritmtica de la
variable.
La varianza expresa, en promedio, qu tanto se alejan los valores de la media
aritmtica, pero las distancias las expresa al cuadrado, por lo tanto la varianza
queda expresada en unidades de la variable al cuadrado ( , lo
cual puede que no tenga un sentido muy lgico, pero como se expres
anteriormente es la medida de dispersin que ms se utiliza.
Cuando los datos ya se encuentran tabulados en una tabla de distribucin de
frecuencias, la varianza se obtiene como:



Donde son los diferentes valores que toma la variable, si es discreta, o los
puntos medios o marcas de clase, si la variable es continua y son las
frecuencias que tiene cada valor o cada intervalo.
Esta frmula por manipulacin algebraica se puede transformar en:



EJ EMPLO 4.2

La experiencia (aos) en su oficio de una muestra de operarios de una fbrica es:
12 8 10 5 7 25 14 1 4 20
Estos datos se encuentran en forma bruta o no tabulada.
Observar que la experiencia vara entre los operarios, qu tanto es esa variacin
puede medirse con una medida de dispersin, tal como la varianza.
Primero se debe calcular la media aritmtica, pues la varianza mide la dispersin
que presentan los valores respecto de ella.


La varianza puede obtenerse mediante:


Esto significa: En promedio, la experiencia que tienen los operarios se dispersa o
vara alrededor de la experiencia media en .
Observar que este valor es bastante grande, por lo cual se puede decir que la
experiencia que tienen los operarios es muy variable entre ellos o de otra forma,
que los operarios no son uniformes en la experiencia que tienen.

EJ EMPLO 4.3

En la siguiente tabla se muestra el valor, en millones$, de los crditos para
vehculo que concedi durante el mes pasado una entidad financiera:

TABLA 4.1: CRDITOS PARA VEHCULO
VALOR DE
LOS
CRDITOS
(MILLONES$)
)
NMERO
DE
CRDITOS


VALOR
MEDIO













)
4 - 10
10 - 16
16 - 22
22 - 28
28 - 34
34 - 40
40 - 46
4
12
25
30
10
5
4
7
13
19
25
31
37
43
28
156
475
750
310
185
172
1032.55
1216.05
413.44
1|12.13
629.38
970.69
1589.35
196
2028
9025
18750
9610
6845
7396
TOTAL 90 2076 5963.59 53850

Las dos primeras columnas corresponden a los datos disponibles, que ya se
encuentran tabulados en una distribucin de frecuencias.
La tercera columna corresponde a los puntos medios o marcas de clase de cada
intervalo .
En la tercera columna se encuentran los productos de cada marca de clase por su
frecuencia , necesarios para calcular la media aritmtica


El valor medio (promedio) por el cual se concedieron los crditos fue de 23.06
millones $.
Qu tanto varan los valores de los crditos alrededor de la media? Esto se puede
medir con la varianza.
En la quinta columna se encuentran los clculos necesarios para obtener la
varianza.



Esto significa que el valor de los crditos varan (se dispersan, se alejan) alrededor
de la media en 67.01 .

OTRA FRMULA PARA CALCULAR LA VARIANZA.

El numerador de la definicin de la varianza se puede operar algebraicamente,
operando el cuadrado de la diferencia, para obtener frmulas que pueden ser ms
sencillas, pues tienen involucrados menos clculos,

Para datos no tabulados.
Y la correspondiente para datos tabulados,



EJ EMPLO 4.4

Utilizando los datos del ejemplo 2, ya se haba obtenido que


Utilizando ahora para la varianza la frmula derivada, obtenemos



Que es el mismo resultado obtenido anteriormente.

EJ EMPLO 4.5.

Utilizando los datos del ejemplo 4.3
Para este ejemplo, los clculos necesarios se presentan en la columna 6 de la
tabla 4.1



4.5 DESVIACIN ESTNDAR.

La desviacin estndar se define como la raz cuadrado positiva de la varianza.


La desviacin estndar se expresa en las mismas unidades de medida en que
est expresada la variable, por lo cual resulta ms fcil y comprensible su
interpretacin que la varianza.


EJ EMPLO 4.6

Si tomamos la varianza calculada en el ejemplo 2, tenemos que la desviacin
estndar se puede obtener como:

Lo cual significa que: En promedio, la experiencia que tienen los operarios se
dispersa o vara alrededor de la experiencia promedio en 7.43 aos.
Observar que este valor tiende a ser grande, lo cual indica que la experiencia es
muy variable entre los operarios, es decir, no son uniformes en esta caracterstica.

4.6 COEFICIENTE DE VARIACIN

El coeficiente de variacin de un conjunto de datos se define como el cociente
entre la desviacin estndar y la media aritmtica de un conjunto de datos.

El coeficiente de variacin tambin se suele expresar en porcentaje (multiplicar por
100%)


El coeficiente de variacin es una medida de dispersin relativa que se utiliza para
establecer el grado de variacin que presenta un conjunto de valores alrededor de
su media aritmtica. La varianza y la desviacin estndar son las medidas ms
extensamente utilizadas para medir la dispersin o variacin de los valores
alrededor de su media , sin embargo, a veces puede resultar difcil establecer si su
magnitud es grande o pequea. El coeficiente de variacin puede en este sentido
facilitar su interpretacin. Se considera que si el coeficiente de variacin es menor
a 0.15 (o 15%) los valores tienen muy poca dispersin, es decir los elementos
tienden a ser homogneos. Si el coeficiente de variacin est entre 0.15 y 0.30 ( o
entre el 15% y 30%), se considera que los valores presentan una dispersin
moderada, o sea, los elementos tienden a ser ligeramente homogneos. Si el
coeficiente de variacin es mayor a 0.30 ( o el 30%), los valores tienen una alta
dispersin y los elementos tienden a ser heterogneos.

EJ EMPLO 4.7

Para un grupo de empleados de una empresa se ha encontrado que su salario
mensual tiene una media de $1200000 y una desviacin estndar de
$500000.Es uniforme el salario de estos empleados?.
Al observar la magnitud de la desviacin estndar parece que es grande, esto
se puede confirmar con el coeficiente de variacin:

Que est bastante por encima de 0.30, por lo cual podemos decir que el salario de
los trabajadores es bastante disperso, es decir el grupo de empleados es bastante
heterogneo con respecto a su salario mensual.


GLOSARIO



COEFICIENTE DE VARIACIN: Medida de dispersin relativa que se utiliza para
comparar diferentes distribuciones y se expresa la relacin entre la desviacin
estndar y la media.

DESVIACIN ESTNDAR: definida como la raz cuadrada positiva de la varianza;
es una medida de dispersin que se expresa en las mismas unidades de medida
que la variable estudiada.

DISPERSIN: Variabilidad que presenta un conjunto de datos.

MEDIDA DE DISPERSIN: medida que expresa la magnitud en la variacin que
presenta un conjunto de datos.

RANGO: Diferencia entre el mayor y menor valor de un conjunto de datos.

VARIANZA: Medida que expresa el promedio de las distancias al cuadrado entre
los valores y su media aritmtica.



BIBLIOGRAFA


LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMA. Pearson Educcin,2004.

MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMIA. Editorial alfaomega. 2005.






EJ ERCICIOS

1. Durante nueve das se observ el nmero de unidades que produjeron dos
trabajadores de una fbrica que elaboraban el mismo artculo, obteniendo
OPERARIO 1 : 22 25 28 29 35 27 26 20 30
OPERARIO 2 : 21 24 26 28 28 27 29 24 26
Cul de los dos operarios es :
a. Ms eficiente en su produccin diaria ? Porqu ?
b. Ms uniforme en su produccin diaria ? Porqu ?

2. El consejo de Administracin de una corporacin est estudiando la posibilidad
de adquirir una de dos compaas y para ello analiza la administracin de cada
una en relacin con su inclinacin a correr riesgos. En los ltimos cinco aos , la
primera compaa alcanz un promedio de rendimiento sobre las inversiones del
28% con una desviacin estndar de 5.3%. La segunda tuvo un rendimiento medio
de 37.8% con una desviacin estndar de 6.29%. Cul de estas dos empresas ha
aplicado una estrategia ms riesgosa en sus inversiones ? Porqu?. Cul de las
dos empresas recomendara comprar? Porqu?.

3. En dos empresas, A y B, dedicadas a la produccin de un mismo artculo, se
tomaron muestras de 10 trabajadores de la empresa A y 15 de la empresa B y se
cont el nmero de unidades semanales, X, que elaboraba cada uno de ellos,
obteniendo :
A : X
i
= 191 X
i
2
=3721
B : X
i
= 274 X
i
2
=5148
Comparar la produccin semanal de los trabajadores de cada empresa en cuanto
a la produccin media, variacin absoluta de la produccin semanal, y variacin
relativa de la produccin semanal.

4. Un inversionista est interesado en hacerse socio en una de dos empresas de
inversiones. El deseara ser socio de aquella empresa de la cual considere que
obtiene mayor rentabilidad con menor riesgo. Para decidir observa que las ltimas
inversiones realizadas por las empresas han tenido las siguientes rentabilidades (
%) :
EMPRESA A : 27 32 31 28 25 22 24
EMPRESA B : 25 29 24 26 24 30 35 23
En cul de las dos empresas le recomendara invertir ? Porqu?.

5. Se pregunt el precio ( X ,en $ ) de un artculo en 20 tiendas y los datos
obtenidos se resumieron as : X
i
=4000 , X
i
2
=928000. Obtener e interpretar el
coeficiente de variacin del precio del artculo.

6. Da a da durante el mes de J ulio pasado y lo mismo durante el mes de Agosto
se tom el precio (libra) de venta mayorista para un producto agrcola . En J ulio se
encontr que el precio tuvo una media de $180 y desviacin estndar de $36; en
Agosto el precio tuvo una media de $240 y desviacin estndar de $44. En cul de
los dos meses fue ms estable el precio del producto ?

7. Cul de las siguientes es una medida de dispersin relativa?
A. La desviacin estndar
B. El coeficiente de variacin
C. La varianza
D. La mediana
E. El rango

8. La varianza se mide en
A. Unidades al cuadrado de la variable.
B Unidades de la variable.
C porcentaje.
D. diferentes unidades de la variable.

9. La raz cuadrada de la varianza se llama
A. Coeficiente de variacin
B. desviacin media
C. desviacin estndar
D. Amplitud

10. El Rango o Recorrido de un conjunto de datos es :
A. La diferencia entre el tercer cuartel y el primer cuartel.
B. La diferencia entre el mayor valor y el menor valor
C. El mayor valor
D. El menor valor

11. Cual de las siguientes medidas es una medida de dispersin absoluta?
A. El tercer cuartil
B. La variable estandarizada
C. La desviacin estndar
D. El coeficiente de variacin.

12. En una empresa A los salarios mensuales de los trabajadores tienen una
media de $1500000 y desviacin estndar de $400000; en otra empresa B los
salarios mensuales de los trabajadores tienen media de $ 1300000 y desviacin
estndar de $450000. A partir de esta informacin podemos afirmar que los
salarios en la empresa A
A. Tienen forma sesgada a la derecha
B. Son absolutamente ms variables que los de la empresa B.
C. Tienen una menor dispersin relativa que los de la empresa B.
D. Son menos asimtricos que los de la empresa B.











UNIDAD V
ANLISIS DE REGRESIN





OBJ ETIVOS:
1. Establecer la relacin entre dos variables.
2. Utilizar el diagrama de dispersin para observar la forma de la relacin
entre dos variables.
3. Estimar un modelo lineal para expresar la relacin entre dos variables.
4. Utilizar la ecuacin lineal estimada para predecir valores de la variable
dependiente con base en la variable independiente.






5.1 INTRODUCCIN


Muchas decisiones en Administracin, Negocios y Economa se basan en
predicciones sobre el comportamiento de una o ms variables con base en
relaciones conocidas o supuestas entre variables.
En el anlisis de regresin se considera el caso de la relacin entre dos
variables que conduce a la estimacin de una ecuacin, es decir una frmula
matemtica o modelo.

Establecido este modelo, se puede utilizar con propsitos de pronstico o
prediccin, que son ampliamente utilizadas con fines de planeacin.

En el anlisis de regresin se considera:
1. La existencia de relacin entre las variables. Esta relacin debe ser
establecida desde el propio contexto de las variables, es decir, bajo un
sustento terico. Hay que tener en cuenta que aqu no se considera una
relacin causal.
2. La definicin de una variable dependiente o explicada y una variable
independiente o explicatoria.
3. Suponer un modelo o ecuacin que permita relacionar las variables.

En este captulo solo consideramos el caso de la relacin entre dos variables y
slo se considera el caso de la relacin lineal entre ellas.


5.2 DIAGRAMA DE DISPERSIN

El diagrama de dispersin es un grfico que se suele utilizar para representar el
comportamiento conjunto de dos variables. En el eje horizontal se representa la
variable independiente y en el vertical, la variable dependiente.

EJ EMPLO 5.1

Suponer que a un grupo de personas se les ha medido su ingreso mensual ( en
millones de $) y su gasto mensual de consumo( en millones de $) y que se han
obtenido los siguientes datos:






TABLA 5.1

PERSONA INGRESO
MENSUAL
GASTO
MENSUAL DE
CONSUMO
1
2
3
4
5
6
7
8
9
10
4.5
2.8
3.0
1.7
2.5
3.3
2.2
1.5
2.0
3.7
3.5
2.4
2.5
1.6
2.2
2.7
2.0
1.4
1.7
3.1

Es relativamente fcil suponer que entre las dos variables, ingreso mensual y
gastos mensuales de consumo, existe relacin y que el ingreso mensual es la
variable dependiente o explicatoria, pues puede explicarse a partir de ella las
variaciones en el gasto mensual de consumo de las personas, que sera la
variable dependiente.
Una forma de representar grficamente las dos variables es mediante el
siguiente grfico, que representa en el eje horizontal los valores de la variable
independiente y en el eje vertical los valores de la variable dependiente.


GRFICO 5.1

El grfico anterior se conoce con el nombre de diagrama de dispersin o nube de
puntos.
Este grfico nos muestra que evidentemente existe relacin entre las dos variables
y adems que esta relacin es directa: en la medida en que el ingreso mensual en
que el ingreso mensual aumenta, los gastos mensuales de consumo tambin
aumentan o a la inversa, cuando el ingreso mensual disminuye, los gastos
mensuales de consumo tambin disminuyen.

Otro hecho que tambin muestra el grfico es que los puntos tienden a alinearse
alrededor de una lnea recta, entonces puede utilizarse este hecho para suponer
que entre las dos variables existe una relacin lineal y por lo tanto un modelo lineal
sera apropiado para relacionar las dos variables.

No necesariamente la relacin entre dos variables puede ser lineal. Consideremos
el siguiente ejemplo.

EJ EMPLO 5.2

Se mide a 8 operarios la experiencia (en meses) que tienen en realizar un trabajo
y el tiempo (minutos) que tardan en realizar ese trabajo.

TABLA 5.2

OPERARIO EXPERIENCIA TIEMPO
1
2
3
4
5
6
7
8
10
15
12
8
0
20
6
4
31
37
29
33
45
25
34
38

En este caso la variable independiente es la experiencia del operario
(representada en el eje horizontal)y la variable dependiente es el tiempo en que se
realiza el trabajo(representado en el eje vertical).

GRFICO 5.2: Diagrama de dispersin de la experiencia y tiempo para realizar un
trabajo por 8 operarios.

En el grfico puede observarse que existe relacin inversa entre las dos variables,
entre mayor sea la experiencia el tiempo en que se realiza el trabajo es menor, y a
la inversa, entre menor sea la experiencia menor es el tiempo que se tarda en
realizar el trabajo.

Tambin puede observarse que los puntos no tienden a alinearse alrededor de
una recta sino de una curva.
Sin embargo, tambin pueden presentarse casos en los cuales las dos variables
no muestran ningn tipo de relacin como puede verse en el siguiente grfico.



GRFICO 5.3: No relacin entre dos variables.

5.3 Estimacin de la ecuacin lineal de mnimos cuadrados.
Partimos del supuesto de que entre las dos variables existe una relacin lineal (el
diagrama de dispersin puede sugerirlo). La ecuacin lineal tiene la siguiente
forma:

se llaman los parmetros de la ecuacin lineal.

Como usualmente solo se dispone de los datos provenientes de una muestra,
estos solo permiten realizar una estimacin de la verdadera relacin entre las dos
variables. Entonces se dice que la ecuacin lineal se ESTIMA a partir de los datos
muestrales, y se expresa de la siguiente forma:

son los estimadores de los parmetros.
En la ecuacin, se llama el intercepto de la recta, y representa el valor que se
estima toma la variable dependiente cuando la variable independiente toma el
valor de cero ( no siempre tiene un sentido lgico). El valor de se llama la
pendiente de la recta y representa el valor en que se estima vara la variable
dependiente cuando la variable independiente vara en una unidad.

MTODO DE MNIMOS CUADRADOS.

A partir del diagrama de dispersin se puede observar que no existe ninguna recta
que pase justo por encima de todos los puntos. Se trata de obtener la recta que
pueda pasar lo ms cercana posible a todos los puntos del diagrama de
dispersin.

Cuando se ajusta una recta a los puntos del diagrama de dispersin para cada
valor observado en la muestra para la variable independiente habr dos valores
diferentes para la variable dependiente, el observado en la muestra ( y) y el
estimado por la ecuacin lineal( ). La diferencia que hay entre los dos es un error,
es decir,

El mtodo de mnimos cuadrados establece que la ecuacin que mejor se ajusta a
los datos muestrales es aquella que minimiza la suma de los errores al cuadrado.

Este mtodo conduce a obtener los estimadores de los parmetros de la ecuacin
lineal a partir de las siguientes ecuaciones:






EJ EMPLO 5.3

Se desea disponer de un modelo que exprese como cambian los costos totales de
produccin (millones $) de acuerdo con la cantidad de unidades producidas, para
un determinado artculo. Se obtuvieron datos de cinco fbricas que elaboran el
mismo artculo, que se muestran en la siguiente tabla.

TABLA 5.3

FBRICA CANTIDAD
DE
UNIDADES
PRODUCIDAS
COSTOS
TOTALES DE
PRODUCCIN
1
2
3
4
5
30
50
60
20
40
10
14
15
9
12

La variable dependiente es el costo total de produccin y la variable independiente
es la cantidad de unidades producidas.
Puede suponerse que las dos variables se relacionan en forma lineal como lo
muestra el siguiente diagrama de dispersin



GRFICO 5.4: Diagrama de dispersin de unidades producidas y costos totales de
produccin.

Para obtener la ecuacin lineal que relaciona las dos variables se deben
inicialmente realizar los clculos que se muestran en la siguiente tabla

TABLA 5.4

FBRICA CANTIDAD
DE
UNIDADES
PRODUCIDAS
(
COSTOS
TOTALES DE
PRODUCCIN










1
2
3
4
5
30
50
60
20
40
10
14
15
9
12
300
700
900
180
480
900
2500
3600
400
1600
200 60 2560 740

A partir de los datos anteriores se obtienen las medias de las dos variables:


Utilizando las ecuaciones (5.1) y (5.2) se obtienen los estimadores de los
parmetros,



Entonces, la ecuacin estimada ser:

El valor del intercepto, 5.6 significa que si una fbrica no produjera, se esperara
que tuviera unos costos de 5.6 millones $. Notar que este valor representa los
costos fijos estimados promedios para las empresas.
El valor de la pendiente, 0.16 significa que si una fbrica aumenta(disminuye) su
produccin en una unidad se espera o se estima que sus costos totales de
produccin se aumenten(disminuyan) en 0.16 millones $. Notar que este valor
representa los costos variables de estas empresas.

PREDICCIN.

Una vez obtenida la ecuacin, que representa un modelo, para relacionar las dos
variables, este modelo puede utilizarse con fines de pronstico o prediccin.

EJ EMPLO 5.4

Si una fbrica deseara producir 70 unidades del artculo, qu costos de produccin
se estimara que debera tener?
Para responder la anterior pregunta solamente se requiere reemplazar el valor
supuesto de la variable independiente, en este caso 70, en la ecuacin estimada,

Millones $
As que se estimara que la fbrica tendra costos de produccin por 16.8 millones
$.

5.4 ERROR ESTNDAR DE ESTIMACIN

Al obtener una ecuacin lineal para estimar la relacin entre dos variables hemos
vistos que siempre habr un error. El error estndar de estimacin es una medida
de la confiabilidad del modelo estimado. Puede interpretarse como la cantidad
promedio en que los valores observados de la variable dependiente se dispersan o
varan alrededor de la recta. Otra forma de interpretarlo es como la cantidad
promedio de error que se comete al utilizar la ecuacin lineal para estimar la
variable dependiente con base en valores conocidos o supuestos para la variable
dependiente.
El error estndar de estimacin se define como:

: representa los valores estimados con la ecuacin lineal para todos los valores
observados de la variable independiente.

EJ EMPLO 5.5

Para el ejemplo 5.3 vamos a obtener el error estndar de estimacin.
Inicialmente se reemplazan en la ecuacin estimada los diferentes valores de la
variable independiente, con lo cual se obtienen los valores estimados para la
variable dependiente. Los clculos se muestran en la siguiente tabla.

TABLA 5.5

FBRICA CANTIDAD
DE
UNIDADES
PRODUCIDAS
(
COSTOS
TOTALES DE
PRODUCCIN









1
2
3
4
5
30
50
60
20
40
10
14
15
9
12
10.4
13.6
15.2
8.8
12.0
0.16
0.16
0.04
0.04
0.0
0.4




Luego, el error estndar de estimacin es:

MILLONES $

Este valor se puede interpretar como el error promedio que se comete al utilizar la
ecuacin lineal ajustada para estimar el costo total de produccin de una fbrica
con base en la cantidad de unidades producidas.

OTRA FRMULA.
Otra frmula que puede utilizarse para el clculo del error estndar de estimacin,
se obtiene por manipulacin algebraica, y resulta mucho ms fcil de calcular
manualmente, es:




EJ EMPLO 5.6

Obtener el error estndar de estimacin para el ejemplo 5.3 utilizando la frmula
5.4.

Los clculos se disponen como en la siguiente tabla:

TABLA 5.6
FBRICA CANTIDAD
DE
UNIDADES
PRODUCIDAS
(
COSTOS
TOTALES DE
PRODUCCIN










1
2
3
4
5
30
50
60
20
40
10
14
15
9
12
300
700
900
180
480
100
196
225
81
144
200 60 2560 746

millones $.
Que es igual al obtenido anteriormente.

5.5 COEFICIENTE DE DETERMINACIN.

El coeficiente de determinacin se define como:


Es decir, el coeficiente de determinacin es el cociente entre las variaciones de los
valores estimados por la ecuacin lineal d regresin y las variaciones de la
variable dependiente, ambos con respecto de la media.
El coeficiente de determinacin es una medida que siempre se encuentra
comprendido entre 0 y 1.
El coeficiente de determinacin puede interpretarse de dos formas: Una, como la
proporcin de las variaciones de la variable dependiente que son explicadas por
las variaciones de la variable independiente; la otra como una medida de la
bondad del ajuste de la ecuacin lineal a los datos muestrales.
Cuando el coeficiente de determinacin tienda a 0 es porque la ecuacin lineal no
se ajusta a los datos muestrales, por el contrario, si el coeficiente de
determinacin tiende a 1 es porque la ecuacin lineal explica bien la relacin entre
las dos variables.

EJ EMPLO 5.7

Obtener el coeficiente de determinacin para el ejemplo 5.3

Los datos se disponen como en la siguiente tabla:

TABLA 5.7

FBRICA CANTIDAD
DE
UNIDADES
PRODUCIDAS
(
COSTOS
TOTALES DE
PRODUCCIN













1
2
3
4
5
30
50
60
20
40
10
14
15
9
12
10.4
13.6
15.2
8.8
12.0
4
4
9
9
0
2.56
2.56
10.24
10.24
0
26 25.6
Entonces, el coeficiente de determinacin ser:





Esto significa que el 0.9846(o el 98.46%) de las variaciones que se producen en el
costo total de produccin son explicadas por las variaciones que se producen en la
cantidad de unidades producidas.
De otra parte, como el coeficiente de determinacin es bastante alto, cercano a 1,
se puede decir que la ecuacin lineal es un buen modelo para representar la
relacin entre las dos variables.


OTRA FRMULA.

Mediante manipulacin algebraica la frmula del coeficiente de determinacin se
puede transformar en otra que es ms sencilla para trabajo manual:



EJ EMPLO 5.8

Para el ejemplo 5.3, obtener el coeficiente de determinacin utilizando la frmula
5.6

Los datos se disponen como en la siguiente tabla:

TABLA 5.8

FBRICA CANTIDAD
DE
UNIDADES
PRODUCIDAS
(
COSTOS
TOTALES DE
PRODUCCIN














1
2
3
4
5
30
50
60
20
40
10
14
15
9
12
900
2500
3600
400
1600
300
700
900
180
480
100
196
225
81
144
200 60 740 2560 746



Que es el mismo resultado obtenido anteriormente.

5.6 COEFICIENTE DE CORRELACIN

El coeficiente de correlacin se define como la raz cuadrada del coeficiente de
determinacin:

El coeficiente de correlacin siempre tiene el mismo signo de en la ecuacin
lineal de regresin. Siempre vara entre -1 y 1.

El coeficiente de correlacin es una medida del la asociacin lineal que existe
entre las dos variables. Un coeficiente de correlacin cercano a 0 indica que no
existe relacin lineal entre las dos variables. Si es cercano a -1 indica que existe
una muy buena relacin lineal inversa entre las dos variables. Si es cercano a 1,
indica que existe una muy buena relacin lineal directa entre las dos variables.

EJ EMPLO 5.9

Para los datos del ejemplo 5.3, el coeficiente de correlacin sera:

Este valor indica que existe una correlacin de 0.992 entre la cantidad de
unidades producidas y los costos totales de produccin. Como este valor es
prximo a 1 se puede decir que existe una buena relacin lineal directa entre las
dos variables.

EJ EMPLO 5.10.

Durante diez meses se observ la tasa de inters efectiva anual ( %) de
colocacin que tena una institucin financiera y el nmero de crditos solicitados
por los clientes. Se obtuvieron los datos que se muestran en la tabla 5.9:
En la tabla tambin se muestran las columnas con los clculos necesarios.

TABLA 5.9

MES TASA DE
INTERS

(
NMERO DE
CRDITOS
SOLICITADOS














1
2
3
4
5
6
7
8
9
10
22.5
30.0
22.0
28.0
26.5
31.0
25.5
28.5
24.5
21.8
4500
2900
4500
3300
3500
2750
3600
3000
3700
5000
506.25
900.0
484.0
784.0
702.25
961.0
650.25
812.25
600.25
475.24
101250
87000
99000
92400
92750
85250
91800
85500
90650
109000
20250000
8410000
20250000
10890000
12250000
7562500
12960000
9000000
13690000
2500000
260.3 36750 6875.49 934600 140262500

a. Cul es la variable dependiente y cul la independiente?
RESPUESTA: La cantidad de crditos solicitados en un mes depende de la
tasa de inters que cobre la institucin financiera. Luego, la variable
independiente es la tasa de inters cobrada por el banco y la variable
dependiente es la cantidad de crditos solicitados por los clientes.
b. Representar los datos en un diagrama de dispersin. Analizar.
RESPUESTA. El diagrama de dispersin se muestra a continuacin. En el
diagrama de dispersin se confirma la existencia de relacin entre las dos
variables. Adems, se observa, como cabra esperarse que las dos variables
muestran una relacin inversa. Entre ms alta sea la tasa de inters menor es
la cantidad de crditos solicitados por los clientes, y al contrario, entre ms
baja sea la tasa de inters cobrada, mayor es la cantidad de crditos
solicitados por los clientes. Tambin se observa que los puntos tienden a
concentrarse alrededor de una recta, por lo cual el modelo lineal sera
apropiado para relacionar las dos variables.





c. Obtener la recta de regresin de mnimos cuadrados que relaciona las dos
variables.
RESPUESTA. Los parmetros de la ecuacin lineal se estiman mediante:



Entonces, la ecuacin lineal de regresin que relaciona las dos variables es:

d. Interpretar los parmetros de la ecuacin lineal estimada.
El valor de , significa que si la entidad financiera cobrara una tasa de
inters efectiva anual del 0% estimara que el nmero de crditos que solicitarn
los clientes seran 9409.07
El valor de , significara que si la entidad aumentara (disminuyera) la
tasa de inters efectiva anual en un 1%, se esperara que el nmero de crditos se
disminuir(aumentar) en 220.287.
e. Obtener e interpretar el error estndar de estimacin.
Crditos.
Este valor significa que si la ecuacin lineal ajustada se utiliza para estimar el
nmero de crditos solicitados en un mes con base en la tasa de inters anual
efectiva cobrada, en promedio se cometer un error de 211.957 crditos.
f. Obtener e interpretar el coeficiente de determinacin.

El 0.931(el 93.1%) de las variaciones que se producen en la cantidad de crditos
solicitados mensualmente se producen por las variaciones producidas en la tasa
de inters efectiva anual cobrada.
Como el valor del coeficiente de determinacin es alto, se aproxima a 1, se puede
decir que la ecuacin lineal explica muy bien el comportamiento de las dos
variables.
g. Obtener e interpretar el coeficiente de correlacin.
=
Significa que existe una correlacin de -0.965 entre el nmero de crditos
solicitados mensualmente y la tasa de inters cobrada. Como este valor se
aproxima a -1 se puede decir que la ecuacin lineal establece una buena relacin
inversa entre las variables.



GLOSARIO

COEFICIENTE DE CORRELACIN: Medida de asociacin lineal entre dos
variables.

COEFICIENTE DE DETERMINACIN: Medida que expresa la proporcin de la
variacin en la variable dependiente que se explica por las variaciones en la
variable independiente..

DIAGRAMA DE DISPERSIN: Grfica en el cual se representan mediante puntos
en el plano, los valores para dos variables en cada elemento de la muestra;
presenta como se relacionan dos variables-

ERROR ESTNDAR DE ESTIMACIN. Mide el error promedio que se comete al
utilizar la ecuacin lineal para predecir el valor de la variable dependiente,
utilizando la ecuacin estimada.

MTODO DE MNIMOS CUADRADOS: Procedimiento estadstica que se utiliza
para ajustar una ecuacin lineal a un conjunto de datos muestrales de tal manera
que minimiza la distancia al cuadrado entre los puntos muestrales y la recta
ajustada.

REGRESIN: Mtodo estadstico que permite predecir el valor de una variable a
partir del conocimiento de otra variable con la cual se encuentra relacionada.

RELACIN LINEAL: Una forma de asociacin entre dos variables que se describe
estadsticamente mediante la ecuacin de la lnea recta.




BIBLIOGRAFA


LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMA. Pearson Educcin,2004.

MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMIA. Editorial alfaomega. 2005.

MARTINEZ BENCARDINO, Ciro. ESTADSTICA. Editorial ECOE. 2006



EJ ERCICIOS

1. Indicar si es FALSO O VERDADERO cada una de las siguientes afirmaciones:

a. El anlisis de regresin se utiliza para establecer relaciones de causa y
efecto.
b. La ecuacin de regresin se ajusta a partir de los datos de una poblacin y
no de una muestra.
c. El coeficiente de correlacin mide el grado de asociacin lineal entre dos
variables.
d.
1. Para un conjunto de mquinas se obtuvo la siguiente informacin
correspondiente a la eficiencia (medida en porcentaje), y al tiempo de uso (en
aos)
EFICIENCIA(%) 62 54 81 94 80 77 58 51 79 60 97
TIEMPO DE USO (AOS) 7 9 3 2 4 3 8 10 5 6 1
a. Determinar la ecuacin de regresin lineal que relaciona la eficiencia de las
mquinas con el tiempo de uso. Interpretar los parmetros.
b. Que eficiencia se esperara que tuviera una mquina con 18 meses de uso?
c. Calcular e interpretar el coeficiente de determinacin.

2. Para una muestra de municipios se tienen los siguientes datos correspondientes
al impuesto predial y al nmero de habitantes.
Poblacin 1 2 3 4 5 6 7 8 9
10
Impuestos ( millones$) 850 1180 1640 2280 7000 1100 1610 2611
2000 4440
Habitantes ( miles) 168 240 350 380 150 200 210 490
420 450
Obtener le interpretar todo lo relacionado con la ecuacin lineal de regresin.

3. Los siguientes datos corresponden a una muestra de autos de entidades
pblicas correspondientes a la edad del auto( aos) y los costos mensuales de
mantenimiento( miles$)
AUTOMVIL 1 2 3 4 5 6 7 8 9 10
EDAD DEL AUTO 1 2 2 2 2 3 4 4 5 5
COSTO ME DE MANT. 350 370 420 440 480 510 550 580 620 700
a. Establecer la ecuacin lineal que relaciona las dos variables. b. Interpretar los
parmetros de la anterior ecuacin. c. Estimar el costo mensual de mantenimiento
de un automvil con 6 aos de uso. d. Interpretar el coeficiente de determinacin.
e. interpretar el coeficiente de correlacin. f. Establecer, a un nivel de significancia
0.05, si realmente existe relacin lineal entre las dos variables.

4. Una empresa productora de alimentos est estudiando el efecto de una
campaa publicitaria emprendida para promover la venta de un tipo de enlatado.
Se seleccionaron al azar a diez personas y se les pregunt el nmero de veces
que haban visto los anuncios puestos en la televisin y el nmero de enlatados
que haban comprado, en el mes anterior. Las respuestas obtenidas se
resumieron as
X
i
=34 X
i
2
=160 Y
i
=88 Xi Y i =368 Y
i
2
=885
a. Obtener la ecuacin lineal de regresin que relaciona las dos variables.
b. Interpretar los parmetros de la anterior ecuacin
c. Si una persona ha visto 4 anuncios en la TV, cuntas cajas del enlatado se
esperara hubiera comprado?










UNIDAD VI
SERIES DE TIEMPO





OBJ ETIVOS:
1. Conocer los componentes de una serie cronolgica.
2. Utilizar las tcnicas de regresin para modelar las series cronolgicas.
3. Modelar el comportamiento pasado de una serie cronolgica.
4. Utilizar un modelo de serie de tiempo para predecir el comportamiento
futuro de una serie de tiempo.









6.1 INTRODUCCIN

Los datos series de tiempo o datos cronolgicos suelen contener informacin
subyacente sobre el comportamiento pasado de una variable.
El anlisis de las series de tiempo se utiliza para conocer los patrones del
comportamiento de una o ms variables.
Casos como el manejo de inventario en una empresa , las predicciones del
tamao de una poblacin en un futuro, el presupuesto anual o mensual de una
empresa, el comportamiento del precio de un producto, etctera, son casos en los
cuales el conocimiento del comportamiento a travs de los registros histricos
pueden servir de base para proyectar el comportamiento futuro de la variable.
Modelando el comportamiento pasado de una serie de tiempo, este modelo se
puede utilizar con el fin de realizar pronsticos o predicciones, que son una
herramienta ampliamente utilizada en la administracin.

6.2 DEFINICIN

Una serie de tiempo una serie cronolgica corresponde al registro de una variable
en un elemento en diferentes tiempos o momentos, usualmente a intervalos
regulares de tiempo.

Los datos de series cronolgicas corresponden a registros histricos de los cuales
disponen las empresas.

EJ EMPLO 6.1

Los registros de una empresa muestran que las unidades vendidas de un producto
han sido como se muestran en la siguiente tabla.

TABLA 6.1: Registros de ventas de una empresa.


AOS
UNIDADES
VENDIDAS
2000
2001
2002
2003
2004
2005
2006
2007
700
770
750
820
900
1020
1100
1250

Cuando se desea abordar en conocimiento de una serie de tiempo es necesario
definir la unidad de tiempo que se utilizar en el anlisis, tal como aos, meses,
trimestres etc.
El anlisis de una serie cronolgica consistir en establecer un modelo que trate
de reproducir el comportamiento pasado de la variable. Un grfico de los datos es
de gran ayuda:

GRFICO 6.1: UNIDADES VENDIDAS POR UNA EMPRESA

6.3 COMPONENTES DE UNA SERIE DE TIEMPO.
Toda serie de tiempo se considera que la variable es afectada por cuatro factores
o componente que la afectan en cada periodo. Estas componentes son:
Tendencia, variaciones estacionales, variaciones cclicas y variaciones aleatorias.
TENDENCIA.
La tendencia o tendencia secular se concibe como el movimiento a largo plazo de
la variable., es decir, la forma en que vara a travs del tiempo la variable. La
tendencia generalmente se origina en los aumentos de poblacin, a los cambios
tecnolgicos, etc


GRFICO 6.2: TENDENCIA
El grfico 6.2 muestra que la variable a travs del tiempo, a pesar de haber
periodos en los cuales disminuye, tiende sistemticamente a aumentar.
El presupuesto del pas, la poblacin del pas, las ventas de automviles son
algunos ejemplos de variables que muestran una tendencia a travs del tiempo.
VARIACIONES ESTACIONALES.
Son variaciones que presenta una variable dentro de un ao calendario tendiendo
a presentar el mismo comportamiento ao tras ao. Las variaciones estacionales
generalmente se presentan debido a las temporadas del ao, cambios climticos
(estaciones) que hacen que el comportamiento de algunas variables tengan un
comportamiento particular en determinadas pocas del ao. Las ventas de
juguetes en navidad, las ventas de pasajes areos en pocas de vacaciones, los
precios de algunos productos agrcolas en pocas de cosecha, son algunos
ejemplos de las variaciones estacionales.


GRFICO 6.3: VARIACIONES ESTACIONALES
Observar el grfico 6.3. Los datos representan los registros de ventas de una
empresa trimestralmente. Se muestra una tendencia a aumentar a travs de los
trimestres. Tambin se observa que las ventas son consistentemente ms alta en
el cuarto trimestre y ms baja en el segundo trimestre. Estos son ejemplos de
variaciones estacionales.
VARIACIN CICLICA.
Son variaciones alrededor de la tendencia que ocurren en periodos de al menos
cinco aos y hasta veinte aos, generalmente son asociados con los ciclos
econmicos donde suelen presentarse pocas de gran crecimiento o de
depresiones. Estas fluctuaciones afectan el comportamiento de algunas variables
en algunos aos.



GRFICO 6.4: VARIACIONES CICLICAS.

El grfico 6.4 muestra una variacin cclica tpica en donde se muestran
fluctuaciones hacia arriba y hacia abajo, alrededor de una tendencia creciente.

VARIACIONES ALEATORIAS.

Son variaciones irregulares completamente impredecibles. Las variaciones
aleatorias pueden deberse a fenmenos tales como paros, huelgas, inviernos o
veranos prolongados, que hacen que se tenga en un periodo dado una variacin
completamente aleatoria.


GRFICO 6.5: VARIACIONES ALEATORIAS.

En el grfico 6.5 se observa el caso de una variacin aleatoria en el periodo
nmero siete, donde la variable despus de tener un comportamiento regular,
presenta una baja considerable.

El anlisis de una serie de tiempo consiste en estudiar cada uno de estos
componentes, medir la magnitud de su influencia sobre el comportamiento de la
variable y utilizarlos para predecir su comportamiento futuro.
Solamente consideraremos el componente de tendencia, que se presenta a
continuacin.

6.4 ANLISIS DE TENDENCIA.
El comportamiento de tendencia de una serie de tiempo se estudia mediante el
ajuste de una funcin que pueda describir el comportamiento de la variable a
travs del tiempo. El mtodo usual es realizar el ajuste mediante el mtodo de
mnimos cuadrados.

El estudio de la tendencia permite describir el comportamiento histrico de la
serie. Muchas decisiones empresariales se toman a partir del conocimiento que
se tenga del comportamiento de la variable. Pero adems este conocimiento
permite tomar decisiones haca el futuro. Por ejemplo, tener una estimacin del
nmero de habitantes de un pas a 10 o 20 aos permite tomar decisiones
sobre planeacin. Si se puede estimar hacia el futuro del nmero de vehculos
que habr en una ciudad se podrn tomar decisiones sobre la construccin de
vas. Son muchos los ejemplos que se pueden tener sobre el uso de los
pronsticos en la toma de decisiones.

AJ USTE DE LA TENDENCIA MEDIANTE EL MTODO DE MNIMOS
CUADRADOS.

El modelo correspondiente a una ecuacin lineal estimada a partir de datos
muestrales tiene la forma:

Donde
, representa a la variable que se estudia y que se supone vara a travs del
tiempo.
, representa el valor estimado para la variable en algn periodo.
, representa la variable independiente, que en este caso es el tiempo.
, representan los estimadores de los parmetros de la ecuacin lineal.

Igualmente como en el anlisis de regresin, la estimacin de los parmetros por
el mtodo de mnimos cuadrados conduce a resolver las siguientes ecuaciones:





CODIFICIN DEL TIEMPO.

La variable independiente tiempo se mide en meses, trimestres, aos, etc., que no
son de por s magnitudes numricas, pero estas medidas de tiempo se pueden
transformar en medidas numricas mediante una codificacin. Para la codificacin
de los periodos de tiempo se selecciona arbitrariamente un periodo (llamado
periodo origen de la serie. Al periodo origen se le asigna el valor de cero. Los
dems valores de la variable codificada se obtienen contando el nmero de
periodos transcurridos desde el origen (hacia atrs se asignan valores negativos y
hacia adelante valores negativos).


EJ EMPLO 6.2

Considerar los datos que se presentan en la tabla 6.2 que muestra el nmero de
quejas que se han presentado trimestralmente en una entidad prestadora de
servicios.

TABLA 6.2: NMERO DE QUEJ AS TRIMESTRALES

TRIMESTRE NMERO
DE
QUEJ AS

(CODIFICADA)

(CODIFICADA)

(CODIFICADA)
I-2005
II-2005
III-2005
IV-2005
I-2006
II-2006
III-2006
IV-2006
I-2007
II-2007
III-2007
IV-2007
550
650
400
350
580
600
420
380
690
750
580
450
0
1
2
3
4
5
6
7
8
9
10
11
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
1
2
3
4
5
6
7
8
9
10
11
12

En la tabla 6.2 se presentan tres formas diferentes de codificacin. En la tercera
columna se presenta una forma de codificacin, tal vez la ms utilizada, en la cual
se ha tomado como periodo origen el primer trimestre de 2005. En la cuarta
columna se presenta otra codificacin en la cual se ha tomado como origen
segundo trimestre de 2006 y en la quinta columna se presenta otra codificacin en
la cual el origen se ha tomado como el cuarto trimestre de 2004(a pesar de no
contarse con registro de este periodo).

Con los valores asignados a la variable independiente por codificacin se puede
realizar la estimacin de la ecuacin lineal de tendencia.

Las dems medidas utilizadas en el anlisis de regresin tambin pueden ser
utilizadas de la misma forma ( error estndar de estimacin, coeficiente de
determinacin, coeficiente de correlacin).

EJ EMPLO 6.3

En la tabla siguiente se muestra el nmero de pasajeros que ha transportado una
aerolnea en el periodo 1999-2007.




TABLA 6.4: PASAJ EROS TRANSPORTADOS POR UNA AEROLINEA.

AOS NMERO DE
PASAJ EROS
1999
2000
2001
2002
2003
2004
2005
2006
2007
12500
13200
14100
15800
15600
16200
18100
19000
21300

En la siguiente tabla se muestra la codificacin realizada para la variable
independiente tomando arbitrariamente como periodo origen el ao 1999. Los
datos se disponen de la misma forma que para el anlisis de regresin.

TABLA 6.5: PASAJ EROS TRANSPORTADOS POR UNA AEROLINEA.

AOS NMERO DE
PASAJ EROS
(








1999
2000
2001
2002
2003
2004
2005
2006
2007
12500
13200
14100
15800
15600
16200
18100
19000
21300
0
1
2
3
4
5
6
7
8
0
1
4
9
16
25
36
49
64
0
13200
28200
47400
62400
81000
108600
133000
170400
156250000
174240000
198810000
249640000
243360000
262440000
327610000
361000000
453690000
145800 36 204 644200 2427040000

La ecuacin lineal de regresin que expresa la tendencia del nmero de pasajeros
transportados por la aerolnea se obtiene:




Entonces la ecuacin que expresa la tendencia anual del nmero de pasajeros
transportados por la aerolnea es:

En esta ecuacin el valor de no tiene sentido, pero el valor de ,
significa que el nmero de pasajeros transportados por la aerolnea, en promedio,
se aumenta anualmente en 1016.67.
El error estndar de estimacin:
=

Que significa que si la ecuacin lineal de regresin se utiliza para estimar el
nmero de pasajeros que transportar la empresa en un ao, en promedio se
cometer un error de 661.3 pasajeros.
El coeficiente de determinacin:

El 95.29% de las variaciones que se producen en la cantidad de pasajeros
transportados por la aerolnea son explicados por la tendencia.

PREDICCIN.

La ecuacin lineal ajustada se puede utilizar para predecir el comportamiento
futuro de la variable, as si deseamos predecir el nmero de pasajeros que
transportara la aerolnea en 2008 y 2009, solo se requiere reemplazar en la
ecuacin el valor de X por nueve y diez respectivamente.
Pronstico para el ao 2008:


Pronstico para el 2009:




GLOSARIO


SERIE DE TIEMPO: Conjunto de datos registrados a intervalos de tiempo
regulares para una variable.

TENDENCIA: variacin a largo plazo de una serie cronolgica.

VARIACIN ESTACIONAL: Variaciones que tiene una serie de tiempo dentro de
un ao repitindose todos los aos en la misma poca.

VARIACIN CICLICA: Variacin de una serie de tiempo alrededor de la ecuacin
de tendencia.

VARIACIN ALEATORIA: Variacin no predecible que se produce en una serie de
tiempo.


BIBLIOGRAFA


LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMA. Pearson Educcin,2004.

MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMIA. Editorial alfaomega. 2005.

MARTINEZ BENCARDINO, Ciro. ESTADSTICA. Editorial ECOE. 2006




EJ ERCICIOS


1. Indicar si cada una de las siguientes afirmaciones es VERDADERA o
FALSA
a. Las variaciones estacionales solo pueden ocurrir en periodos
mensuales.
b. El conocimiento del comportamiento histrico de una variable permite
predecir su comportamiento futuro.
c. Puede haber variables que no presentan variaciones estacionales.
d. La ecuacin para modelar la tendencia de una serie cronolgica debe se
siempre la ecuacin lineal.
e. Las variaciones irregulares siempre se pueden predecir.
f. Una serie de tiempo se puede obtener por muestreo.

2.
1. Las captaciones (millones$) que ha tenido una entidad financiera en los ltimos
diez aos han sido:
AOS 1998 1999 2000 2001 2002 2003 2004 2005
2006 2007
CAPTACIONES 800 850 900 1200 1800 2000 2400 2780
3600 3800
Ajustar la ecuacin lineal a la tendencia de las captaciones y utilizarla para estimar
las captaciones que realizara la empresa en 2008 y 2009

2. Los ingresos no operacionales (en millones de $) que ha tenido una empresa
presentan el siguiente registro para el periodo para el periodo 2000-2007

AOS 2000 2001 2002 2003 2004 2005
2006 2007
INGRESOS NO OPERACIN. 45 60 58 74 95 80
120 135
Obtener la ecuacin lineal que expresa la tendencia de los ingresos no
operacionales de la empresa y utilizarla para estimar los ingresos no
operacionales que tendra la empresa en 2009, 2010 y 2011.

3. El nmero de unidades vendidas, por una compaa en el periodo 2001-2007 ha
sido:

AOS 2001 2002 2003 2004 2005 2006
2007
#DE UNIDADES VEND. 2200 2500 2400 3000 3100 3500
4200
Establecer la ecuacin lineal que expresa la tendencia de las ventas y utilizarla
para estimar el nmero de unidades que esperara vender la compaa en 2008 y
2009

4. El presupuesto que ha tenido un municipio presenta el siguiente registro
histrico:
AO 2002 2003 2004 2005 2006 2007
PRESUP ( MILES MILLONES $) 340 400 440 680 710 900
a. Ajustar la ecuacin lineal que exprese la tendencia anual del presupuesto.
b. Interpretar de la anterior ecuacin.
c. Utilizar la anterior ecuacin para estimar el presupuesto que tendra el municipio
en 2008, 2009 y 2010.

5. Las captaciones en CDT que ha tenido una entidad financiera tiene el siguiente
registro:


TRIMESTRE
CAPTACIONES
(milesde
millones$)


I-2003 2800
II-2003 4300
III-2003 4400
IV-2003 5200
I-2004 2900
II-2004 4900
III-2004 4600
IV-2004 6800
I-2005 2700
II-2005 4800
III-2005 4500
IV-2005 7500
I-2006 3150
II-2006 5100
III-2006 4100
IV-2006 9000
I-2007 3200
II-2007 5800
III-2007 4200
IV-2007 9200

Suponer que las captaciones en CDT siguen una tendencia lineal. Ajustar esta
ecuacin e interpretar . Obtener e interpretar el coeficiente de determinacin.
Comentar Utilizar la ecuacin lineal de tendencia para estimar las captaciones en
cada uno de los trimestres de 2008 y2009.
































UNIDAD VII
NMEROS NDICES







OBJ ETIVOS:
1. Comprender el sentido de los nmeros ndices como medida de la variacin
experimentada por una variable entre dos periodos.
2. Conocer los principales tipos de nmeros ndice.
3. Poder calcular diferentes ndices.
4. Utilizar los nmeros ndices.









7.1 INTRODUCCIN.

Los nmeros ndices forman parte de un conjunto de indicadores referidos a
variaciones que experimenta una variable a travs del tiempo. Los ndices
son ampliamente utilizados en Economa y Finanzas. Tal vez los ndices
ms utilizados son los que se utilizan para calcular el ndice de Precios al
Consumidor, que es un indicador de cmo varan los precios de una
canasta de bienes y servicios. Otro ndice muy conocido es el ndice que
diariamente publican las Bolsas de Valores referidos a la variacin de los
precios de las acciones que se negocian en ellas.

Vamos a tratar de en este captulo sobre los principales tipo de ndices y
sus aplicaciones.


7.2 DEFINICIN DE UN NMERO NDICE.

Los nmeros ndices son cantidades relativas, generalmente expresadas en
porcentaje, que miden la variacin en los precios, cantidades o valores de
uno o ms bienes en un periodo llamado de estudio o de inters con
respecto a otro periodo llamado base.
Segn lo anterior, los ndices pueden ser de precios, de cantidades o
valores.
Los nmeros ndices se pueden referir a un solo bien (ndices simples) o
referirse a ms de un bien (una canasta de bienes).
Con respecto a los periodos involucrados en el ndice, se tienen dos
periodos: el periodo en el cual interesa establecer la variacin (periodo de
inters) con respecto a otro periodo (periodo base o de referencia).
El periodo base se establece arbitrariamente pero se prefiere que sea muy
estable en cuanto a los precios o cantidades (consumidas, vendidas,
exportadas, etc.).
Con respecto de la base, los ndices pueden ser de base fija o de base
variable.

7.3 NDICES PARA UN SOLO BIEN. (NDICES SIMPLE)

Expresan la variacin en el precio, cantidad o valor de un nico bien en un
periodo con respecto a un periodo base.
Estos ndices pueden ser de base fija o de base variable.

7.3.1 NDICE SIMPLE DE BASE FIJ A

Un ndice se dice que es de base fija si dados diferentes periodos, el
periodo de comparacin es el mismo para toda la serie.
Los ndices de base fija se definen como:

NDICE DE PRECIOS.
Indica la variacin en el precio de un bien en uno o ms periodos con
respecto a un mismo periodo.

Donde:
: Indica el ndice de precios en el periodo con respecto al
periodo base ( .

: Precio del bien en el periodo de estudio .
: Precio del bien en el periodo base,

NDICE DE CANTIDAD.
Expresa la variacin en la cantidad de un bien en uno o ms periodos con
respecto a otro periodo fijo de referencia.


Donde:
: Cantidad utilizada (vendida, comprada, exportada, etc. ) en el periodo
de inters .
: Cantidad utilizada (vendida, comprada, exportada, etc. ) en el periodo
base
: ndice de cantidad en el periodo de inters con respecto al periodo
base

NDICE DE VALOR.
Expresa la variacin en el valor de un bien en uno o ms periodos con
respecto a un mismo periodo base.


Donde:
: Es el ndice de valor de un bien en el periodo de inters con
respecto al periodo base
Valor del bien en el periodo de inters
Valor del bien en el periodo base

Observar que los ndices se expresan en porcentaje pero no se les suele
agregar el smbolo %.

EJ EMPLO 7.1
El registro histrico del precio que ha tenido un bien se muestra en la
siguiente tabla:

TABLA 7.1 : Precio de un producto

AO PRECIO(
$)
2000
2001
2002
2003
2004
2005
2006
2007
4400
5000
5400
6000
6800
7500
8300
10000

Generalmente no interesa cul ha sido el precio del bien sino la evolucin
en la variacin porcentual que ha tenido a travs del tiempo. Para el caso
de ndices con base fija se selecciona un periodo base que sirve de
comparacin para todos los dems periodos. Para el ejemplo
seleccionamos como periodo base el ao 2001. Los ndices de precios para
el producto se obtienen de la siguiente forma:














Los ndices de precios para el producto quedarn de la siguiente forma:

TABLA 7.2: ndice de precio de un producto.

AOS NDICE
2001=100
2000
2001
2002
2003
2004
2005
2006
2007
88.0
100.0
108.0
120.0
136.0
150.0
166.0
200.0


Cuando se disponen de ndices con base fija de especificarse cul es el
periodo
2. representa el precio del producto en un
3. do (aumentado o disminuido) el
Tomemos como ejemplo el prim
cio que tuvo
2. l precio del producto fue 0.88 veces el precio que tuvo
3. l precio del producto fue un 12% menor que en el ao

.3 NDICES CON BASE VARIABLE.
do de comparacin es
periodo que se est utilizando como periodo base, como aparece en la
tabla 7.2: 2001=100, pues siempre en la base el ndice valdr cien.
Un ndice se puede interpretar de alguna de las siguientes formas:
1. Como el porcentaje que representa el precio del producto en un
con respecto al periodo base.
Como el nmero de veces que
periodo con respecto al periodo base.
Como el porcentaje en que ha varia
precio del producto en un periodo con respecto al periodo base.
er ndice (88.0) de la tabla 7.2:
1. En el ao 2000 el precio del producto fue el 88.0% del pre
en el ao 2001.
En el ao 2000 e
en el ao 2001.
En el ao 2000 e
2001.
7

Un ndice se dice que es de base variable si el perio
el periodo inmediatamente anterior. Los ndices de base variable se
expresan de la siguiente forma:
NDICE DE PRECIOS.

Donde:
Es ndice de precio de un bien en el periodo de inters con respecto
al periodo inmediatamente anterior .
: Precio del bien en el periodo de r inte s
Precio del bien en el periodo inmediatamente anterior

DICE DE CANTIDAD: N

Donde:
: ndice de cantidad en el periodo de inters con respecto al periodo
inmediatamente anterior .
Cantidad utilizada del n e bie n el periodo de inters
Cantidad utilizada del bien en el periodo inmediatamente anterior

DICE DE VALOR. N


onde: D
ndice de valor en el periodo de inters con respecto al periodo
inmediatamente anterior
Valor del bien en el pe o riod de inters
Valor del bien en el periodo inmediatamente anterior .

J EMPLO 7.2
n la tabla siguiente se muestra el nmero de unidades vendidas de un
ABLA 7.3: Unidades vendidas.
ES UNIDADES
E

E
artculo en los meses del primer semestre del ao 2007:

T

M
VENDIDAS
ENERO
O FEBRER
MARZO
ABRIL
MAYO
J UNIO
400
450
420
460
500
600

Nos interesa conocer como ha sido la variacin en el nmero de unidades
vendidas, utilizando ndices de base fija, con lo cual obtendremos la
variacin porcentual en la cantidad de unidades vendidas en cada mes con
respecto al mes inmediatamente anterior:

Observar que el ndice para el mes de Enero no se puede calcular puesto que se
requiere de la cantidad de unidades vendidas en Diciembre de 2006, que no est
disponible en la tabla 7.3.





Los anteriores ndices se resumen en la siguiente tabla:

TABLA 7.4

MESES NDICE
ENERO
FEBRERO
MARZO
ABRIL
MAYO
J UNIO

1112.5
93.3
109.5
108.7
120.0

7.4 INDICES COMPUESTOS.

En los ndices compuestos se dispone de una canasta de bienes de los cuales
interesa establecer la variacin promedio que ha habido en los precios,
cantidades o valores de los bienes que posee la canasta, en un periodo de inters
o de estudio con respecto a un periodo base.
En los ndices compuestos bsicamente se tienen dos situaciones: ndices no
ponderados e ndices ponderados.

7.4.1 NDICE AGREGATIVO SIMPLE.

En este ndice se considera que la importancia que tienen todos los bienes
incluidos en la canasta es la misma. Para el caso del ndice de precios, se definen
como la suma de todos los precios de todos los bienes de la canasta en el periodo
de inters dividido por la suma de todos los precios de todos los bienes de la
canasta en el periodo base, multiplicado por cien.



EJ EMPLO 7.3

Para la produccin de un bien se utilizan cuatro insumos. La cantidad consumida
de cada uno de los insumos y los precios ($) a los cuales se han comprado en los
aos 2006 y 2007 se muestran en la siguiente tabla:

TABLA 7.5: Precios y cantidades consumidas.

2006 2007
INSUMOS CANTIDAD PRECIO($) CANTIDAD PRECIO($)
A(Kilos) 700 12000 750 12500
B((Litros) 5200 30000 500 40000
C(Unidades) 2500 2000 2100 2500
D(Kilos) 800 15000 900 16000

Para obtener el ndice de precios para el ao 2007 con respecto al 2006, para los
cuatro insumos, se requiere solamente sumar los precios en cada uno de los aos,
como se muestra en la siguiente tabla:

TABLA 7.6: Precios y cantidades consumidas.

2006 2007
INSUMOS CANTIDAD PRECIO($) CANTIDAD PRECIO($)
A(Kilos) 700 12000 750 12500
B((Litros) 5200 30000 500 40000
C(Unidades) 2500 2000 2100 2500
D(Kilos) 800 15000 900 16000
59000 71000


Segn esto, los precios de los insumos, en el ao 2007 tuvieron un aumento del
20.3%.
Observar que en este ndice no se han tenido en cuenta la cantidad consumida de
cada una.

7.4.2 NDICE DE PROMEDIO DE RELATIVOS.

Para este ndice, se promedian, bien con la media aritmtica, o preferiblemente
con la media geomtrica, los ndices individuales de cada uno de los bienes.
Si se utiliza la media aritmtica, el ndice se definira:

Donde m representa el nmero de bienes que tiene la canasta.
Si se utiliza la media geomtrica, se tendra:


EJ EMPLO 7.4

Considerando los datos del ejemplo 7.3, se muestran en la sexta columna los
ndices de cada uno de los insumos:

TABLA 7.6: Precios y cantidades consumidas.

2006 2007
INSUMOS CANTIDAD PRECIO($) CANTIDAD PRECIO($)

A(Kilos) 700 12000 750 12500 104.2
B((Litros) 5200 30000 500 40000 133.3
C(Unidades) 2500 2000 2100 2500 125.0
D(Kilos) 800 15000 900 16000 106.7

Si se utiliza la media aritmtica, tenemos:


Si se utiliza la media geomtrica, tenemos:

Como en el anterior ndice en estos tampoco se tienen en cuenta las cantidades
consumidas de cada insumo. Tambin se observa que los dos ndices anteriores
dan resultados diferentes. En general con los nmeros ndices es preferible utilizar
la media geomtrica, pues suelen aparecer variaciones atpicas.


7.5 NDICES PONDERADOS.

Es usual que no todos los bienes que se incluyen en la canasta tengan
la misma importancia. Los ndices ponderados requieren que se asigne
un peso o ponderacin que exprese la importancia de cada uno de los
bienes.
Un ndice ponderado se define como:

Donde es ponderacin que se asigna a cada uno de los bienes
(i=1,2,3,,m; donde m es el nmero de bienes que se incluyen en la
canasta)
De acuerdo con la forma en que se asignen las ponderaciones a los
bienes se tienen diferentes tipos de ndices. Los ndices ponderados
ms usuales son los de Laspeyres, Paasche y Fisher. Los tres llevan el
apellido de quienes lo propusieron.

7.5.1 NDICE DE LASPEYRES.
Laspeyres, para el ndice de precios, asigna como ponderacin las
cantidades que de cada bien se hayan utilizado en el periodo base,
es decir, .
Entonces, el ndice de Laspeyres se puede expresar como:

Laspeyres parte del supuesto de que las cantidades utilizadas en el periodo base
permanecen constantes a travs del tiempo; la critica que se le hace al supuesto
de Laspeyres es que las cantidades no deben permanecer constantes, sino que
deben ser menores, pues los precios tienden a ser mayores. Si lo anterior fuera
cierto, entonces, el ndice de Laspeyres tendera sistemticamente a sobrestimar
el verdadero valor del ndice de precios.

EJ EMPLO 7.5
Consideremos los datos del ejemplo 7.3
TABLA 7.7 Precios y cantidades consumidas.

2006 2007
INSUMOS CANTIDAD PRECIO($) CANTIDAD PRECIO($)

A(Kilos) 700 12000 750 12500 8750000 8400000
B((Litros) 5200 30000 500 40000 208000000 156000000
C(Unidades) 2500 2000 2100 2500 6250000 5000000
D(Kilos) 800 15000 900 16000 12800000 12000000
235800000 181400000
El ndice de precios de Laspeyres para el ao 2007 con respecto al 2006 sera:


7.5.2 NDICE DE PAASCHE.
Paasche, para el ndice de precios, propone como ponderacin las cantidades que
de cada uno de los bienes de la canasta se hayan utilizado en el periodo de
inters , es decir,
Entonces, el ndice de Paasche se expresa como:

Paasche parte del supuesto de que las cantidades que se utilizan actualmente
seran las mismas que se han estado utilizando desde el periodo base. La crtica
que se hace al supuesto de Paasche es que las cantidades que se utilizan en los
periodos anteriores al actual deberan ser mayores puesto que los precios deban
ser menores. Si esto fuera as, el ndice de Paasche subestimara el verdadero
valor del ndice.

EJ EMPLO 7.6.

Consideremos los datos del ejemplo 7.3, Los clculos necesarios se muestran en
la tabla 7.8

TABLA 7.8 Precios y cantidades consumidas.
2006 2007
INSUMOS CANTIDAD PRECIO($) CANTIDAD PRECIO($)

A(Kilos) 700 12000 750 12500 9375000 9000000
B((Litros) 5200 30000 500 40000 20000000 15000000
C(Unidades) 2500 2000 2100 2500 5250000 4200000
D(Kilos) 800 15000 900 16000 14400000 13500000
49025000 41700000

El ndice de precios de Paasche para el ao 2007 con respecto al ao 2006 sera:


7.5.3 NDICE DE FISCHER

Ante la situacin de los dos ndices anteriores, Laspeyres sobreestima y Paasche
subestima, surgieron diferentes propuestas para construir ndices ponderados. El
ndice de Fisher, llamado tambin ndice ideal es simplemente la media
geomtrica entre los ndices de Laspeyres y Paasche:

EJ EMPLO 7.8
Para el ejemplo que hemos venido trabajando,
=123.6

Como se observa todos los ndices compuestos dan resultados diferentes, por lo
cual debe utilizarse aquel ndice que se crea cumple ms apropiadamente con los
respectivos supuestos.


7.6 CAMBIO DE BASE EN LOS NMEROS NDICES.
Es frecuente que los usuarios de ndices encuentren que los ndices no estn
expresados en la forma en que se requieren. Por ejemplo, los ndices pueden
estar expresados con base variable y se requieren con base fija o a la inversa. A
continuacin se trata de efectuar estos cambios.

7.6.1 CAMBIO DE UNA BASE FIJ A A OTRA BASE FIJ A.
Se dispone de una serie de ndices expresados con base fija, pero por razones
prcticas se desea expresarlos con base en otro periodo.
Para pasar una serie de ndices que estn expresados en una base fija a otra
base fija solo se requiere dividir cada uno de los ndices de la serie por el ndice
que tiene el periodo que se desea tener como nueva base, multiplicado por cien.

EJ EMPLO 7.9.

Se dispone de una serie de ndices de precios, como se muestra en la siguiente
tabla:

TABLA 7.9. NDICES CON BASE FIJ A EN 1997.

AOS NDICES
1997=100
2002
2003
2004
2005
2006
2007
188.0
200.0
215.0
228.0
240.0
260.0

Deseamos expresar estos mismos ndices con otra base, por ejemplo en el ao
2003. Entonces todos los ndices de la serie se dividen por el ndice que tiene el
periodo que se va a utilizar como nueva base (200), quedando la serie de ndices
de la siguiente forma.

TABLA 7.10. NDICES CON BASE EN 2003

AOS NDICES
2003=100
2002
2003
2004
2005
2006
2007
94.0
100.0
107.5
114.0
120.0
130.0



7.6.2 CAMBIO DE UNA BASE FIJ A A UNA BASE VARIABLE Y A
LA INVERSA.
7.6.3
Cuando se dispone de una serie de ndices expresados con base fija y se desea
expresarlos con base variable, se utiliza la siguiente relacin:

Si los ndices estn expresados con base variable y se desean expresar con base
fija en cualquier periodo, de la expresin anterior se obtienen

Para los periodos posteriores a aquel que se ha seleccionado como periodo base,
o


EJ EMPLO 7.10

Sea la serie de ndices expresados con base fija dados en la tabla siguiente.

TABLA 7.11: NDICES CON BASE EN2000
AOS NDICES
2000=100
2001
2002
2003
2004
2005
2006
2007
112.0
124.0
138.0
145.0
160.0
170.0
185.0

Si deseamos expresar los ndices con base variable, utilizamos la ecuacin 7.14, y
se obtiene:

TABLA 7.12: NDICES CON BASE VARIABLE.
AOS NDICES
2000=100
2001
2002
2003
2004
2005
2006
2007
112.0
110.7
111.3
105.1
110.3
106.3
108.8


EJ EMPLO 7.11.

Dada una serie de ndices con base variable,

TABLA 7.13: NDICES CON BASE VARIABLE.
AOS NDICES
2000
2001
2002
2003
2004
2005
2006
2007
108.0
111.0
113.0
107.0
112.0
109.5
108.5
106.8

Queremos expresar los anteriores ndices con base fija, por ejemplo en el ao
2002, entonces, este ao tendr como ndice 100.0, y utilizando las ecuaciones
7.15 y 7.16, obtenemos:

TABLA 7.14: NDICES CON BASE FIJ A EN 2002
AOS NDICES
2000
2001
2002
2003
2004
2005
2006
2007
79.7
88.5
100.0
107.0
119.8
131.2
142.4
152.1


7.7 USO DE LOS NDICES.

De los ndices que ms se utilizan en las aplicaciones generales es el ndice de
Precios al Consumidor (IPC), sin embargo en aplicaciones particulares se deben
utilizar los ndices correspondientes a los fenmenos que se estudian.

Las aplicaciones ms usuales de los ndices son:
1. Para obtener el porcentaje de inflacin que ha ocurrido en un periodo
cualquiera:

EJ EMPLO 7.12

Suponer que el IPC para el ao 2000 era de 180 y para el ao 2005 era de 250, el
porcentaje de inflacin que ha ocurrido entre el ao 2000 y 2005 ser:

2. Para deflactar. Deflactar es expresar valores nominales o corrientes como
valores reales o a precios constantes de un determinado periodo.

EJ EMPLO 7.13

En el ao 2000 el IPC era de 100 y en el ao 2005 era de 140, Si una persona en
2000 tena ingreso mensual de $500000 y en 2005 era de $1800000, Cul es el
ingreso real de la persona en 2005 a precios constantes de 2000?



3. Para actualizar el precio de activos.


EJ EMPLO 7.14
Se compr en el ao 2001 una maquinaria por un precio de $4000000,
cuando el IPC tena un valor de 120. Cul ser el precio de la mquina en
el ao 2007 en el cual el IPC tiene un valor de 174?


GLOSARIO

NDICE DE CANTIDAD: Medida que indica la variacin en la cantidad de uno o
ms bienes en un periodo con respecto a otro.

NDICE DE PRECIO: Medida que indica la variacin sufrida en el precio de uno o
ms bienes en un periodo con respecto a otro.

NDICE DE VALOR: Medida de la variacin del valor de uno o ms bienes en un
periodo con respecto a otro.

NDICE DE LASPEYRES. ndice ponderado en el cual para el ndice de precios se
utiliza como ponderacin las cantidades utilizadas en el periodo base y para el
ndice de cantidad se utiliza como ponderacin los precios del ao base.

NDICE DE PAASCHE: ndice ponderado en el cual se utiliza como ponderacin
para el ndice de precios las cantidades utilizadas en el actual o de inters y para
el ndice de cantidades los precios de los bienes en el periodo de inters.

NDICE DE PROMEDIO DE RELATIVOS: es un ndice promedio de los ndices
individuales de cada uno de los bienes.



BIBLIOGRAFA

LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMA. Pearson Educcin,2004.

MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y
ECONOMIA. Editorial alfaomega. 2005.

MARTINEZ BENCARDINO, Ciro. ESTADSTICA. Editorial ECOE. 2006





EJ ERCICIOS

1. Indicar si cada una de las siguientes AFIRMACIONES ES verdadera o falsa
a. El ndice de precios para el periodo base siempre es cero.
b. El ndice de precios al consumidor ( IPC) que lleva el DANE utiliza el
ndice de Fisher.
c. El ndice de promedio de relativos utiliza el promedio de los ndices de
cada bien incluido en el ndice.
d. El ndice de Paasche solo se utiliza para establecer el ndice de precios.
e. Un ndice de valor mide la variacin combinada en precios y cantidades.
f. El ndice de Laspeyres no se puede utilizar para medir la inflacin.
g. Un ndice de precios de 100 indica que el o los bienes aumentaron su
precio en un 100%.
h. El ndice de agregativos simples no tiene en cuenta la importancia de
cada bien.
i. El ndice de Laspeyres tiende siempre a sobreestimar el verdadero valor
del ndice.

2. Una fbrica elabora un producto para el cual utiliza cuatro materias primas.
La cantidad de materia prima utilizada y los precios de compra de ellas tienen
el siguiente registro para los aos 2007 y 2008
2007 2008
MATERIA PRIMA CANTIDAD PRECIO ($) CANTIDAD PRECIO($)
----------------------------------------------------------------------------------------------------------
A (KG) 800 200 850 300
B (KG) 1500 700 900 1100
C (UNIDAD) 2000 800 2500 1000
D (UNIDAD) 1000 1500 1500 1800
Obtener e interpretar el ndice de precios de para el ao 2008 con base en el
ao 2007
a. Agregativos simples.
b. Promedio de relativos.
c. Laspeyres.
d. Paasche.
e. Fisher.
f. Obtener el ndice de valor.

3. En la produccin de un tipo de ponqu se utilizan como insumos harina,
huevos, crema de leche, azcar y uvas. La cantidad utilizada de estos insumos y
el precio al cual se compran es:
CANTIDAD PRECIO DE COMPRA ($)
INSUMOS POR KILO 2005 2006 2007 2008
Harina (kg) 0.7 700 850 950 1000
Huevos (unidad) 4 60 70 90 100
Crema (kg) 0.3 2000 2400 2500 2800
Azcar 0.2 450 500 540 620
Uvas 0.1 2800 2950 3000 3200
a. Obtener un ndice ponderado para obtener el ndice de precio de los insumos
en cada uno de los aos con base en 2005
b. Si en el ao 2005 el Kilo de ponqu se venda en $4500, cul deba ser el
precio de venta en cada uno de los dems aos ?

4. La siguiente tabla presenta los ingresos anuales ( en millones $ ) de una
persona durante el perodo 1999-2006, lo mismo que la variacin porcentual en
el ndice de precios al consumidor durante el mismo perodo.
AOS 1999 2000 2001 2002 2003 2004 2005 2006
INGRESOS 6.7 7.5 9.6 11.5 13.9 16.3 19.1 20.5
I.P.C. 9.23 8.75 7.65 6.99 6.49 5.5 4.85 4.48
(variacin porcentual
a. Expresar los ndices con base fija en 2001
b. Establecer cul es el ingreso real de la persona en cada uno de los aos 1999
-2006 a precios constantes de 2000.
c. Cul fue el porcentaje de inflacin que tuvo Colombia entre 2000 y 2005?
d. Si la persona compr en 2001 un apartamento por 60 millones$, cul ser su
precio en 2005?
5. La cantidad de materia prima utilizada por unidad de producto elaborado en
una fbrica y el precio de compra de esas materias primas para el perodo 2003-
2007 se da en la siguiente tabla.
MATERIA PRIMA CANTIDAD POR PRECIO DE COMPRA ( $ )
UNIDAD
2003 2004 2005 2006 2007
A (KG) 50 400 480 550 620 750
B (KG) 78 1500 1900 2100 2400 2700
C (MT) 10 120 150 170 250 280
D (UNIDAD) 2 2000 2450 2600 2800 2900
a. Obtener un ndice ponderado de precios para cada uno de los aos con base
variable. Interpretarlos.
b. Si en 2003 el precio de venta del artculo se estableci en $ 180000, utilizar los
anteriores ndices para establecer el precio que debera haber tenido el artculo
en los dems aos de la anterior serie.

6. En la pgina del DANE (www.dane.gov.co) puede encontrar los registros del
IPC. Obtenga el IPC de por lo menos cuatro aos, mes a mes, graficarlos y
comentar su comportamiento.

7. En la pgina del DANE (www.dane.gov.co) puede encontrar la Metodologa del
ndice de Precios al consumidor. Utilizarla para responder lo siguiente:
a. Cuntos productos se incluyen en la canasta?
b. En cuntos grupos se dividen los productos de la canasta?
c. Cul es la ponderacin correspondiente a cada uno de los grupos de bienes?
Comentar.
d. Para qu ciudades se obtiene el IPC?.
e. Qu ponderacin corresponde a cada ciudad?
f. Para cuntos estratos socioeconmicos se obtiene el IPC?
g. Qu ponderacin corresponde en el IPC a cada estrato socioeconmico?

































ORLANDO ANTONIO MOSCOTE FLOREZ
Profesor de ctedra ESAP-
Estadstico
Especialista en Docencia Universitaria
Especialista en Gestin de Riesgos Financieros
oamoscote@hotmail.com