Está en la página 1de 109

Módulo nº 1:

LA ESTADÍSTICA Y SUS INSTRUMENTOS

Objetivos:
1. Definir qué significa estadística
2. Citar algunas aplicaciones de la estadística en administración y
otras áreas.
3. Explicar lo que significa estadística descriptiva y estadística
inferencial.
4. Distinguir los distintos tipos de características como objeto de
estudio de la estadística.
5. Distinguir entre los diversos niveles de medición
6. Organizar datos originales en una distribución de frecuencias

Estadística 13 Lic. M. Gabriela. Biondolillo


Introducción

Hoy tenemos mas intentos de comunicación y un exceso de medios de


comunicación. Las comunicaciones se han convertido en inquietud fundamental de
los estudiosos y profesionales de todas las instituciones: empresas, fuerzas
armadas, administración pública, hospitales, universidades, etc. Pero las
comunicaciones se han mostrado tan esquivas como el unicornio, el nivel de ruido
se ha elevado tan velozmente que en realidad hoy lo único que puede oírse es el
parloteo acerca de las comunicaciones, es evidente que cada vez hay menos
comunicación. Entretanto hay una explosión de información, de hecho, todos
tenemos acceso a una inagotable abundancia de datos. Todos nos sentimos como el
niño pequeño que está solo en la confitería, no sabemos qué debe hacerse para
conseguir que esta cornucopia de datos se convierta en información y, mas aún, en
conocimiento.

Vivimos en un mundo que se encuentra en un proceso de cambio


permanente, a diario se producen modificaciones en los esquemas de vida del
hombre, motivados por la irrupción de nuevas técnicas, máquinas mas avanzadas,
sistemas de gestión perfeccionados, etc. Hay una aceleración muy grande de la
ciencia y la tecnología, el conocimiento es un factor determinante y no es otra cosa
que lo expresado anteriormente: la problemática de transformar la información en
conocimiento.

Pero...
¿Qué es la información?

A lo largo del tiempo, el hombre se ha ocupado de acumular determinados


bienes considerados de mayor valor según las épocas (alimentos, metales
preciosos, etc.), tal como lo expresa, entre otros, el libro de Alvin Toffler “La tercera
ola”

Hoy, con los avances tecnológicos la información se expande e incrementa


año tras año. Ese crecimiento sostenido ha llevado a afirmar que estamos frente al
fin de la era industrial y en presencia de la sociedad de la información.
Estadística 14 Lic. M. Gabriela. Biondolillo
Teniendo en cuenta que las organizaciones actuales, en las que todos
nosotros estamos involucrados de alguna forma, están sujetas a cambios
constantes, no es difícil comprender que la información sea considerada un insumo
de gran importancia para la toma de decisiones.

Por todo lo expuesto y considerando que las funciones de la administración


que ya conoces (planear, organizar, dirigir y controlar) exigen tomar decisiones en
forma constante, es de gran importancia analizar de qué forma obtiene la empresa
su información, en qué momento, cómo la utiliza y cómo circula dentro de la
estructura organizativa.

Entonces, podemos afirmar que la información es un conjunto de datos


ordenados que adquieren significado dentro de un contexto y que facilita la
realización de operaciones y la toma de decisiones.

Un dato puede ser, por ejemplo, un nombre y apellido, un número o cualquier


otro símbolo que tenga sentido o no y pueda ser usado o no. Para que sea
considerado información, es necesario que tenga significado dentro del contexto en
el que va a ser usado, por ejemplo: que ese nombre y apellido enunciado
anteriormente sea el de un cliente, y que forme parte del listado de clientes
potenciales de la gerencia comercial, o que cualquier dato suyo resulte de
importancia para la empresa.

Los requisitos esenciales de la información son:


 que se obtenga en el momento oportuno;
 que sea clara y confiable;
 que sea tan detallada como lo requiera cada nivel de la organización;
 que el costo de la información no sea mayor que los resultados esperados que
esta permita obtener.

Durante el desarrollo de esta asignatura, conoceremos una serie de


herramientas que te permitirán alcanzar algunos de estos requisitos.

Estadística 15 Lic. M. Gabriela. Biondolillo


Pensemos por un momento que eres el administrador asignado al control de
calidad del agua en Mendoza, responsable del nivel de clorinación del agua. Para
llevar adelante tu trabajo en forma eficiente requieres herramientas que te permitan
un adecuado manejo de la información disponible.
Dicho nivel de clorinación ha de acercarse bastante al que exige el
departamento de salud pública. Para verificar el cloro sin necesidad de verificar cada
litro de agua que sale de la planta, decides muestrear diariamente algunos litros,
medir el contenido de cloro y extraer una conclusión sobre el nivel promedio de
clorinación que tiene el agua tratada ese día.
La tabla anexa muestra las concentraciones de cloro de 30 litros
seleccionados como muestra de un día. Estos niveles son los datos brutos de donde
sacarás tus conclusiones respecto a la población total a la que se aplicó la
clorinación ese día.

Concentraciones de cloro en partes por millón (ppm) en 30 litros de agua tratada


16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.8
15.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0
16.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3

Aplicando los métodos que se describen en la materia, podrás llegar a


conclusiones correctas.

La estadística y su utilización en el ámbito de la empresa

La creciente complejidad de las actividades de los negocios en años


recientes, ha incrementado el uso de la estadística para tomar decisiones.

Cuando las empresas eran pequeñas, los propietarios de las mismas estaban
directamente ocupados en casi todas las áreas de actividad de los negocios. A
medida que el tamaño creció, los propietarios fueron a veces separados de la
administración debido a las habilidades especiales requeridas para el manejo.
Además el gerente de una empresa moderna, inserta en un contexto que se
caracteriza por la inestabilidad y la turbulencia, encara un grado mucho mayor de
incertidumbre. Para tener éxito en la toma de decisiones, el gerente debe ser capaz
de tratar sistemáticamente con la incertidumbre misma mediante cuidadosas

Estadística 16 Lic. M. Gabriela. Biondolillo


evaluaciones y aplicaciones de métodos estadísticos concernientes a las
actividades de los negocios.

Información cuantitativa abundante puede ser obtenida de cada una de las


principales áreas. Se puede decir, en términos generales, que la estadística se
aplica, dentro de la organización de una empresa, en las siguientes áreas:

 administración general: en la planeación a largo plazo deben pronosticarse las


tendencias poblacionales de diversos países y analizar sus efectos en los
mercados consumidores.

 investigación y desarrollo: deben estimarse los costos de diversos proyectos y


deben anticiparse los requerimientos de personal, capacidad de planta, equipos y
tiempo.

 producción: en la producción de un artículo en grandes cantidades se hace


necesario detectar y eliminar alteraciones sistemáticas de la calidad, para ello se
aplican métodos de control, como también en los estudios de tiempos y
movimientos encaminados a obtener una mayor productividad y en la aplicación
de nuevos métodos de producción o en el lanzamiento de nuevos productos;
problemas relacionados con la disposición y estructura de plantas, tamaño y
ubicación de las mismas, programación y control de la producción,
mantenimiento, etc.

 finanzas: en la determinación de la magnitud que tomará cierto aspecto en algún


punto futuro del tiempo (corto, mediano o largo plazo), en los controles
presupuestarios y en el planteamiento de ciertas actividades de carácter
financiero.

 contabilidad: es de gran importancia en la auditoria, ya que mediante la


aplicación de ciertos métodos se seleccionan ciertas facturas, cuentas o
documentos de cobro sin necesidad de recurrir a la totalidad de ellos, y con base
en el examen que de ellas se realiza se pueden obtener conclusiones sobre la
situación contable actual de la organización.
Estadística 17 Lic. M. Gabriela. Biondolillo
 personal: el control sobre el número total de horas laboradas, el tiempo dejado de
laborar, los accidentes de trabajo, la clasificación del personal (por antigüedad,
sueldo, estudios, etc.) son informaciones de tipo estadístico necesarias en una
empresa para efectos de una buena y sana política laboral.

 comercialización: las encuestas estadísticas son indispensables para determinar


la reacción de los consumidores frente a los actuales productos de la empresa y
en el lanzamiento de los nuevos; pronósticos de las ventas de los productos
actuales y nuevos para los mercados existentes y para los que se abran después,
determinación de los canales de distribución, estudios muestrales de las
respuestas del público a las campañas publicitarias, etc.

Algunos conceptos necesarios

Antes de comenzar a conocer las principales herramientas de la estadística,


es necesario que acordemos sobre el significado de ciertos términos que son de
gran importancia para la comprensión de los temas que desarrollaremos a
continuación.

Estadística, es una ciencia que trata de la recopilación, organización,


presentación, análisis e interpretación de datos numéricos (estadísticas) con el fin de
realizar una toma de decisiones más efectiva. Entonces, podemos decir que se
refiere a un conjunto de métodos, normas, reglas y principios para observar, agrupar,
describir, cuantificar y analizar el comportamiento de un grupo.

En un principio se consideraba que la función de la estadística era la


descripción de las características de un grupo. En su origen la estadística era
histórica; hoy en día además de ser descriptiva es analítica, considerándose esta
última como la función más importante que realiza, ya que permite obtener
conclusiones para un grupo mayor, denominado población, partiendo de una
investigación realizada en un grupo menor, denominado muestra, cuyos elementos
se seleccionan aleatoriamente o al azar.

Estadística 18 Lic. M. Gabriela. Biondolillo


La estadística descriptiva es un conjunto de procedimientos estadísticos
que sirven para organizar y resumir conjuntos de datos numéricos, tiene como
finalidad poner en evidencia aspectos característicos (promedios, variabilidad de
datos, etc.) que sirven para efectuar comparaciones sin pretender sacar
conclusiones de tipo más general.

La estadística inferencial es un conjunto de procedimientos estadísticos que


sirven para deducir o inferir algo acerca de un conjunto de datos numéricos
(población), seleccionando un grupo menor de ellos. Busca dar explicaciones al
comportamiento de un conjunto de observaciones, probar la validez de los
resultados, intenta descubrir las causas que lo originan, lográndose de está manera
conclusiones que se extienden más allá de las muestras estadísticas mismas.

La estadística descriptiva - analítica se define como un conjunto sistemático


de procedimientos para observar y describir numéricamente el fenómeno, y
descubrir las leyes que regulan la aparición, transformación y desaparición del
mismo.

La estadística, de acuerdo con lo anterior, se podría definir como aquel


método que permite no solo describir el hecho o fenómeno, sino deducir y evaluar
conclusiones acerca de una población, utilizando resultados proporcionados por una
muestra.

Finalidad de la estadística

En términos generales, se considera que la finalidad de la estadística es


suministrar información, y su utilidad dependerá en gran parte, del fin que se
proponga y de la forma como se obtengan los datos.

La creciente especialización lograda por la empresa moderna ha obligado a la


utilización continua de métodos estadísticos; es así como, en la producción masiva,
el control de calidad mediante la inspección de artículo por artículo es casi imposible
de realizar. Cuando el artículo deba ser sometido a cierto control sobre dureza,
resistencia, duración, que implique su destrucción, es indispensable la aplicación de
Estadística 19 Lic. M. Gabriela. Biondolillo
técnicas de muestreo para, por una parte, reducir el número de elementos
destruidos y, por otra, obtener conclusiones que se puedan hacer extensivas al total
de los elementos producidos, de donde se extrajo la muestra.

Otros aspectos que requieren de la aplicación de dicha técnica son, entre


otros, las investigaciones realizadas por una empresa que desea conocer los
cambios ya sea en los gastos o en el gusto de los consumidores, las situaciones de
la demanda, el exceso de existencias, la capacidad de compra de un grupo familiar,
etc. Pero precisando sobre algunos aspectos para los cuales la estadística tiene
alguna importancia, se podrán mencionar:

 conocer la realidad de una observación o fenómeno: al cuantificar un


fenómeno estamos conociendo su situación actual; es así como al tener la
información diaria, semanal o mensual sobre la producción de un artículo se sabrá
si se está cumpliendo con lo programado o, por el contrario, estamos por debajo o
por encima de nuestra programación, lo cual afectará los stock, las ventas, las
existencias de materia prima, etc. Se podrá determinar el total de la producción
nacional de un artículo en un momento determinado; además, sabremos si el
volumen de producción satisface la demanda interna o si, por el contrario, hay
necesidad de recurrir a las importaciones para cubrir el déficit. También se puede
determinar el excedente de producción que se requiere para mantener los precios
internos de mercado.

 determinar lo típico o normal de esa observación: cuando se cuantifica la


característica de una muestra o población, se obtiene un valor denominado
promedio, siendo esta la forma de referirnos al grupo, cuantificando así su
comportamiento. Si decimos que el promedio de unidades vendidas de un
artículo A, en 20 almacenes, en el mes de marzo fue de 1.200 unidades, es una
forma de determinar el comportamiento del grupo; pero con este valor típico o
normal del conjunto no se quiere decir que los 20 almacenes vendieron la misma
cantidad; posiblemente algunos mas, otros menos, pero el promedio fue de 1.200.

 determinar los cambios que presenta el fenómeno: cualquier fenómeno de


carácter estadístico presenta variaciones a través del tiempo, pero requiere una
Estadística 20 Lic. M. Gabriela. Biondolillo
observación continua para poder determinar la magnitud del cambio. La demanda,
la producción, las ventas, los precios, son fenómenos que constantemente
registran cambios que deben ser tenidos en cuenta por la administración de una
empresa.

 relacionar dos o más fenómenos: desde el punto de vista de correlación, se


puede determinar si existe una relación válida entre dos o más características de
una misma observación o entre dos o más fenómenos. Tal es el caso de la
relación de ingresos y gastos para un grupo de familias o la relación entre las
unidades producidas, vendidas y el precio.

 determinar las causas que originan el fenómeno: los cambios que se observan
en un fenómeno pueden tener una o varias causas de origen. El aumento de las
exportaciones de un artículo puede ser causado por un mejoramiento del precio
en el mercado externo o por un volumen de producción superior a la demanda
interna o por otras causas que producen cambios en el comportamiento del
fenómeno.

 hacer estimativos sobre el comportamiento futuro del fenómeno: en


numerosas ocasiones se requiere proyectar, para estimar el comportamiento
futuro de un fenómeno. La proyección a dos o tres años de la población de una
región sirve para determinar el mercado potencial del producto, es decir, el
conocimiento, aunque sea estimativo, de la demanda en los años próximos.

 obtener conclusiones de un grupo menor (muestra) para hacerlas


extensivas a un grupo mayor (población): al realizar mediciones en una
muestra cuyo tamaño debe ser el óptimo deseado, los resultados obtenidos
pueden ser considerados como el comportamiento que se obtendría si se hubiera
trabajado con todos los elementos que constituyen la población de la cual se
extrajo la muestra.

 además de lo anterior, la estadística facilita una serie de instrumentos o técnicas


que, al ser utilizadas correctamente, permiten determinar el grado de validez y

Estadística 21 Lic. M. Gabriela. Biondolillo


confiabilidad ya sea de las predicciones o de las conclusiones obtenidas a partir
de muestras.

Población y muestra

Se le asigna dentro de la ciencia estadística el nombre de población (N) a


todo el conjunto de elementos que poseen una característica común y que son
plausibles de ser estudiados, es decir, es un conjunto de medidas o el recuento de
todos los elementos que presentan una característica común. Nótese la diferencia
fundamental con la acepción de la palabra población desde el punto de vista
geográfico donde se refiere exclusivamente a personas, en el caso estadístico una
población puede estar formada por personas o cosas.

El término población se usa para denotar el conjunto de elementos del cual se


extrae la muestra (n). Los compradores a menudo prueban una porción pequeña de
cualquier fiambre antes de comprarlo, determinan a partir de un trozo el sabor de
toda la horma. Una fábrica, para validar el tiempo que dura una lámpara
incandescente, prueba solamente algunas e infiere que el resto se comportará, en
términos de duración, de igual forma. Probar todo el producto o todos los productos
es innecesario y hasta destructivo; Si el comprador probara todo el queso o la
fábrica probara todas las lámparas no quedarían productos para vender.

Al realizar cualquier estudio estadístico un factor importante a tener en cuenta


son los costos del mismo, costo que está influenciado por la cantidad de elementos
a estudiar, por la disposición inmediata o no de los mismos, por la dispersión
geográfica que presenten, etc.

Cada vez es más frecuente que el tamaño de la población tienda a infinito, es


decir, que la cantidad de elementos que la componen es muy numeroso, esto hace
que sea necesario en estas ocasiones estudiar muestras para inferir como se
comporta la población, fundamentalmente por los dos aspectos mencionados
anteriormente: la inutilidad de probar todos los productos o por el valor en términos
monetarios que tendría el estudio.

Estadística 22 Lic. M. Gabriela. Biondolillo


Lo ideal sería que el número de elementos o unidades de observación que
constituyen la muestra, fuera igual al contenido en la población. Pero como no
ocurre así, las conclusiones que se consideran válidas para la muestra pueden ser
extendidas a la población, garantizándolas estadísticamente mediante la indicación
de la validez del proceso. Pero debe temerse en cuenta que trabajar con muestras
para inferir como sería la población, trae aparejado problemas de errores de
estimación que hay que tratar de reducir a su mínima expresión.

Entonces, se define la muestra (n) como un conjunto de medidas o el


recuento de una parte de los elementos pertenecientes a la población. Los
elementos se seleccionan aleatoriamente, es decir, todos los elementos que
componen la población tienen la misma posibilidad de ser seleccionados. Existen
diversas formas de obtener una muestra, las distintas técnicas de muestreo
dependen:

 del grado de precisión requerido;


 del tamaño de la población;
 del costo y tiempo.

Muestreo

Las muestras probabilísticas pueden obtenerse a través de:

 muestreo aleatorio simple: se basa en la premisa que todos y cada uno de los
elementos de la población tengan la misma probabilidad de ser elegidos, se
realiza por sorteo o con la tabla de números aleatorios.

 muestreo aleatorio estratificado: la población se estratifica de acuerdo a


alguna característica que solo le permitirá pertenecer a la misma. Se forman de
esta manera varias muestras que pueden ser de igual tamaño o proporcional.

 muestreo sistemático: se enumeran los elementos de la población y se saca,


por ejemplo, el número 6, luego el 16, 26, 36 y así sucesivamente.

Estadística 23 Lic. M. Gabriela. Biondolillo


Una muestra no probabilística corresponde a la selección de las unidades o
elementos según el criterio o conveniencia del investigador. En estos casos, algunas
unidades tienen mayor probabilidad que otras de ser seleccionadas; por tal razón no
se puede determinar la validez, ni la confianza que merecen dichos resultados.

Uno de los aspectos más importantes al trabajar con muestras es poder


definir si la misma es o no representativa de la población que pretendemos estudiar.
El otro aspecto a dilucidar es cual es el tamaño de la muestra que debemos analizar
para poder aplicar los resultados obtenidos y trasladarlos como estimadores de los
parámetros poblacionales.

Elementos de una población

Los elementos que integran la población o la muestra pueden corresponder a


personas u objetos; además el elemento puede ser una entidad simple (una
persona) o una entidad compleja (una familia) y se denomina unidad investigada.

Estos son ejemplos de lo que podrían denominarse elementos de una


población y características de la misma:

Elementos Características
Personas Salarios
Personas Horas trabajadas
Personas Cargos
Departamentos Ventas
Hogar Consumo

Es importante resaltar el hecho de que a pesar de encontrarse una población


constituida por un grupo de elementos, a la estadística no le interesa el elemento en
sí, sino su característica.

Según sea el tamaño, la población puede considerarse como finita o infinita.


Es población finita cuando el número de elementos que la componen es limitado;
es población infinita cuando el número de elementos que la componen es infinito.

Estadística 24 Lic. M. Gabriela. Biondolillo


Atributos y variables

Las características o caracteres (xi) corresponden a ciertos rasgos,


cualidades o propiedades que poseen los elementos que constituyen a la población
o muestra. Algunos caracteres son mensurables y se describen numéricamente, por
tal motivo se denominan caracteres cuantitativos o variables, tales como estatura,
peso, ingreso, valor, producción, ventas, etc. y pueden clasificarse en:

 variables continuas: pueden tomar cualquier valor dentro de los números reales
(edad, temperatura, kilos, etc.)

 variables discretas: solo toman valores enteros (cantidad de hijos, materias


aprobadas, etc.)

Otros se expresan mediante palabras por no ser mensurables pero si


contabilizables, tales como profesión, cargo, marcas, calidad, etc. y se denominan
caracteres cualitativos o atributos. Estos pueden ser:

 atributos dicotómicos: son aquellos que aceptan solo dos alternativas; por
ejemplo: ciudadano argentino o extranjero.

 atributos policotómicos: son aquellos que aceptan mas de dos alternativas; por
ejemplo: nacionalidad de los barcos ingresados al puerto.

La determinación del tipo de carácter que estemos estudiando es muy


importante porque de ello depende la forma de ordenar los datos, de sistematizarlos
en una tabla de frecuencias, la manera de presentar tablas resúmenes y determinar
el tipo de gráfico que se debe utilizar.

Otros conceptos importantes

Estadísticas, en plural, se refiere a una ordenamiento sistemático de datos


presentados en forma de cuadros o gráficas. En otras palabras, las estadísticas son

Estadística 25 Lic. M. Gabriela. Biondolillo


datos agrupados metódicamente y consignados en publicaciones, elaboradas por las
diversas empresas y entidades, buscando sean conocidos por los interesados.

Las estadísticas primarias son aquellos datos obtenidos ya sea por


encuestas directas, mediante la utilización de cuestionarios o como resultado de la
observación directa; esta última es una técnica muy utilizada es estudios de carácter
científico o en investigaciones de mercado. Se puede decir también que son datos
publicados por quien recoge directamente de la fuente de información primaria.

Las estadísticas secundarias son aquellas en las que los datos se obtienen
de publicaciones, las cuales pueden ser reproducciones totales o parciales. Son
fuentes valiosas utilizadas en cualquier tipo de investigación.

Las estadísticas temporales, denominadas también series de tiempo o


series cronológicas son las obtenidas y ordenadas en forma cronológica, siendo el
resultado de investigaciones u observaciones periódicas: días, meses, años. Cuando
las investigaciones son aisladas, es decir, no presentan periodicidad continuada, las
estadísticas se llaman atemporales.

Las estadísticas también pueden clasificarse como internas o externas. Las


estadísticas internas de una empresa se originan de los registros internos, tales
como producción, ventas, salarios y otros. Las estadísticas externas son registros
originados fuera de la empresa, por ejemplo: precios de la competencia, opinión de
los consumidores respecto del producto, etc.

Los parámetros son todas aquellas medidas que describen numéricamente


las características de una población. También se les denomina valor verdadero ya
que una característica poblacional tendrá un solo parámetro (media, varianza, etc.).
Sin embargo, una población puede tener varias características y, por tanto, varios
parámetros.

La descripción numérica de una característica correspondiente a la muestra


se denomina estadígrafo. De una población se puede obtener T número de
muestras posibles y en cada una de ellas se puede cuantificar la característica
Estadística 26 Lic. M. Gabriela. Biondolillo
obteniéndose, por lo general, valores diferentes para cada muestra a pesar de ser
utilizado el mismo estadígrafo o medida.

Te propongo, a esta altura del desarrollo del módulo, el primer ejercicio de


autoaprendizaje... Suerte!

Autoaprendizaje 1-1
Una compañía comercial de Mendoza pidió a una muestra de
1960 consumidores que probaran un plato de pescado congelado
de elaboración reciente por un fabricante, denominado “Suspiro
de Mar”. De los 1960 consumidores consultados, 1176 dijeron que
comprarían el menú si se pusiera a la venta.
1. ¿Qué informará la compañía al fabricante respecto a la aceptación del “Suspiro
de Mar”?
2. ¿Es este un ejemplo de estadística descriptiva o inferencial? Justifica tu
respuesta.

Escalas de medición

Una medición consiste en el establecimiento de números o códigos a las


observaciones mediante el empleo de una escala apropiada. Una escala se puede
definir como un instrumento de medición.

Las escalas de medición se diferencian por propiedades de orden y de


distancia, según la clasificación que elaboró S. S. Stevens (1.946) podemos
identificar las escalas de medición: nominal, ordinal, de intervalo y de razón.

 escala nominal: es aquella en la que no se hace ningún supuesto respecto de las


relaciones que existen entre los valores de las variables. Cada valor se asigna a
una categoría diferente, la que se define mediante un nombre. Por ejemplo: el
lugar de nacimiento de una persona es una variable medida en escala nominal,

Estadística 27 Lic. M. Gabriela. Biondolillo


sexo, tipo de religión, establecimiento donde cursó sus estudios, medicina que le
fue administrada, etc.; la variable no tiene un orden preestablecido.

 escala ordinal: es aquella que surge al ordenar todas las categorías de la


variable de acuerdo a algún criterio. Por ejemplo: clasificar a las personas de
acuerdo a su máximo nivel de instrucción alcanzado en primario, secundario,
universitario, etc. constituye un orden de clasificación. En este caso lo único que
sabemos es que el nivel de instrucción secundario es superior al primario y que el
universitario es superior al primario y secundario; no obstante, no sabemos con
certeza cuánto “mayor” es una categoría de la variable respecto a otra porque no
existe una medición de distancia.

 escala de intervalo: es aquella que tiene la propiedad de asignar una medición


de distancia entre los valores de la variable. Entonces, cuando se dice que un
objeto es mayor que otro, se puede especificar cuántas unidades de diferencia
hay entre ambos o por cuántas unidades un objeto es mayor que otro. Una
característica de la escala de intervalo es que el punto de origen o punto cero en
la escala de medición es un punto de acuerdo o punto convencional. Otras
variables que se pueden medir con escala de intervalo son: altura, temperatura,
tiempo, riqueza e inteligencia. En síntesis, la escala de medida de intervalo
permite estudiar diferencias entre valores de la variable, pero no respecto de sus
magnitudes proporcionales.

 escala de razón: es aquella que presenta todas las propiedades de orden y


distancia de una escala de intervalo adicionando el punto 0 o punto de origen. En
una escala de razón, al igual que en una escala de intervalo, las unidades de
medida son equidistantes unas de otras con la única diferencia que, en las
escalas de razón, existe un punto cero correctamente definido. Por ejemplo: en
cualquier distancia física entre objetos, medida en metros o centímetros, existe
una distancia cero definida como la total ausencia de distancia entre ellos. La
existencia de un punto cero definido implica que se pueden efectuar
comparaciones proporcionales y cualquier operación matemática apropiada para
números reales.

Estadística 28 Lic. M. Gabriela. Biondolillo


El tipo de escala de medición que se utilice al medir una variable condiciona el
tratamiento estadístico que se efectuará a los datos.

DATOS

caracteres caracteres
cualitativos o cuantitativos o
atributos variables

escala de escala de
escala nominal escala ordinal
intervalo razón

Autoaprendizaje 1-2
1. El INDEC informó acerca de las poblaciones en las siguientes
provincias:
Provincia Número de personas
Mendoza 750.000
San Juan 530.000
San Luis 620.000
La Rioja 480.000

¿De qué tipo de característica se trata?


¿Qué escala de medición reflejan estos datos? ¿por qué?

Estadística 29 Lic. M. Gabriela. Biondolillo


La calificación de un examen especial aplicado al personal reclutado por una
empresa industrial para medir sus conocimientos en el área son:
Puntuaciones Número de solicitantes
90-99 42
80-89 19
70-79 7
60-69 4
Menos de 60 3
¿De qué tipo de característica se trata?
¿Qué escala de medición reflejan estos datos? ¿por qué?

Método estadístico

Toda ciencia tiene su propia metodología de estudio y aplicación, la


estadística tiene su método propio que, en definitiva, son una serie de etapas a
cumplir para asegurar el éxito de la investigación. Los pasos del método estadístico
son:

 Objeto: qué, cuándo, cómo, dónde.


 Unidad de investigación: a quien va dirigida.
 Método de observación: población o muestra.
 Proceso de recolección de datos: entrevista personal,
PLANEAMIENTO encuesta telefónica o por correo, observación.
 Presupuesto.
 Calendario de trabajo.
 Preparación del cuestionario: aspectos materiales y técnicos.
 Selección y preparación del personal.
 Supervisión.
 Control de encuestas.
RECOLECCIÓN  Revisión de cuestionarios inconclusos.

Estadística 30 Lic. M. Gabriela. Biondolillo


 Calidad y consistencia de las preguntas.
 Cumplimiento de los plazos prefijados.
 Codificación y tabulación.
PROCESAMIENTO  Cuadros

 Gráficos
ANÁLISIS  Informe final
 Publicación

Planeamiento:

Objetivo: como en la mayoría de las actividades humanas, es imprescindible


antes de iniciar cualquier acción la definición del objetivo del estudio estadístico,
pues de él depende el resto de las etapas que componen un trabajo de esta
naturaleza. Es importante reflexionar y contestar los interrogantes anteriormente
detallados; que se va a estudiar, cuándo se va a realizar el estudio, cómo se va a
efectuar el trabajo, dónde se recolectará la información, esta lista no es taxativa, sino
meramente enunciativa.

Unidad de investigación: en esta etapa se define cual es la población


plausible de estudio, es decir cuales son los elementos que reúnen los requisitos o
características de nuestro objetivo de estudio.

Método de observación: en función de la cantidad de elementos que


compongan nuestra unidad de investigación, en este momento se decidirá por
estudiar a la población (si ésta fuera lo suficientemente chica, en función de razones
de necesidad o costo) o si estudiaremos una muestra de esa población. Asimismo se
debe decidir que tipo de muestreo se usará: aleatorio simple, aleatorio sistemático o
aleatorio

Proceso de recolección de datos: ya hemos dicho que la descripción


estadística de un fenómeno se hace mediante datos numéricos. La recogida de
estos datos puede realizarse utilizando fuentes de datos internas o externas.

Estadística 31 Lic. M. Gabriela. Biondolillo


 Algunas veces los datos son intrínsecos a la propia actividad de la empresa que
los recopila en un momento determinado. Se dice, entonces, que el dato es
interno y la fuente de datos interna. Tal sería, por ejemplo: la información que
puede proporcionar el departamento de personal de una empresa sobre la
categoría, edad o sueldo de sus empleados.

 Otras veces interesa obtener datos ajenos al funcionamiento de la propia


empresa. La fuente de esos datos ha de ser, en consecuencia, externa y los datos
son externos. Por ejemplo: una empresa desea introducir un producto para
comercializar en una cierta población, para lo cual necesita saber el nivel
adquisitivo de sus posibles compradores. Consultará entonces diversas fuentes
de datos externas: bancos, dependencias gubernamentales, etc.

Los datos externos suelen obtenerse por medio de:

 Observación directa: de la realidad que se quiere estudiar; esta es una técnica


muy usada en varias actividades, los supermercados utilizan este método para
estudiar las reacciones de los consumidores ante la ubicación de diferentes
productos en distintos lugares del local; también lo utiliza el laboratorista químico
cuando mezcla diferentes sustancias para observar las reacciones. En Francia
para determinar que consumen las familias y en que cantidades lo hacen, se
estudia la basura de las mismas.

 Entrevista personal: indicada cuando se requieren respuestas mas completas y


mayor número de respuestas por cada una de las personas seleccionadas en la
muestra; es la más rica de las formas de obtener datos, la misma puede ser
estructurada (en donde la secuencia de preguntas está preestablecida) o libre
(situación donde el entrevistador va dirigiendo la conversación en función de las
reacciones del entrevistado).

 Encuestas: especialmente indicada cuando se requieren respuestas cortas y muy


concretas o cuando las muestras son muy grandes. Tiene además la ventaja de
su bajo costo económico. Las encuestas pueden ser

Estadística 32 Lic. M. Gabriela. Biondolillo


 personales: de los tres tipos de encuestas es la más apta cuando las
preguntas no hacen referencias a temas delicados (entiéndase: religión,
inclinaciones sexuales, o temas que afecten la intimidad de las personas),
tiene la ventaja de poder manejar el tiempo de duración de contacto con el
encuestado y de aclarar cualquier situación no entendida por el mismo.
Suelen tener un costo bastante alto cuando son realizados por personal
capacitado.

 telefónicas: se usan para investigaciones donde la población objetivo de


nuestro estudio pertenece a un sector socioeconómico alto o medio-alto,
no se puede muestrear telefónicamente para averiguar temas de
productos masivos, puesto que no toda la población posee teléfono y no
se cumpliría una premisa básica del muestreo: todos tienen que tener la
mismo probabilidad de ser elegidos.

 por correo: es la más barata de las tres, pero adolece del problema que
sólo se reciben pocas respuestas, todavía en nuestro país no se ha
realizado campañas para concientizar a la comunidad de la importancia de
las respuestas, para que obtener mayor cantidad de respuestas se suele
sortear algún premio atractivo entre lar respuestas recibidas.

 Consulta de publicaciones especializadas: dado que muchas entidades públicas


y privadas emiten periódicamente informes estadísticos de tipo general o
especializados. Dichas publicaciones son una importante fuente de datos
externos a un costo muy bajo.

 Obtención de información a través de bases de datos: la mas difundida de todas


es Internet, es un lugar de consulta de información de la más diversa índole, con
ventajas tales como la comodidad de recolección, el costo de la misma y la
fuente consultada.

Presupuesto: un aspecto importantísimo a tener en cuenta al realizar


investigaciones estadísticas es determinar el costo de la misma, los gastos que
implica suelen ser altos; papelería, honorarios de encuestadores, gastos en el
Estadística 33 Lic. M. Gabriela. Biondolillo
proceso de grabación de datos y procesamiento de los mismos. Muchas
investigaciones quedan inconclusas por falta de dinero para concluirlas, y a
diferencia de otras actividades, en ésta, un trabajo inconcluso es un trabajo
inservible.

Calendario de trabajo: atento que los resultados estadísticos varían conforme


se modifica la realidad, es importante determinar las fechas de inicio y finalización
del mismo, a fin de tener en cuenta las variables que pudieran influenciar el entorno
en el lapso en que se realiza la investigación. Si estuviéramos estudiando la opinión
de la población respecto al sida, y en medio de la investigación apareciera una
vacuna para esta enfermedad, seguramente las opiniones se modificarían
sustancialmente.

Preparación del cuestionario: debe hacerse un buen análisis de las preguntas,


si las mismas serán abiertas (donde el encuestado vierte su opinión) o cerradas
(donde la persona debe optar por una o más opciones preestablecidas), la cantidad
de preguntas a incluir en función del tiempo que los encuestados estén dispuestos a
brindar, etc.

Selección y preparación del personal: es importante contar con personal


capacitado para esta tarea, si bien la misma es relativamente sencilla, es necesario
instruir al encuestador sobre su rol de asentamiento de respuestas, y que bajo
ningún punto de vista debe influenciar para obtener una respuesta determinada;
asimismo jamás deberá entrar en discusiones de ninguna naturaleza con un
entrevistado.

Recolección

Supervisión: es una actividad importante a realizar, fundamentalmente


cuando se trabaja con personal con poca experiencia en el tema; el objetivo de esta
tarea es controlar que la recolección de los datos se realice de acuerdo a la
planificado.

Estadística 34 Lic. M. Gabriela. Biondolillo


Control de encuestas: esta tarea consiste en verificar si han sido relevadas
todas las encuestas, si las mismas presentan preguntas “trampa” observar como
reaccionó el encuestado ante esta situación; si ante una pregunta de validación
respondió equivocadamente se debe rechazar la encuesta.

Revisión de cuestionarios inconclusos: en reiteradas oportunidades muchas


preguntas quedan sin responder, ante este hecho se debe verificar la importancia
relativa de la pregunta faltante, de ser primordial al efecto del estudio se deberá
rechazar la misma.

Calidad y consistencia de las preguntas: esta tarea se realiza


fundamentalmente cuando se utilizan preguntas abiertas, es decir, preguntas donde
el encuestado debe emitir opinión; por supuesto no se va a rechazar una encuesta
por el tipo de opinión que se emita, sino que se eliminaría si la respuesta no
corresponde a la interrogación realizada.

Cumplimiento de los plazos prefijados: atento que este tipo de estudio muy
difícilmente pueda trasladarse en el tiempo, es muy importante que se respeten los
plazos establecidos en el calendario de trabajo, a fin de no realizar un análisis sobre
variables que pudieran haberse modificado.

Procesamiento

Cuadros: el desarrollo de este tema se realiza mas adelante

Gráficos: el desarrollo de este tema se realiza mas adelante

Codificación y tabulación: el desarrollo de este tema se realiza en el título


siguiente.

Sistematización de los datos a través de la frecuencia

Estadística 35 Lic. M. Gabriela. Biondolillo


Existen tres formas de sistematizar los datos: datos no agrupados, datos
agrupados sólo por su frecuencia y datos agrupados por frecuencia y en intervalos
de clase.

Los datos no agrupados son una serie de valores recolectados por cualquiera
de los métodos de recolección y donde figuran todos y cada uno de ellos.

A continuación se muestra una tabla con datos sobre el número de roturas


encontradas en cajas que contienen adornos de porcelana, depositadas en el
almacén de productos terminados de la empresa XX (información que retomaremos
más adelante para el desarrollo de otros temas).

Estadística 36 Lic. M. Gabriela. Biondolillo


Nro. de caja Cantidad de Nro. de caja Cantidad de
roturas roturas
1 2 16 2
2 1 17 3
3 1 18 0
4 0 19 3
5 3 20 2
6 3 21 2
7 2 22 2
8 1 23 1
9 2 24 4
10 4 25 3
11 0 26 2
12 2 27 3
13 3 28 2
14 1 29 1
15 2 30 2

La anterior información la denominaremos datos sin agrupar. Estos datos así


presentados tienen una ventaja y un inconveniente, si los mismos son trabajados en
una planilla de cálculo es sumamente fácil obtener los estadígrafos más importantes
(medidas de tendencia central, de dispersión, de asimetría y de apuntamiento); por
otra parte, si el análisis de estos datos se hace manualmente, el proceso se torna
engorroso, por lo cual se sugiere trabajar con el concepto de frecuencia, es decir,
agrupar los datos en función de la cantidad de veces que se repiten.

Distribución de frecuencias: la tabla de frecuencias tiene como finalidad


presentar en forma ordenada los valores que toman las diferentes características, en
tal forma que permitan al lector tener una visión de conjunto. Los datos se clasifican
y ordenan de acuerdo con ciertas características cualitativas o cuantitativas,
indicándose el número de veces que se repite el valor de la variable o atributo.

En el caso de atributos o aspectos cualitativos se indica el número de


veces que el valor del atributo se repite y es lo que se denomina frecuencia de
ocurrencia. En términos de la proporción que esta frecuencia de ocurrencia
representa en el número total observado, se le conoce con el nombre de frecuencia
relativa de ocurrencia.

Estadística 37 Lic. M. Gabriela. Biondolillo


Es importante destacar, en el caso de atributos, que la característica puede
ser analizada, en parte, mediante el cálculo de razones o porcentajes y, al igual que
las variables cuantitativas, se pueden representar gráficamente.

La elaboración de una tabla de frecuencia para la variable discreta, la


explicaremos mediante un ejemplo basado en los datos sin agrupar que se
encuentran arriba, en donde se supuso que se tenían 300 cajas de madera en la
bodega de un almacén y cada una de ellas contiene figuras de porcelana. Se desea
examinar las cajas con el fin de saber el número de figuras que han sufrido
desperfectos en el transporte desde la fábrica hasta la bodega. Por motivos de
tiempo, espacio físico y personal disponible, se tomó la decisión de revisar un 10%
de las cajas, por tal razón se tendrá 30 cajas de un total de 300.

 N: 300 (tamaño de la población objetivo)


 n: 30 (tamaño de la muestra)

Cada caja seleccionada, en forma aleatoria, se simbolizó por xi (minúscula en


la muestra, mayúscula en la población), donde el subíndice “i” toma valores desde 1
hasta n, siendo x1 la primera caja seleccionada, x2 la segunda caja seleccionada y
así sucesivamente. Cada xi tendrá el valor correspondiente a la característica
examinada, en este caso le corresponderá el número de figuras de porcelana
desperfectas.
x1=2 x6=3 x11=0 x16=2 x21=2 x26=2
x2=1 x7=2 x12=2 x17=3 x22=2 x27=3
x3=1 x8=1 x13=3 x18=0 x23=1 x28=2
x4=0 x9=2 x14=1 x19=3 x24=4 x29=1
x5=3 x10=4 x15=2 x20=2 x25=3 x30=2

Tal como se manifestó, la anterior información se denomina datos sin


agrupar.

Veamos ahora, paso por paso, cómo se elabora una tabla de frecuencias para
la variable discreta. Pero antes te presento la simbología que se utiliza en la
elaboración de estas tablas:

 N: tamaño poblacional
Estadística 38 Lic. M. Gabriela. Biondolillo
 n: tamaño de la muestra

 xi : característica cuantitativa, discreta o continua, observada en cada unidad


investigada.

 ri : frecuencia absoluta. Número de veces que se repite el valor de la variable.

 fri : frecuencia relativa. Se obtiene dividiendo cada frecuencia absoluta por el


tamaño de la muestra o el tamaño de la población.

 Ri : frecuencia absoluta acumulada, se hace por medio de sumas sucesivas de


manera que la última frecuencia absoluta acumulada será igual a n.

 Fri : frecuencia relativa acumulada, para calcularla se procede igual que en la


frecuencia anterior.

 m: número de valores que toma la variable.

En este proceso se requiere, en primer lugar, determinar los valores que toma
la variable (m). Con los datos anteriores correspondientes al número de figuras de
porcelana desperfectas por caja examinada, encontramos que los valores son 0, 1,
2, 3, 4, entonces m=5. En función de esto armamos la tabla de frecuencia:

xi ri fri Ri Fri
0 3 3/30= 0,10 3 0,10
1 6 6/30= 0,20 9 0,30
2 12 12/30= 0,40 21 0,70
3 7 7/30= 0,23 28 0,93
4 2 2/30= 0,07 30 1,00
 30 1,00 -- --

La frecuencia relativa nos indica la distribución porcentual, en el ejemplo se


tiene que el 10% de las cajas no tienen figuras defectuosas.

Estadística 39 Lic. M. Gabriela. Biondolillo


Intervalos de clase: para estudiar un hecho en el que la amplitud de la
población o muestra es grande, donde la variable continua puede tomar un número
elevado de valores, se definen los intervalos de clase que son subconjuntos del
conjunto de valores que puede tomar la variable continua. Estas clases pueden tener
una amplitud constante o variable; así, por ejemplo, si se trata
de estudiar la estatura de una población de individuos, una vez elegida la muestra
(que eventualmente podría coincidir con la población, como es sabido), es
conveniente dividir en clases las posibles estaturas de los individuos investigados.
Podría hacerse de la siguiente forma:

 menos de 160 cm.


 de 160 a 170 cm.
 de 170 a 180 cm.
 igual o mas de 180 cm.

Se puede observar que la primera y la última clase tienen amplitud


indeterminada, mientras las otras dos tienen una amplitud constante de 10 cm. Los
extremos son 160, 170 y 180 cm y las marcas de clase o punto medio del intervalo
(xi ), 165 y 175 cm, las cuales se calculan sumando el límite inferior mas el límite
superior del intervalo y luego dividirlo por dos.

Se llaman límites del intervalo a los valores extremos de dicho intervalo. Por
ejemplo, dado el intervalo 160-170 cm., diremos que 160 es el límite inferior (L.I.) y
que 170 es el límite o extremo superior (L.S.). Podría pensarse que los extremos
son valores que están incluidos en dos intervalos de clase, para que esto no suceda
consideraremos incluido dentro de cada intervalo solo al extremo inferior (160 cm.) y
el extremo superior (170 cm.) se considera incluido en el intervalo siguiente 170-180
cm.

Otro criterio para dejar bien sentado a qué intervalo pertenecen los extremos
es tomar lo que se conoce como límites exactos, en nuestro ejemplo de estaturas se
tomaría como sigue:

Estadística 40 Lic. M. Gabriela. Biondolillo


 hasta 159,50 cm.
 159,51 - 169,50 cm
 169,51 - 179,50 cm.
 desde 179,51 cm.

sin embargo esta notación es mas engorrosa y menos clara que la anterior.

Los criterios a seguir para elegir la amplitud y el número de intervalos de clase


son:

 en cuanto a la amplitud de cada clase podemos considerar como una elección


acertada es elegir clases de mayor amplitud en las regiones donde el carácter es
mas raro y de menor amplitud en el resto. Esto sucede si elegimos clases de
amplitud variable; sin embargo, es mucho mas general elegir las clases con
amplitud constante, por simplicidad. Para calcular la amplitud del intervalo (c) se
realiza la siguiente operación: “c= rango / m”

 en cuanto al número de clases a adoptar dependerá de la precisión de las


medidas que se pretende alcanzar, finalidad del estudio, grado de variabilidad de
los datos, necesidad de efectuar comparaciones, etc.; en todo caso se
recomienda que el valor de m, hasta donde sea posible, no sea menor de 5 ni
mayor de 16. Es común la utilización de la fórmula de Sturges para obtener la
cantidad de intervalos de clase (m), esta es “m = 1+3,3 log n”

Los estudios estadísticos están sujetos a una serie de factores que, según se
manejen, harán que el estudio sea suficientemente fiable o no lo sea. Además de
estos factores, existe otro tipo de error que podríamos considerar numérico, debido
al redondeo de los cálculos, etc. Dichos errores están implícitos en una buena parte
de los estudios realizados.

Con respecto a la agrupación de los datos en clases o intervalos, hay que


decir que lleva implícito un cierto error en el cálculo posterior de las distintas
medidas de la distribución, y este error será mayor cuanto mayor sea la amplitud de
los intervalos elegidos. Pero si esta amplitud es muy pequeña y, por consiguiente, el
Estadística 41 Lic. M. Gabriela. Biondolillo
número de intervalos es muy grande, entonces la serie estadística pierde claridad y
los cálculos resultan mas engorrosos. Por lo tanto, se debe tender al máximo
equilibrio entre estos dos efectos contrarios:

 mayor número de clases implica menos claridad pero mas exactitud y precisión;

 menos clases y mas amplias significa ganar en claridad de exposición y facilidad


de cálculo, pero en detrimento de la exactitud y precisión a conseguir en los
cálculos.

Veamos ahora, paso por paso, cómo se elabora una tabla de frecuencias para
la variable continua. Antes te presento la simbología que se utiliza en la elaboración
de estas tablas, muchas de las cuales coinciden con las utilizadas en la elaboración
de las tablas para la variable discreta, tal como lo viste precedentemente.

 N: tamaño poblacional

 n: tamaño de la muestra

 xi : característica cuantitativa, discreta o continua, observada en cada unidad


investigada. También se utiliza para indicar la marca de clase cuando trabajamos
con intervalos de clase.

 ri : frecuencia absoluta. Número de veces que se repite el valor de la variable.

 fri : frecuencia relativa. Se obtiene dividiendo cada frecuencia absoluta por el


tamaño de la muestra o el tamaño de la población.

 Ri : frecuencia absoluta acumulada, se hace por medio de sumas sucesivas de


manera que la última frecuencia absoluta acumulada será igual a n.

 Fri : frecuencia relativa acumulada, para calcularla se procede igual que en la


frecuencia anterior.

Estadística 42 Lic. M. Gabriela. Biondolillo


 m: número de intervalos o número de valores que toma la variable.

 L.I. - L.S.: los intervalos en los que se divide la variable continua. Siendo L.I. el
límite inferior y L.S. el límite superior del intervalo.

 c: amplitud del intervalo entre L.I. - L.S.

 rango: diferencia que hay entre el valor máximo y el valor mínimo de la serie
estadística.

Se desarrolla a continuación un ejemplo para la construcción de una tabla de


frecuencia para la variable continua. Consideremos nuevamente la población de 300
cajas (N= 300) y seleccionemos aleatoriamente una muestra de 30 cajas (n= 30), o
sea el 10% a fin de investigar el peso en kg. de cada caja. La información sobre el
peso de cada caja se da en números enteros con el fin de simplicar el trabajo, sin
olvidar que la medida utilizada admite valores fraccionarios, por tal motivo se la
clasifica como variable continua.

x1= 48 x2= 56 x3= 60 x4= 67 x5= 47 x6= 70


x7= 70 x8= 63 x9= 72 x10= 76 x11= 74 x12= 67
x13= 92 x14= 70 x15= 69 x16= 61 x17= 71 x18= 79
x19= 85 x20= 68 x21= 82 x22= 55 x23= 65 x24= 88
x25= 52 x26= 58 x27= 76 x28= 57 x29= 72 x30= 67

En la elaboración de la tabla de frecuencias se deben observar los siguientes


pasos:

1. se determina el valor máximo y el valor mínimo que toma la variable xi, en este
caso xmin= 47 y xmax= 92;

2. se calcula el rango, es decir, 92 - 47 = 45.

3. se hace necesario determinar el número de intervalos (m) que se utilizará para


agrupar los datos, aplicando la regla de Sturges con la cual se obtiene una
aproximación aceptable sobre el número de intervalos necesarios; m= 1 + 3,3 log

Estadística 43 Lic. M. Gabriela. Biondolillo


30, lo que arroja un resultado de 5,87. El número de intervalos estará entre 5 y 6,
utilizaremos en nuestro ejercicio seis intervalos (m=6).

4. se debe decidir sobre la amplitud de cada intervalo (c). Al determinar el valor de c


no es necesario que sean todos los intervalos iguales; sin embargo, con fines de
simplicidad y funcionalidad se puede considerar el valor de c constante para todos
los intervalos. Dicho valor constante se obtiene aplicando la fórmula siguiente: c=
rango/m, entonces, 45/6= 7,5. Para facilitar los cálculos se aproxima c a 8; por lo
tanto se altera el valor del rango, si recordamos que m fue fijado y no se debe
cambiar, se tendrá: 8=rango/6, entonces 8=48/6. En este caso el rango se
incrementa en tres unidades, de 45 pasó a 48, el incremento debe ser distribuido
proporcionalmente, sumando unas unidades al límite superior y restándole otras
al límite inferior.

l. C. xi ri fri Ri Fri
46 - 54 50 3 0,10 3 0,10
54 - 62 58 6 0,20 9 0,30
62 - 70 66 10 0,33 19 0,63
70 - 78 74 6 0,20 25 0,83
78 - 86 82 3 0,10 28 0,93
86 - 94 90 2 0,07 30 1,00
 -- 30 1,00 -- --

Propiedades de las frecuencias: estas son:

1. las frecuencias absolutas son números enteros;

2. la suma de las frecuencias absolutas es igual a tamaño de la muestra (n) o al de


la población (N);

3. las frecuencias relativas son números fraccionarios, esto es “0<fri<1”;

4. la suma de las frecuencias relativas es igual a 1;

Estadística 44 Lic. M. Gabriela. Biondolillo


5. el último término de las frecuencias absolutas acumuladas es igual a n;

6. el último término de las frecuencias relativas acumuladas es igual a 1.

Autoaprendizaje 1-3
Los ingresos mensuales (en pesos) de una pequeña muestra de nuevos operadores
de computadora en el área del Gran Mendoza son: $1650, $1475,
$1760, $1540, $1495, $1590, $1625 y $1510.
1. ¿Cómo se denominan los datos precedentes?
2. Utilizando como primera clase $1400 – $1499, como segunda
$1500 – $1599, y asi sucesivamente, organiza los ingresos
mensuales en una distribución de frecuencias.
3. ¿Cómo se llaman los números en la columna derecha de la distribución de
frecuencias?
4. Describe la distribución de ingresos mensuales.

Los salarios mensuales (en pesos) de una muestra de 87 empleados de una


empresa fueron redondeados al peso más cercano. Van desde $1041 hasta $2548.
1. Organiza los datos en siete clases utilizando la misma amplitud para cada clase,
teniendo en cuenta los datos precedentes.
2. ¿Con qué intervalos de clase sería más fácil trabajar?

Para cerrar el desarrollo de los conceptos básicos de estadística, te


recomiendo la lectura de los capítulos 1 y 2 del libro complementario.

Estadística 45 Lic. M. Gabriela. Biondolillo


Trabajo Práctico nº 1

Tema: La Estadística y sus instrumentos


Actividades:

1. Indica en cada una de las siguientes situaciones, si la población de referencia es


finita o infinita:
 palabras con error en un texto
 alumnos de colegios privados de Mendoza
 portadores de sida
 has. sembradas con ajo en la República Argentina
 clientes morosos de una entidad bancaria
 contribuyentes de la D.G.I.

2. Clasifica los caracteres expresados a continuación:


 peso de niños al nacer
 ingresos del jefe de hogar
 cantidad de cigarrillos fumados al día
 nivel de educación
 estado civil
 cantidad de palabras escritas por minuto
 contenido de latas de tomate
 cantidad de llamadas telefónicas por hora

3. La fábrica de gaseosas La Sed proyecta lanzar al mercado un nuevo sabor. Se


realiza un test de aceptación de dicho sabor en una muestra de 30 niños,
utilizando una escala de 10 puntos, para medir el grado de aceptación. Los puntos
obtenidos en los 30 niños fueron los siguientes: 2, 6, 8, 7, 4, 5, 10, 6, 6, 7, 6, 7, 3,
8, 7, 6, 8, 6, 5, 4, 7, 8, 5, 7, 6, 7, 2, 7, 2, 7. La muestra estuvo compuesta por igual
número de niños de ambos sexos, de 6 a 12 años, pertenecientes a una
concentración escolar del barrio El Terrón de la ciudad de Cenizas. Responde:
 ¿cuál es la población?
 ¿cuál es la muestra?
Estadística 46 Lic. M. Gabriela. Biondolillo
 ¿la característica es cualitativa o cuantitativa?
 ¿cuál es la variable?
 ¿de qué tipo es la variable?
 construir una distribución de frecuencias incluyendo todas las frecuencias
conocidas
 ¿cuál es el valor de m?

4. El puntaje obtenido por los alumnos de la cátedra de estadística en el último


examen es el siguiente: 63, 62, 65, 69, 62, 70, 45, 62, 74, 59, 68, 66, 66, 55, 60,
65, 63, 57, 66, 68, 67, 58, 74, 74, 61, 67, 71, 64, 52, 76, 63, 71, 76, 60, 71, 67, 60,
72, 68, 59, 69, 55, 79, 57, 51, 67, 47, 72, 71, 67, 54, 67, 65, 64, 50, 60, 64, 71, 72,
63.
 agruparlos en intervalos de clase de amplitud = 5
 agruparlos en intervalos de clase de amplitud = 3
 confeccionar el cuadro de frecuencias para los dos casos.

5. De la serie de salario mensual de 100 obreros encontrar:


 frecuencia absoluta
 frecuencia relativa
 frecuencias acumuladas.

Salario Cant. de
mensual obreros
200 - 250 4
250 - 300 7
300 - 350 12
350 - 400 15
400 - 450 22
450 - 500 14
500 - 550 10
550 - 600 8
600 - 650 5
650 - 700 3
 100

6- El jefe de personal de una empresa encontró que el número de días que los 50
empleados habían tomado por incapacidad médica durante el año eran:
1 20 9 7 15 9 6 10 22 2
Estadística 47 Lic. M. Gabriela. Biondolillo
22 10 3 2 3 10 10 3 6 25
9 10 6 5 3 22 9 1 5 10
10 9 9 25 9 25 5 3 6 9
7 16 4 15 25 5 9 10 3 6

Elabora la tabla de frecuencias correspondiente.

7- El jefe de ventas investiga los precios de cierto artículo en 40 almacenes


diferentes y encuentra los siguientes datos:
76 85 80 88 74 65 91 89
76 83 71 70 86 67 68 73
77 71 75 75 68 74 72 75
84 75 75 73 87 68 79 70
72 63 77 89 60 72 83 88

Elabora la tabla de frecuencias que corresponda

Estadística 48 Lic. M. Gabriela. Biondolillo


Autoevaluación del módulo nº 1

Indica si la expresión es verdadera o falsa. Si es falsa, anota la respuesta


correcta.
1. Otro nombre para la estadística inferencial es estadística descriptiva.
2. Una muestra de consumidores probó una nueva galleta de queso y la clasificó de
excelente, muy buena, regular o mala. El nivel de medición para esta
investigación de mercado es ordinal.
3. Un sindicato de plomeros y colocadores de tubería tiene 5020 agremiados. Se
seleccionó e interrogó a un grupo representativo de 248 integrantes. Se
considera que 248 es la población.
4. Los métodos empleados para saber algo acerca de la población de truchas en el
Parque Nacional Lanín, con base en una muestra de 40 truchas, se denomina
estadística inferencial.
5. En general, debe elaborarse una distribución de frecuencias de manera que
haya, al menos, 20 clases.
6. Las distribuciones de frecuencias relativas se obtienen dividiendo cada
frecuencia absoluta entre el número total de observaciones o tamaño de la
muestra.
7. Los kilos de pan elaborados por día en una panadería son un ejemplo de variable
discreta.
8. A la estadística no le interesan los elementos que conforman una población sino
sus características.

Estadística 49 Lic. M. Gabriela. Biondolillo


Módulo nº 2:
CUADROS Y GRÁFICOS

Objetivos:
1. Presentar datos utilizando representaciones usuales como las
gráficas de líneas, de barras y de sectores.
2. Representar la distribución de frecuencia para la variable
continua en un histograma, polígono de frecuencias y ojiva.
3. Elaborar cuadros estadísticos para la presentación de
información.

Estadística 50 Lic. M. Gabriela. Biondolillo


Elaboración de un cuadro

Cuando se va a hacer la agrupación de las observaciones correspondientes a


las características que interesa analizar, es necesario establecer, ante todo, algún
criterio de ordenación. Por ejemplo, la clasificación de una característica cualitativa
se puede hacer de acuerdo con un orden alfabético, cronológico o en forma de
importancia. Para la clasificación de las características cuantitativas se utilizan las
escalas numéricas.

No hay que olvidar que los cuadros o tablas corresponden a arreglos


sistemáticos de datos. La forma del cuadro depende en gran parte del propósito para
el cual se ha preparado. A pesar de que no se tienen reglas fijas para la elaboración
de cuadros, si se pueden observar y aplicar algunas de las recomendaciones, que
en forma muy general, se han hecho y como tales se han aceptado:

 El cuadro debe ser lo más sencillo posible, siendo preferible la elaboración de


dos o más cuadros, en vez de uno solo que contenga demasiados detalles
respecto de las características examinadas.

 Si en una publicación o informe se tienen dos o más cuadros, estos deben ser
numerados.

 Todo cuadro debe tener un título, el cual debe ser claro y conciso, que responda
a los interrogantes: qué, cómo, dónde y cuándo se hizo, como por ejemplo:
“Encuesta sobre el precio de artículos de primera necesidad en Luján de Cuyo -
Mendoza - Marzo de 1.998”. El título podría clarificarse aun más si se establece a
quién se hizo la investigación: amas de casa, comerciantes minoristas, etc.

 El titulo debe tener una separación del cuadro, dejando por lo menos dos
espacios intermedios. Algunos consideran que el título debe ser colocado en la
parte superior del cuadro en tal forma que el lector se entere de inmediato sobre
el contenido del cuadro; otros son partidarios de colocarlo debajo.

Estadística 51 Lic. M. Gabriela. Biondolillo


 El encabezamiento del cuadro contiene los títulos y subtítulos de las columnas.
Los títulos deben ser colocados en mayúscula y los subtítulos en minúscula. En el
encabezamiento del cuadro se puede colocar una columna para totales, que
puede estar ubicada al principio o al final, partiendo de izquierda a derecha.
También los totales pueden ubicarse en la parte inferior del cuadro, pero dentro
del mismo. En el encabezamiento pueden haber columnas para subtotales en el
caso que sea necesario.

 El cuerpo del cuadro corresponde a la parte numérica, información o contenido.


Si la primera columna del cuadro se utiliza para describir una característica
cualitativa, los nombres que toma se ubicaran en las diferentes líneas,
pudiéndose usar letras mayúsculas o minúsculas, seguida de puntos suspensivos
hasta el comienzo de la segunda columna, en caso que el papel no tenga los
renglones trazados.

 Se debe tener cuidado con el contenido del cuadro, ya que si no se conoce la


información o cantidad, el espacio correspondiente no debe dejarse en blanco o
colocar ceros y en ese lugar se colocarán guiones. Ahora, si en lugar de no
conocer la información, la situación es que no se tiene, se debe hacer una
indicación o llamada colocada en dicho espacio. Se presentan a continuación
algunas convenciones utilizadas en la confección de cuadros:

 cantidad inferior a la unidad aceptada


 no hay cifras disponibles
 cifras revisadas
 estimaciones
 información suspendida
 sin movimiento
 datos provisionales

 El cuadro se cerrará por encima y por debajo con líneas mas fuertes (o doble
línea) que las utilizadas en el interior del cuadro.

Estadística 52 Lic. M. Gabriela. Biondolillo


 Deberán especificarse las unidades de medida utilizadas para la descripción de
la característica. En el caso que se quiera presentar cifras relativas o
porcentuales, no se excluirán del mismo las respectivas frecuencias absolutas.

 Pie: será utilizado un espacio debajo del cuadro para dar referencia al origen de
los datos, es decir, de dónde fueron tomados. Además, para dar explicaciones
sobre las abreviaturas, símbolos o códigos utilizados; también servirá dicho
espacio para indicar si el cuadro fue tomado de otra publicación, indicando con
claridad la fuente, autor, página, etc.

 Además de las recomendaciones anteriores, no sobra agregar que la buena


presentación de un cuadro se conseguirá a base de experiencia, dada por una
práctica constante sobre este tipo de trabajo, sin olvidar que la finalidad de un
cuadro es ordenar los valores que toman las características, de tal manera que al
sintetizar la información, se tenga un mayor conocimiento sobre lo investigado.

CUADRO Nº
TITULO (qué, cómo, cuándo, dónde)
Título en mayúsculas
ENCABEZAMIENTO (título en Subtítulo en minúscula TOTAL
mayúsculas)
Sub -
total

CUERPO (líneas en mayúscula o


minúscula)

TOTALES
PIE

Elaboración de gráficos

Estadística 53 Lic. M. Gabriela. Biondolillo


La presentación de las informaciones obtenidas se puede realizar de varias
formas:
 textual (en forma de texto);
 cuadros, tal como analizamos anteriormente;
 gráficos.

Cuando el informe se hace en forma textual, se trata de una presentación simple y


limitada, tal como sucede en los reportajes y artículos periodísticos, donde los datos
aparecen intercalados con los comentarios y con las conclusiones derivadas de las
interpretaciones de los mismos, en una forma ligera y descriptiva.

En un informe textual complementado con cuadros, estos sirven de ayuda al


lector para entender o ampliar lo que dice el texto. Sin embargo, la utilización de
texto y cuadros no es suficiente para la presentación de un buen informe, ya que la
lectura del texto implicará un tiempo precioso para entender todo el contenido;
ahora, si el lector se remite a los cuadros encontrará unas cifras, que en algunos
casos no le aclaran lo suficiente y en otros, no le dicen mucho sobre el problema
estudiado, de ahí que sea necesario que el informe vaya acompañado de gráficos,
no como sustituto de las formas anteriores de presentación, sino como la mejor
manera de visualizar la información contenida en los cuadros y en el texto.

De todas las representaciones de datos estadísticos, los gráficos muestran en


forma extensiva y con la necesaria profundidad las características del fenómeno en
estudio.

El gráfico es una representación de datos ilustrada, construida principalmente


mediante la asignación de valores a un conjunto de líneas horizontales y verticales
llamadas ejes.

Generalmente los gráficos usan como sostén un sistema de ejes cartesianos


X e Y donde se presentan dos variables asociadas. Generalmente en el eje “Y” se
colocan las frecuencias que presentan los distintos valores de la variable x que se
representa sobre el eje de abscisas o eje “X”.

Estadística 54 Lic. M. Gabriela. Biondolillo


Ventajas y Desventajas

Sus principales ventajas son: concisión, rapidez de percepción, vista de


conjunto de una situación y síntesis de datos. Entre las desventajas encontramos
que desprecia necesariamente ciertos detalles y resulta confuso cuando se pretende
comparar varias distribuciones.

Reglas en la elaboración de gráficas

La forma de la gráfica depende en gran medida del gusto de la persona que la


elabora; sin embargo, hay ciertos principios generales que se deben tener en cuenta
en el logro de una buena gráfica:

 La mejor gráfica es la mas simple. Las líneas y símbolos usados deben ser los
estrictamente indispensables para una mejor visualización de la información.

 Si hay mas de dos gráficas deben estar numeradas.

 Toda gráfica debe llevar un título que aclare el contenido de la misma. Debe
responder a los interrogantes: qué, cómo, cuándo y dónde.

 La posición del título en la gráfica se considera de gusto personal, de ahí que


algunos aconsejan que debe ser colocado en la parte superior y otros, que debe
estar en la parte inferior.

 Las líneas que llevan escalas deben dibujarse mas gruesas que las demás
coordenadas; a su vez, las líneas que representan los datos o la variable deben
ser mas gruesas que las escalas.

 La línea vertical, denominada ordenada, se utiliza para representar la frecuencia.

 Las características cualitativas y cuantitativas van en la línea horizontal o


abscisa.

Estadística 55 Lic. M. Gabriela. Biondolillo


 La lectura de la escala del eje horizontal se hace de izquierda a derecha y la
lectura del eje vertical, debe hacerse de abajo hacia arriba.

 En toda gráfica se debe explicar la fuente de donde fueron obtenidos los datos;
además, aclarar las escalas, leyendas, notas y convenciones que ayuden a
identificar las características presentadas.

 Los gráficos deben ser lo bastante sencillos para procurar una idea clara y ser
comprensibles sin la ayuda de las descripciones del texto.

 Los datos numéricos sobre los que se basa la gráfica deben presentarse en
cuadro adjunto, si no son incluidos en la misma gráfica.

 Las gráficas deben seguir, y nunca preceder la exposición del texto.

 Cuando los valores representados en un gráfico son elevados y varían poco, se


pierde un gran espacio por debajo de la curva, siendo preciso entonces adoptar
una escala bastante pequeña que desdibuja las variaciones. Por ello es
aconsejable interrumpir el cuadriculado mediante un corte horizontal o vertical
según el eje en cuestión.

 Cuando la gráfica presenta mas de una variable, debe hacerse una muy clara
diferenciación por medio de leyendas, notas o signos convencionales.

Tipos de gráficos

Hay numerosos tipos de gráficas pero vamos a ver detenidamente aquellas


que son consideradas como las mas usuales:

Estadística 56 Lic. M. Gabriela. Biondolillo


 diagrama de puntos: se marcan simplemente los puntos de coordenadas de
todos los pares de valores (x;y). Son importantes ya que dan una primera
interpretación de un fenómeno en el cual se hipotetiza sobre la asociación de dos

20

15

10

0
1989 1990 1991 1992 1993 1994 1995 1996 1997

variables. Son usados en series de tiempo, correlación y regresión y en gráficos


de control.

 diagrama de frecuencia: se utiliza para la representación de la variable discreta.


En el eje horizontal se colocan los valores que toma la variable xi y en el eje
vertical las frecuencias absolutas o relativas. Para cada valor de xi le
corresponderá una frecuencia ri o fri, indicándolo en el plano cartesiano mediante
un punto; luego, partiendo de ese punto tomado como referencia, trazamos una
perpendicular al eje horizontal y se obtendrán las barras con las cuales
representamos la variable. También se puede hacer la representación de la
variable utilizando las frecuencias absolutas o relativas acumuladas; por tal razón
se denominan diagramas de frecuencias acumuladas. En este caso se observará
que las líneas que representan la variable van en sentido horizontal, a diferencia
del caso anterior cuyas barras son verticales. Las gráficas elaboradas con
frecuencias absolutas son exactamente iguales a aquellas elaboradas con
frecuencias relativas, diferenciándose únicamente en los valores de las escalas
correspondientes a las frecuencias.

25

20

15

10

0
Estadística 1 2 3 4 57 5 6 7 Lic.8 M. Gabriela.
9 Biondolillo
 histogramas: está formado por un conjunto de rectángulos, cada uno de ellos
levantado en cada intervalo, de tal manera que la base será igual a la amplitud del
intervalo (c) y la altura estará dada ya sea por la frecuencia absoluta o relativa. Se
utiliza para la representación de la variable continua. Si elaboramos el histograma
teniendo en cuenta las frecuencias relativas, será un gráfico de gran utilidad al
comparar dos distribuciones.

45
40
35
30
25
20
15
10
5
0
30-40

70-80
10-20

40-50

50-60

60-70

80-90

90-100
20-30

 polígonos de frecuencia: con la misma información utilizada para la elaboración


del histograma, se puede dibujar el polígono de frecuencia. En primer lugar se
establecen los puntos medios en la parte superior de cada rectángulo, luego se
unen dichos puntos mediante una línea, prolongándose en el primer y último
intervalo hasta el eje de abscisas y al punto medio del intervalo anterior y
posterior a los de la variable en estudio. Esto se hace a efectos de que el área
encerrada bajo la curva sea exacta en función del valor de los ángulos opuestos
por el vértice. Se utiliza para representar la variable continua dado que se basa en
el histograma.

45
40
35
30
25
20
15
10
5
0
15 25 35 45 55 65 75 85 95

Estadística 58 Lic. M. Gabriela. Biondolillo


 ojivas: para el trazado de esta gráfica, en primer lugar, se ubican los puntos en el
plano cartesiano. Dichos puntos se determinan teniendo en cuenta el límite
superior de cada intervalo y las respectivas frecuencias absolutas o relativas
acumuladas; luego se unen esos puntos, partiendo desde el límite inferior del
primer intervalo ubicado en el eje horizontal. Se utiliza para la representación de
la variable continua.
200
180
160
140
120
100
80
60
40
20
0
40-50

80-90

90-100
0-10

10-20

30-40

50-60

60-70

70-80
20-30

 pictogramas: es una forma de representar las cantidades estadísticas por medio


de dibujos, utilizando para ello objetos y figuras; las figuras deben explicarse por
si mismas. Se acostumbra que el tamaño sea uniforme, indicándose aparte de las
figuras el valor de una de ellas. Por otro lado, el tamaño puede variar y la altura
de cada objeto estará dada por la frecuencia absoluta o relativa; pero una
inmensa mayoría considera que dicha representación puede conducir a errores en
su interpretación, especialmente cuando los tamaños de las figuras no son
proporcionales a la cantidad que se representa. Si los tamaños de las figuras no
son uniformes pero sí proporcionales, se tendrá una representación exacta pero
poco expresiva.

30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996

Estadística 59 Lic. M. Gabriela. Biondolillo


 cartogramas: es la representación de una información estadística por medio de
mapas, dentro de los cuales se ubican símbolos y, en algunos casos, gráficas;
para indicar tanto la localización geográfica así como la importancia del valor de la
variable observada en relación con el conjunto.

 diagramas de barras: es uno de los gráficos mas utilizados por su sencillez y por
la facilidad que ofrece para representar las características cuantitativas y
cualitativas. Pueden ser:
 Verticales

30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996

 Horizontales

1996

1995

1994

1993

1992

1991

1990

0 5 10 15 20 25 30

Estadística 60 Lic. M. Gabriela. Biondolillo


 Simples

25

20

15

10

0
1990 1991 1992 1993 1994 1995 1996

 Subdivididas

60
50
40
30
20
10
0
1990 1991 1992 1993 1994 1995 1996

Valor 1 Valor 2

 Absolutas

30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996

Estadística 61 Lic. M. Gabriela. Biondolillo


 Relativas

20,00%

15,00%

10,00%

5,00%

0,00%
1990 1991 1992 1993 1994 1995 1996

 Bidireccionales

30
25
20
15
10
-30
5 -20 -10 0 10 20 30
0 Export. Importac.
1990 1991 1992 1993 1994 1995 1996
Valor 1 Valor 2

 Apareadas

 diagramas circulares: se utiliza con mucha frecuencia para representar


características cualitativas, y sirve para hacer notar las diferencias en las
proporciones o porcentajes en que está dada la distribución. Este tipo de
comparación es relativamente efectivo, siempre que los segmentos sean lo
suficientemente grandes para permitir comparaciones. El proceso que se sigue en
la confección de la gráfica circular o pastel, consiste en subdividir los 360º de la
circunferencia, proporcionalmente al porcentaje de cada una de las clases que ha
tomado la característica.

Estadística 62 Lic. M. Gabriela. Biondolillo


1996 1990
18% 11%

1991
16%

1995
14%

1992
12%

1994
16% 1993
13%

 diagramas de líneas: es otra de las gráficas muy utilizadas pero, al mismo


tiempo, la que presenta mayores dificultades en la visualización de los datos,
dando lugar, algunas veces, a imágenes o conclusiones erróneas debido a la
mala confección de las escalas de los ejes. También se los denomina curvas de
sucesión porque generalmente se refieren a variables observadas durante un
periodo. Dichas variables se denominan series de tiempo o series cronológicas: la
variable tiempo se coloca en el eje horizontal y los valores que toma la variable en
el eje vertical.

30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996

Autoaprendizaje 2-1
Las exportaciones anuales de un grupo de pequeñas empresas
farmacéuticas son:
Exportaciones Número de empresas
(en millones de $)
2-4 6
5-7 13
Estadística 63 Lic. M. Gabriela. Biondolillo
8-10 20
11-13 10
14-16 3
1. Representa las exportaciones en un histograma.
2. ¿Cuáles son los puntos medios?
3. Representa las exportaciones en un polígono de frecuencias.
4. Interpreta las gráficas.

Para cerrar el desarrollo de los conceptos relacionados con la confección de


cuadros y gráficos, te recomiendo la lectura del capítulo 3 del libro complementario.

Estadística 64 Lic. M. Gabriela. Biondolillo


Trabajo Práctico nº 2

Tema: Cuadros y Gráficos


Actividades:

1. Elabora una gráfica adecuada para presentar la siguiente información: durante


unos 5 meses se construyeron 134 km. de carretera en la siguiente forma: el primer
mes 3,60% del total, el segundo mes 7,60% del total, el tercer mes 15,30% del total,
el cuarto mes 24,50% del total y el último mes el 49% restante.

2. Grafica los siguientes datos referidos a una población potencial de consumidores:


EDAD Distribución porcentual (%)
(años) Hombres Mujeres
15-19 10,9 9,7
20-24 9,1 8,9
25-29 7,6 7,4
30-34 5,8 6,3
35-39 4,9 5,3
40-44 4,2 4,5
45-49 3,9 3,0
50-54 2,5 2,8
55-59 2,2 1,0

4. Realizar el gráfico que muestre los datos obtenidos de una encuesta realizada en
1.999 en la zona este de la provincia de Mendoza sobre la cantidad de personas
que adquieren el diario.

Hombres Mujeres Total


Nunca 6 14 20
Acontecimientos 1 5 6
especiales
2 veces por 23 8 31

Estadística 65 Lic. M. Gabriela. Biondolillo


semana
1 vez por semana 27 19 46
Todos los días 14 10 24
Total 71 56 127

4. Grafica y determina el valor probable que tomará la función de acuerdo a la tendencia que se observa en el
gráfico.

Mes Ventas
Enero 600
Febrero 400
Marzo 200
Abril 100
Mayo 300
Junio 500
Julio 600
Agosto 500
Setiembre 300
Octubre 100
Noviembre 300
Diciembre

5. Realiza un gráfico que permita ejercer control entre los costos presupuestados y
los reales según la tabla siguiente:

Volumen de Importe de los costos en miles de


producción pesos
en m3 Presupuestados Reales
100 130 90
300 380 340
500 550 470
700 700 600
900 800 800
1100 930 1050
1300 1090 1190

Estadística 66 Lic. M. Gabriela. Biondolillo


Autoevaluación del módulo nº 2

Indica si la expresión es verdadera o falsa. Si es falsa, anota la respuesta


correcta.
1. Un histograma es una gráfica que representa la distribución de frecuencia de una
variable discreta.
2. Para trazar un polígono de frecuencias, se necesitan los puntos medios de clase
y las frecuencias de clase.
3. El gráfico de sectores es más adecuado para la representación de las
características cuantitativas.
4. Lo que distingue a una ojiva es que para su elaboración se deben utilizar las
frecuencias acumuladas.
5. La forma de un cuadro estadístico depende del objetivo que se persiga pero, en
general, debe ser sencillo.
6. La presentación de las informaciones obtenidas se puede realizar de varias
formas: textual, cuadros y gráficos.
7. Un buen gráfico reemplaza a una tabla estadística en la presentación de los
datos.

Estadística 67 Lic. M. Gabriela. Biondolillo


Módulo nº 3:
MEDIDAS ESTADÍSTICAS

Objetivos:
1. .Calcular y aplicar adecuadamente la media aritmética, la
mediana y el modo, teniendo en cuenta sus ventajas y
desventajas.
2. Identificar la posición de la media, la mediana y el modo tanto en
distribuciones simétricas como asimétricas.
3. Calcular y aplicar adecuadamente las medidas de dispersión,
asimetría y apuntamiento a un conjunto de datos organizados en
una distribución de frecuencias.
4. Calcular y comprender los usos del coeficiente de variación y de
asimetría.

Estadística 68 Lic. M. Gabriela. Biondolillo


Introducción

En esta unidad se presenta una serie de métodos para estudiar o medir el


comportamiento de los elementos que constituyen una población. Si bien es cierto
que los cuadros y gráficos describen el fenómeno, no lo hacen en forma
satisfactoria, y por tanto hay necesidad de acudir a ciertas medidas denominadas
parámetros de la población, cuando se hacen sobre el total de esta, y estadígrafos
cuando corresponden a una parte de la población o muestra.

Teniendo en cuenta la clasificación anterior, los símbolos que se refieren a la


población estarán representados por letras griegas o por letras mayúsculas de
nuestro alfabeto, y los que se refieren a la muestra, por letras minúsculas de nuestro
alfabeto.

Para el análisis de una variable o una distribución unidimensional se


consideran cuatro tipos de medidas:

1. medidas de posición o de tendencia central;

2. medidas de dispersión o de variabilidad;

3. medidas de asimetría o de deformación;

4. medidas de apuntamiento o curtosis.

A continuación, te presento las características fundamentales de las


principales medidas. No obstante, para el desarrollo de ejemplos y la mejor
comprensión de los temas es necesaria la lectura de los capítulos 4, 6 y 7 del libro
“Estadística” de Garzó y García.

Cuando realices la lectura verás que es necesario ajustar la simbología, dado


que la empleada en este material no coincide con la del libro. Por otra parte, la
exposición del libro es más amplia, de manera tal que deberás utilizar este material
como guía para identificar los temas relevantes para nuestros objetivos.
Estadística 69 Lic. M. Gabriela. Biondolillo
Medidas de tendencia central

Finalidad: describir y sintetizar mediante un número único las características


más relevantes de un conjunto de valores.

Media aritmética

Concepto: para datos no agrupados, la media aritmética es igual a la suma


de todos los valores de la variable dividida entre el número total de valores. La
fórmula es:

X=  Xi
n

Donde:

 X significa media aritmética

 Xi indica un valor específico

 n es el número total de valores en la muestra

  es la letra griega sigma mayúscula e indica la operación de sumar un


conjunto de datos (sumatoria)

Para calcular la media aritmética para datos agrupados por su frecuencia, la


fórmula es:

X=  Xi . ri
n
Donde ri es la frecuencia asociada a cada uno de los valores de la variable.

Estadística 70 Lic. M. Gabriela. Biondolillo


Características

 mas conocido

 mas fácil de calcular

 mas utilizado

Ventajas

 se presta a tratamiento algebraico

 gran estabilidad en el muestreo

 sensible a cambios en los valores de la distribución

Desventajas

 no puede aplicarse cuando no están definidos los valores extremos de los


intervalos de clase

 muy afectada por valores extremos por lo que se torna no representativa

Propiedades

 la suma de las desviaciones del valor de la variable respecto de la media es igual


a cero (0);

 la media aritmética de una constante es igual a la constante;

 la media del producto de una constante por una variable es igual a multiplicar la
constante por la media de la variable;

Estadística 71 Lic. M. Gabriela. Biondolillo


 la media de una variable mas (o menos) una constante es igual a la media de la
variable mas (o menos) la constante;

 la media de una muestra dividida en submuestras es igual a la media ponderada


de las submuestras, tomando como ponderación el tamaño de las mismas.

x = x1 . n1 + x2 . n2
n1 + n2

Autoaprendizaje 3-1

Los ingresos netos de una muestra de grandes importadores de


antigüedades se organizaron en la tabla siguiente:

Ingresos Netos
(en millones de U$S) Nro. de importadores
2-4 1
5-7 4
8-10 10
11-13 3
14-16 2
1. ¿Cómo se denomina la tabla?
2. Calcula la media aritmética del ingreso neto.
3. La media calculada en el punto 2 ¿es un estadígrafo o un parámetro? ¿por qué?
4. ¿Cuál es la mejor estimación de la media poblacional?

Mediana

La Mediana (Me) es aquel valor de la variable que supera la mitad de las


observaciones y a su vez es superado por la otra mitad de las observaciones.

Estadística 72 Lic. M. Gabriela. Biondolillo


Características:

 menos importante que la media, de aplicación menos frecuente

 gran inestabilidad en el muestreo

 fórmulas rígidas que no admiten tratamiento algebraico

Se aplica:

 distribuciones irregulares cuyos valores extremos afectan el cálculo de la media:


la mediana no es afectada por los cambios en el valor de la variable mientras no
sea en la observación central.

 distribuciones que presentan el primero y último intervalo abierto: el valor de la


Me depende del número de observaciones y no del valor de las mismas.

Cálculo:

 Me de una serie con datos no agrupados, se ordenan los datos de manera


creciente o decreciente y luego se calcula el orden de la mediana. Con número
impar de observaciones, el valor de la mediana está dado por el valor de la
variable cuya ubicación en el arreglo de datos coincide con el orden de la
mediana. Con número par de observaciones, el valor de la mediana está dado por
la media aritmética de los dos valores centrales del arreglo de datos.

Me= n + 1
2

 Me de una serie con datos agrupados por frecuencia y en I.C.: en primer lugar
se calcula el orden de la mediana como n/2 y con ese valor ubicamos la clase
mediana según la columna de Ri (frecuencia absoluta acumulada) teniendo en
cuenta que el valor de Ri debe ser igual o superior al valor dado por el orden de la
mediana. Luego aplicamos la siguiente fórmula:
Estadística 73 Lic. M. Gabriela. Biondolillo
Me= L.I. + c/ri . (n / 2 - Ri -1)

Donde:

 L.I. es el límite inferior de la clase mediana

 C: amplitud de la clase mediana

 Ri: frecuencia absoluta de la clase mediana

 n/2 es el orden de la mediana

 Ri -1 es la frecuencia absoluta acumulada de la clase anterior a la clase mediana.

 Me de una serie con datos agrupados solo por la frecuencia: en primer lugar
se calcula el orden de la mediana como n/2 y con ese valor ubicamos la clase
mediana según la columna de Ri (frecuencia absoluta acumulada) teniendo en
cuenta que el valor de Ri debe ser igual o superior al valor dado por el orden de la
mediana. Luego, el valor de la mediana es el valor de la variable que corresponde
a la Ri indicada.

Autoaprendizaje 3-2
El número de paros en el trabajo, en la industria automotriz para
meses seleccionados son: 6, 0, 10, 14, 8, 0.
1. ¿Cuál es la mediana del número de paros?
2. ¿Cuántas observaciones están por debajo de la mediana?
¿cuántas por encima?

Modo

Estadística 74 Lic. M. Gabriela. Biondolillo


El Modo (Mo) es aquel valor de la variable que mas veces se repite, es decir,
presenta la mayor frecuencia.

Características

 menos importante y de uso limitado

 sus fórmulas no admiten tratamiento algebraico

 no es sensible a valores extremos

 no es afectado por cambios en el valor de la variable diferentes al valor del modo

Se aplica:

 distribuciones con I.C. abiertos

 distr ibuciones con I.C. de amplitud constante

 distribuciones con frecuencia muy grande en relación a otras

 promedios de tipo industrial (producción, ventas, etc.)

Cálculo:

 para datos no agrupados y para datos agrupados por la frecuencia se busca el


valor de la variable que mas veces se repite en función de la columna ri
(frecuencia absoluta).

 para datos agrupados por la frecuencia y en I.C. se aplica la siguiente fórmula,


teniendo en cuenta el intervalo de clase que presenta la mayor frecuencia
absoluta (ri)

Estadística 75 Lic. M. Gabriela. Biondolillo


Mo= L.I. + (  1 /  1 +  2) . c

Donde:

 L.I. es el límite inferior del intervalo modal (el que tiene mayor frecuencia
absoluta)

  1 es la diferencia entre la frecuencia absoluta del intervalo modal y la


frecuencia absoluta del intervalo anterior a la clase modal

  2 es la diferencia entre la frecuencia absoluta del intervalo modal y la


frecuencia absoluta del intervalo posterior a la clase modal.

Relación empírica entre las medidas de tendencia central

Esta dada por la siguiente relación:

Media - Modo = 3 . (Media - Mediana)

Estadística 76 Lic. M. Gabriela. Biondolillo


Trabajo Práctico nº 3

Tema: Medidas de Tendencia Central


Actividades:

1. En base a los datos siguientes:


1.1 determinar las frecuencias absolutas para cada valor
1.2 construir una tabla de frecuencia con intervalo de amplitud = 1
1.3 calcular media aritmética, mediana y modo para datos no agrupados y
para datos agrupados
10.3 15.3 7.9 14.6 15.0 14.9 15.0 7.0 12.8 12.9
11.6 8.7 9.3 13.2 11.0 6.8 7.9 8.6 10.3 8.5
10.0 10.9 12.3 11.4 8.3 10.6 11.8 9.3 10.6 10.6
12.6 12.6 13.2 10.2 9.3 9.7 10.6 11.3 11.1 9.5
6.9 11.1 14.1 12.6 11.4 11.4 9.9 6.3 7.9 11.9
12.8 13.1 13.7 9.9 6.7 8.7 10.3 8.7 11.6 6.3
8.5 7.8 7.8 10.5 10.9 9.5 8.7 8.4 9.7 10.6
10.9 14.0 11.3 6.9 9.4 9.9 10.1 11.8 10.6 13.6
7.3 10.7 10.6 10.8 10.5 11.3 10.1 8.1 8.9 11.3
7.4 8.6 9.8 7.6 6.4 6.8 7.8 7.5 10.6 9.6

2. Una industria de cemento tiene registros correspondientes a la producción


semanal de este producto. Los registros de 50 semanas consecutivas en un año en
particular fueron:

Producción Q de semanas
Menos de 5 6
5-7 9
7-9 15
9-11 18
Mas de 11 2
Total 50

calcular media aritmética, mediana y modo.

3. Un supermercado tiene catalogadas a sus sucursales de acuerdo a:


 las zonas en las que están instaladas
 índice de tamaño (considerando superficie ocupada y cantidad de personal)
 volumen de ventas semanales en pesos

Estadística 77 Lic. M. Gabriela. Biondolillo


Sucursal Zona Índice de tamaño Ventas semanales
A 1 3 620
B 2 5 720
C 3 2 270
D 2 1 340
E 2 1 350
F 1 4 660
G 2 5 1120
H 3 4 720

calcular para cada variable en estudio (zona, tamaño, ventas) la medida que mejor la
represente.

4. La media aritmética de 30 acciones es de $28. Si 10 de ellas tienen un promedio


de $26 ¿cuál es el valor de las restantes?

5. Una empresa ha determinado para el mes de marzo de 2.002 una venta promedio
de $53.000; con posterioridad descubre que un error en el programa de la
computadora ha hecho que este disminuya en un 18% el importe de cada factura.
¿Cuál es en realidad el valor de la venta promedio?

6. Una empresa se encuentra discutiendo los aumentos salariales con el sindicato,


mientras el representante sindical propone un aumento de $100 para cada
empleado, el gerente quiere un aumento de 25% para cada trabajador. Le solicitan
su asesoramiento y Ud. debe indicar en función de la distribución actual de salarios
qué aumento le conviene económicamente aplicar a la empresa y qué aumento le
conviene a cada uno de los trabajadores.

Escala de sueldos Cantidad de


empleados
150-250 10
250-350 20
350-450 30
450-550 20
550-650 10

Estadística 78 Lic. M. Gabriela. Biondolillo


7. El área de recursos humanos de una empresa fabril ha recopilado la cantidad de
infortunios ocurridos en los últimos tres años. Calcular media, mediana y modo.

Cantidad de Cantidad de meses


accidentes
0 2
1 5
2 9
3 6
4 4
5 3
6 3
7 2
8 1
9 1

8. De la distribución del peso de los paquetes que se entregan en la empresa “A” por
día, calcular: media, mediana y modo.

Peso de los Cantidad de


paquetes paquetes
3-6 6
6-9 9
9-12 10
12-15 8
15-18 7

9. En una fábrica textil se hicieron observaciones en una sección de 400 telares, en


tiempos al azar, durante diez días para determinar el número de telares que estaban
trabajando en cualquier momento. Calcular media, mediana y modo.

Día Nro. de
telares
1 360
2 363
Estadística 79 Lic. M. Gabriela. Biondolillo
3 361
4 365
5 360
6 355
7 363
8 359
9 357
10 368

10. Calcular la media y la mediana del sueldo semanal de los veinte empleados que
se presentan a continuación: 42, 42, 68, 69, 69, 72, 72, 72, 72, 73, 74, 74, 75, 76,
77, 77, 79, 79, 79, 80.

14. De la siguiente distribución de ventas de la empresa XX durante las últimas 100


semanas, expresada en miles de pesos, calcular la media, mediana y modo.

Ganancias Semanas
0-4 3
4-8 8
8-12 24
12-16 30
16-20 25
20-24 6
24-28 4

Estadística 80 Lic. M. Gabriela. Biondolillo


Medidas de Dispersión

Finalidad: determinar el grado de variabilidad de los datos respecto a un


promedio

Tipos:
 rango, oscilación o recorrido
 varianza
 desviación típica o estándar
 coeficiente de variación

Rango

 mas fácil de calcular: r = Xmax – Xmin

 engañoso porque se eliminan los otros valores de la variable

Varianza

Varianza (S2) es la media aritmética de los cuadrados de las desviaciones de los


valores de la variable respecto de la media aritmética

 muy conocido y usado

 da origen a la medida de dispersión mas significativa (desviación estándar o


típica)

S2 =  ( Xi - X )2 (datos no agrupados)
n

S2 =  ( Xi - X)2 . ri (datos agrupados)


n

Estadística 81 Lic. M. Gabriela. Biondolillo


Propiedades de la varianza

 la varianza es siempre un valor positivo porque la variable está elevada al


cuadrado

 la varianza de una constante es igual a cero S2 (k) = 0

 la varianza de la suma (o resta) de una variable mas (o menos) una constante, es


igual a la varianza de la variable S2 (x + k) = S2 (x)

 la varianza de una constante por una variable es igual al producto de la constante


al cuadrado por la varianza de la variable S2 (k.x) = k . S2 (x)

Desviación Típica

 es la raíz cuadrada de la varianza S = S2

 se utiliza para comparar dos o mas distribuciones cuando están dadas en la


misma unidad de medida para determinar cuál de ellas presenta mayor o menor
variabilidad absoluta

Autoaprendizaje 3-3
Los tiempos de servicio en una muestra de taladros disponibles
para su alquiler en una empresa de herramientas se organizaron
en la siguiente tabla:

Antigüedad
(en años) Número
2-4 2
5-7 5
8-10 10
11-13 4
14-16 2

Estadística 82 Lic. M. Gabriela. Biondolillo


1. ¿Cómo se denomina este agrupamiento?
2. Calcula el tiempo medio de funcionamiento de los taladros.
3. Estima la desviación estandar muestral.
4. ¿Cuál es la varianza muestral?

Coeficiente de Variación

d = (s / x) . 100

 se utiliza para comparar la variabilidad relativa entre dos o mas distribuciones


expresadas en unidades de medida diferentes

 se usa también para determinar la representatividad de la media.

Autoaprendizaje 3-4
A un gran grupo de conscriptos de la Fuerza Aérea se le aplicaron
dos pruebas experimentales: una de aptitudes mecánicas y otra
de destreza manual. La media aritmética de la calificación en la
prueba de aptitudes mecánicas fue de 200, con una desviación
estándar de 10, la media y la desviación estandar para la prueba
de destreza manual fueron respectivamente: 30 y 6. Compara las dispersiones
relativas de los dos grupos e interpreta la respuesta.

Medidas de Asimetría

 distribución simétrica: X = Me = Mo

 distribución asimétrica positiva (derecha): Mo < Me < X

 distribución asimétrica negativa (izquierda): Mo > Me > X

 primer coeficiente de Pearson = X - Mo


S

Estadística 83 Lic. M. Gabriela. Biondolillo


 segundo coeficiente de Pearson = 3 (X - Me)
S

 coeficiente de sesgo a3 = m3 / S3

donde:

m3=  (xi – x)3 . ri


n

 resultado menor a 0: distribución asimétrica negativa (izquierda)

 resultado igual a 0: distribución simétrica

 resultado mayor a 0: distribución asimétrica positiva (derecha)

 es muy importante porque indica la posición del sesgo (como los coeficientes de
Pearson) y también el porcentaje de observaciones de la distribución que está
sesgado.

Autoaprendizaje 3-5
Las ventas semanales en una muestra de tiendas de suministros
eléctricos, se organizaron en una distribución de frecuencias.. Se
calculó la media de las ventas semanales como $105900, la
mediana como $105000 y el modo como $104500.
1. Representa las ventas en forma de un polígono de frecuencias
y observa la ubicación de la media, la mediana y el modo en el
eje X.
2. ¿La distribución es simétrica, asimétrica positiva o asimétrica negativa? Explica
tu respuesta.

Estadística 84 Lic. M. Gabriela. Biondolillo


Autoaprendizaje 3-6
Una muestra de operadores de captura de datos muy
experimentados, reveló que su velocidad media al teclear es de
87 palabras por minuto, con una mediana de 73. La desviación
estandar es 16,9 palabras por minuto. ¿Cuál es el coeficiente de
asimetría? Interprétalo.

Medidas de Apuntamiento o Curtosis

 indica el grado de agudeza en la cima de la curva que representa a la distribución,


es una medida de la altura de la curva

 curtosis: K = m4 / S4 y los resultados pueden ser:

donde:

m4 =  (xi – x)4 . ri
n

 menor a 3 (tres): curva platicúrtica o achatada

 igual a 3 (tres): curva mesocúrtica o normal

 mayor a 3 (tres): curva leptocúrtica o apuntada

Características de la Curva Normal

 Simétrica: X = Me = Mo

 Homogénea: Coeficiente de Variación está entre 0 y 25%

 Coeficiente de sesgo a3 = 0

Estadística 85 Lic. M. Gabriela. Biondolillo


 Mesocúrtica: K = 3

 entre la media y una vez la desviación típica por encima y por debajo, se tendrá el
68,3% de las observaciones

 entre la media y dos veces la desviación típica por encima y por debajo, se tendrá
el 95,5% de las observaciones

 entre la media y tres veces la desviación típica por encima y por debajo, se tendrá
el 99,7% de las observaciones

 a partir de tres, por mas que se aumente el número de veces que se repite el
valor de la desviación típica, no se tendrá el 100% puesto que la curva se
aproxima al eje horizontal pero no lo toca (curva asintótica)

Estadística 86 Lic. M. Gabriela. Biondolillo


Trabajo Práctico nº 4

Tema: Medidas de dispersión, asimetría y apuntamiento


Actividades:

1. Con los datos del ejercicio nº 1 del trabajo práctico nº 3 calcular:


 rango
 varianza para datos agrupados
 desviación típica para datos agrupados
 coeficiente de variación

2. En función de lo expresado en el ejercicio nº 5 del trabajo práctico nº 3, si la


varianza fuera de $2.500. ¿Cuál sería la desviación típica después del arreglo?

3. Electrónica Moderna es una compañía que está considerando la conveniencia de


implantar dos programas de capacitación. A dos grupos se les impartió capacitación
para realizar la misma tarea. Para adiestrar al grupo 1 se requirieron en promedio 32
horas para capacitar a cada empleado con una varianza de 64 horas. En el segundo
grupo se necesitó un promedio de 19 horas con una varianza de 81 horas. ¿Cuál
programa mostró la menor variabilidad relativa en sus resultados?

4. Hay varias medidas posibles del desempeño de ventas, entre ellas la constancia
con que un vendedor cumple con las metas establecidas. Los datos siguientes
representan el porcentaje de la meta lograda por tres vendedores en los últimos 5
años.
Patricia 88 68 89 92 103
Juan 76 88 90 86 79
Francisco 104 88 118 88 123
en función de lo expresado, ¿cuál de los vendedores tuvo el mejor desempeño?

5. El consejo de administración de una corporación está estudiando la posibilidad de


adquirir una de dos compañías y con mucho detenimiento analiza la administración
de cada una en relación a su inclinación a correr riesgos. En los últimos 5 años, la
primera compañía alcanzó un promedio de rendimiento sobre la inversión del 28%
con una desviación típica de 5,3%. La segunda tuvo un rendimiento sobre la
Estadística 87 Lic. M. Gabriela. Biondolillo
inversión promedio de 37,8% con una desviación típica de 4,8%. Si suponemos que
el riesgo se acompaña con una mayor dispersión relativa, ¿cuál de estas dos
empresas ha aplicado una estrategia mas riesgosa?

6. Una empresa analiza los cien últimos balances mensuales y encuentra que sus ganancias son normales a través
de ellos. Calcular las medidas necesarias para comprobar esta afirmación.
Ganancias Cantidad
55-59 2
59-63 9
63-67 24
67-71 28
71-75 24
75-79 7
79-83 3
83-87 3

7. Una empresa holliwodense de repartos, está escogiendo un grupo de extras para


una película, las edades de los primeros 20 varones entrevistados son: 50, 54, 56,
55, 55, 61, 49, 60, 52, 51, 57, 59, 56, 62, 57, 52, 56, 54, 59, 49. El director de la
película quiere hombres cuya edad se agrupe estrechamente alrededor de los 55
años. Como es un entusiasta aficionado de la estadística, sugiere que una
desviación estándar de 3 años sea aceptable. ¿Cumple con el requisito este grupo
de extras?

8. El administrador de un hospital mendocino realizó una encuesta sobre el número


de días que 200 pacientes escogidos al azar permanecen en él después de ser
sometidos a una operación. He aquí los datos:

Estancia en el 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24


hospital (en
días)
Número de 24 83 52 22 11 5 2 1
pacientes
teniendo en cuenta los datos precedentes ¿constituye una distribución de tipo
normal?
Estadística 88 Lic. M. Gabriela. Biondolillo
9. Con las dos siguientes muestras se describen las edades de los estudiantes que
asisten al programa diurno y al programa nocturno de la carrera de administración
en la Universidad Central. Si la homogeneidad del grupo escolar es un factor positivo
del aprendizaje, aplica una medida de variabilidad relativa que indique a cuál de los
dos grupos será mas fácil enseñarle.
Programa diurno: 24, 30, 28, 23, 25, 22, 26, 27, 28, 25.
Programa nocturno: 26, 33, 29, 28, 27, 29, 33, 34, 27, 28.

10. Con el propósito de estimar la demanda futura, la Fiat efectuó un estudio en el


que preguntó a un grupo de matrimonios cuántos automóviles deberán poseer en el
año 2.001 los que deseen economizar combustible. En cada matrimonio la compañía
sacó el promedio de las respuestas de ambos cónyuges para obtener la respuesta
global del matrimonio. Las respuestas fueron después tabuladas en una distribución
de frecuencias, ¿cuáles son sus características respecto de la distribución normal?
Número de 0-0.49 0.50-0.99 1.00-1.49 1.50-1.99 2.00-2.49 2.50-2.99
autos
Frecuencia 2 14 23 7 4 2

Estadística 89 Lic. M. Gabriela. Biondolillo


Autoevaluación del módulo nº 3

Escribe en la línea la respuesta correcta.


1. La _________________________ se determina ordenando los datos en forma
creciente o decreciente y seleccionando el valor central.
2. La __________________________ no puede calcularse si la distribución de
frecuencias tiene una clase de extremos abiertos.
3. Si la media es mayor que la mediana, la distribución es
________________________ asimétrica.
4. Si la media, la mediana y el modo son iguales, la distribución es
________________________.
5. La ____________________________ no se recomienda si se tiene un valor de la
variable extremadamente grande en el conjunto de datos.
6. Si se suman las desviaciones de los valores de la variable respecto de la media,
el resultado es siempre ______________________________.
7. El valor que ocurre con más frecuencia en un conjunto de datos es el
____________________.

Indica si la expresión es verdadera o falsa. Si es falsa, anota la respuesta


correcta.
1. Una medida de la agudeza de una curva de distribución es el sesgo.
2. Cuando trabajamos con datos agrupados en intervalos de clase, podemos
calcular una media aproximada si suponemos que cada valor de una clase dada
es igual a su punto medio.
3. Si la curva de una cierta distribución tiene el extremo más largo hacia la izquierda
de la escala de medición del eje horizontal, se dice que la distribución está
negativamente sesgada.
4. La dispersión de un conjunto de datos da una cierta visión de la confiabilidad de
la media aritmética.
5. La varianza, al igual que la desviación estándar, toma en cuenta cada una de las
observaciones del conjunto de datos.
6. Una desventaja de utilizar el rango para medir la dispersión es que no toma en
cuenta la naturaleza de las variaciones entre la mayoría de las observaciones.

Estadística 90 Lic. M. Gabriela. Biondolillo


7. La varianza indica la distancia promedio de cualquier observación del conjunto de
datos con respecto a la media.

Estadística 91 Lic. M. Gabriela. Biondolillo


Módulo nº 4:
ANALISIS BIVARIABLE

Objetivos:
1. Conocer las características de una serie cronológica.
2. .Identificar los componentes de una serie de tiempo y las
características de cada uno de ellos
3. Analizar el objetivo de la regresión lineal simple.
4. Determinar una ecuación que pueda usarse en pronósticos.
5. Presentar las consideraciones en que se basa el análisis de
regresión.
6. Determinar la fuerza de la relación entre las variables a través del
uso del coeficiente de determinación.

Estadística 92 Lic. M. Gabriela. Biondolillo


Series Cronológicas

Ya hemos estudiado las series estadísticas en general y hemos detallado su


representación gráfica; pero las hemos estudiado con carácter estático (en un
momento del tiempo).

Dentro de estas series, merecen una atención especial aquellas que tienen el
tiempo entre sus variables, series cronológicas o series de tiempo.

Concepto

Llamaremos serie cronológica a aquella en la algunos de sus caracteres se


mide en unidades de tiempo.

Ya hemos visto que el tiempo es un carácter cuantitativo, el resto de los


caracteres de la serie pueden ser cualitativos o cuantitativos.

Estas series podemos expresarlas matemáticamente como una función del


tiempo Y= F(t) y estudian el comportamiento de una variable Y (producción, ventas,
precios, etc.) a lo largo del tiempo t.

En cuanto a las unidades de tiempo, algunas tienen duración constante


(horas, días, etc.), pero otras son variables (meses, años, etc.). Este carácter
variable puede influir en los resultados de algunos estudios, y debe tenerse en
cuenta al elegir las unidades de tiempo.

Representación gráfica

La representación gráfica se hace en un plano cartesiano. En el eje horizontal


o abscisa se coloca el tiempo (años, meses, semanas, días); en el eje vertical u
ordenada van los valores correspondientes a la variable Y.

Estadística 93 Lic. M. Gabriela. Biondolillo


Para cada unidad de tiempo se tendrá un valor de Y, el cual se representa en
el plano mediante un punto, y habrá tantos puntos como periodos observados
tengamos, los que al ser unidos, darán una línea.

Factores que la afectan

Los valores de la variable Y son distintos en cada periodo, de forma que la


gráfica de la función evoluciona al transcurrir el tiempo. A esta evolución la
llamaremos “movimiento de la serie”.

Cualquier serie cronológica real, estará sujeta a un movimiento mas o menos


complejo que podrá descomponerse en cuatro movimientos característicos
principales que llamaremos “componentes de la serie”, estos son:
- tendencia
- variaciones estacionales
- variaciones cíclicas
- variaciones aleatorias

Tendencia: son aquellas variaciones suaves que se suceden en un periodo


relativamente largo. El periodo debe ser largo (mas de cinco) para poder establecer
una línea de tendencia que sea representativa o significativa. La línea de tendencia
muestra la evolución general de la serie y puede determinarse por varios métodos.

Variaciones estacionales: estos movimientos representan, durante años


sucesivos, la evolución de la serie a lo largo de cada periodo de tiempo dentro de
cada año. Generalmente están ligadas a las estaciones del año (verano, otoño,
invierno, primavera), aunque también corresponden a cambios periódicos que se
repiten en intervalos de tiempo más cortos; por ejemplo: consumo de energía en las
24 horas del día. Estos movimientos anuales de la serie son debidos a sucesos
recurrentes que se repiten anualmente y aunque los valores dentro de cada año no
sean los mismos, las gráficas evolucionan casi idénticamente.

Variaciones cíclicas: son fluctuaciones a largo plazo, mas o menos


periódicas, que se repiten cada cierto numero de años y que, a diferencia de las
Estadística 94 Lic. M. Gabriela. Biondolillo
variaciones estacionales, es difícil determinar el periodo o ciclo, ya que no se puede
saber con exactitud cuándo comienza y cuándo termina, tal es el caso de las
fluctuaciones cíclicas originadas en la actividad económica (expansión, recesión).

Variaciones aleatorias: son aquellas que se presentan en forma accidental,


siendo difícil su predicción y que alteran la serie de un modo apreciable. Por
ejemplo: terremotos, inundaciones, huelgas, etc. Aunque estos hechos producen
variaciones en la serie que solo duran un corto intervalo de tiempo, las
consecuencias pueden ser tan intensas, que sean capaces de alterar otros
movimientos de la serie (originar un nuevo ciclo, variar la curva de tendencia, etc.).
No se les puede aplicar los métodos de ajuste.

Toda estas series cronológicas deben ajustarse a través de un recta promedio


que las defina, esta recta permite, a través de su pendiente determinar si la variable
va en ascenso o en descenso, y además se puede observar el valor probable que la
misma presentará en el futuro; temsa que se desarrollan a continuación.

EJEMPLO

Período Valor
1989 18 Valor Lineal (Valor)
1990 20
1991 19 30
1992 24
25
1993 22
1994 23 20
1995 24 15
1996 25
10
1997 24
1998 26 5
1999 0
1996
1 9 89

1 99 0

1 9 91

1 99 2

1 9 93

1 9 94

19 9 5

1 99 7

19 9 8

1 9 99

20 0 0

2 0 01

2000
2001

Es importante destacar que este tipo de ajuste, sólo es válido cuando se


tienen varios períodos y el entorno en que se encuentra inmersa la variable es
similar a través de los distintos momentos. Esta herramienta es muy usada en
materia comercial y económica en estos momentos en nuestro país porque los

Estadística 95 Lic. M. Gabriela. Biondolillo


factores exógenos, tales como inflación, cotización del dólar, índices de producción,
se han mantenido similares en los últimos años.

Nubes de dispersión de puntos: tipos.

A través de la representación gráfica de las series cronológicas, podemos


distinguir cuatro tipos de nubes de dispersión de puntos:
- lineal
- exponencial
- parabólicas
- aleatorias

Ajustes

Realizaremos el análisis sobre la tendencia por ser el que habitualmente se


presenta en las series de tiempo. Puede tomar diferentes formas: rectilíneo,
parabólico o exponencial.

La mejor línea es aquella que mejor representa a ese conjunto de puntos. La


gráfica ayuda mucho a determinar la línea y la dirección que toma. Sin embargo
puede afirmarse, que no es posible determinar con absoluta certeza la bondad de la
adaptación de una línea, pues solamente el juicio personal y la experiencia del
estadístico, son los elementos que se pueden poner en juego en la elección del
mejor ajuste.

La nube de dispersión de puntos aleatoria no puede someterse a ningún tipo


de ajuste.

Para el ajuste de la nube de puntos parabólica, se trabaja con un sistema de


tres ecuaciones con dos incógnitas donde la primera ecuación esta elevada a la
tercer potencia, la segunda ecuación al cuadrado y la tercera ecuación a la primer
potencia. En el ajuste de la nube de puntos exponencial trabajamos con el logx.
Analizaremos en detalle el ajuste de la nube de puntos lineal.
Estadística 96 Lic. M. Gabriela. Biondolillo
Ajuste rectilíneo: existen varios métodos para realizar el ajuste de una recta
en una serie cronológica, a saber: método de la mano alzada, puntos seleccionados,
semipromedios y mínimos cuadrados. El primero y el último es el que
desarrollaremos a continuación.

1- método de la mano alzada: se lo conoce también como método gráfico.


Es muy utilizado por personas de mucha experiencia; con su aplicación se obtienen
resultados muy satisfactorios, especialmente cuando la serie presenta muy pocas
variaciones o estas se producen en forma suave. El inconveniente que presenta este
método es la no existencia de un instrumento que juzgue adecuadamente la bondad
de la línea, por otra parte, por mas experta que sea la persona, una serie puede dar
origen a diferentes líneas, de ahí que se lo considere como un método muy
subjetivo.

El proceso que se sigue en la aplicación del método de mano alzada, consiste


en dibujar la línea poligonal correspondiente a los datos originales, luego se estudia
su comportamiento, para después trazar una línea recta a mano alzada a través de
esos puntos. Si se prolonga la línea hasta el año que se desea estimar, leeremos en
el eje vertical el valor, precio o cantidad de Y para ese año. Algunos consideran que
una vez trazada la línea recta, se pueden determinar dos puntos, especialmente el
primero y el último y luego obtener una ecuación para la línea de tendencia.

2- método de los mínimos cuadrados: los métodos anteriores permiten


obtener una regular aproximación de la tendencia que presenta la serie. El método
mas utilizado para realizar un buen ajuste es el conocido como el de los mínimos
cuadrados.

Este método no solo sirve para ajustar una línea recta, sino también para
ajustar tendencias no lineales, tales como la parabólica, exponencial, etc. Se trabaja
asimismo con la ecuación general de la recta Y= bx + c.

Para calcular el valor que tomara la variable en el futuro, es necesario


resolver dos ecuaciones normales en forma simultánea:
Estadística 97 Lic. M. Gabriela. Biondolillo
Yi = b .  Xi + nc
Xi Yi = b .  Xi2 + c . Xi

Predicción del futuro

La línea resultante del ajuste puede extenderse al futuro y nos insinúa la


tendencia que presentara esa serie. Algunos autores critican este proceso de
vaticinio, por el hecho de estar fundamentado en cifras históricas, que reflejan una
vivencia del pasado. Sin embargo, es un hecho que cualquier proceso futurista
necesita fundamentarse en el presente y en el pasado. Así tenemos que pensar que
el comportamiento futuro de la variable dependerá de que las condiciones bajo las
cuales se dieron las informaciones, sigan siendo las mismas en el futuro. Por esa
razón se recomienda que una predicción no sea mayor de cinco años ya que las
condiciones pueden variar. Por otra parte, una buena selección de la línea nos dará
una mejor aproximación entre el valor estimado y el valor real.

Su importancia en cualquier empresa no es discutible. En la vida comercial es


interesante conocer las fluctuaciones de las ventas a través del tiempo y las causas
que originan esas variaciones; todo esto hará pensar sobre una posible ampliación o
reducción de los stocks de mercancía, el volumen de producción, niveles de precios,
espacio físico, etc.

Una línea que represente una serie cronológica puede ser considerada casi
recta pero no debemos suponer que continuara en la misma dirección, salvo que las
condiciones que la originan permanezcan constantes. Por esto, al trazar una línea ya
sea recta, parabólica o exponencial, debemos analizar en primer lugar las causas y
evaluar la probabilidad de que así ocurra, antes de iniciar cualquier proceso de
estimación.

Estadística 98 Lic. M. Gabriela. Biondolillo


Autoaprendizaje 4-1
Los datos sobre la producción anual de sillas mecedoras producidas por una
empresa de Cuyo desde 1.993 se presentan a continuación:

Año Producción
(en miles)
1.993 4
1.994 8
1.995 5
1.996 8
1.997 11
1.998 9
1.999 11
2.000 14
1. Grafica los datos de producción.
2. Determina la ecuación de estimación por el método de los mínimos cuadrados.
3. Con base en la ecuación de la recta ¿cuál será la producción estimada para el
año 2.003?

Regresión y Correlación

Todos los días, los administradores toman decisiones profesionales y


personales basadas en predicciones de hechos futuros. Para hacer estas
predicciones, se basan en la relación (intuitiva y calculada) entre lo que ya se sabe y
lo que se debe estimar: Si los responsables de la toma de decisiones pueden
determinar cómo lo conocido se relaciona con el evento futuro, pueden ayudar
considerablemente al proceso de toma de decisiones. Este es el objetivo de este
tema: cómo determinar la relación entre variables.

La regresión y los análisis de correlación nos mostrarán cómo determinar


tanto la naturaleza como la fuerza de una relación entre dos variables.
Estadística 99 Lic. M. Gabriela. Biondolillo
En el análisis de regresión, desarrollaremos una ecuación de estimación, es
decir, una fórmula matemática que relaciona las variables conocidas con la variable
desconocida. Luego, una vez que conocemos el patrón de esta relación, podemos
aplicar el análisis de correlación para determinar el grado en el que están
relacionadas las variables. El análisis de correlación, entonces, nos dice qué tan
bien la ecuación de estimación realmente describe la relación.

Tipos de relaciones

La regresión y correlación se basan en la relación, o asociación, entre dos


variables. La variable conocida se llama la variable independiente; la variable que
tratamos de predecir es la variable dependiente. Por ejemplo: los científicos saben
que existe una relación entre las ventas anuales de latas de aerosoles (variable
independiente) y la cantidad de fluorocarbonos liberados en la atmósfera cada año
(variable dependiente).

El ejemplo precedente es una ilustración de asociación directa entre la


variable independiente y la variable dependiente, es decir, al incrementarse la
variable independiente, la variable dependiente también se incrementa. Podemos
representar gráficamente una relación directa al ubicar la variable independiente en
el eje X y la variable dependiente en el eje Y, de manera que la pendiente de la línea
resultante es positiva porque Y se incrementa al incrementarse X.

Las relaciones también pueden ser inversas, en estos casos la variable


dependiente decrece al aumentar la variable independiente; de manera tal que la
gráfica se caracteriza por una pendiente negativa (la variable Y disminuye al
aumentar la variable independiente X).

A menudo encontramos una relación causal entre las variables, esto es, la
variable independiente “ocasiona” que la variable dependiente cambie. Pero en
muchos casos, otros factores ocasionan los cambios tanto en la variable
dependiente como en la independiente

Estadística 100 Lic. M. Gabriela. Biondolillo


Por esta razón, es importante que se consideren las relaciones encontradas
por la regresión como relaciones de asociación pero no necesariamente de causa y
efecto. A menos que se tengan razones específicas para creer que los valores de la
variable dependiente son ocasionados por los valores de la variable independiente,
no se debe inferir causalidad de las relaciones que se encuentren mediante la
regresión.

Diagramas de dispersión

El primer paso en la determinación de si existe relación entre dos variables es


examinar la gráfica de los datos observados o conocidos. Como ya sabemos, esta
gráfica se denomina diagrama de dispersión.

Un diagrama de dispersión nos puede dar dos tipos de información.


Visualmente, podemos buscar patrones que indiquen que las variables están
relacionadas. Entonces, si esto sucede, podemos ver qué tipo de línea, o ecuación
de estimación, describe esta relación.

También podemos trazar o ajustar una línea recta a través de nuestro


diagrama de dispersión para representar la relación, de manera análoga al
procedimiento empleado en el tema anterior (series de tiempo). Cuando los puntos
de datos están relativamente cerca de la línea de ajuste, podemos decir que existe
un alto grado de asociación entre las variables.

La relación entre las variables X e Y también puede tomar la forma de una


curva y la dirección de la curva puede indicar si la relación curvilínea es directa o
inversa.

Estimación mediante la línea de regresión

Estadística 101 Lic. M. Gabriela. Biondolillo


La ecuación para una línea recta donde la variable dependiente Y esta
determinada por la variable independiente X es, como sabemos, la ecuación general
de la recta Y= b.x+c.

Usando esta ecuación, podemos tomar un valor dado de X y calcular el valor


de Y. La b es la pendiente de la línea y representa qué tanto cada cambio de unidad
da la variable independiente X cambia la variable dependiente Y. La c se denomina
la “intersección Y” u “ordenada al origen” porque su valor es el punto en el cual la
línea de regresión cruza el eje Y, es decir, el eje vertical. Tanto b como c son
constantes numéricas y su valor podemos encontrarlo empleando el método de los
mínimos cuadrados de manera similar a su aplicación para el análisis de series
cronológicas.

Yi = b .  Xi + nc
Xi Yi = b .  Xi2 + c . Xi

Matemáticamente la línea obtenida tendrá un buen ajuste si minimiza el error


entre los puntos estimados en la línea y los verdaderos puntos observados que se
utilizaron para trazarla.

Análisis de correlación

El análisis de correlación es la herramienta estadística que podemos usar


para describir el grado hasta el cual una variable está linealmente relacionada con
otra., es decir, se utiliza junto con el análisis de regresión para medir qué tan bien la
línea de regresión explica los cambios de la variable dependiente Y.

Los estadísticos han desarrollado una medida para describir la correlación


entre dos variables: el coeficiente de determinación (r2), que permite medir la fuerza
de la asociación que existe entre dos variables X e Y.

·r = c .  Y + b  XY – nY2
 Y2 - nY2
Estadística 102 Lic. M. Gabriela. Biondolillo
Autoaprendizaje 4-2
Un agrónomo experimentó con distintas cantidades de fertilizante líquido en una
muestra de parcelas del mismo tamaño. La cantidad de
fertilizante y el rendimiento son:

Parcela Cantidad de fertilizante Rendimiento


(en toneladas) (cientos de bushels)
A 2 7
B 1 3
C 3 8
D 4 10
1. El agrónomo está interesado en predecir el rendimiento ¿Cuál es la variable
dependiente? ¿Cuál es la variable independiente?
2. Traza un diagrama de dispersión.

Para cerrar el desarrollo de los conceptos básicos del análisis bivariable, te


recomiendo la lectura de los capítulos 9 y 10 del libro complementario.

Estadística 103 Lic. M. Gabriela. Biondolillo


Trabajo Práctico nº 5
Tema: Análisis bivariable
Actividades:

1. Calcula el valor que tomará la variable en el año 2004.


Años Ventas
1.988 6613
1.989 6745
1.990 6548
1.991 6487
1.992 6652
1.993 6213
1.994 6415
1.995 6111
1.996 6175
1.997 5925
1.998 6019
1.999 6258
2.000 6176
2.001 5998

2. Calcula el valor que tomará la variable en el año 2010.


Años Producción
1.960 17150
1.970 20616
1.980 23962
1.990 28237
2.000 32322
2.010

3- Consideremos los datos arbitrarios que aparecen en la siguiente tabla


correspondientes al periodo 1.970 - 1.998, de una serie no continua. Estimar el valor
de Yi para el 2.005.

Años Yi
1.970 12
1.978 18
1.985 20
1.992 36
1.998 54

4- En función de los datos de ventas (en miles de pesos) de la empresa XX durante los últimos 10 años calcular
el valor de las ventas estimadas para el año 2.004 suponiendo que se mantienen las mismas condiciones.
Estadística 104 Lic. M. Gabriela. Biondolillo
Años Ventas
1.992 584
1.993 573
1.994 498
1.995 552
1.996 601
1.997 683
1.998 654
1.999 740
2.000 788
2.001 800

5- El editor en jefe de un importante periódico de la provincia ha intentado convencer


al dueño del periódico para que mejore las condiciones de trabajo en el taller de
prensas. Está convencido de que, cuando trabajan las prensas, el grado de ruido
crea niveles no saludables de ansiedad y tensión. Recientemente hizo que un
psicólogo realizara una prueba durante la cual los prensistas se situaron en cuartos
con niveles variables de ruido y luego se les hizo otra prueba para medir niveles de
ansiedad. La siguiente tabla muestra el índice de su grado de ansiedad y el nivel de
ruido al que se vieron expuestos (1.0 es bajo y 10.0 es alto).

Nivel de ruido 4 3 1 2 6 7 2 3
Grado de 39 38 16 18 41 45 25 38
ansiedad

a- Representa gráficamente estos datos


b- Desarrolla la ecuación de estimación que describa los datos
c- Pronostica el grado de ansiedad que podríamos esperar cuando el nivel de ruido
es 5.
d- Calcula el coeficiente de determinación y elabora su interpretación.

6- Una compañía administra a sus vendedores una prueba en adiestramiento de ventas antes de permitirles salir a
trabajar. La administración de la compañía está interesada en determinar la relación entre las calificaciones de la
prueba y las ventas hechas por esos vendedores al final de un año de trabajo. Los siguientes datos se recolectaron
de 10 agentes de ventas que han estado en el campo durante un año.
Número de Calificación Nro de
vendedor de la prueba unidades
vendidas
1 2.6 95
Estadística 105 Lic. M. Gabriela. Biondolillo
2 3.7 140
3 2.4 85
4 4.5 180
5 2.6 100
6 5.0 195
7 2.8 115
8 3.0 136
9 4.0 175
10 3.4 150

a- Encuentra la línea de regresión de mínimos cuadrados que podría usarse para


predecir ventas en función de las calificaciones de las personas en el
adiestramiento.
b- ¿En cuánto se incrementa el número esperado de unidades vendidas por cada
incremento de un punto en la calificación de la prueba?
c- Utiliza la línea de regresión de mínimos cuadrados para predecir el número de
unidades que vendería una persona en adiestramiento que recibió una
calificación de prueba promedio.
d- Calcula el coeficiente de determinación e indica su significado.

Estadística 106 Lic. M. Gabriela. Biondolillo


Autoevaluación del módulo nº 4

Indica si la expresión es verdadera o falsa. Si es falsa, anota la respuesta


correcta.
1. La tendencia, como componente de una serie cronológica, representa la
dirección a largo plazo de una serie temporal.
2. Las variaciones cíclicas son fluctuaciones que se presentan en forma imprevista,
siendo imposible su predicción.
3. Las series cronológicas son aquellas variaciones suaves que se suceden en un
periodo relativamente largo de tiempo.
4. La recta obtenida por el método de los semipromedios tiene su principal ventaja
en la sencillez y rapidez del cálculo con relación a los otros métodos conocidos.
5. El método de los mínimos cuadrados es el más exacto para obtener la recta de
ajuste.
6. Las variaciones estacionales de una serie cronológica implican patrones de
cambio en el lapso de una año que tienden a repetirse anualmente; por lo que
siempre se relaciona con las estaciones del año.
7. El inconveniente del método de la mano alzada para realizar el ajuste rectilíneo
en una serie cronológica es la no-existencia de un instrumento que juzgue
adecuadamente la bondad de la línea, por lo que se torna un método muy
subjetivo.
8. El análisis de regresión y correlación se basa en la relación o asociación entre
dos variables, la variable conocida se llama variable dependiente y la variable
que tratamos de predecir es la variable independiente.
9. El coeficiente de determinación permite medir la fuerza de la asociación que
existe entre dos variables X e Y.
10. Es importante considerar las relaciones encontradas por la regresión como
relaciones de asociación pero no necesariamente como relaciones causales.

Estadística 107 Lic. M. Gabriela. Biondolillo


Módulo nº 5:
INDICADORES ECONÓMICOS

Objetivos:
1. Elaborar índices ponderados y no ponderados.
2. Elaborar índices de precio y cantidad de aplicación especial.
3. Explicar cómo se elabora y utiliza un índice de precios al
consumidor.
4. Citar las aplicaciones especiales del índice de precios al
consumidor para determinar el ingreso real, poder adquisitivo
del dinero y demás uso de tipo económico.

Estadística 108 Lic. M. Gabriela. Biondolillo


Introducción

Los números índices son cifras relativas, expresadas en términos


porcentuales que sirven para indicar las variaciones que presenta una serie de
observaciones, cuando se comparan respecto a una de ellas, tomada como punto de
referencia y denominada periodo base.

Por lo general los números índices se constituyen en series cronológicas


cuando se utilizan para indicar las variaciones porcentuales de una variable a través
del tiempo.

En una serie corta, el periodo base corresponderá al primer valor de la serie;


en una serie larga, debe seleccionarse aquel periodo que haya sido mas estable, es
decir, que no presente cambios bruscos debido a factores, ya sean internos o
externos. En algunas ocasiones, la selección del periodo que debe tomarse como
base dependerá de lo que se quiera presentar, por ejemplo si se examina una serie
referente a los precios de un artículo, se tendrá que el índice de variación será
mucho mas alto, cuanto mas lejano se encuentre el periodo base; y será mas baja
la variación cuanto mas cercano esté el periodo base.

Los números índices son muy usados en el análisis de ventas, producción,


precios, costos, beneficios, aumentos de capital, comercio exterior, etc. y en especial
cuando se quieren comparar dos series, como por ejemplo, los cambios en los
precios de dos o mas artículos durante un periodo determinado de tiempo. Por lo
tanto habrá necesidad de tener cuidado con su uso, pues a diferencia de lo que la
mayoría cree, el índice no mide, solo es un indicador que pretende reflejar el
comportamiento de ciertas observaciones en forma aproximada.

Según la composición, el índice puede ser: simple o compuesto. A su vez los


índices compuestos se clasifican en agregativos o de promedios.

Estadística 109 Lic. M. Gabriela. Biondolillo


Índices simples

Un índice simple se obtiene dividiendo cada precio, cantidad o valor de una


serie dada ya sea en periodos anuales, mensuales, etc., por el precio, cantidad o
valor de uno de esos periodos, el cual ha sido tomado como base o punto de
referencia, y el resultado de ese cociente se multiplica por cien.

La fórmula general es: 1t o = Xt . 100


Xo siendo:

1: índice
t: periodo que se analiza
o: periodo base
Xt: precio, cantidad o valor del periodo que se investiga
Xo: precio, cantidad o valor del periodo considerado como base

El índice simple también se puede calcular sin tener fija la base, en este caso
cada índice se obtiene cambiando de base. Se dice, que en una serie, los índices
son de base variable, cuando a cada observación se la divide por el valor de la
observación inmediatamente anterior, multiplicándolo por 100. Los incrementos o
disminuciones que se presentan para cada periodo se dan respecto al año
inmediatamente anterior.

Autoaprendizaje 5-1
De acuerdo con Fortune, las ventas anuales de algunas
empresas industriales seleccionadas fueron:

Estadística 110 Lic. M. Gabriela. Biondolillo


Rango Compañía Ventas
(en millones de U$S)
1 GM 101781,9
2 Exxon 76416,0
3 Ford 71643,4
4 IBM 54217,0
5 Chrysler 26257,7
1. Expresa las ventas anuales de General Motors en forma de índice usando las
ventas de International Business Machines como base.Interpreta el resultado.
2. Expresa las ventas anuales de Chrysler como un índice usando las ventas de
IBM como base. Interpreta el resultado.

Índices eslabonados

El índice simple con base variable presenta la ventaja de indicar las


variaciones para cada periodo respecto del anterior, pero se puede transformar en
un índice con base fija, el cual se obtiene mediante sucesivas multiplicaciones de los
relativos de cada eslabón.

1t o = 100 x R10 x R21 x R32 x....Rt t-1

Índices agregativos simples

Son los índices mas usados, especialmente cuando se tiene una serie de
precios correspondientes a un grupo de artículos dados en unidades de medida
diferentes. Estos índices se calculan teniendo en cuenta la suma de precios,
cantidades o valores de un grupo de artículos para un periodo, dividida por la suma
de los precios, cantidades o valores para ese grupo de artículos de otro periodo
considerado como base.

1to =  Xt . 100
 Xo

Estadística 111 Lic. M. Gabriela. Biondolillo


Autoaprendizaje 5-2
Se va a elaborar un índice de precios de ropa para el 2001 con
base en 1990. Los precios de 1990 y 2001 y las cantidades
consumidas en 1990, se muestran a continuación:

Artículo Precio (1990) Cantidades vendidas (1990) Precio (2001)


Vestidos 35 500 unidades 65
Zapatos 40 1200 pares 90
1. Suponiendo que el número vendido permanece constante, esto es, que se
vendió el mismo número en 1.990 y 2001, ¿cuál es el índice ponderado de
precios para 2001 usando como base 1990? Interpreta el resultado.

Índices compuestos

Para explicar los índices compuestos consideraremos como punto de partida


los índices agregativos simples, utilizados en el análisis de un grupo de artículos sin
tener en cuenta la importancia que alguno de ellos pueden presentar en relación al
conjunto. Esa importancia se denomina ponderación.

Existe gran cantidad de fórmulas para calcular índices ponderados, cuyo


empleo dependerá de la naturaleza misma del problema. En los índices que se
expondrán, las ponderaciones son las cantidades o los precios.

Índices de precios

 Índice de Laspeyres: puede interpretarse como la relación existente entre los


precios actuales de un grupo de artículos con los precios de esos mismos
artículos considerados en el periodo base, manteniéndose constante como
ponderación las cantidades del periodo base.

LI =  Pt x Qo x 100
Estadística 112 Lic. M. Gabriela. Biondolillo
 Po x Qo

 Índice de Paasche: se interpreta como la relación existente entre los precios


actuales de un grupo de artículos, con los precios de esos mismos artículos en el
periodo base, manteniéndose constantes las ponderaciones que corresponden a
las cantidades de dichos artículos dadas en el periodo que se investiga.

PI =  Pt x Qt x 100
 Po x Qt

 Índice de Fisher: es un promedio geométrico que se define como la raíz cuadrada


del producto del índice de Laspeyres por el de Paasche.

FI = LI x PI

Índices de cantidad

Las fórmulas que se dan para el cálculo de los índices de cantidad de


Laspeyres, Paasche y Fisher son muy parecidas a la de los precios, con la diferencia
de que en estos la ponderación son los precios.

LJ =  Po x Qt x 100
 Po x Qo

PJ =  Pt x Qt x 100
 Pt x Qo

FJ = LJ x PJ

Autoaprendizaje 5-3

Estadística 113 Lic. M. Gabriela. Biondolillo


Los precios al mayoreo y los volúmenes producidos de producto
agrícola son:

Artículo Precio Producción


1995 2001 1995 2001
Trigo (bushel) 2.00 4.00 100 700
Huevos (doc.) 0.30 0.20 1000 800
Cebada (tn) 60.00 70.00 50 110
1. Usando el método de Laspeyres, calcula un índice para el volúmen de la
producción agrícola del 2001 considerando como base 1995. Interpreta el índice.

Uso de los números índices

 Cálculo del salario o ingreso real


 proceso de conversión del salario nominal en real: deflactación
 proceso de transformación de valores expresados a precios corrientes en
valores a precios constantes.
 para el cálculo se requiere el traslado de la base del índice de precios al
consumidor.

Salario real = Salario nominal x 100


IPC

 Cálculo del poder de compra


 también se denomina poder adquisitivo del dinero o valor del dinero
 relación existente entre la unidad monetaria y la cantidad de bienes que se
pueden obtener a cambio de ella.
 para el cálculo se requiere el traslado de la base del índice de precios al
consumidor.

Estadística 114 Lic. M. Gabriela. Biondolillo


Poder adquisitivo = ___1__ x 100
IPC

IPA = IPCo x 100


IPCt

 Porcentaje de desvalorización
 Indica la pérdida del poder de compra para un periodo con respecto a otro
considerado como base
% de desvalorización = 100 x [ 1 - IPCo/IPCt ]

 Porcentaje de devaluación: indica la pérdida de valor de una moneda en


relación a las monedas extranjeras y, por lo general, se hace referencia al dólar.
 En primer lugar se obtiene el porcentaje de aumento o disminución en el
tipo de cambio
% alza = 100 x [ Tt/To - 1 ]
 el cálculo del porcentaje de devaluación para el mismo periodo se realiza:
% de devaluación = 100 x [ 1 - To/Tt ]

 Índice de producción: se aplica la fórmula de los índices simples


Índice de producción = Pt/Po x 100

 Índice de productividad: indica la relación existente entre los resultados


obtenidos y los insumos utilizados en un periodo. Puede calcularse de dos
formas:
 dividiendo cada índice de producción por su respectivo índice de obreros y
el valor resultante se multiplica por 100

Índice de productividad = Índice de producción x 100


Índice de obreros
 dividiendo la producción de cada año por el número de obreros,
obteniéndose la productividad por obrero. Luego, cada valor resultante se
divide por uno de la serie considerado como base
Estadística 115 Lic. M. Gabriela. Biondolillo
Índice de productividad = Productividad del periodo t x 100
Productividad del periodo o

Proporciones, porcentajes, razones y tasas

Constantemente estamos hablando de índices o indicadores, lo que puede


dar lugar a cierta confusión acerca de términos tales como índices, proporciones,
porcentajes y tasas, así que es conveniente hacer algunas aclaraciones.

Los números índices, tal como se ha visto, relacionan una o mas variables en
un periodo dado (colocado como numerador) con la misma variable o variables en
otro periodo, denominado base (como denominador) y sirven para indicar las
variaciones que presenta una variable en función de uno de sus valores que se toma
como referencia o término de comparación. Como cada relativo lo multiplicamos por
100, los números índices son porcentajes de variación que presenta cada valor de la
variable con respecto al tomado como referencia. Estos números índices
generalmente son aplicados en series cronológicas.

La razón, la proporción y la tasa tienen en común, como los números índices,


la relación de dos valores, el uno como numerador y el otro como denominador,
siendo el cociente de dividir una cantidad por otra, pero con las siguientes
diferencias:

En la razón el valor considerado como numerador no debe estar contenido en


el valor correspondiente al denominador, en consecuencia, la razón puede ser un
número superior a la unidad. En el caso de que la razón se multiplique por 100 se
tiene nuevamente un porcentaje. Por ejemplo: supongamos que el número de
personas que visitan un centro comercial en un día cualquiera es de 7.000 personas,
de las cuales, 4.200 son mujeres y 2.800 son hombres. Ahora si dividimos, se
tendrá:

La relación = 4.200 mujeres = 1,5


2.800 hombres
Estadística 116 Lic. M. Gabriela. Biondolillo
La anterior relación es una razón por el hecho que el numerador no esta
contenido en el denominador. Este resultado significa que por cada hombre va mujer
y media, en otras palabras, por cada 100 hombres van 150 mujeres a dicho lugar.

La relación = 4.200 mujeres x 100 = 150


2.800 hombres nos indica que las mujeres
frecuentan ese centro comercial en un 50% mas que los hombres.

Cuando el valor del numerador está incluido en el denominador, se tiene una


proporción, es decir, el cociente de dividir un sumando cualquiera por su total. Si tal
coeficiente se multiplica por 100 se obtendrá un porcentaje. Siguiendo con el
ejemplo, la proporción de hombres que visitan el centro comercial es:
P = 2.800 / 7.000 = 0,40

esta proporción nos indica que por cada cien personas que van a ese centro
mercantil, en un día, 40 son hombres y 60 son mujeres. Ahora si multiplicamos por
100 se tendrá:

2.800 x 100 = 40% son hombres y


7.000

4.200 x 100 = 60% son mujeres.


7.000

Se observara que una proporción no puede ser menor que 0 ni mayor que 1.
En términos porcentuales se dirá que es un número comprendido entre 0 y 100.

A las razones y porcentajes en ocasiones se las denomina tasas; sin embargo


al estudiar los cambios que se operan en una población, los porcentajes y las
razones no son suficientes para analizar completamente la información disponible,
siendo necesario recurrir a la elaboración de tasas.

Estadística 117 Lic. M. Gabriela. Biondolillo


La palabra tasa se emplea para estudiar una variable en función de otra con
la que está relacionada. Estos cocientes se multiplican por 100, 1.000, etc. para
evitar el uso de decimales. Utilizando el mismo ejemplo, tenemos:

T= nº de visitantes al centro comercial por día x 1.000


población de la ciudad estimada para ese día

T = 7.000 x 1.000 = 1,45


4.820.000

con lo cual se quiere indicar que 1,45 por 1.000 de los habitantes de esta ciudad
visitan el centro comercial.

La tasa especifica es aquella que se basa en algunos subgrupos homogéneos


de una población sin tomar en cuenta la totalidad de la población.

Para cerrar el desarrollo de los conceptos básicos de indicadores


económicos, te recomiendo la lectura del capítulo 8 del libro complementario.

Estadística 118 Lic. M. Gabriela. Biondolillo


Trabajo Práctico nº 6
Tema: Indicadores económicos
Actividades:

1. Las ventas de pescado presentan para las respectivas variedades las cifras que se indican a continuación:
Año Besugo Caballa Corvina Bacalao Merluza
1.999 652 28 1039 536 3239
2.000 674 13 1106 496 3546
2.001 693 46 1354 401 3627
calcula los índices de precios para cada artículo, para los años 2.000 y 2.001,
tomando como base 1.9998.

2. De acuerdo a informaciones del Ministerio de Economía, las ventas de subproductos ganaderos al exterior (en
miles de U$S) fueron los que se presentan en la siguiente tabla. Calcula el índice agregativo simple por ambos
métodos.

Subproductos 2.000 2.001


Vacunos 162,107 238,756
Ovinos 14,431 22,981
Porcinos 7,772 11,361
Equinos 2,489 2,802

3. Cierta comunidad ha registrado los siguientes consumos y precios de tres alimentos básicos. Calcula índice de
precio y cantidad de Laspeyres, Paashe y Fischer.

Artículo Unidad Px 1.994 Px 2.001 Q 1.994 Q 2.001


Pan Kg. 240 600 5 6
Leche Lts. 200 550 5 7
Huevos Doc. 600 1600 3 3

4. En noviembre de 1.998 un empleado ganaba un salario de $750 y en el mes de


marzo de 2.002 su salario fue reajustado con un aumento de $350. Se sabe además
que los índices de precios para los mismos meses fueron de 1.258,2 y 2.836,5
respectivamente. Se quiere saber si con el reajuste que le hicieron su salario mejoró
con respecto al anterior.

5. Con los datos del ejercicio 4 calcula el poder de compra.

6. Con los siguientes datos, obtiene el índice de producción y el índice de obreros. Calcula el índice de
productividad para cada año tomando como base 1.995.
Año Producción Obreros

Estadística 119 Lic. M. Gabriela. Biondolillo


1.995 450 1278
1.996 684 1390
1.997 573 1267
1.998 793 1350
1.999 895 1222
2.000 773 1200
2.001 800 1190

Estadística 120 Lic. M. Gabriela. Biondolillo


Autoevaluación del módulo nº 5

Indica si la expresión es verdadera o falsa. Si es falsa, anota la respuesta


correcta.
1. El proceso de convertir el salario real en nominal se denomina deflactación.
2. Los números índices son cifras relativas expresadas en términos porcentuales
que sirven para indicar las variaciones que presenta una serie de observaciones
cuando se comparan respecto de una de ellas, tomada como punto de referencia
o período base.
3. Un índice eslabonado permite transformar un índice simple de base variable en
un índice simple de base fija.
4. Los números índices miden la variación en el valor de una variable en un periodo
respecto de otro considerado como base.
5. Un índice compuesto permite asignar una importancia mayor a los cambios que
se dan en algunas variables que a los que se presentan en otras, cuando lo
calculamos.
6. El número índice para un año base es siempre igual a cero.
7. Siempre se encuentra un número índice al tomar el cociente de un valor actual
entre un valor base y multiplicándolo por 100.
8. La selección de una base no apropiada no distorsiona a los números índice
9. La medida del IPC está basada en una sola variable.

Estadística 121 Lic. M. Gabriela. Biondolillo

También podría gustarte