Está en la página 1de 72

Unidad 1: El método estadístico.

Organización y presentación de datos

Unidad 1: El método estadístico. Organización y presen-


tación de datos.

1. Introducción

En esta unidad, a partir de la base de conceptos adquiridos en los


cursos de matemática, damos inicio a este primer curso de estadística que
nos permitirá conocer la utilidad de estas herramientas en nuestra área del
conocimiento y las etapas que debemos seguir para realizar un análisis
estadístico de los datos. Además, veremos cómo obtener una primera
aproximación a un conjunto de datos, a través de su organización en tablas
y gráficos.

En resumen, en esta unidad vamos a:


 Visualizar los aportes de la estadística en el proceso de producción
de conocimientos en distintos campos científicos.
 Comprender la lógica de las etapas del método estadístico.
 Distinguir entre los distintos tipos de investigación de acuerdo a la
manera en que se recolectan los datos y a los fines que persiguen.
 Identificar los distintos tipos de variables y las correspondientes es-
calas de medición.
 Organizar los datos en tablas y gráficos para encontrar una primera
descripción de los mismos.

2. ¿Por qué estudiar estadística?


En la actualidad, la estadística y sus aplicaciones forman parte de la
vida cotidiana, en ámbitos tan diversos como la política, la medicina, la
educación, los negocios, entre otros. Las posibilidades de acceso a la in-
formación y el aumento de capacidad de cálculo de las computadoras, han
hecho posible en las últimas décadas importantes avances en el almace-
namiento de grandes bases de datos en los más diversos campos de la
Ciencias. Como afirma Peña, “… el reto más importante de la estadística
en este Siglo XXI es cómo extraer la información de estas grandes masas
de datos y utilizarla de manera efectiva para aumentar nuestro conocimien-
to, orientar la toma de decisiones y dirigir la mejora de procesos y servi-
cios” (2001: pág.42)
En el área de las Ciencias Económicas la estadística es una herra-
mienta muy importante y de gran utilidad. A menudo escuchamos acerca
de las estadísticas en las bajas y alzas en la Bolsa de Valores, las estadís-
ticas sobre los precios vigentes de un cierto producto o bien de relaciones
estadísticas puntuales, como por ejemplo: 1) el comportamiento de las
familias que como agente económico en el mercado genera estadísticas de
ventas que, a su vez, ayudan a las empresas a tomar decisiones sobre los
productos que deben mantenerse, descartarse o modificarse; ó 2) las em-
presas aseguradoras de autos recopilan datos acerca de la edad de los
conductores, el tipo de vehículo, accidentes más comunes y tales estadís- 1
ticas guían a las empresas para fijar las primas de seguro a cobrar.
Como la información permite generar conocimiento, se plantean de
esta manera modelos estadísticos para simplificar la realidad incorporando
un cierto grado de confianza a los resultados, dando una medida a la incer-
tidumbre y obteniendo, de esta manera, información útil que contribuya a
las decisiones.
Un modelo conocido es, por ejemplo, el que establece una relación
lineal inversa entre el precio de un bien y la cantidad demandada. La esta-
dística aporta métodos que permiten evaluar la compatibilidad entre ese
modelo teórico planteado y la información empírica que surge de los valo-
res observados de precios y cantidades, incorporando el concepto de alea-
toriedad, para considerar los distintos resultados posibles que se puedan
presentar. Dentro de las Ciencias Económicas, la Estadística puede apli-
carse a diversas áreas, razón por la cual es una herramienta necesaria
para los profesionales en esta área. Como ejemplos podemos enumerar:

En el área contable:
 Analizar determinadas variables en el tiempo, tales como nivel de
facturación, de gastos, índices de endeudamiento, etc.
 Seleccionar muestras de comprobantes y realizar tareas de control.
 Realizar control de calidad sobre los artículos fabricados por una
empresa.
 Estudiar los factores que inciden en la rentabilidad de las empresas.

En el área de economía:
 Cuantificar el impacto de ciertos factores en el desempleo.
 Medir la distribución del ingreso.
 Modelar el comportamiento del Producto Bruto Geográfico a través
del tiempo.

En el área de administración:
 Identificar el perfil requerido de los empleados de una empresa.
 Mejorar la calidad de los servicios.
 Estimar la proporción de clientes que prefieren determinados pro-
ductos.

Llegar a informar cada una de las situaciones precedentes, exige to-


do un proceso anterior que abarca desde el planteo de un objetivo, la reco-
lección de los datos pertinentes, el análisis estadístico de los mismos y, por
último, la obtención y presentación de los resultados. Esta es la razón por
la cual necesitamos una formación estadística, ya que un profesional de
Ciencias Económicas debe ser capaz de leer e interpretar datos de manera
crítica, definir cuáles dan respuestas claras a cuestiones importantes y
conocer las metodologías que nos permitirán extraer conclusiones objeti-
vas basadas en análisis de dichos datos.

3. Breve historia de la estadística


El origen de la estadística se remonta a la edad antigua. Los estados
ya recogían datos en Egipto, hacia el año 3050 A.C. bajo el reinado de
Ramsés II, en Israel, bajo el reinado del rey David, en China hace más de
cuarenta siglos, como así también en la Grecia antigua. La información
recogida tenía como propósito, entre otros, recaudar impuestos, repartir
tierras, tener registros de nacimientos y muertes, etc. No obstante, su ori-
gen antiguo, fueron los romanos quienes hicieron censos con mayor siste-
maticidad y con una periodicidad de 5 años; cuenta la historia que durante
2 el nacimiento de Cristo se llevó a cabo uno de ellos. Luego de la caída del
imperio romano vino un largo período de pobres registros, resurgiendo
recién en el año 762 en Francia con Carlomagno y casi trescientos años
después, en Inglaterra, bajo el reinado de Guillermo El Conquistador,
cuando se logra un gran compendio estadístico conocido como el Domes-
day Book, para el año 1086.
Ya en la edad moderna, específicamente a mediados del S. XVII, en
Alemania y de la mano de Conring, se afianza la visión de la estadística
Unidad 1: El método estadístico. Organización y presentación de datos

cuyo objetivo se definía como la descripción cuantitativa de los hechos


notables de un estado, tendencia que fue proyectada y consolidada por
Achenwall, quien utilizó el término alemán “statistik” para referirse a esta
disciplina, y posteriormente por Von Scholer, a quien se le atribuye haber
separado el estudio de la teoría estadística de su aplicación práctica. To-
dos ellos formaron parte de la Estadística Universitaria Alemana, lo que
constituye el antecedente más formal de la estadística descriptiva actual.
A su vez, en Inglaterra, Graunt y posteriormente Petty encabezan La investigación
otra línea denominada Estadística Investigadora. Esta escuela centró la científica es un pro-
atención en la búsqueda de leyes empíricas que explicaran los fenómenos ceso guiado y el obje-
sociales y políticos de la época. En base a sus ideas se comienzan a reali- tivo de los métodos
zar los primeros censos oficiales en el sentido moderno del término. Como estadísticos es hacer
antecedente a ello, se conoce que el primero fue realizado por España en este proceso tan efi-
Perú, en 1548, mientras que, en la propia Europa el primero fue en Irlanda ciente como sea posi-
en el año 1703. Y ya a comienzos del Siglo XIX casi todos los países de ble mediante la formu-
lación de hipótesis y la
Europa recogen información mediante censos oficiales. En nuestro país,
confrontación con los
bajo la presidencia de Sarmiento se llevó a cabo el primer censo nacional hechos.
de población en 1869, aunque “el más lejano antecedente estadístico ar-
gentino de que se tiene noticia está constituido por los primitivos recuentos El método científico
de soldados y familias dispuestos por Don Juan de Garay al fundar la ciu- permite llevar a cabo
dad de Santa Fé. Una experiencia similar se registra en 1577, cuando Don el proceso de investi-
Lorenzo Juárez de Figueroa encaró el reparto de los solares de la Ciudad gación científica, es la
de Córdoba” INDEC (1983). aplicación de la lógica
Paralelamente y con muy pocos puntos de contacto, durante el Siglo y la objetividad a la
XVII se desarrolla una rama de la matemática conocida como Teoría de comprensión de los
fenómenos. De las
Probabilidad, que surge para resolver problemas de juegos de azar, mode-
sucesivas confronta-
lando fenómenos aleatorios. Entre los precursores se encuentran Pascal y ciones entre hipótesis
Fermat. En el Siglo XVIII, matemáticos como Bernoulli, Laplace y Gauss y datos se va avan-
desarrollan importantes técnicas estadísticas como la estimación de un zando en el conoci-
parámetro, el desarrollo de la ley normal para describir la variabilidad de miento.
los errores de medida y el planteo del problema de mínimos cuadrados.
Posteriormente se aplicó para el tratamiento de los errores de medición en
el campo de la física y la astronomía, y en el Siglo XIX se extendió a apli-
caciones biológicas y a otras áreas, como las Ciencias Sociales. En este
sentido, podemos mencionar a Quetelet, quien introduce la aplicación de la
estadística a las Ciencias Sociales y a Galton que introdujo el término re-
gresión para explicar el comportamiento de la estatura entre padres e hijos.
A su vez, debemos mencionar a sus discípulos Pearson, Goset (Student) y
Fisher que desarrollaron metodologías que constituyen el núcleo de la es-
tadística actual.

4. ¿Qué es la Estadística?
Como hemos hecho referencia en el punto anterior, los métodos es-
tadísticos constituyen una herramienta indispensable para llegar a conclu-
siones confiables a partir de resultados empíricos que surgen del análisis
de datos.
En un sentido amplio, la estadística es el arte y la ciencia de reunir,
analizar, presentar e interpretar datos. Mood y Graybill expresan que la
estadística es “la tecnología del método científico. La estadística propor-
ciona instrumentos para la toma de decisiones cuando prevalecen condi- 3
ciones de incertidumbre” (1978; pag 3). Otros autores consideran que es la
ciencia desarrollada para resolver problemas en presencia de variabilidad.
La esencia de la estadística consiste en el desarrollo y uso de modelos de
pensamiento que se dirigen hacia la comprensión del mundo real y a la
predicción del futuro ya que tiene en cuenta la incertidumbre.
¿Qué se entiende en estadística por variabilidad e incertidumbre?
Hablamos de variabilidad porque una serie de datos estadísticos surge de
mediciones efectuadas a ciertos elementos y los resultados varían de una
unidad a otra.
Además, muy a menudo se trabaja con una parte de la totalidad de
los elementos o individuos que están bajo consideración en una investiga-
ción, lo cual genera incertidumbre. En estadística, a esa totalidad de ele-
mentos se denomina Población. Como las poblaciones a menudo son muy
grandes, es imposible o muy costoso recoger información de toda la pobla-
ción, lo que obliga a trabajar con una parte representativa de esa pobla-
ción, denominada Muestra Aleatoria.

4.1. Población y muestra

Una población es el conjunto completo de elementos o individuos que


interesa en una investigación, cada elemento se designa como unidad
estadística y su tamaño se representa por la letra N. Una muestra es una
parte de la población que se selecciona para realizar una determinada
investigación y su tamaño se indica con n.

Necesitamos una muestra que sea representativa de la población, a


fin de extender las conclusiones hacia la población de donde la misma ha
sido seleccionada. Para ello los elementos de la muestra deben ser selec-
cionados aleatoriamente.

Una Muestra Aleatoria es aquella en la que todos los elementos de la


Un generador de nú- población tienen una probabilidad conocida de ser seleccionados. Si la
meros aleatorios es probabilidad es igual para todas las unidades estadísticas, se trata de una
un dispositivo informáti- Muestra Aleatoria Simple.
co o físico diseñado El listado de los elementos a partir del cual se selecciona la muestra en
para producir secuen- estadística es denominado Marco muestral.
cias de números sin un
Las características de la unidad estadística relacionada con el tema sobre
orden aparente. Por
ejemplo el uso de los el cual estamos investigando que deben relevarse se denominan variables
bolilleros en los sor- en estadística.
teos, o en Excel las
funciones “aleatorio” o
“aleatorio.entre”. Ejemplo Análisis Industrias de Córdoba

Para ilustrar los conceptos de población y muestra, utilizaremos el


siguiente ejemplo:

La Unión Industrial de Córdoba, durante el año 2006, realizó un estudio


para analizar distintos aspectos de la actividad industrial. Para ello, de la
población de 2000 industrias radicadas en la provincia (N=2000), se tomó
una muestra aleatoria de 150 empresas (n=150).

En este ejemplo, para una muestra aleatoria simple, cada una de las 2000
industrias tiene igual probabilidad de ser seleccionada (0,005=1/2000). Una
forma de conformar la muestra de 150 empresas es elegir al azar 150 nú-
4 meros de un listado de 2000 números que se han asignado a las empre-
sas. El listado de las 2000 industrias se denomina en estadística marco
muestral.

Toda medida resumen que se calcula para describir características


del estudio a partir de la muestra se denomina Estadístico, el que podrá
ser utilizado para inferir conclusiones sobre la población.
Unidad 1: El método estadístico. Organización y presentación de datos

Parámetro y Estadístico
Toda medida resumen que se calcula para describir características pobla-
cionales se llama parámetro, el cual es una cantidad fija que generalmen-
te no se conoce y debe ser estimada. Un estadístico es una medida calcu-
lada con las observaciones muestrales.

4.2 Estadística descriptiva e inferencial

Dada la base de datos, y después de una primera organización de


los datos, es posible avanzar en el descriptivo de los datos y aplicar técni-
cas que permiten la resolución de problemas bajo condiciones de incerti-
dumbre. Teniendo en cuenta ello, podemos dividir los métodos estadísticos
en dos grandes ramas:

La Estadística Descriptiva está formada por aquellos métodos gráficos y


numéricos que se utilizan para resumir y procesar los datos, con el fin de
describir apropiadamente sus principales características. La Inferencia
Estadística incluye los métodos que permiten hacer generalizaciones con
respecto a la población con base en información proporcionada por una
muestra aleatoria, con un grado de incertidumbre cuantificable.

La Estadística Descriptiva, desde la década del 60, incorporó nuevas


medidas y gráficos al análisis descriptivo tradicional que se presentaron
bajo el nombre Análisis exploratorio de datos. Los métodos de la Estadísti-
ca Inferencial se basan en la teoría de probabilidad, y permiten construir
intervalos de estimación para los parámetros desconocidos y realizar prue-
bas de hipótesis.

El siguiente esquema ilustra los conceptos definidos en esta sección.

En esta asignatura aprenderemos los métodos englobados en esta-


dística descriptiva, así como la teoría de probabilidad y variables aleato-
rias. En el último capítulo introduciremos al estudio de las distribuciones en
el muestreo, que constituye el fundamento teórico para el estudio de los
métodos inferenciales.
Ejemplo Análisis Industrias de Córdoba

Con los datos de la muestra se realizó un análisis descriptivo de


cada una de las características relevadas y de algunas relaciones
entre variables (estadística descriptiva).
Además, otro objetivo del estudio consistió en estimar el porcentaje de
empresas de la población que usan Internet, para lo cual se utilizaron mé-
todos inferenciales como la estimación de parámetros por intervalos (esta-
dística inferencial).
No obstante, las diferencias en cuanto a los objetivos que pueden te-
ner los estudios, siempre debe seguirse un razonamiento lógico que puede
resumirse en las etapas del método estadístico.

5. Etapas del método estadístico


Las etapas a seguir para realizar un estudio estadístico que permitirá
la toma racional de decisiones, se pueden organizar de la siguiente mane-
ra:

En resumen, cada etapa consiste en:

Estos métodos de infe-  Planteamiento del Problema: en primer lugar, se deben definir los
rencia estadística serán objetivos del estudio, la población objetivo, a partir de la cual se
estudiados en Estadísti- construirá el marco muestral y las variables de interés y sus rela-
ca II. De manera intuitiva ciones. Cuando se trabaja con una muestra, en el planteamiento
un intervalo de confian-
za es un rango de valo-
del problema, se debe decidir el método de muestreo más conve-
res (calculado en una niente, determinar el tamaño de la muestra y la precisión esperada,
muestra) en el cual se temas que escapan al alcance de esta materia
encuentra el verdadero
valor del parámetro, con
 Diseño y recopilación: Formulación estadística de la cuestión: de-
una probabilidad deter-
minada. Una prueba finir la población de estudio a partir del marco muestral, el tipo de
estadística es un proce- estudio a realizar y las variables de interés. Diseñar cómo se obtie-
dimiento para, a partir de nen los datos, una vez recolectados se realiza un análisis de con-
una muestra aleatoria, sistencia, elaborando de esta manera la base de datos para su aná-
extraer conclusiones
que permitan aceptar o lisis.
rechazar una hipótesis
6 previamente formulada  Organización y presentación de datos: se refiere a la presenta-
sobre el valor de un ción de los datos en tablas y gráficos, que muestran su comporta-
parámetro desconocido
de una población. miento y de este modo nos ayudan a comprender la información re-
cabada.

 Análisis: consiste en el cálculo de medidas descriptivas y la inter-


pretación de la información obtenida (estadística descriptiva), lo
que, de manera conjunta, nos permitirá responder los objetivos del
Unidad 1: El método estadístico. Organización y presentación de datos

estudio. Cuando se está trabajando con una muestra, los resulta-


dos se proyectan a la población, estableciendo un error, esto forma
parte de la estadística inferencial que básicamente consiste en rea-
lizar estimaciones por intervalos, contrastar hipótesis y validar los
supuestos en que se basan los modelos planteados.

 Resultados y conclusiones: Finalmente se informan los resulta-


dos más relevantes respondiendo a los objetivos iniciales plantea-
dos en la formulación del problema. Es importante concluir con ba-
se a los resultados de manera adecuada, de forma tal que contribu-
ya a una mejor comprensión y exposición de los mismos, en fun-
ción de los objetivos del trabajo.

En este capítulo y en el siguiente se introducen los conceptos de las


dos primeras etapas señaladas y se ilustran las técnicas para la organiza-
ción, cálculo de medidas descriptivas y su interpretación. A continuación,
analizamos en detalle cada etapa.

5.1. Planteamiento del Problema

Como se señaló precedentemente, lo primero que se debe hacer en


una investigación es definir el problema que se quiere abordar, para lo cual
debe tenerse muy en claro la población objetivo, los parámetros a estimar
y/o pruebas de hipótesis que se plantean. Para ello se deberá definir:

Ejemplo Análisis Industrias de Córdoba

El marco muestral fue confeccionado a partir del listado de aproxi-


madamente 2000 empresas provisto por el Registro Industrial de la
Provincia. De ese padrón se seleccionó una muestra aleatoria de 150 em-
presas y un grupo adicional de 53 firmas, elegidas conforme a criterios
predeterminados por la Unión Industrial. Una de las dimensiones del estu-
dio fue la inserción internacional de la firma, para lo cual se definieron, en-
tre otras, las siguientes características –variables- a relevar: Si la empresa
es exportadora; si lo es, si tiene necesidad de financiación y asesoramiento
para exportar, como así también la evolución de las exportaciones en rela-
ción al año anterior.

De acuerdo a los objetivos que persiguen, los estudios se clasifican


como se muestra en el siguiente esquema.

7
Estudios Exploratorios: estos estudios se basan en casos seleccionados
discrecionalmente (no aleatoriamente) y suelen ser el paso inicial de estu-
dios posteriores, porque ayudan a familiarizarnos con la situación o el pro-
blema, a identificar las variables importantes y a utilizar estas últimas para
plantear hipótesis que puedan ponerse a prueba en una investigación pos-
terior.
La falta de aleatorización es una limitación básica de los estudios ob-
servacionales. Esta limitación se ve reflejada en el análisis de los datos
donde se debe tener mucho cuidado en el momento de obtener conclusio-
nes y en la generalización de las mismas.
Validez es la compro- La validez de las conclusiones obtenidas depende en gran medida de
bación de lo que se los conocimientos del experto sobre el tema que investiga y de la incorpo-
deseaba medir es me- ración de información externa proveniente de otros estudios.
dido realmente.
Algunos ejemplos de estudios exploratorios:

- La Unión Industrial solicita un estudio sobre un conjunto específi-


co de empresas, seleccionadas por ciertas características particu-
lares para analizar las formas de gerenciamiento de las mismas a través
de entrevistas a personas claves dentro de la empresa.

- Frecuentemente en marketing es necesario probar la eficacia de diversas


campañas publicitarias. En técnicas conocidas como grupos focales, se
analiza la reacción de un grupo seleccionado de clientes potenciales ante
distintas propuestas de presentación del producto.

- Existen estudios observacionales denominados “paneles de basura” que


estudian la basura humana para analizar los patrones de consumo domés-
tico. Actualmente el uso de los escáneres electrónicos permite hacer estu-
dios observacionales (en reemplazo a la observación humana) sobre el
consumo de productos y cambio de comportamientos de consumo.

Estudios descriptivos/confirmatorios: en estos estudios el objetivo es


hacer inferencia respecto a la población, para lo que se trabaja con una
muestra aleatoria. En los relevamientos muestrales se estiman parámetros
desconocidos de la población. En los experimentos el diseño es más exi-
gente ya que se quieren probar relaciones de causalidad. A continuación,
se explican algunas características de estos estudios.

Diseños de experimentos: tienen como objetivo determinar si algunas


variables, generalmente llamadas tratamientos, afectan a otra conocida
como variable respuesta. Para obtener conclusiones válidas sobre causali-
dad, se debe ejercer control sobre uno o más factores que afectan la res-
puesta. Los experimentos son investigaciones que se caracterizan por ser
estudios organizados y controlados por el investigador. Además de utilizar
técnicas apropiadas de diseño experimental, se efectúa una buena planifi-
cación estadística que permite establecer una relación entre los tratamien-
tos en estudio y las respuestas observadas. Para realizar un experimento
se asignan aleatoriamente las unidades muestrales a cada uno de los tra-
tamientos, observando posteriormente los resultados obtenidos.
Estudios de este tipo se llevan a cabo frecuentemente en agronomía
y medicina, aunque ha tenido un importante desarrollo en administración.

Ejemplos de diseños de experimentos:

8 - Un ejemplo en agronomía, consiste en seleccionar parcelas, a las


cuales se les aplican diferentes fertilizantes (tratamientos) y se
quiere saber cuál es el que produce mayor rendimiento (respuesta). Para
obtener conclusiones válidas se deben controlar algunos factores como
pueden ser la calidad del suelo y la cantidad de riego.
- En investigación de mercado, cuando se desarrolla un nuevo empaque
para un producto y se desea conocer si el mismo va a tener éxito en cuan-
to al aumento de las ventas. El producto se vende en 10 supermercados
Unidad 1: El método estadístico. Organización y presentación de datos

de la ciudad. El investigador de mercado dividirá a los supermercados en


dos grupos de 5. A un grupo de 5 supermercados enviará el producto en-
vasado en el empaque tradicional y al otro grupo de 5 supermercados en-
viará el producto con su nuevo envase. La aleatorización será contemplada
por el investigador si la asignación de los supermercados a los distintos
empaques se hace estrictamente al azar. Si se ha respetado esta aleatori-
zación, se puede aplicar una metodología estadística conveniente que le
permitirá tomar decisiones en cuanto a la eficacia del nuevo empaque.

A pesar de la garantía en cuanto a la validez de sus conclusiones, los


experimentos no siempre son posibles de realizar debido a la existencia de
restricciones lógicas o éticas que limitan la aplicación de las técnicas de
aleatorización. Por ejemplo, un investigador médico no puede dejar a un
grupo de pacientes sin darle una cierta droga para el tratamiento de una
enfermedad simplemente para comparar la eficacia de una droga en el
tratamiento de la enfermedad. Se enfrentará así a un problema ético, apa-
rentemente contrapuesto al avance de la ciencia.

Relevamientos muestrales: En el relevamiento muestral el investigador


estudia una población bien definida extrayendo de ella un subconjunto de
unidades de observación denominado muestra. Si la muestra se obtiene al
azar se dice que se tiene una muestra aleatoria. Sólo las muestras aleato-
rias permiten obtener conclusiones respecto de las poblaciones de las cua-
les se extraen, además de informar el error estadístico de tales conclusio-
nes.

Es evidente que para que las conclusiones obtenidas a partir de una


muestra reflejen verdaderamente lo que está ocurriendo en la población, el
investigador debe tener en cuenta el proceso de aleatorización al diseñar
su plan de muestreo y al obtener la información pertinente. Para seleccio-
nar una muestra aleatoria se debe contar con un marco de muestreo
adecuado que es el listado disponible de todos los elementos que compo-
nen la población.

La mayoría de los estudios que se realizan en el área de las Ciencias


Económicas se hacen a través de encuestas por muestreo, razón por la
cual nos detenemos en este tipo de estudio.

Algunos de los numerosos ejemplos que podemos plantear son los si-
guientes:

- Si se quiere seleccionar una muestra de alumnos de la Facultad


de Ciencias Económicas, un marco de muestreo adecuado estaría
dado por el registro de alumnos que se encuentra en el despacho de
Alumnos de la Facultad donde se los tiene ordenados por número de lega-
jo. Una manera de seleccionar los alumnos al azar podría ser seleccionar
sistemáticamente 1 de cada 100 alumnos. A estos alumnos seleccionados
al azar se les hará la entrevista correspondiente. También se podrían ge-
nerar números aleatorios utilizando un programa de computación adecua-
do y los alumnos que se corresponden con los números seleccionados, 9
serán luego entrevistados. La selección aleatoria de la muestra asegura la
representatividad de la misma y la buena generalización de los resultados
obtenidos en la muestra a la población de alumnos de la Facultad.
- En el estudio realizado por la Unión Industrial, se seleccionó aleato-
riamente una muestra de 150 empresas, a las que se les administró un
cuestionario. Revise la introducción del informe de del Análisis de las in-
dustrias de Córdoba.
- Para determinar la eficacia de una campaña publicitaria en una ciudad,
se selecciona una muestra aleatoria de personas a entrevistar.
- En una auditoría contable, se selecciona una muestra aleatoria de
comprobantes para estimar el porcentaje que tienen errores.

5.2. Recopilación de datos

Los datos pueden provenir de fuentes primarias o secundarias.


Una de las principales fuentes primarias es la encuesta por muestreo
(“survey”), en los que los datos son recolectados aplicando un cuestionario
a los elementos de la población o muestra seleccionada.
Los datos de fuentes primarias son los que recopila el propio investi-
gador para resolver un problema particular. Un instrumento habitual para
recoger datos primarios es el cuestionario, en el que se formulan preguntas
respecto a datos personales, opiniones, actitudes, comportamiento y otras
características.
En el punto siguiente trataremos algunos aspectos a tener en cuenta
en la elaboración de este instrumento.

Diseño de cuestionarios

El diseño del instrumento para recolectar datos es vital a la hora de


realizar la encuesta, ya que nos permite recabar información significativa
que ayude al proceso de toma de decisiones. El procedimiento general
para diseñar un cuestionario involucra:
- la elección de preguntas que deben responder a los objetivos del estudio
- determinar la forma de administrar el cuestionario (personal, telefónico o
por correo)
- la redacción de las preguntas
- determinar el formato de respuestas: preguntas cerradas o abiertas
- prueba y evaluación del cuestionario

A continuación, se presentan como ejemplos de cuestionarios un


bloque del cuestionario administrado a la muestra de empresas seleccio-
nadas en el estudio realizado por la Unión Industrial y un cuestionario que
se aplica a los alumnos de Estadística con fines educativos.
C. INSERCION INTERNACIONAL DE LA FIRMA
16. Exporta?
17. Si no exporta, quisiera exportar alguno de sus productos?
1.Si 2.No 1.Si 2.No Pasar a la pregunta 25

18. Necesita asesoramiento para exportar?


21. Las exportaciones directas de la empresa durante 2005 constituyeron el
1.Si 2.No % del total de las ventas de igual período.

19. Necesita financiación para exportar? 22.El monto total de las exportaciones en el 2005 comparadas con las del 2004

1.Si 2.No 1.Aumentaron 2.Disminuyeron 3.Sin cambios 4.NO exportó en el año 2004

23. En su operatoria normal de exportación, ¿tiene alguna dificultad especial


20. Señale el motivo
que le signifique una pérdida competitiva?
1.Capital de trabajo
1.Si 2.No
2.Adquisición de maquinaria
3.Post-financiamiento de exportaciones 24. ¿Podría identificarla/s en orden de importancia?
4.Otras (especificar)
10 1
(Si respondió “No” en la pregunta 16 2
pasar a la pregunta 25) 3
4
Unidad 1: El método estadístico. Organización y presentación de datos

11
En ambos modelos de cuestionarios pueden observarse dos tipos de
preguntas:
1) aquellas que se completan con la información solicitada, las que
se denominan preguntas abiertas -por ejemplo, la pregunta 24 del primer
cuestionario- y
2) preguntas en la que el entrevistado debe seleccionar una o más
de las opciones presentadas, las que se denominan preguntas cerradas.
También es conveniente señalar que el cuestionario no debe ser demasia-
do largo y que las preguntas deben ser concisas, no ambiguas y preferen-
temente de tipo cerradas. Las preguntas abiertas condicionan menos al
entrevistado y permite explorar significados pero, la desventaja es que re-
Algunos organismos ciben mayor influencia del encuestador, hay más dificultad para codificar
importantes con infor- las respuestas y se recaban más respuestas inapropiadas.
mación estadística dis-
ponible son: Los datos de fuentes secundarias son aquellos que han sido reuni-
dos y publicados por otras instituciones.
- Instituto Nacional de
Estadísticas y Censos. En general se trabaja con datos provenientes de organismos públicos
- Dirección Nacional de o privados tales como INDEC, BCRA, AFIP, Cámaras empresariales, ONU,
Estadísticas y Censos
FMI, sólo para mencionar algunos, muchos de los cuales, desde hace al-
de la Provincia.
- Comisión Económica gunos años están disponibles en internet.
para América Latina y el
Caribe.

Actividad 1
En cada uno de los siguientes casos defina la población y clasifique el tipo
de estudio de acuerdo a sus objetivos.

Caso 1.- La Encuesta Permanente de Hogares se realiza dos ve-


ces al año en base a una muestra representativa de hogares de las princi-
pales ciudades del país. El objetivo de la misma consiste en describir la
situación del empleo y la comparación de situaciones de desempleo entre
ciudades y entre períodos en los cuales se realiza la encuesta.

Caso 2.- El Departamento de Compras de una fábrica de tractores


ha encarado el estudio de la duración de las baterías que compra a 3 pro-
veedores con el fin de mejorar la calidad de sus productos en base a un
plan de calidad total. Para ello solicita una muestra de 10 baterías a cada
uno de los proveedores, cuidando que todas las baterías tengan exacta-
mente las mismas características de funcionamiento.
Las baterías son llevadas al Departamento de Investigación y Desa-
rrollo de la fábrica donde se han implementado una serie de tests de dura-
bilidad apropiada. Todas las baterías son sometidas a los mismos tests
bajo las mismas condiciones (calor, humedad, personal encargado de
efectuar las mediciones, etc.). Al finalizar se anota una cierta medida de
durabilidad que luego será comparada entre los 3 proveedores para ver si
hay alguno de ellos que se diferencia realmente en cuanto a la calidad de
las baterías.

Caso 3.- Una Oficina de Salud desea efectuar un estudio de la tasa


12 de mortalidad asociada a la causa del fallecimiento. Para ello utiliza los
certificados de defunción otorgados en distintas municipalidades. El objeti-
vo del estudio consiste en tomar acciones preventivas para disminuir el
riesgo de determinadas enfermedades.
Unidad 1: El método estadístico. Organización y presentación de datos

Caso 4.- La encuesta industrial se realiza en forma trimestral en el


Instituto de Estadística de la Facultad con el objetivo de evaluar la marcha
de la industria cordobesa a través de la opinión de los empresarios. Para
ellos se toma una muestra de firmas seleccionadas al azar, teniendo en
cuenta el tamaño de las mismas medido por la cantidad de empleados.
Luego de analizar los datos se publican tablas mostrando los porcentajes
correspondientes a las opiniones de las empresas encuestadas.

Caso 5.- A los efectos de indagar el sistema de evaluación de los


empleados de las empresas familiares de la Ciudad de Córdoba un inves-
tigador seleccionará discrecionalmente 10 empresas que difieren en tama-
ño y tipo de actividad de un total de 300 empresas. En las que realizara
entrevistas en profundidad a directivos y empleados.

5.3. Tipos de variables

En estadística, cada una de las características a estudiar se denomi-


na variable, la cual admite diversas respuestas para las unidades estadís-
ticas. A su vez, la realización de una respuesta particular constituye un
dato.

En el ejemplo Encuesta a alumnos, para las variables sexo, can-


tidad de materias aprobadas y gastos en libros, los datos de un
alumno en particular son:

Sexo: Mujer
Cantidad de materias aprobadas: 3
Gasto en libros: $147

En el estudio de las industrias, donde se miden las variables activi-


dad, cantidad de personal, monto de ventas anuales y si es exportadora,
para una empresa particular se obtuvieron los siguientes datos:

Actividad: Industria Alimenticia


Cantidad de personal: 50
Monto de ventas anuales: $8.000.000
Exporta: Sí

Clasificación de las variables


Las variables se clasifican en:

13
Cuando la pregunta admite como respuesta un número, se trata de una
variable cuantitativa o numérica. A su vez, si los valores que asume la
variable surgen de un conteo o de una enumeración, la variable es numé-
rica discreta, como por ejemplo “cantidad de materias aprobadas” (núme-
ros enteros). En cambio, si se obtienen datos a través de un sistema de
medición, la variable es continua ya que asumiría valores en un intervalo
(números reales). En el relevamiento a los alumnos, el “gasto en libros” y la
“estatura” constituyen ejemplos de este tipo de variables.
Cuando la variable no admite una respuesta numérica, sino que la
unidad de análisis se asigna a una clase o categoría la variable es cualita-
tiva o categórica. Ejemplos de variables cualitativas son: sexo, lugar de
procedencia, nivel de educación de los padres, el motivo por el cual nece-
sita financiación para exportar.

Cómo se miden las variables

La medición de una variable (o característica de estudio) es el proce-


so de asignar números u otros símbolos a los elementos. La regla por la
cual se asignan los números o símbolos constituye una escala de medi-
ción, y cada escala cuenta con propiedades que las distinguen.
La escala de medición es nominal cuando los elementos se asignan
a categorías preestablecidas. La propiedad que la caracteriza es catego-
rizar o dar categorías, por ejemplo, en la variable procedencia se definie-
ron las categorías: Ciudad de Córdoba, Interior de la Provincia. de Córdo-
ba, Otras provincias, Otros países; a las que se les asignaron números de
1 a 4. Estos números sólo tienen el valor de dar un código a cada catego-
ría, la elección es arbitraria ya que podríamos haberle dado cualquier otro
valor o cambiar el orden de la codificación.

Por ejemplo:

1- Otros países 10- Otros países


2- Interior de la Provincia de Cba. 20- Interior de la Provincia de Cba.
3- Otras Provincias 30- Otras Provincias
4- Ciudad de Córdoba 40- Ciudad de Córdoba

Las categorías a las que se asignan las unidades de observación se


expresan por palabras y son mutuamente excluyentes y exhaustivas. El
concepto mutuamente excluyente significa que si un elemento pertenece a
una categoría no puede pertenecer a la vez a otra categoría de la variable.
Exhaustiva significa que todos los elementos de la población o muestra
deben ser clasificados en una categoría. Las variables sexo y el motivo por
el cual necesita financiación para exportar, son también ejemplos de varia-
bles categóricas medidas en escala nominal. En el caso particular en el
que las variables presentan sólo dos categorías se denominan variables
dicotómicas.

La escala es ordinal cuando las respuestas están dispuestas en un


cierto orden, al asignarle números se utiliza la propiedad de orden, como
por ejemplo el nivel de educación de los padres. También aquí las catego-
rías deben ser mutuamente excluyentes y exhaustivas.

Otro ejemplo es la variable Su primer año universitario puede calificarse


como:

1. Muy Fácil
2. Fácil
3. Regular
14 4. Difícil
5. Muy Difícil

Las escalas de intervalo y de razón que veremos a continuación sólo


pueden ser utilizadas con variables numéricas.

La Escala de Intervalo, agrega a la propiedad de orden, la de igual-


dad de diferencias dada por distancias o intervalos iguales. No sólo permi-
Unidad 1: El método estadístico. Organización y presentación de datos

te conocer cuál es el valor más grande sino cuantificar en cuánto es más


grande, por lo que representa, matemáticamente hablando, un nivel de
medición más preciso que las anteriores. En esta clase de medida, la pro-
porción de dos intervalos cualesquiera es independiente de la unidad de
medida y del punto cero. Un ejemplo típico es la medición de la temperatu-
ra en la que se utilizan básicamente dos escalas, Celsius y Fahrenheit, en
ambas el valor cero es diferente, es un valor arbitrario definido por una
convención determinada. Cuando medimos la temperatura en grados Cel-
sius podemos afirmar que entre 40º y 20º hay 20 grados de diferencia, pe-
ro no podemos decir que 40º es el doble de calor que 20º porque el punto
cero de referencia tiene distinto significado en cada escala.
Sin embargo, en la mayoría de las mediciones con escala numérica,
se define un punto cero real en su origen, lo que define una escala de ra-
zón. Los ejemplos de variables numéricas planteados están dados en es-
cala de razón: cantidad de materias aprobadas, gastos en libros y estatura.
Son variables donde el cero indica nulidad o ausencia de los que se estu-
dia. Para las materias aprobadas, 0 indica que no ha aprobado ninguna.
Esta escala además de la distinción de orden y distancia, permite es-
tablecer en qué proporción es mayor un valor de la variable que otro.

Por ejemplo, si los alumnos A y B tienen 4 y 6 materias aprobadas La distinción entre


respectivamente, podemos afirmar que B tiene dos materias apro- escalas de intervalos
badas más que A, o que tiene el 50% más de materias aprobadas. y razón es muy sutil,
incluso pocas veces
En el cuadro siguiente se resumen los tipos de variable y sus posi- nos encontramos con
bles niveles de medición, en el que se observa que las variables numéricas ejemplos de escalas
de intervalos, por lo
son las que permiten elegir distintos niveles de medición.
que este material se
trabajará con escalas
Por ejemplo, el nivel de ingresos de los jefes de hogar puede obte- de razón.
nerse en una escala numérica (escala de razón) como Ingresos ob-
tenidos en pesos en el último mes.

Sin embargo, puede el nivel de ingresos organizarse como categorías,


Esta limitación puede
definiendo por ejemplo tres categorías, a saber: ingresos bajos (de 0 a ser definida en pos a
5000$), ingresos medios (de 5000 a 15000$) e ingresos altos (más de una respuesta más
15000$). En este último caso hemos modificado la escala pasando de una confiable, sabiendo
escala de razón a una escala ordinal, limitando las posibilidades de aná- que la información
lisis de los datos. sobre ingresos no
siempre es dada en
SENTIDO EN QUE SE forma fidedigna por
TIPO DE VARIABLE NIVEL DE MEDICIÓN PUEDEN MODIFICAR prejuicios de índole
LAS ESCALAS social o impositivo, los
Nominal que se evitan defi-
Categórica niendo intervalos de
Ordinal
Numérica De intervalos ingresos en la pregun-
(discreta y continua) De razón ta.

Es muy importante la elección de la escala porque el análisis estadís-


tico difiere según el tipo de variable y la escala utilizada.

Actividad 2: 15
1- Determine si cada una de las siguientes variables es categórica (cualita-
tiva) o numérica (cuantitativa), y si es numérica indique si es discreta o
continua.

a) Cantidad de personas que habitan por vivienda.


b) Tipo de vivienda.
c) Cantidad de habitaciones.
d) Cantidad de dormitorios.
e) Ingreso total de las personas que habitan la vivienda.
f) Gasto en bienes duraderos por semestre.
g) Si tiene línea telefónica
h) Gasto en bienes de consumo por mes.

2- De la clasificación anterior identifique una variable dicotómica y una


variable con escala nominal.
3- Modifique una variable con escala numérica a una escala ordinal.

5.4 Organización y presentación de datos estadísticos

Una vez que disponemos de los datos los organizamos en una tabla
donde en las columnas definimos las variables y en las filas a los indivi-
duos A esta tabla la denominamos base de datos
Actualmente la disponibilidad de datos en soporte electrónico, permi-
te trabajar los mismos desde programas informáticos orientados especial-
Infostat mente para la organización y análisis de datos. Existe una gran oferta de
Este software ha sido estos programas dentro de los cuales hemos seleccionado Infostat. El di-
diseñado en la Univer- seño de Infostat es similar al de otros softwares estadísticos, lo que brinda
sidad Nacional de Cór- al usuario la posibilidad de adaptarse de manera relativamente fácil, y
doba por la Facultad de además cuenta con un manual de ayuda al que se puede acceder selec-
Ciencias Agropecua- cionando la opción MANUAL en el menú AYUDA.
rias.
Existe una versión es- Aspectos generales del software
tudiantil disponible en Al abrir InfoStat, se visualizará una barra de herramientas localizada
su página web. Usted
en la parte superior de la ventana del programa, la que contiene los si-
puede solicitar una
clave gratuita ingresan- guientes menús: Archivo, Edición, Datos, Resultados, Estadísticas, Gráfi-
do por “Clave gratuita cos, Ventanas, Aplicaciones y Ayuda. Los softwares estadísticos en gene-
para versión estudian- ral permiten crear una base de datos o leer una base de datos generada
til”. por otro programa (excel, acces, o algún programa estadístico). En Infostat
podemos abrir una base de datos en formato del programa (extensión idb)
o desde otros formtos comoo Excel, veamos a continuación como abrimos
la base “alumnos.xls” (disponible en la sección Materiales y Recursos del
aula virtual).

Veamos cómo hacemos con Infostat


Al ingresar al programa Infostat, seleccione del menú ARCHIVO ->
NUEVA TABLA y se presentará una “Nueva Tabla” en blanco donde
podrá cargar los datos relevados a los efectos de conformar la base de
datos deseada.
A continuación, se muestra la tabla de Infostat con la información de las respues-
tas de los siete primeros alumnos de la encuesta.

Cada fila
representa
un caso u
observación
con todas
16 las variables

Cada columna representa una va-


riable o característica de estudio
Para abrir una base de datos elaborada con otro aplicativo seleccione menú AR-
CHIVO -> ABRIR y en el recuadro que se despliega busque el archivo y marque la
opción ABRIR.
Unidad 1: El método estadístico. Organización y presentación de datos

El programa permite tener abiertas varias bases de datos (tablas) simultáneamen-


te, las que pueden desactivarse con la opción ARCHIVO -> CERRAR.
Las bases pueden guardarse en formato InfoStat (con extensión .idb - InfoStat
Data Base) correspondiente al Infostat con Menú ARCHIVO -> GUARDAR TA-
BLA. Otra posibilidad es guardar la tabla con otro formato (EXCEL, texto, DBASE,
Paradox) usando la opción GUARDAR TABLA COMO.
Una vez que disponemos de una base de datos es posible realizar modificaciones
en la misma.
El menú DATOS tiene una serie de opciones para definir el tipo de datos y realizar
algunas acciones sobre las filas (datos) o columnas (variables) de la tabla.

Una vez construida la base debemos realizar un análisis de consis-


tencia de los datos y depurarla, para lo cual podemos ayudarnos con la
representación de las variables en tablas y gráficos. Este resumen o repre-
sentación depende del tipo de variable considerada, y permite realizar un
primer análisis de éstas. En las secciones siguientes trabajaremos con
cada tipo de variable en particular, a fin de poder organizar y presentar los
datos.
El resumen y la presentación de datos a través de tablas y gráficos,
permite mostrar la información de un conjunto de datos a una forma más
simple, de tal manera que facilita a quien los lee tener una idea general de
su comportamiento, es decir de la forma en que están distribuidos.
Otro aspecto que consideraremos es si el análisis es para una varia-
ble, lo que en estadística se denomina análisis unidimensional o si se ana-
lizan dos o más variables conjuntamente (análisis bidimensional o multidi-
mensional. En esta asignatura, veremos los dos primeros tipos (unidimen-
sional y bidimensional), apuntando en este capítulo, a la forma en que ha-
bitualmente se presentan los datos.

5.4.1 Distribuciones Unidimensionales

Comenzaremos con el análisis de las variables categóricas, para


continuar luego con numéricas discretas y continuas.
En la sección anterior mostramos que en una base de datos cada fila
corresponde a una unidad de análisis y cada columna a una variable. Si
tomamos una columna en particular, la misma constituye lo que en estadís-
tica se llama una serie simple, la que muestra cada una de las observacio-
nes en el orden en que fueron recopiladas. A partir de esos datos elabora-
remos distribuciones de frecuencias.

Variables Categóricas
Para armar una tabla resumen de este tipo de variables, contamos la can-
tidad de casos que pertenecen a cada clase o categoría, lo que se deno-
mina frecuencia absoluta y calculamos la proporción de casos en cada una
de ellas, lo que se denomina frecuencia relativa, las que pueden expresar-
se en porcentajes. Con estas frecuencias, se puede construir una tabla de
tres columnas, donde en la primera se anotarán las categorías y en las
otras dos, la cantidad y el porcentaje de observaciones.
Para la variable Sector de la Economía al que pertenecen 148 indus-
trias, cuyas categorías están expresadas en escala nominal, las frecuen-
cias se presentan en la Tabla 1.1.
17

Posicionados al inicio de la variabla Sector, para categorizarla:


DATOS -> CATEGORIZAR -> ASIGNAR CATEGORIAS SEGÚN
CODIGO DE VALORES
Asignamos los códigos según las referencias, se genera una nueva variable
Cat_sector con los nombres de las categorías.
Para construir la tabla de frecuencias ESTADISTICAS -> TABLA DE FRECUEN-
CIA.
En la solapa VARIABLES seleccionar la variable Cat_sector (para seleccionar una
variable hacer clic en ella y, con la flecha, pasarla al cuadro de la derecha).
En la ventana TABLA DE FRECUENCIAS marcar FA y FR para obtener una tabla
con las frecuencias absolutas y relativas, que se presenta en una nueva ventana
de Resultados
Frecuencia absoluta:
es el número de casos Tablas de frecuencias
que se repite cada cate-
Variable Clase FA FR
goría de la variable.
Cat_sector 1 49 0,33
Frecuencia relativa: es
Cat_sector 2 36 0,24
la proporción de casos Cat_sector 3 50 0,34
que se repite cada cate- Cat_sector 4 13 0,09
goría de la variable.

Los resultados obtenidos son presentados en la tabla1.1

Tabla 1.1 Sector de la economía

FRECUENCIA ABSO-
SECTOR DE LA ECONOMÍA PORCENTAJE
LUTA
De Origen Agropecuario 49 49/148 x100 33,1
Productos no metálicos 36 24,3
Productos metálicos 50 33,8
Otras Industrias 13 8,8
Total 148 100,0

Observando las frecuencias absolutas y porcentajes, podemos con-


cluir que, de 148 empresas encuestadas, 49 pertenecen al sector industrial
de origen agropecuario, lo que representa el 33,1% del total; 36 al sector
de productos no metálicos (24,3%), 50 industrias que fabrican productos
metálicos (33,8%) y el resto a Otras actividades industriales (8,8%).
Esta información puede representarse gráficamente. Los gráficos no
agregan información, pero se emplean para tener una representación vi-
sual de la totalidad de la misma, presentando los datos de tal modo que se
pueda percibir fácilmente los hechos esenciales y compararlos con otros.
En el caso de variables categóricas, utilizamos el Diagrama Circular y el
Gráfico de Barras.
En el Diagrama Circular (Gráfico 1.1) se representa en el círculo el
100% de las empresas encuestadas y las porciones o divisiones se hacen
en función a los tipos de empresas según las frecuencias ya indicadas.
Puede utilizarse también el gráfico de barras (Gráfico 1.2), donde cada
una de ellas representa una categoría (en el ejemplo, un sector de la eco-
nomía) y la altura de cada barra, la frecuencia correspondiente.

Para graficar la variable Cat_sector


GRAFICOS GRAFICOS DE SECTORES

Para realizar un gráfico de sectores, por ejemplo, indicar la variable que


va a graficar y especificar que las categorías están en filas. Luego, junto con el
gráfico emerge la ventana HERRAMIENTAS GRAFICAS que permite modificar el
color, título, etc.

Gráfico 1.1.
Sector de la economía
18
Unidad 1: El método estadístico. Organización y presentación de datos

Es válido también representar la distribución de frecuencias de la variable Sexo


con un gráfico de barras
Gráficos -> Gráfico de barras.
A continuación, se elige en variable a graficar: "Caso" y en variable de clasifica-
ción: Cat_Sector. Luego de aceptar se elige “Frecuencias absolutas” o “Frecuen-
cias relativas” según lo que se desee graficar.

Gráfico 1.2.
Sector de la economía

Sector de la Economía

51,9
Caso: frecuencia absoluta

41,7

31,5

21,3

11,2
Agropecuario No metálicos Metálicos Otras
Cat_sector

Del análisis de la tabla y los gráficos podemos decir que en esta muestra,
las empresas del sector industrial de productos metálicos y del sector de
origen agropecuario poseen participación similar en el total, siendo los dos
grupos más representativos, le siguen en importancia las industrias de
productos no metálicos. Otra variable categórica relevada en escala ordinal
fue la opinión de las empresas acerca de “la suficiencia de la oferta de
mano de obra calificada”. Las respuestas se agruparon en cuatro catego-
rías, según se presenta en la Tabla 1.2.

Tabla 1.2. Suficiencia de la Oferta de Mano de Obra Calificada

SUFICIENCIA DE LA FRECUENCIA PORCEN-


FRECUENCIA
OFERTA DE MANO DE PORCENTAJE ABSOLUTA TAJE
ABSOLUTA
OBRA CALIFICADA ACUM. ACUM.
Suficiente 50 33,8 50 33,8
Medianamente suficiente 42 28,4 92 62,2
Escasamente suficiente 39 26,4 131 88,5
Insuficiente 17 11,5 148 100,0
Total 148 100,0

131/148 x100

La escala es ordinal, ya que las categorías indican un cierto orden en


relación al nivel de suficiencia manifestado por las empresas. Cuando la
variable es categórica ordinal se pueden obtener las frecuencias absolu-
tas o relativas acumuladas, si lo que queremos saber es la cantidad o 19
proporción de elementos hasta cierta categoría en particular. En el gráfico
1.3 se representa a la variable categórica analizada.
Gráfico 1.3.
Oferta de Mano de Obra Calificada

El Gráfico 1.3, fue


realizado con la plani-
lla de cálculo MS Ex-
cel. La tabla que se
obtiene como resulta-
do en Infostat se pue-
de copiar a una plani-
lla Excel y desde el
menú INSERTAR ->
GRÁFICOS, seleccio-
nar el gráfico que se
quiera utilizar.

Actividad 3
El gerente de una empresa desea conocer la distribución de empleados
de acuerdo a su nivel de instrucción máximo alcanzado. Una vez recolec-
tada la información realizó un resumen de los datos, obteniendo la siguien-
te tabla de distribución de frecuencias:

NIVEL DE INSTRUC- FRECUENCIA ABSO- FRECUENCIA RELA-


CIÓN LUTA TIVA
Primario 48
Secundario 36
Terciario 15
Universitario 5
No sabe / no contesta 2
Total 106

a) Identifique la variable de estudio y a qué tipo pertenece.


b) Complete el cuadro calculando las frecuencias relativas para cada cate-
goría.
c) Represente las frecuencias por medio de un gráfico.

Variables numéricas

En primer lugar, analizaremos las variables numéricas discretas,


Para reflexionar que son aquellas que provienen de un proceso de conteo y que estarán
¿En qué situación la representadas con números enteros. Los valores que asume la variable en
cantidad de valores las n mediciones, a los que hemos llamado serie simple, pueden denotarse
distintos de la variable x1, x2 , ..., xn , en general xi para i=1,2,...,n donde el subíndice i indica el
es igual al número de orden en que se efectuaron las mediciones.
observaciones? Para resumir la información, construiremos la tabla de distribución de
frecuencias de manera análoga a como lo hicimos para las variables cate-
góricas. En la primera columna de la tabla se enumerarán los k valores
distintos de la variable, que se denotan con xi para i= 1, 2,…,k, donde x1 es
el mínimo y xk es el máximo valor que asume. Observe que el número de
20 distintos valores (k) que asume la variable es siempre menor o a lo sumo
igual al número de observaciones (n).
Para una mejor comprensión de la tabla de frecuencias considere-
mos el siguiente ejemplo referido al bloque de indicadores de innovación
tecnológica. En el mismo se relevó la cantidad de empleados que realizan
actividad de diseño e ingeniería industrial en cada una de las firmas de la
muestra que tienen desarrollada esta área de innovación tecnológica y se
obtuvo una variable que asume valores entre 1 y 6.
Unidad 1: El método estadístico. Organización y presentación de datos

En las columnas 2 y 3 de la Tabla 2.3 se presentan las frecuencias


absolutas y relativas simples denotadas como ni y hi, respectivamente y en
las dos restantes las acumuladas: absoluta (Ni) y relativa (Hi). Como se
señaló antes, las frecuencias relativas simples y acumuladas, pueden ex-
presarse porcentualmente.

Para la variable personal_diseño definirla como un valor entero desde


DATOS -> TIPO DE DATOS -> Entero
Luego pedir una tabla de frecuencia
ESTADISTICAS -> TABLA DE FRECUENCIA
En la solapa VARIABLES elegir personal_diseño, en la ventana TABLA DE
FRECUENCIAS y marcar, FA, FR, FAA y FRA.

Tabla 1.3. Cantidad de empleados área Diseño e Ingeniería Industrial

EMPLEADOS FRECUENCIA FRECUENCIA


QUE REALIZAN FRECUENCIA FRECUENCIA ABSOLUTA RELATIVA
LA ACTIVIDAD (nI) RELATIVA (hI) ACUM. ACUM.

Xi (Ni) (Hi)
1 13 0.46 17 0.46
2 7 0.25 20 0.71
3 3 0.11 23 0.82
4 2 0.07 25 0.89
5 2 0.07 27 0.96
6 1 0.04 28 1.00
Total 28 1.00

Observemos que la suma de las frecuencias absolutas es igual al


tamaño de la muestra, en tanto que la suma de las frecuencias relativas es
igual a uno.
En símbolos:
k
Frecuencias absolutas n
i 1
i n kn N xmax  n

ni
Frecuencias relativas hi 
n
h
i
i 1 H xmax  1

El total de empresas que cuentan con un departamento de diseño e


ingeniería industrial es 28 (n=28). De la lectura de la Tabla 1.3 surge que
las empresas que cuentan con un solo empleado afectado al departamento
de diseño e ingeniería industrial (x1 =1) son 13 (n1=13), las que represen-
tan un 46% (h1=0,46) del total, mientras que las que tienen 5 empleados o
menos son 27 (N5=27) lo que representa una proporción de 0,96 del total
(H5=0.96). Podemos hacer otra lectura diciendo que las empresas con más 21
de 4 empleados
(1-N4) en el departamento de diseño son 3, lo cual equivale en porcentaje
al 11%.

Para representar gráficamente las frecuencias calculadas en la tabla,


utilizamos gráficos cartesianos; en el eje de las abscisas se marcan los
distintos valores que puede asumir la variable y en el eje
de las ordenadas se va a representar la cantidad o porcentaje de observa-
ciones.

Las frecuencias simples (absolutas o relativas) se representan en un


gráfico de bastones (Gráfico 1.4.), donde para los distintos valores que
puede asumir la variable se levanta una ordenada que representa la canti-
dad o porcentaje de observaciones.

Infostat al igual que muchos softwares estadísticos no poseen


un comando para la construcción de los gráficos de bastones y
escalonados directamente. Veamos una manera de simular estos
gráficos con Infostat. Para graficar las frecuencias absolutas o relativas
simple seleccionar GRÁFICOS  GRÁFICOS DE BARRAS

En Variables a graficar
van los casos

En criterio de clasificación
va la variable que se quiere
graficar

En la ventana siguiente seleccionar

Seleccionar las frecuencias


a graficar

Luego se puede mejorar la edición del grafico cambiando la solapa


series el tamaño y en el eje Y los límites de la escala.

22
Unidad 1: El método estadístico. Organización y presentación de datos

Gráfico 1.4.
Cantidad de empleados área Diseño e Ingeniería Industrial
(frecuencias absolutas)

Gráfico de bastones

14 13
frecuencia absolutas

10

7
7

4 3
2
1 1
0
1 2 3 4 5 6 7
personal de diseño

Observamos en la tabla y en el gráfico de bastones, que la mayor


cantidad de empresas poseen un empleado en el área de diseño e ingenie-
ría industrial. La máxima cantidad de empleados que se posee en esa área
es de seis. Para las frecuencias acumuladas (absolutas y relativas) se
utiliza un gráfico escalonado (Gráfico 1.5.), donde para cada valor x i se
marca la frecuencia acumulada, valor que se mantiene constante hasta el
siguiente donde se produce el próximo escalón.

En Infostat se puede hacer este gráfico DESDE GRÁFICOS 


HISTOGRAMA, seleccionar la variable y desde la solapa series
de la ventana de Herramientas gráficas:

- cambiar la cantidad de clases a los distintos valores de la variable


- cambiar a frecuencias acumuladas (puede ser absolutas o relativas)
- destildar cuerpo

Gráfico 1.5.
Cantidad de empleados área Diseño e Ingeniería Industrial
(frecuencias absolutas acumuladas)
Diagrama escalonado

30

25
frec. abs. acumulada

20

15

10

5 23
0
1 1 2 3 4 5 6 6
personal_diseño

Dada la naturaleza discreta de la variable, entre los valores 3 y 4, por


ejemplo, no asume ningún otro valor; por lo tanto dentro de ese intervalo la
frecuencia será constante (igual a 23) y recién en 4 aumenta a 25 que se
mantendrá hasta el valor 5, y así sucesivamente.

Actividad 4:
La siguiente tabla muestra el stock de galletas obleas en paquetes de 20
gramos de la marca Trick en 30 kioscos.

STOCK DE GALLE- CANTIDAD DE KIOS-


TAS COS
300 3
400 5
500 7
600 6
700 5
800 4

a) Represente gráficamente la distribución de frecuencias relati-


vas (simple y acumuladas).
b) Obtenga todas las conclusiones posibles y responda:
b1) ¿Cuántos kioscos tienen 500 paquetes de galletas?
b2) ¿Cuántos kioscos tienen como máximo 500 paquetes?
b3) ¿Qué porcentaje de kioscos tienen 800 paquetes?
b4) ¿Qué porcentaje de kioscos tienen más de 500?

Actividad 5:
El gerente de ventas de “La Favorita”, desea lanzar una campaña de pro-
mociones para lograr que los compradores acudan con mayor frecuencia a
su negocio. Para obtener información preguntó a 25 consumidores mien-
tras esperaban en la caja para abonar: ¿Cuántas veces concurrió a este
negocio en el último mes? Para un día particular obtuvo las siguientes res-
puestas:

4 5 3 3 1
4 6 5 4 2
6 6 7 1 5
1 2 4 3 2
2 4 7 7 6

Sobre la base de esta información:


a) Organice los datos en una tabla de frecuencias.
b) Grafique convenientemente esta información.
c) Calcule y grafique las frecuencias relativas acumuladas. ¿Cómo se de-
nomina este gráfico?

24
Unidad 1: El método estadístico. Organización y presentación de datos

En el caso de variables numéricas continuas donde es necesario


agrupar los datos en intervalos. Cabe aclarar que cuando la variable es
discreta, pero asume muchos valores distintos puede también presentarse
por una distribución por intervalos. Como ejemplo de este tipo de variables
analizaremos el “porcentaje que representan los costos laborales en los
costos totales de la empresa”, incluida en la sección Personal Ocupado del
cuestionario.

Previo a la confección de la tabla por intervalos, podemos realizar


una primera exploración de este tipo de datos, utilizando el diagrama de
tallo y hojas, que constituye una variante de la distribución de frecuencias.
Este diagrama divide a las observaciones en “dígitos primarios y dígitos
derivados”. Por ejemplo, si las observaciones de los datos tuvieran a lo
sumo dos dígitos, la columna de las decenas sería el dígito primario y la
columna restante sería el dígito derivado. Si las observaciones fueran de
tres dígitos, el dígito primario estaría formado por las centenas y las dece-
nas, y el dígito derivado por las unidades. Cuando los datos estén forma-
dos por más de tres dígitos lo conveniente es cambiar la escala de medida.
Los dígitos primarios de los datos se denominan “tallo”; y los dígitos deri-
vados (unidades) se denominan “hojas”. La unidad de hoja se refiere a la
escala que se utiliza para presentar los datos en el diagrama.

Para una mejor comprensión de este diagrama veremos cómo se re-


presenta en éste la variable a analizar.
Los valores de la variable Porcentaje de Costo Laboral son los siguientes:

50 45 30 7 10 50 30 30 50 39
40 50 8 25 49 25 50 38 50 10
30 25 5 7 40 26 20 30 25 40
40 40 25 40 66 25 38 21 40 33
33 30 78 15 5 10 38 40 10 66
8 30 18 20 50 35 7 20 36 30
30 20 30 20 40 15 25 35 26
25 60 40 10 25 38 32 30 40
28 40 40 22 52 40 40 8 6
25 50 50 30 35 19 25 47 15
25 60 35 10 18 25 23 29 20
20 50 50 3 10 20 15,3 20 55
45 20 17 30 30 35 17 45 40
13 15 20 30 35 40 20 50 20
40 35 50 10 25 25 50 35 35

Representaremos la variable costos laborales en este tipo de dia-


grama (Gráfico 1.6.). El gráfico ha sido construido con el software estadís-
tico SPSS.

25
Gráfico 1.6.
Diagrama de Tallo y hoja de Porcentaje de Costo Laboral

A través de éste gráfico podemos observar el comportamiento de la


variable, donde representamos en el tallo el primer dígito del valor obser-
vado y en las hojas o ramificaciones el segundo dígito, lo cual nos da una
idea de la concentración de los valores más frecuentes, los valores meno-
res y los más grandes.
En este conjunto de datos los valores más frecuentes (35 en total) están
comprendidos entre el 20% y el 29% de los costos laborales, siendo los
valores mínimo y máximo el 3% y el 78%, respectivamente.

Actividad 6:
El siguiente ejemplo muestra la distribución de edades de 100 personas.

EDAD- Diagrama de tallo y hojas (“Stem-and-Leaf Plot”).

Frecuencia Tallo y hojas


7.00 1 - 8889999
16.00 2 - 0001111222334444
12.00 2 - 56666678999
10.00 3 - 0122223344
12.00 3 - 555677888899
15.00 4 - 001112223333344
10.00 4 - 5667778899
6.00 5 - 011224
8.00 5 - 55578889
1.00 6 - 4
3.00 6 - 789

Analice la distribución de edades

Tabla de frecuencias por intervalos

Para construir una tabla de distribución de frecuencias por intervalos,


debemos seguir los siguientes pasos:
26 1) decidir la cantidad de intervalos de clase apropiados;
2) obtener la amplitud de los mismos;
3) establecer una regla general para definir los límites del intervalo de cada
clase.

1) Decidir la cantidad de intervalos de clase apropiados (k): si bien


depende de la cantidad de observaciones con las que se cuenta,
se recomienda establecer no menos de 5 intervalos y no más de
Unidad 1: El método estadístico. Organización y presentación de datos

20. Si fueran muy pocas clases, los intervalos podrían ser muy
grandes, es decir cada intervalo abarcaría demasiada cantidad
de observaciones para permitir detectar la tendencia de los datos.
Por otra parte, tener demasiados intervalos se contradice con el
propósito que se persigue que es resumir un conjunto grande de
datos, para facilitar el análisis o la toma de decisiones. Conti-
nuando con el tratamiento de la variable “porcentaje de costo la-
boral” y dado que posee 141 observaciones, 7 intervalos serán
más que suficientes (con la la fórmula automática de Infostat re-
sulta 7,21, por esta razón tomamos 7 intervalos).

2) Obtener la amplitud de los intervalos de clase (c): una opción que


se usa frecuentemente es que todos los intervalos sean de igual
amplitud, lo cual facilita la interpretación. Ese valor c se obtiene
calculando la diferencia entre el valor más grande del conjunto de
datos (valor máximo) y el más pequeño (valor mínimo) dividiendo
luego esta diferencia entre el número de clases elegido. El desvío
del numerador es lo que se conoce como Recorrido o Rango
(R).
R Valor máximo  Valor mínimo
c =
k k

Donde:
c: amplitud de cada intervalo.
R: recorrido o rango de variación de la variable.
k: cantidad de intervalos elegidos.

Para el ejemplo:
78  3
c=  10, 714  11
7
c´= 11 donde: c´ es la amplitud definida

Por conveniencia y facilidad de lectura se deberá siempre redondear


el valor c por exceso, ya que al multiplicar la amplitud definida (c´= 11) por
la cantidad de intervalos, da como resultado un nuevo recorrido (R´) lige-
ramente superior al original, de tal manera que aquel incluya los dos ex-
tremos de este último. Por último, se repartirá la diferencia entre el Nuevo
Recorrido y el original (R´- R) por defecto y exceso. Para reflexionar
Si el recorrido teórico y
1 por defecto original coinciden la dife-
R´- R = 77 - 75 = 2 rencia entre ellos es cero.
1 por exceso Para que todos los valo-
res de la variable queden
Entonces el valor mínimo definido será: R´- R = 3 -1 =2 representados en un in-
tervalo el primero o el
Para construir los intervalos de clase al valor mínimo definido se le último, debe ser cerrado.
sumará la amplitud definida (c´) hasta conformar los 7 intervalos, de la si-
guiente forma:

y 'i-1 - y 'i 27
2 ; 13
13 ; 24
24 ; 35
35 ; 46
46 ; 57
57 ; 68
68 ; 79
3) Establecer una regla general para definir los límites del intervalo
de cada clase: para evitar el doble conteo de las observaciones.
Los intervalos serán semiabiertos, pueden ser abiertos por dere-
cha o por izquierda. Por ejemplo, en la primera alternativa los in-
tervalos son: “[)” cerrados por la izquierda y abiertos por la dere-
cha, lo que significa que se incluirá dentro del intervalo un valor
que sea igual al límite inferior; mientras que un valor exactamente
igual al límite superior del intervalo, será incluido en el intervalo
siguiente. Así el valor 35, para este caso, se computará dentro
del cuarto intervalo.

La principal desventaja de este tipo de tabla resumen es que no se


puede saber cómo se distribuyen los valores individuales dentro de cada
intervalo de clase ya que cada uno puede representarse por un punto me-
dio o marca de clase que se obtiene como el promedio simple entre los
límites de cada intervalo de clase.
y i' 1  y i'
yi =
2

Para el ejemplo, la primera marca de clase se obtiene como:

y0'  y1' 2  13
y1=   7,5
2 2

Si se desea obtener una distribución de frecuencias absolutas, una


vez construidos los intervalos se deberá contar la cantidad de valores que
se incluyen dentro de cada uno y así quedará conformada. Para obtener el
resto de las distribuciones se debe proceder de manera similar a cuando
se trabajó con datos discretos. Seguidamente en la Tabla 1.4 se presentan
las distribuciones de frecuencias vistas hasta aquí.

Tabla 1.4. Porcentaje de costo laboral

PORCENTAJE DE FREC. FREC.


PORCENTA- PORCENTA-
COSTO LABORAL ABSOLU- ABSOLUTA
JE JE ACUM.
y 'i-1 - y 'i TA ACUM.
HI HI
NI NI
2 – 13 18 12,8 18 12,8
13 – 24 27 19,1 45 31,9
24 – 35 37 26,2 82 58,2
35 – 46 36 25,5 118 83,7
46 – 57 18 12,8 136 96,5
57 – 68 4 2,8 140 99,3
68 – 79 1 0,7 141 100,0
141 100,0

Para lograr una tabla de distribución por intervalos en Infostat debe


28 tildarse la siguiente información: límites inferiores (LI) y superiores (LS)
de los intervalos de clase, marca de clase (MC), frecuencias absolutas
(FA), frecuencias relativas (FR), frecuencias absolutas acumuladas
(FAA) y frecuencias relativas acumuladas (FRA). El número de clases, puede ser
obtenido en forma automática o definido por el usuario (PERSONALIZADO). Para
la forma automática InfoStat obtiene el número de clases tomando el log2(n+1)
que da igual a 7 tal como lo hemos construido.
Unidad 1: El método estadístico. Organización y presentación de datos

Para ilustrar la posibilidad que da Infostat de calcular los intervalos en forma per-
sonalizada, construiremos una tabla de frecuencia para la variable de cinco inter-
valos. Para ello, tildando la opción Personalizado, debe indicarse 5 intervalos,
definiendo el mínimo y máximo valor de la variable. Por defecto, Infostat construye
los intervalos cerrados a la derecha, lo que se puede cambiar destildando la op-
ción en el cuadro de dialogo.

ESTADISTICAS -> TABLA DE FRECUENCIA


En la solapa VARIABLES elegir costos lab/costo total, en la ventana TABLA DE
FRECUENCIAS marcar, LI, LS, MC, FA, FR, FAA y FRA. Además, indicar NU-
MERO DE CLASES PERSONALIZADO; en nuestro caso considerar 5 clases

Y se obtiene una tabla como la siguiente:


Tablas de frecuencias
Variable Clase LI LS MC FA FR
costos lab/costo totAL 1 [ 3,00 18,00 ] 10,50 28 0,20
costos lab/costo totAL 2 ( 18,00 33,00 ] 25,50 54 0,38
costos lab/costo totAL 3 ( 33,00 48,00 ] 40,50 37 0,26
costos lab/costo totAL 4 ( 48,00 63,00 ] 55,50 19 0,13
costos lab/costo totAL 5 ( 63,00 78,00 ] 70,50 3 0,02

Los gráficos de las frecuencias absolutas o relativas simples para


distribuciones por intervalos son gráficos de superficie llamados histogra-
mas. El histograma (Gráfico 1.7.a), es uno de los medios gráficos de más
fácil interpretación, está formado por rectángulos o barras que se levantan
desde el eje de las abscisas donde se han marcado previamente, en una
escala numérica, los límites de cada intervalo de clase. La altura de cada
Densidad de frecuen-
una de las barras, que se registra en el eje de las ordenadas, se determina
cia es el cociente entre
de manera tal que su área sea proporcional a la frecuencia de cada clase, las frecuencias absolu-
pudiendo representarse tanto las frecuencias absolutas como las relativas tas y la amplitud del
o porcentajes cuando los intervalos son de la misma amplitud. ni / ci
intervalo
Cuando los intervalos son de distinta amplitud, la altura de cada ba-
rra se obtendrá como la proporción entre las frecuencias absolutas y la
amplitud del intervalo ni / ci , fracción que se denomina densidad de fre-
cuencia y será el resultado de esta fracción lo que se marcará sobre el eje
de las ordenadas para cada intervalo. 29
Es importante señalar dos cuestiones a tener en cuenta:
a) Nunca deben quedar el primer intervalo y el último con frecuencia
nula.
b) Generalmente es más útil presentar los datos en función de las fre-
cuencias relativas, ya que los términos absolutos pueden variar en-
tre distintas mediciones dependiendo esta variación fundamental-
mente de la cantidad de observaciones, es decir, la proporción en-
tre los intervalos tiene mayor permanencia.

Si suavizamos los extremos de cada intervalo, el histograma se


transforma en un polígono de frecuencias (Gráfico 1.7.b), que representa
la forma tradicional de graficar un conjunto de datos de escalas medibles.
El histograma y el polígono de frecuencias tienen la misma superfi-
cie, ya que cada porción de la superficie (triángulo) del histograma que se
pierde en un extremo del intervalo de clase, se gana en el otro extremo del
mismo, lo que se puede visualizar en el Gráfico 1.7 c en el que se ha su-
perpuesto un polígono al histograma. En ambos gráficos el área total para
la distribución de frecuencia relativa es 1 y para la frecuencia en porcentaje
es 100%.
Para construir un polí- Igual que la tabla de distribución de frecuencias, estos gráficos nos
gono de frecuencias permiten observar que entre 24 y 35 % se encuentra la mayor cantidad de
se marcan los puntos
medios o marcas de
empresas.
clase de cada intervalo La representación gráfica de las frecuencias acumuladas cuando la
sobre el eje de las varia ble en cuestión es numérica continua, es la Ojiva (Gráfico 1.8), que
abscisas, agregando es un gráfico lineal y se utiliza cuando se desea aproximar cuántas o qué
en los extremos (por porcentaje de las observaciones están por encima o por debajo de ciertos
defecto y por exceso)
dos nuevos intervalos valores clave.
con frecuencia cero. Una distribución de frecuencias acumuladas en base menor (mayor)
La frecuencia de cada indica cuántas observaciones de la distribución tienen un valor menor (ma-
clase se representa en yor o igual) que el límite superior (inferior) de cada clase.
el eje de las ordena-
Mediante la ojiva en base menor se puede aproximar por ejemplo
das.
Uniendo luego los que el 50% de las empresas poseen porcentajes de costos laborales me-
puntos de coordena- nores al 32%, o bien interpolando en sentido inverso: el porcentaje de em-
das que surgen de la presas que tienen un porcentaje de costo laboral menor al 40% es aproxi-
intersección de la madamente el 70%. Este tipo de gráfico resulta interesante al querer com-
frecuencia de clase y
el punto medio obten- parar dos ó más distribuciones.
dremos el polígono de
frecuencias.
Los dos nuevos inter- GRÁFICOS -> HISTOGRAMA
valos agregados en los Al construir un histograma, la ventana HERRAMIENTAS GRÁFICAS
extremos son para muestra un cuadro de diálogo que permite modificar los atributos del
cerrar el gráfico en el
histograma obtenido. En la solapa SERIES de esta ventana hay un
eje horizontal.
menú de opciones de histograma que permite cambiar el número de clases (Cla-
Para construir una ses) que por defecto son calculadas como Log2(n+1). Además, la ventana permite
ojiva, la variable se elegir la frecuencia representada en el histograma (Frec.). Las frecuencias a grafi-
marca sobre el eje de car pueden ser: frecuencia relativa (Frec. rel) que es la opción por defecto, fre-
las abscisas y las cuencia absoluta (Frec. abs.), frecuencia absoluta acumulada (Frec.abs. acum.) y
frecuencias acumula- frecuencia relativa acumulada (Frec. rel.acum.). El campo Bordes permite elimi-
das sobre el eje de las nar los contornos de las barras que forman el histograma. Se puede construir el
ordenadas. Los puntos polígono de frecuencia activando el campo Polígono. El campo Cuerpo permite
de coordenadas esta-
eliminar el histograma de fondo a partir del cual se dibujó el polígono. Los campos
rán dados por el límite
inferior de cada inter- LIPC y LSUC permiten ingresar los límites inferior y superior para la primera y
valo de clase y la fre- última clase respectivamente. Para lograr que los “ticks” se correspondan con las
cuencia acumulada marcas de clase de cada intervalo activar M. clases en la solapa Series.
hasta el intervalo ante- En el siguiente gráfico se eligieron frecuencias absolutas, 7 clases y polígono de
rior. Para el último frecuencias.
intervalo se marcará
también el límite supe-
rior del mismo y la
frecuencia acumulada
total. Luego, para
30
obtener la curva de
ojiva se conectan
estos puntos por líneas
rectas.
Unidad 1: El método estadístico. Organización y presentación de datos

Gráfico 1.7.
Porcentaje de Costo Laboral

POLIGONO DE FRECUENCIAS
(a) Histograma con polígono de fre-
0,34
cuencias

0,26
frecuencia relativa

0,17

0,09

0,00
-8 3 14 24 35 46 57 67 78 89
costos lab/costo totAL

(b) Polígono de frecuencias

Para graficar las frecuencias acumuladas se debe elegir GRAFICOS -


> HISTOGRAMA. En la solapa SERIES de la ventana HERRAMIEN-
TAS GRÁFICAS, destildar “Bordes” y “Cuerpo”, tildar “Marca de cla-
ses” y “Polígono” y seleccionar “Frecuencias acumuladas” (relativas
o absolutas). El gráfico que resulta es la OJIVA.

Gráfico 1.8.
Ojiva de base menor para el de frecuencias acumuladas en porcentaje de
Costo Laboral

OJIVA

1,00

0,75
frec. rel. acumulada

0,50

0,25

0,00
-8 3 14 24 35 46 57 67 78 89
costos lab/costo totAL 31

Interpretación de la forma de los gráficos de frecuencias

Los gráficos de frecuencias pueden presentar distintas formas. Si se


analiza cómo se distribuyen las observaciones entre todos los valores que
asume la variable, advertimos que pueden hacerlo de forma simétrica o
asimétrica. En una distribución simétrica (Gráfico 1.9) los datos están con-
centrados en los valores centrales, disminuyendo de manera similar hacia
ambos lados de la frecuencia máxima, lo que se ve representada en una
Ojiva con forma de S.
En una distribución asimétrica los datos pueden estar más concen-
trados en los valores menores de la variable (asimetría derecha o positiva)
o en los valores mayores (asimetría izquierda o negativa) (Grafico 1.9 b y c
respectivamente). En la asimetría derecha la ojiva presenta una fuerte
acumulación de las observaciones al inicio, y en la izquierda esta acumula-
ción ser presenta al final de la distribución.

Gráfico 1.9.
Análisis de la forma de la distribución de los datos

Distribución simétrica

Distribución de frecuencias simples Distribución de frecuencias acumuladas

Distribución asimétrica derecha o positiva

Distribución de frecuencias simples Distribución de frecuencias acumuladas

Distribución asimétrica izquierda o negativa

32

Distribución de frecuencias simples Distribución de frecuencias acumuladas


Unidad 1: El método estadístico. Organización y presentación de datos

Actividad 7:
Las ventas diarias (en $) para los últimos 120 días de una compañía de
servicios de transporte se organizaron en la siguiente distribución de fre-
cuencias:

FRECUENCIA FRECUENCIA
FRECUENCIA FRECUENCIA
ABSOLUTA RELATIVA
INTERVALO ABSOLUTA RELATIVA
ACUMULADA ACUMULADA
yi 1  yi ni I hi Ni Hi

530 - 730 3
730 - 930 7
930 – 1130 11
1130 – 1330 22
1330 – 1530 40
1530 – 1730 24
1730 – 1930 9
1930 – 2130 4
Total 120
Determine:

a) ¿Cuántos días se vendieron entre $1130 y $ 1330?


b) ¿Qué porcentaje de días se registraron ventas de entre $ 1130 y $
1330?
c) Represente mediante un histograma y un polígono de frecuencias,
la información dispuesta en la tabla.
d) Aproximadamente ¿cuál es el porcentaje de días que tienen como
ingreso $ 1730 o más?
e) ¿Podría describir la forma de la distribución?

Actividad 8:
Los precios de venta (en miles de $) de 40 casas de una zona residencial
de la ciudad de Córdoba son los siguientes:

90 99 78 84 45 124 113 52 49 109


101 107 111 90 105 80 123 125 100 42
56 47 69 50 81 96 73 93 62 57
113 82 115 86 85 104 73 130 84 129

a) Organice los datos en una distribución de frecuencias tomando cin-


co Intervalos de clase de una amplitud de $ 18, comenzando con el
valor 41.
b) Confeccione los gráficos que correspondan.
c) ¿Cuántas casas cuestan entre $ 77.000 y $ 95.000?
d) ¿Qué porcentaje de casas con un valor entre $ 77.000 y $ 95.000
se venden?
e) ¿Aproximadamente cuál es el porcentaje de las viviendas que se 33
venden en $ 77.000 o más?
5.4.2 Distribuciones Bidimensionales

Para estudiar el comportamiento de dos variables en forma conjunta,


como una primera inspección de los datos, podemos resumir la informa-
ción en tablas o gráficos según el tipo de variable que estemos conside-
rando.

Dos variables categóricas

Cuando se analizan dos variables categóricas, se construye una ta-


bla de frecuencias conjunta denominada tabla de contingencia. En una
tabla de contingencia una variable se representa en las filas y otra en las
columnas, por lo tanto, la tabla tendrá tantas filas y columnas como las
categorías de las variables.
En cada celda de la tabla se representa la frecuencia (absoluta o re-
lativa) asociada al par de categorías que se intersecan entre la fila y la co-
lumna.
Consideremos que queremos analizar conjuntamente si la empresa
es exportadora y el Sector de la Economía al que pertenece. Construire-
mos una tabla de contingencia (Tabla 1.5.) con las variables Sector de la
economía con tres categorías representadas en las filas, y la variable Ex-
porta, con dos posibilidades Si o No en las columnas.

Tabla 1.5. Tabla de contingencia: Sector de la economía y Exporta

EXPORTA
SECTOR DE LA ECONOMÍA
Si No TOTAL
De Origen Agropecuario 10 39 49
Productos no metálicos 6 30 36
Productos metálicos 13 37 50
Otras Industrias 6 7 13
Totales 35 113 148

Frecuencias conjun- Frecuencias marginales


tas
Las empresas de Productos no metálicos y que exportan, es decir
que presentan estas dos características conjuntamente son 6, este valor se
denomina frecuencia conjunta. Observemos que el total de cada fila es la
cantidad de empresas que pertenecen a cada categoría del sector de la
economía y el total de cada columna, es el total de empresas que exportan
o no. Los totales por filas y por columnas son las frecuencias marginales y
corresponden a las frecuencias de cada variable individualmente.
Generalizando, para las variables categóricas X con I categorías e Y,
con J categorías, simbolizaremos con nij a la frecuencia correspondiente a
categoría i de X conjuntamente con j de Y, los totales por fila se denotan
“ni.” y los totales por columna “n.j”.
Podemos representar en forma general una tabla de contingencia
con I filas y J columnas donde I y J son las categorías de las distintas va-
riables (Tabla 1.6.).

Tabla 1.6. Tabla de contingencia


34
Y
Y1 Y2 … YJ TOTAL
X
X1 n11 n12 … n1J n1
X2 n21 n22 … n2J n2
. . . … . .
XI nI1 nI1 … nIJ nJ
TOTAL n.1 n.2 n.J n
Unidad 1: El método estadístico. Organización y presentación de datos

En la Tabla de Contingencia se cumplen las siguientes relaciones:

La suma de todas las I J


Para nuestro ejemplo:
frecuencias conjuntas
 n n
3 2
debe ser igual al total i 1 j 1
ij
 n
i 1 j 1
ij  148
de observaciones.
Para nuestro ejemplo i =3
La suma de cada fila es J

n
J
igual a la frecuencia
marginal de la categoría n j 1
ij  ni .
j 1
3j  n3.
representada en la fila.
n3.  50
La suma de cada co- Para nuestro ejemplo j =2
I

n
lumna es igual a la fre- I
cuencia marginal de la  nij  n. j
i 1 i 1
i2  n.2
categoría representada
en la columna. n.2  113
La suma de las fre-
cuencias marginales I J I J
por fila y por columnas  ni .  n  n. j  n
i 1 j 1
 ni .  n
i 1
n
j 1
.j n
son iguales al total de
datos.

Si dividimos todos los valores de la tabla por el total de observaciones, se


obtienen las frecuencias relativas conjuntas, que denotaremos como hij
y se calculan como:
nij
hij 
n

La suma de todas las Para nuestro ejemplo:


I J
frecuencias relativas
conjuntas es igual a  h
i 1 j 1
ij 1
uno.
Para nuestro ejemplo i =3
La suma de cada fila
es igual a la frecuencia J
relativa marginal de la h j 1
ij  hi .
variable representada
en la fila.

La suma de cada co- Para nuestro ejemplo j =2


lumna es igual a la fre- I
cuencia relativa margi-
nal de la categoría re- h
i 1
ij  h. j
presentada en la co-
lumna.
La suma de las fre-
cuencias marginales
por fila y por columnas
son iguales uno.

35
Para construir una tabla de contingencia en Infostat, acceder desde el
menú ESTADISTICAS -> DATOS CATEGORIZADOS -> TABLAS DE
CONTINGENCIAS
Aparece una ventana en la que se deben desplazar las variables Cat_exporta y
Cat_sector a la ventana CRITERIOS DE CLASIFICACION de la solapa VARIA-
BLES. Luego al aceptar aparecerá la ventana TABLA DE CONTINGENCIA; en la
solapa SELECCIÓN DE FILAS Y COLUMNAS se debe indicar cuál de las varia-
bles se corresponderá con las filas de la tabla y cuál con las
columnas y destildar presentación en orden alfabético. En la solapa OPCIONES
se pueden elegir los tipos de frecuencias, dejamos tildado sólo Frecuencias abso-
lutas y Frecuencias relativas al total, y destildamos las pruebas (chi cuadrado y
otras que se estudiarán en la asignatura Estadística II). En la ventana resultados
se muestran las tablas siguientes.

Tablas de contingencia
Frecuencias absolutas
En columnas:Cat_exporta
Cat_sector NO SI Total
De Origen Agropecuario 39 10 49
Productos no metálicos 30 6 36
Productos metálicos 37 13 50
Otras Industrias 7 6 13
Total 113 35 148

Frecuencias relativas al total


En columnas:Cat_exporta
Cat_sector NO SI Total
De Origen Agropecuario 0,26 0,07 0,33
Productos no metálicos 0,20 0,04 0,24
Productos metálicos 0,25 0,09 0,34
Otras Industrias 0,05 0,04 0,09
Total 0,76 0,24 1,00

Las frecuencias relativas pueden ser más útiles que las absolutas en
algunas interpretaciones. Por ejemplo el 9% de las empresas (frecuencia
relativa al total igual 0,09), fabrican productos metálicos y exportan. Consi-
derando solamente la variable exporta, leemos la frecuencia marginal por
columna y podemos observar que el 76 % de las empresas no exportan.
Las industrias de origen agropecuario que no exportan son las más fre-
cuentes, con el 26%.
Para graficar las frecuencias absolutas o relativas conjuntas se pue-
den utilizar los gráficos de barras múltiples o los de barras componen-
tes.
En un gráfico de barras múltiples, se representa para cada categoría
de una variable (en este caso los tipos de industria) tantas barras como
categorías de la otra (si exporta o no) y la altura de cada barra es el por-
centaje de frecuencia conjunta entre las dos categorías analizadas. A con-
tinuación, se presenta un gráfico de barras múltiples construido con Excel.

Gráfico 1.10.
Análisis conjunto de Sector de la economía y Exporta.

Industrias clasificadas según el Sector de la Economia y si


exportan

30
25 26
25
20 20
15 Exporta
10 No Exporta
9
5 7
4 4 5
0
De Origen Productos no Productos Otras
36 Agropecuario metálicos metálicos Industrias

En cambio, en un gráfico de barras componentes, cada barra repre-


senta cada categoría de una variable y se divide en tantas partes como
categorías de la otra. A continuación, veremos cómo construir con Infostat
un gráfico de barras componentes.
Unidad 1: El método estadístico. Organización y presentación de datos

Para construir un gráfico de barras apiladas en Infostat, desde la


ventana de resultados debe capturarse la tabla de contingencia como
una tabla de datos para lo cual debe seleccionarse la tabla que se quie-
ra considerar y hacer clic en el icono

Para graficar ingrese a GRÁFICOS


-> GRÁFICO DE BARRAS APILADAS. Como Variables seleccione SI y NO y
como Criterio de Clasificación, seleccione Cat_sector. El gráfico obtenido se
muestra a continuación:

- Seleccionando apilar valores observados

Gráfico 1.11.
Cantidad de empresas que exportan en cada sector

53 CANTIDAD DE EMPRESAS QUE EXPORTAN EN CADA SECTOR

39
Valores acumulados

26

13

0
De Origen AgropecuarioProductos no metálicos Productos metálicos Otras Industrias
Cat_sector

- Seleccionando apilar proporciones

37
Gráfico 1.12.
Proporción de empresas que exportan dentro de cada sector

Empresas que exportan dentro de cada sector

1,00

0,75

0,50

0,25

0,00
De Origen AgropecuarioProductos no metálicos Productos metálicos Otras Industrias
Cat_sector

A partir del análisis gráfico ¿qué conclusión puede obtener respecto


a la exportación en el sector industrial?

Frecuencias condicionadas

Cuando analizamos una tabla de contingencia muchas veces intere-


sa conocer la proporción que representa una variable sobre una determi-
nada categoría de la otra. Esto es calcular proporciones sobre los totales
fila o columna según la variable que estamos considerando.

Si queremos analizar qué proporción representa la variable Y sobre


cada categoría de la variable X se calculan las proporciones filas, como se
muestra en la Tabla 1.7., donde podemos observar que el total de cada fila
es 1.

Tabla 1.7. Frecuencias Condicionales por Fila

X Y1 Y2 … YJ TOTAL
X1 n11 / n1. n12 / n1. … n1J / n1. 1
X2 n21 / n2. n22 / n2. … n2J / n2. 1
. . . … . .
. . . … . .
. . . … . .
XI nI1 / nI. nI1/ nI. … nIJ / nI. 1

Las proporciones de cada fila se denominan frecuencias condiciona-


das, en este caso, por filas. Las frecuencias condicionadas por filas indican
la proporción de la categoría j de la variable Y sobre el total de la categoría
i de la variable X.

De la misma forma se calculan las frecuencias condicionadas por co-


lumnas. Las frecuencias condicionadas por columnas indican la proporción
38 de la categoría i de la variable X sobre el total de cada categoría j de la
variable Y.

ESTADISTICAS -> DATOS CATEGORIZADOS -> TABLAS DE CON-


TINGENCIAS
En la solapa OPCIONES se pueden elegir los tipos de frecuencias,
dejamos tildado sólo Frecuencias relativas por filas y Frecuencias
Unidad 1: El método estadístico. Organización y presentación de datos

relativas por columnas. En la ventana resultados se muestran las tablas siguien-


tes.
Tablas de contingencia
Frecuencias relativas por filas
En columnas:Cat_exporta
Cat_sector NO SI Total Frecuencias relativas
De Origen Agropecuario 0,80 0,20 1,00 exporta condicionadas
Productos no metálicos 0,83 0,17 1,00 al sector
Productos metálicos 0,74 0,26 1,00
Otras Industrias 0,54 0,46 1,00
Total 0,76 0,24 1,00

Frecuencias relativas por columnas


En columnas:Cat_exporta
Cat_sector NO SI Total Frecuencias relativas
De Origen Agropecuario 0,35 0,29 0,33 sector condicionadas a
Productos no metálicos 0,27 0,17 0,24 si exporta.
Productos metálicos 0,33 0,37 0,34
Otras Industrias 0,06 0,17 0,09
Total 1,00 1,00 1,00

De las Frecuencias relativas por filas (condicionadas a la fila) se ob-


serva que del total de empresas que pertenecen al sector agropecuario, el
0,20 exporta y el 0,80 no.

Las frecuencias condicionadas por columna, indican que del total de


empresas exportadoras el 0,37 corresponden a Productos metálicos, el
0,29 corresponden al sector agropecuario, el 0,17 a Productos No Metáli-
cos y la misma proporción a otras industrias. Mientras que las no exporta-
doras el 0,35 son empresas de origen agropecuario y el 0,33 de productos
metálicos.

Otros gráficos de frecuencias condicionadas

En muchas situaciones es útil calcular frecuencias de una variable


dado un valor particular de otra variable analizada, que denominamos fre-
cuencias condicionadas.
Las empresas analizadas fueron también consultadas respecto a su
participación en emprendimientos conjuntos con otras empresas, en los
últimos cinco años.

Tabla 1.8. ¿Participa o ha participado en emprendimientos conjuntos con


otras empresas?

FRECUENCIA ABSO-
PARTICIPA PORCENTAJE
LUTA
SI 16 10,8
NO 132 89,2
TOTAL 148 100,0

A las 16 empresas que contestaron afirmativamente, se les pidió que


indique la localización de las empresas con las que se asociaron.

Tabla 1.9. Localización de otras empresas con las que han participado en
emprendimientos 39
LOCALIZACIÓN DE FRECUENCIA ABSO-
PORCENTAJE
OTRAS EMPRESAS LUTA
Locales (100 km) 10 62,5
De la provincia 3 18,75
Nacionales 3 18,75
TOTAL 16 100,00
Para representar estas variables puede utilizarse un gráfico circular
combinado (Gráfico 1.13). Este gráfico está construido con Excel.

Gráfico 1.13.
Gráfico para frecuencias condicionadas

Participación en emprendimientos conjuntos con otras


empresas y su localización

3 No participa

Locales (100 Km)


3
132 16 De la provincia
10 Nacionales

La respuesta a la localización de las empresas con las que participa


o participó del algún tipo de emprendimiento es de naturaleza ordinal, ya
que indica un cierto orden en relación a la jurisdicción a la que pertenece la
empresa socia.

Tabla 1.10. Localización de otras empresas

LOCALIZACIÓN FRECUENCIA
FRECUENCIA PORCENTAJE
DE OTRAS PORCENTAJE ABSOLUTA
ABSOLUTA ACUMULADO
EMPRESAS ACUMULADA
Locales (100 10 62,50
10 62,5
km)
De la provincia 3 18,75 13 81,25
Nacionales 3 18,75 16 100,00
TOTAL 16 100,00

Interpretemos los siguientes valores de las frecuencias acumuladas:


- Un 62,50% se asoció con empresas radicadas a una distancia de hasta
100 Km.
- 13 empresas se asociaron con empresas locales o radicadas en la pro-
vincia, lo que constituye el 81,25 %.

Actividad 9:
Los establecimientos agropecuarios de la Provincia de Córdoba han sido
clasificados de acuerdo a sus niveles de producción, en altos, medianos y
bajos y de acuerdo a la zona geográfica donde se encuentran ubicados.
Los resultados se muestran en la siguiente tabla:

40 Zona geográfica de la Provincia

NIVEL DE
ZONA “A” ZONA “B” ZONA “C” TOTAL
PRODUCCIÓN
Alto 69 47 23 139
Mediano 40 25 80 145
Bajo 38 32 36 106
TOTAL 147 104 139 390
Unidad 1: El método estadístico. Organización y presentación de datos

Se pide:
a) ¿En qué dirección sería preferible calcular los porcentajes? ¿Por
qué?
b) Calcule dichos porcentajes y obtener algunas conclusiones.
c) Obtenga la razón entre el número de establecimientos con nivel de
producción alto y el número de establecimientos con nivel de pro-
ducción bajo en cada una de las tres zonas. Comente sus resulta-
dos.

Dos variables numéricas

Ahora veremos el caso de dos variables numéricas; por ejemplo, se


conoce la cantidad de personal ocupado y el porcentaje del costo laboral
en el costo total de las empresas.

No es conveniente representar estos datos en una tabla de frecuen-


cias debido a que se trata de variables continuas o discretas numerosas y
la combinación de ambas variables pueden estar repetidas muy pocas ve-
ces o ninguna. Para visualizar su comportamiento conjunto es conveniente
realizar un gráfico de dispersión.

En este gráfico, representamos en el eje de las abscisas el porcenta-


je del costo laboral y en el eje de las ordenadas el personal ocupado; po-
demos observar que menores niveles de costo laboral se corresponden
con menor cantidad de personal ocupado. (Gráfico 1.14).

Se puede realizar un gráfico de dispersión como el siguiente desde el


menú de GRAFICOS –> DIAGRAMA DE DISPERSION

Gráfico 1.14.
Diagrama de Dispersión

Relación entre personal y participación del costo laboral


300
270
240
210
Personal

180
150
120
90
60
30
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85
Costos lab/costo total

41
Para construir esta gráfica con Infostat transformamos primero la variable
desde el menú Datos  Transformar, seleccionar la variable y en la venta-
na de dialogo siguiente la transformación que se quiere realizar.
Actividad 10
La tasa de desempleo (x) y la tasa de renuncia (y) para 13 regiones se
relevaron en un momento determinado del tiempo. Los datos obtenidos se
presentan en la siguiente tabla:

Construya un diagrama de dispersión y analice el tipo de relación entre las


variables.

5.4.3. Otro tipo de Gráfico: Gráfico logarítmico.

Los gráficos logarítmicos o a escala logarítmica son utilizados para


representar series económicas, comerciales o en general de cualquier tipo.
La diferencia entre una escala aritmética y una escala logarítmica es que
en la escala aritmética una diferencia numérica se representa siempre
por la misma distancia vertical, por ejemplo, la diferencia entre 200 y 100 o
entre 1300 y 1200 es la misma distancia. En cambio, en la escala logarít-
mica la misma diferencia porcentual se representa siempre por la misma
distancia, por ejemplo, la diferencia entre 200 y 100 o entre 40000 y 20000
es la misma distancia, por esta causa los gráficos con esta escala suelen
llamarse gráficos de razones o proporciones.

¿Cuándo usamos un gráfico a escala aritmética y cuándo uno a esca-


la logarítmica?

 Si se quiere representar gráficamente magnitudes y compararlas


entre sí, el gráfico que se debe utilizar debe estar a escala aritméti-
ca o natural, y las diferencias estarán expresadas en términos de
cantidades reales.
 Si lo que se quiere mostrar son variaciones en porcentajes, o la re-
lación porcentual en el cambio de cierto conjunto de datos con res-
pecto a otros, es necesario utilizar una escala logarítmica.
42
Considerar el comportamiento de una serie económica o comercial
en escala logarítmica, implica la comparación de tasas de cambio, es decir,
la razón entre un par de valores sucesivos de la serie analizada o el cálcu-
lo de números índices. Un gráfico logarítmico evita realizar este cálculo de
proporciones sucesivas.
Unidad 1: El método estadístico. Organización y presentación de datos

Herramientas matemáticas en los que se fundamenta su confección

En primer lugar, veamos la relación que existe entre una progresión


numérica aritmética y una logarítmica.
La siguiente secuencia de números 1, 2, 4, 8, 16, 32, 64, 128, ... si-
gue una progresión geométrica y representa las potencias de 2: 20, 21, 22,
23, 24, 25, 26, 27, ... Examinando los exponentes observamos que los mis-
mos siguen una progresión aritmética 0, 1, 2, 3, 4, 5, 6, 7, … donde la base
de estas potencias es un valor fijo.
Recordemos que un logaritmo está definido como la potencia a la
cual se eleva una base común a fin de obtener un cierto valor prefijado.
Utilizando esta definición en el ejemplo dado:

20 = 1  log 2 1 =0
21 = 2  log 2 2 =1
22 = 4  log 2 4 =2
23 = 8  log 2 8 =3
24 = 16  log 216 =4
25 = 32  log 232 =5
26 = 64  log 264 =6
.
.
.

Realizando cambio de base en los logaritmos se puede formar otra


serie con potencias de cualquier otra base común, normalmente los loga-
ritmos se toman sobre la base 10.

De esta manera podemos reescribir la serie geométrica 1, 2, 4, 8, 16,


32, 64, ... de la siguiente manera 10 0, 100,3010, 100,6020, 100,9030, 101,2040,
101,5050,… nuevamente los exponentes forman una serie aritmética, enton-
ces los logaritmos también forman una serie aritmética. La relación entre
las series permite tratar a una serie geométrica como aritmética mediante
el uso de los correspondientes logaritmos de base común y fija.
Volviendo a las series económicas y comerciales, éstas presentan un
comportamiento que podría ser asimilado a una serie geométrica y que
puede ser analizado a través de los logaritmos. Podemos transformar los
datos en sus correspondientes logaritmos, y por simple comparación de los
mismos es posible descubrir rápidamente cualquier variación en los cam-
bios.

Representación gráfica

Como se mencionó en el último párrafo del punto anterior un camino


es calcular el logaritmo de la variable y representar gráficamente este últi-
mo en coordenadas aritméticas.
Otra forma no necesita transformar los datos originales, lo que se
transforma es la escala de los gráficos en escala logarítmica antes de la
representación de los datos.
A continuación, se presenta un ejemplo, donde los datos son la pro-
ducción de dos empresas entre los años 2000 y 2007 expresados en miles
de pesos y los logaritmos naturales de los datos.
43
Tabla 1.11. Tabla de frecuencias

PRODUCCIÓN (en miles de pesos)


AÑOS EMPRESA A EMPRESA B LN. EMP. A LN. EMP. B
2000 40 2 3,69 0,69
2001 80 4 4,38 1,39
2002 120 8 4,79 2,08
2003 160 16 5,08 2,77
2004 200 32 5,30 3,47
2005 240 64 5,48 4,16
2006 280 128 5,63 4,85
2007 320 256 5,77 5,55

En el Gráfico 1.15 se muestran los valores de la variable en escala


aritmética, donde se pueden analizar los cambios en los niveles de pro-
ducción de un año a otro en términos absolutos.

Gráfico 1.15.
Escala Aritmética

Para analizar las variaciones porcentuales o las tasas de cambio de


un año a otro necesitamos trabajar con logaritmos, en este ejemplo como
una variable es el tiempo éste se representa en el eje de las abscisas a
escala aritmética. En el Gráfico 1.16.a, la escala del eje de las ordenadas
es logarítmica y en el Gráfico 1.16.b se utilizó en el eje de las ordenadas
una escala aritmética, pero se graficaron los logaritmos de los valores de la
variable.

Gráfico 1.16.
(a) Escala Logarítmica
(b)
Producción Anual (en miles de pesos)
1000

100

EMPRESA A
44 EMPRESA B
10

1
2000 2001 2002 2003 2004 2005 2006 2007
Años
Unidad 1: El método estadístico. Organización y presentación de datos

(c) Variables transformadas con el logaritmo

Esta última gráfica es posible construirla con Infostat, para ello


transformamos primero la variable con DATOS  TRANSFOR-
MAR, seleccionar la variable y en la ventana de dialogo siguiente
la transformación que se quiere realizar. Para graficar seleccionar GRÁ-
FICOS  GRÁFICO DE LA DISTRIBUCIÓN EMPÍRICA.

Observamos que la representación gráfica que se obtiene es la mis-


ma en los dos casos y diferente de la gráfica a valores aritméticos. En es-
tos dos últimos gráficos es posible analizar la variación en la tasa de cre-
cimiento de la producción a través de los años.

¿Te animas a realizar un informe con las conclusiones que surgen de


estos gráficos?

5.5. Algunos lineamientos a considerar en la presentación de informes

Los resultados de un estudio estadístico deben ser informados a los


interesados. Es necesario presentar los resultados de manera adecuada,
de forma tal que contribuya a una mejor comprensión y exposición de di-
chos resultados, en función de los objetivos del trabajo. Para organizar una
presentación es necesario conocer con precisión la audiencia para buscar
y seleccionar correctamente los relatos y el lenguaje adecuado, así como
los recursos visuales y gráficos que puedan captar su atención. Esto puede
resultar más complejo cuando la información es abierta utilizando Internet
donde hay un público muy diverso y no siempre se conoce las característi-
cas de quienes reciben la información de los resultados.

Existen tres tipos fundamentales de presentación: en forma escrita,


con cuadros estadísticos y gráficas.

- La presentación escrita es la forma más habitual de presentar un


informe de resultados y conclusiones y/o recomendaciones. Debe
limitarse a lo estrictamente necesario, cuidando de mantener una
secuencia lógica en la exposición sin incurrir en repeticiones, ci- 45
tando todas las tablas y figuras a que se haga referencia.

- Las tablas estadísticas resultan de gran ayuda ya que permiten


mostrar frecuencias, relaciones, contrastes, variaciones y ten-
dencias en una forma sintetizada, más comprensible y ordenada
de la información. Estas deben ser autoexplicativas, para que el
lector no tenga necesidad de acudir al texto pa-
ra conocer de qué trata determinada tabla.
Las partes de una tabla son:
 Número de orden: para facilitar la referencia a la ta-
bla en el texto.
 Título completo, claro y conciso: es decir, debe refle-
jar claramente en qué consiste el contenido.
 Cuadro propiamente dicho o cuerpo de la tabla.
 Notas explicativas o calce (también se le llama pie).
Sirven para indicar la fuente de donde se obtuvieron
los datos y, de ser pertinente, la significación estadís-
tica o alguna breve nota aclaratoria del contenido.

- Los gráficos constituyen un complemento importante para la pre-


sentación de los resultados. Generalmente se elaboran a partir
de tablas estadísticas, pero al presentar los resultados. No es
conveniente acompañar a cada tabla por un gráfico, ello puede
originar repeticiones en la información. El gráfico debe agregar in-
formación, no duplicarla, por lo que el gráfico debe utilizarse
cuando se quiera mostrar algún patrón especial en los resultados,
destacar tendencias o ilustrar comparaciones de forma clara y
exacta. El gráfico, también debe ser autoexplicativo, sencillo y de
fácil comprensión.

Las partes del gráfico son:


 Número de orden.
 Título.
 Cuerpo o gráfico propiamente dicho.
 Leyenda permite identificar claramente los diferentes
elementos del cuerpo del gráfico.

Las Naciones Unidas en su documento Cómo hacer comprensibles


los datos dice: “Un relato estadístico debe basarse en un conocimiento
suficiente de los datos y del fenómeno en estudio, de lo contrario, podría
ser interesante, pero totalmente erróneo. Cuando se está preparando un
relato estadístico, también debes recordar los Principios Fundamentales de
las Estadísticas Oficiales: 1. Imparcialidad; 2. Profesionalidad; 3. Metada-
Las últimas tres caracterís- tos; 4. Formular observaciones sobre interpretaciones erróneas; 5. Diversi-
ticas: 8. Coordinación a nivel dad de fuentes; 6. Confidencialidad; 7. Transparencia”.
nacional; 9. Estándares inter- The International Statistic Institute define una serie de principios éti-
nacionales; 10. Cooperación cos a considerar por los estadísticos. Como expresa Blacona (2011),”… la
internacional, están referidas ética no se incluye formalmente en los planes de estudios. Sin embargo, es
específicamente a las esta- un tópico fundamental para el desempeño profesional”, si bien se refiere
dísticas de organismos oficia- específicamente a los profesionales en estadística, podemos extenderlo a
les. todos aquellos profesionales que utilizan estas herramientas en el ejercicio
de su profesión.

6. Actividades de aprendizaje
46 Actividad 11:
Describa en cada uno de los casos mencionados más abajo:
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es la unidad estadística?
d) ¿Cuál es la variable o característica principal de cada estudio y de qué tipo
es?
Unidad 1: El método estadístico. Organización y presentación de datos

Caso A: Mientras un camión espera para descargar en un silo de granos la


producción de trigo de un campo, se toma una muestra de semillas de tri-
go. Sobre la base de los resultados se clasifica a la semilla en excelente,
muy buena, buena o mala, y se establece el precio de toda la carga del
camión.

Caso B: El Ministerio de Trabajo de la Provincia de Córdoba vigila cons-


tantemente las cifras sobre empleo, salario, movimiento laboral, etc. En
base a una muestra de 100 trabajadores, el Ministerio presenta las siguien-
tes cifras correspondientes a un mes en particular: "2 de cada 100 emplea-
dos cambiaron de trabajo el último mes; el sueldo mensual de los obreros
metalúrgicos fue de $ 12480; el número promedio de horas de trabajo en
las empresas alimenticias fue de 40,2".

Caso C: El departamento de contabilidad de una empresa toma 50 factu-


ras del último mes para analizar si están correctamente confeccionadas, en
base a ello tratar de determinar el porcentaje de facturas "mal confeccio-
nadas" que tendrá el próximo mes.

Caso D: Un fabricante de cosméticos desea estudiar el grado de satisfac-


ción de sus clientes a los que les ha regalado su nuevo producto. Está pla-
neando para ello entrevistar a 400 de esos clientes. Además de lo que se
le pide en el encabezado del ejercicio, elaborar un primer borrador de
cuestionario, anotando tres preguntas que generen variables cualitativas y
tres preguntas que generen variables cuantitativas, que sean apropiadas
para esta encuesta.

Caso E: El gerente del departamento de atención al cliente de la N.V.C.,


está interesado en determinar si los clientes que compraron electrodomés-
ticos en el último año están satisfechos con sus productos. Utilizando las
tarjetas de garantía que envían los clientes después de la compra, el ge-
rente está planeando encuestar a 600 de esos clientes.

Caso F: En una encuesta política para tratar de pronosticar el resultado de


una elección de la Capital Federal, se seleccionan 1000 personas en con-
diciones de votar.

Actividad 12:
La empresa Nielsen efectúa encuestas semanales a los televidentes resi-
dentes en la ciudad de Córdoba. Sus calificaciones estadísticas indican el
tamaño de la audiencia para cada uno de los principales programas de la
televisión local. Las calificaciones de los programas y la parte del mercado
para cada canal se publican semanalmente.
a) ¿Qué trata de medir la empresa Nielsen?
b) ¿Cuál es la población?
c) ¿Usted cree que se utilizará una muestra?
d) ¿Qué tipos de decisiones o acciones cree usted que se basan en
las mediciones de Nielsen?

Actividad 13: 47
Una consultora encargada de efectuar estudios de mercado en Córdoba,
pidió a 800 consumidores que probaran un plato de pastas denominado
“ZIA MARIA”, que es de elaboración reciente de un fabricante. De los 800
consumidores consultados 600 dijeron que comprarían el plato si se pusie-
ra a la venta.
a) ¿Qué informará la consultora al fabricante, respecto a la aceptación
del “ZIA MARIA”?
b) ¿Es éste un ejemplo de estadística descriptiva o inferencial? Justifi-
que la respuesta.
c) ¿Cuál es la población, cuál es la muestra y cuál es la unidad esta-
dística?
d) Identifique el parámetro de interés y el estadístico. ¿Se conoce el
valor de alguno de ellos?

Actividad 14:
Un diario de Córdoba informó acerca del tipo de medios de comunicación
existentes en la ciudad. Los datos son los siguientes:
MEDIOS DE COMUNICACIÓN CANTIDAD
Diarios 3
Radios A.M. 4
Radios F.M. 49
Canales T.V. por aire 3
Canales T.V. por cable 5
Revistas 27

¿A qué escala de medición responden estos datos? ¿Por qué?

Actividad 15:
Determine si cada una de las variables es categórica o numérica. Si es
numérica indique si es discreta o continua, y cuál es la escala de medición.
A los estudiantes de la Facultad de Ciencias Económicas se les preguntó:

a) Si posee automóvil o no.


b) La cantidad de dinero que gastó en transporte el mes anterior.
c) Si tiene computadora o utiliza el gabinete de computación de la facultad.
d) El tiempo que utiliza una computadora por semana.
e) La cantidad de libros que compró en los últimos 12 meses.
f) La cantidad de dinero que gastó en libros en los últimos 12 meses.
g) Las editoriales preferidas.
h) El número de suscripciones a revistas económicas.

Actividad 16:
Para controlar el valor de un inventario, el administrador de una ferretería
quiere limitar la cantidad de cada artículo en el depósito; al mismo tiempo,
evitar perder ventas por falta de stock. Para lograr esto, el administrador
desea saber cuáles son las características de la demanda para cada ar-
tículo.
a) Describa la población de interés para el administrador.
b) Proporcione un ejemplo de muestra representativa de esta pobla-
ción.¿Qué preguntas tendría que hacer el administrador? Elabore
por lo menos tres.

Actividad 17:
Un periódico realizó una encuesta telefónica a 480 habitantes selecciona-
dos aleatoriamente de distintas áreas de la capital cordobesa. La siguiente
tabla muestra las respuestas acerca de la opinión de los servicios de segu-
48 ridad. La pregunta realizada fue: “En su barrio, ¿son adecuados los servi-
cios de policía y de bomberos?” Las respuestas obtenidas fueron:

OPINIÓN NÚMERO DE CASOS


SI 336
NO 96
NS / NC 48
TOTAL 480
Unidad 1: El método estadístico. Organización y presentación de datos

a) Obtenga la distribución de frecuencias relativas.


b) Construya un gráfico de barras y un diagrama de pastel con esta informa-
ción.
c) ¿Cuál de estos gráficos le parece más informativo y por qué?

Actividad 18:
Los siguientes datos se encuentran disponibles en archivos de una empre-
sa. Explicite el tipo de variable y la escala de medición.

ARCHIVO DE PERSONAL
Variable Tipo de varia- Escala de medi-
ble ción
Barrio donde vive el empleado
Salario
Días de vacaciones
Días de ausencia por enfermedad
Edad
Adelantos de sueldo en un mes determina-
do

REGISTRO DE LA PRODUCCIÓN
Variable Tipo de variable Escala de medición
Tipo de producto
Cantidad mensual producida por producto
Costo de la mano de obra
Costo de materiales

REGISTROS DE INVENTARIO
Variable Tipo de variable Escala de medición
Existencia diaria por producto
Existencia diaria por insumo
Descuentos por producto

REGISTROS DE VENTAS
Variable Tipo de variable Escala de medi-
ción
Ventas mensuales por producto
Ventas mensuales por región geográfica
Ventas mensuales por tipo de cliente
Canales de venta

PERFIL DEL CLIENTE


Variable Tipo de varia- Escala de medición
ble
Edad
Sexo
Nivel de ingresos (alto, medio,bajo)
Zona donde vive

49
Actividad 19:
El área de mercadotecnia de una empresa ha propuesto una nueva bebida
dietética que, piensa, captará una gran parte del mercado de adultos jóve-
nes.

¿Qué información se debería tener en cuenta al momento de inver-


tir en la incorporación de un nuevo producto en el mercado? Pro-
ponga una forma de recolección de los datos para obtener esa in-
formación.

Actividad 20:
Las cotizaciones de un tipo de acciones en la bolsa para los últimos 22
días fueron las siguientes:

8.4 9.2 11.3 7.8 10.9 10.2 8.0 9.0 10.4 9.7 8.9

11.7 9.7 9.6 10.5 8.5 9.9 8.2 10.3 11.3 8.0 3.0

Elabore una representación de tallo y hoja e interprétela. (Ayuda: los ente-


ros formarán el tallo y los decimales las hojas).

Actividad 21:
La siguiente tabla muestra datos correspondientes a la enegia anual gene-
rada en el país en Gigawatts/hora.

Años Total de energía generada Hidráulica Nuclear


2008 114724 31456 7330
2009 114337 35093 8162
2010 120011 33300 7171
2011 124802 31309 6371
2012 129007 29308 6395
2013 133705 33333 6207
2014 137181 33345 5514

a) Represente gráficamente la información de manera tal que permita


analizar la evolución porcentual de la energía total generada, y co-
marar la variación interanual de la energía hidráulica y nuclearIndi-
que la variación promedio anual de la energía generada total, hi-
dráulica y nuclear.

Actividad 22:
Represente gráficamente la siguiente información:

Precio 3 3.9 6 10 4.5


Cantidad
1 1.3 2 3.33 1.5
ofrecida
Precio 10 8 7 6 4
Cantidad
2 4 5 6 8
demandada

Para elegir el tipo de gráfico, tenga en cuenta que cada uno de ellos debe
permitir discutir las siguientes opiniones:

a) La elasticidad precio de la oferta es constante.


50 b) La pendiente de la curva de demanda es constante.

Actividad 23:
Para 15 empresas se relevó el precio y el margen de utilidad de un produc-
to. Los datos obtenidos (en miles de pesos) se presentan en la siguiente
tabla:
Unidad 1: El método estadístico. Organización y presentación de datos

PRECIO
UTILIDAD (y)
(x)
15 5,3
15 6,0
14,8 5,2
13 3,9
16 4,8
14 4,2
14,5 4,4
15,5 4,7
13 3,9
15 4,5
13,5 4,7
14,6 5,1
15,5 5,4
14,8 5,9
13,8 4,8

Construya un diagrama de dispersión y analice el tipo de relación entre las varia-


bles.

Actividad 24:
Una heladería cuenta con dos sucursales en la Ciudad de Córdoba, una
ubicada en la zona Norte y otra ubicada en la zona Sur. A continuación, se
presenta información sobre el número de pedidos telefónicos recibidos por
día, para una muestra aleatoria de 20 días:

Zona
4 6 7 5 5 6 7 4 8 6 8 5 7 6 7 5 6 6 7 4
Norte
Zona
4 6 5 3 6 3 5 6 5 6 4 4 5 6 6 2 3 4 5 6
Sur

1. Para cada sucursal:


a) Construya la tabla de distribución de frecuencias.
b) Represente gráficamente las frecuencias absolutas y las frecuen-
cias relativas acumuladas.
c) Analice la distribución
2. Efectúe comparaciones

Actividad 25:
A continuación, se presentan los precios de venta (en miles de $) de 30
casas de dos zonas residenciales de la Ciudad de Córdoba.

90 116 120 95 114 97 121 108 102 91


Zona A 107 99 92 118 100 96 98 110 104 125
100 93 105 112 96 113 100 95 105 129
51
100 148 130 118 135 125 110 132 125 115
Zona B 134 116 131 109 126 112 126 105 150 119
121 145 128 117 136 122 119 130 125 133

1. Para cada zona:


a) Organice los datos en una distribución de frecuencias tomando 5 in-
tervalos de clase (cerrados por derecha).
b) Realice los gráficos que correspondan.
c) Analice la distribución

2. Efectúe comparaciones.

Actividad 26:

La tabla siguiente presenta la población total según el ingreso medio indi-


vidual de los aglomerados urbanos para el segundo trimestre de 2016.

Número de decil Ingreso medio por Variaciones entre de-


decil ciles
1 1.311
2 3.301 252
3 4.477 136
4 5.111 114
5 6.468 127
6 8.150 126
7 9.749 120
8 12.110 124
9 16.114 133
10 30.374 188

Del análisis de los gráficos siguientes se pide un informe sobre la variación


relativa del ingreso medio entre deciles. (Indique el gráfico que utiliza en el
análisis justificando su elección).

52

Actividad 27:
Las ventas diarias (en $) para los últimos 120 días de una empresa de ser-
vicios de transporte se organizaron en la una distribución de frecuencias
por intervalos que ser muestra en la siguiente tabla:
Unidad 1: El método estadístico. Organización y presentación de datos

yi-1 - yi ni
530 -730 3
730 - 930 7
930 - 1130 11
1130 - 1330 22
1330 - 1530 40
1530 - 1730 24
1730- 1930 9
1930 - 2130 4
Total 120

Determine:
a) ¿Cuántos días se vendieron entre $ 1130 y $ 1330?
b) ¿Qué porcentaje de días se registraron ventas de entre $ 1130 y $
1330?
c) Represente mediante un histograma y un polígono de frecuencias,
la información dispuesta en la tabla.
d) Aproximadamente ¿cuál es el porcentaje de días que tienen como
ingreso $ 1730 o más?
e) ¿Podría describir la forma de la distribución?

7. Casos de discusión y análisis


A continuación, se presentan casos de investigación reales.
En cada uno determinar:
 Objetivo de la investigación
 Población
 Unidad estadística
 Marco muestral
 Muestra
 Parámetro
 Estadístico
 Variables de interés (clasificarlas por tipo)
 Fuente de recolección de datos

Caso 1

Un equipo de investigación de nuestra Facultad realizó un estudio


sobre el desempeño académico de los estudiantes que ingresaron en los
años 2000 y 2003 a las tres carreras de la Facultad de Ciencias Económi-
cas (UNC), con el objetivo de identificar las principales variables que con-
tribuyen a explicar tanto el rendimiento como el abandono observados has-
ta fin del año 2005.
El análisis comprende una descripción general de las características
de los estudiantes de ambas cohortes incluidos en cada muestra, teniendo
en cuenta factores como carrera, sexo, lugar de procedencia, modalidad
del establecimiento de nivel secundario del que egresó (público o privado),
cantidad de materias aprobadas en la carrera y nota promedio del secun- 53
dario.
Los datos utilizados para el estudio fueron extraídos del sistema SIU-
Guaraní (Sistema de Información Universitario Guaraní) y de los legajos
individuales de los estudiantes, que obran en la unidad académica.
Para llevar a cabo el estudio se seleccionó un grupo de estudiantes
de cada cohorte según el siguiente detalle:
Número de estudiantes por carrera seleccionados

CARRERA COHORTE 2000 COHORE 2003


Contador 2154 1928
Lic. en Economía 275 252
Lic. en Administración 1157 789
TOTAL 3586 2969
Fuente: Elaboración propia a partir de datos obtenidos del SIU - Guaraní

Caso 2

En nuestra Facultad se realizó un análisis del trabajo informal (tam-


bién denominado no registrado, o en negro) en Argentina, utilizando los
datos de la Encuesta Permanente de Hogares de INDEC y aplicando los
criterios básicos de las definiciones existentes a nivel internacional. Me-
diante un enfoque descriptivo se realizan estimaciones de la cantidad de
trabajadores informales durante los últimos 8 años, tanto en el país como
en sus regiones, y se presentan los resultados en aperturas que compren-
den principalmente aspectos como sexo, edad, categoría ocupacional, ni-
vel de estudios, ramas de actividad y número de horas trabajadas, entre
otros.

Nota: La Encuesta Permanente de Hogares es un programa de pro-


grama de investigación de la realidad social del país. Se nutre de informa-
ción a través de una encuesta realizada a un grupo de hogares seleccio-
nados, que permite conocer las características demográficas y sociodemo-
gráficas de la población, vinculadas a la fuerza de trabajo.

Caso 3

Un equipo de investigación de nuestra Facultad realizó un trabajo pa-


ra analizar los niveles de pobreza en la población de Malvinas Argentinas,
Córdoba, y determinar la incidencia de cada atributo en la misma, con la
finalidad de definir una metodología pertinente y actual capaz de ser apli-
cada en otras comunidades.
Se determinó, en la localidad de Malvinas Argentinas:
 La tasa de pobreza de cada hogar.
 La tasa de pobreza de la población de hogares.
 La tasa de pobreza en la población por atributo considerado.

Para aplicar está metodología, se utilizó una encuesta realizada en el año


2004 en la población de Malvinas Argentinas donde se entrevistaron apro-
ximadamente 700 hogares.
Los atributos que se consideraron son:
1. Ingreso de las familias.
2. Tamaño de la vivienda (en m 2).
3. Años de escolaridad del jefe de familia.
5. Tipo de vivienda.
8. Material de las paredes.
9. Cantidad de personas por cuarto.
10. Situación laboral del jefe de familia.
54
Caso 4

La Universidad de Lomas de Zamora realizó un trabajo para describir


algunas características de los estudiantes universitarios que trabajan y
analizar su actitud frente a algunas herramientas tecnológicas, tales como
la computadora personal (PC) e Internet.
Unidad 1: El método estadístico. Organización y presentación de datos

Durante año 2003, se realizó una encuesta con el fin de estudiar la


penetración de las Tecnologías de la Información y la Comunicación (TICs)
en los estudiantes universitarios, especialmente la incidencia del uso de
Internet. Dicho estudio volvió a realizarse en 2005 y 2007.
El interés está centrado en detectar si los estudiantes trabajadores
han percibido algún cambio, durante el período comprendido entre los
años 2003, 2005 y 2007, en su lugar de trabajo, en cuanto a dos indicado-
res: nivel de comunicación personal y a cantidad de encuentros cara a ca-
ra.
Tanto en al año 2003 como en el 2005 y 2007 se trabajó con un gru-
po de alumnos seleccionados al azar entre los inscriptos durante el segun-
do cuatrimestre del ciclo lectivo de dichos años, en distintas Facultades de
la Universidad Nacional de Lomas de Zamora, sita en la Provincia de Bue-
nos Aires y de la Universidad de Buenos Aires, sita en la Ciudad Autónoma
de Buenos Aires.
La recopilación de los datos se realizó mediante una encuesta direc-
ta, estructurada y precodificada que se entregó a los alumnos selecciona-
dos en dichas oportunidades.

En este estudio se indagó, entre otros, sobre los siguientes aspectos:


 Edad
 Sexo
 Universidad y Facultad
 Nivel de satisfacción que obtiene al realizar actividades con la
computadora personal y satisfacción por el uso de Internet (con las
siguientes categorías: nulo, muy bajo, bajo, moderado, alto, muy al-
to).
 Nivel de uso de Internet (con las siguientes categorías: nulo, muy
bajo, bajo, moderado, alto, muy alto).
 Grado de comunicación personal con compañeros de trabajo (au-
mentó, disminuyó, no varió).
 Cantidad de encuentros personales, cara a cara con compañeros
de trabajo, por semana.

Caso 5

Nickelodeon se conecta en la red para recabar datos* *Extraído de “Inves-


tigación de merca-
dos contemporánea”
¿Cómo averiguar qué piensan los niños? Este fue el problema que afrontó de Carl Mc Daniel y
la vicepresidenta de investigación de Nickelodeon. Los programadores y el Roger Gates.
personal de mercadotecnia de la red de cablevisión para niños deseaban
información sobre los jóvenes televidentes, la cual tradicionalmente se ha- Sesiones de grupo:
bía obtenido mediante sesiones de grupo que consumen mucho tiempo, y grupo de 8 a 10
entrevistas personales. participantes condu-
Gracias al advenimiento del e-mail, la vicepresidenta de investigación cidos por un mode-
tuvo la idea de conectarse con los televidentes en línea. Nickelodeon colo- rador en una discu-
có 70 anuncios en línea mediante Compu Serve. Los niños utilizan sus sión profunda sobre
un determinado te-
computadoras personales y módems para hablar con Nickelodeon y entre
ma o concepto.
ellos, acerca de diversos temas. Pueden escribir avisos de la computadora Entrevista: entrevis-
y tres veces por semana pueden conectarse en juntas programadas con tadores personales
anterioridad. Durante esas juntas, los investigadores de la red dirigen sus 55
que efectúan son-
discusiones sobre diversos temas, una tercera parte del tiempo se dedica a deos y obtienen
ciertos programas de la cadena. respuestas detalla-
Es obvio que los niños participantes son usuarios de CompuServe. das para las pregun-
Su edad va de los ocho a doce años y representan hogares con ingresos tas, a menudo em-
desde U$S 30.000 a U$S 100.000 anuales. Se estima que el mantenimien- plean técnicas no
to anual del sistema cuesta 80.000 dólares, lo que constituye tan sólo una directivas para des-
cubrir motivaciones
fracción del costo de los métodos de investigación tradi-
ocultas
cionales.
De este modo, Nickelodeon obtiene datos más detallados, con más
rapidez y económicos, que con los métodos de investigación tradicionales
(sesiones de grupo y entrevistas). Los niños dan retroalimentación instan-
tánea sobre los programas. Otros datos provienen de respuestas a pregun-
tas tipo encuesta. Algunos consideran este método con escepticismo y
señalan que probablemente esté sesgado a favor de niños locuaces. La
vicepresidenta de investigación entiende que este sistema es una herra-
mienta cualitativa y que, al igual que cualquier investigación de este tipo,
los resultados no pueden proyectarse a nivel nacional.

8. Referencias Bibliográficas

- Berenson, M y Levine, D (2003) Estadística Básica en Administración.


Conceptos y Aplicaciones. 6º Edición Prentice Hall.

- Blaconá, T. (2001) Ética en Estadística: responsabilidad de las universi-


dades en la formación del profesional Recuperado de
http://www.saberes.fcecon.unr.edu.ar/index.php/revista/article/view/50/99
revisado el 20/06/2015

- Blanch et al (2005) Ciclo Básico a Distancia Guía de Estadística I. Edito-


rial Asociación Cooperadora de la Facultad de Ciencias Económicas -
UNC.

- International Statistic Institute (ISI) (2010) Declaration on professional


ethics. Recuperado de http://www.isi-
web.org/index.php/activities/professional-ethics/isi-declaration

- Naciones Unidas Comisión Económica para Europa (2009) Cómo hacer


comprensibles los datos Parte 2 Una guía para presentar estadísticas. Gi-
nebra. Recuperado de
http://www.unece.org/fileadmin/DAM/stats/documents/writing/MDM_Part2_
Spanish.pdf

- Peña, D. (2001) Fundamentos de Estadística. Editorial Alianza.

- Saino, M.(2009). Estadística Descriptiva. Material de estudio y aplicacio-


nes prácticas correspondiente a los Capítulos I, II del programa de Estadís-
tica I. Asoc Coop F.C.E. (U.N.C.). ISBN: 978-987-1436-20-0

56
Unidad 1: El método estadístico. Organización y presentación de datos

Soluciones y respuestas
Actividad 1:

Descripción
Caso de Tipo de estudio ()
de la población
análisis

1 Todos los hogares de las prin-  Confirmatorio a través de


cipales ciudades del país. un relevamiento muestral

Todas las baterías producidas  Confirmatorio


2 por los 3 proveedores de la  Se realiza un experimen-
fábrica de tractores (que se to (porque se controlan
están analizando). ciertas condiciones de
selección)

Todos los certificados de de-  Confirmatorio


3 función emitidos por los muni-  Muestra con información
cipios que se seleccionaron secundaria
para realizar el estudio.

Firmas (empresas), clasifica-  Confirmatorio


4 das su el tamaño de las mis-  Se realiza un releva-
mas según la cantidad de miento muestral
empleados.

5 Empresas familiares de la  Exploratorio


Ciudad de Córdoba  Se realizan entrevistas
en profundidad

Actividad 2:

a) Variable Cuantitativa Discreta


b) Variable Cualitativa
c) Variable Cuantitativa Discreta
d) Variable Cuantitativa Discreta
e) Variable Cuantitativa Continua
f) Variable Cuantitativa Continua
g) Variable Cualitativa
h) Variable Cuantitativa Continua

2- Variable dicotómica: Si tiene línea telefónica. Variable con escala nomi-


nal:
Tipo de vivienda

3- Por ejemplo, el Gasto en bienes de consumo por mes, se puede dividir


en cuatro niveles que los denominamos Muy alto, Alto, Medio, Bajo. En
57
este caso la escala que tomamos para medir es ordinal. Lo mismo se po-
dría hacer con el Ingreso total de las personas que habitan la vivienda (pe-
sos y centavos) y el Gasto en bienes duraderos por semestre.
Actividad 3:

a) Variable de estudio: Nivel de Instrucción. Clasificación: cualitativa.


Escala: ordinal.
b) Tabla de distribución de frecuencias (salida Infostat).

Tablas de frecuencias
Variable Clase Categorías FA FR FAA FRA
NIVEL DE INSTRUCCIÓN 1 1Primario 48 0,45 48 0,45
NIVEL DE INSTRUCCIÓN 2 2Secundario 36 0,34 84 0,79
NIVEL DE INSTRUCCIÓN 3 3Terciario 15 0,14 99 0,93
NIVEL DE INSTRUCCIÓN 4 4Universitario 5 0,05 104 0,98
NIVEL DE INSTRUCCIÓN 5 5NS/NC 2 0,02 106 1,00

c) Gráfico de torta:
Distribución del Nivel de instrucción (salida Infostat).

Gráfico de barras:
Distribución del Nivel de instrucción

Actividad 4:
a) Tablas de frecuencias

Variable Clase Stock FA FR FRA


58 stock 1 300 3 0,10 0,10
stock 2 400 5 0,17 0,27
stock 3 500 7 0,23 0,50
stock 4 600 6 0,20 0,70
stock 5 700 5 0,17 0,87
stock 6 800 4 0,13 1,00
Unidad 1: El método estadístico. Organización y presentación de datos

Gráfico de Bastones del Stock de paquetes de galletas

Diagrama Escalonado del Stock de paquetes de galletas

Se observa que el stock de paquetes de galletas más bajo es de 300,


mientras que el más alto alcanza los 800. El stock más frecuente es de 500
paquetes. Los datos presentan una leve concentración en niveles de stock
más altos (leve asimetría izquierda).

b1) 7 kioscos
b2) 15 kioscos
b3) 13%
b4) 50%

Actividad 5:
a) Tabla de distribución de frecuencias

Tablas de frecuencias 59
Variable Clase MC FA FR FAA FRA
Cantidad de veces 1 1 3 0,12 3 0,12
Cantidad de veces 2 2 4 0,16 7 0,28
Cantidad de veces 3 3 3 0,12 10 0,40
Cantidad de veces 4 4 5 0,20 15 0,60
Cantidad de veces 5 5 3 0,12 18 0,72
Cantidad de veces 6 6 4 0,16 22 0,88
Cantidad de veces 7 7 3 0,12 25 1,00
b) Gráfico de Bastones:
Distribución de cantidad de veces que concurrió al negocio

c) Cálculo de las frecuencias relativas acumuladas (ver tabla de distribu-


ción de frecuencias)

Gráfico acumulativo de frecuencia:


Cantidad de veces que concurrió al negocio

Actividad 6:

Las edades oscilan entre los 18 y los 69 años, con una mayor concentra-
ción entre los 20 y 50 años. La distribución presenta una leve asimetría
hacia la derecha, es decir, hay un desplazamiento de datos hacia las ma-
yores edades.

Actividad 7:
60
Para poder responder la actividad se completó la tabla de distribución de
frecuencias y se confecciono e grafico correspondiente.
Unidad 1: El método estadístico. Organización y presentación de datos

Tablas de frecuencias

Variable Clase LI LS MC FA FR FAA FRA


ventas 1 [ 530,00 730,00 ) 630,00 3 0,03 3 0,03
ventas 2 [ 730,00 930,00 ) 830,00 7 0,06 10 0,08
ventas 3 [ 930,00 1130,00 )1030,00 11 0,09 21 0,18
ventas 4 [ 1130,00 1330,00 )1230,00 22 0,18 43 0,36
ventas 5 [ 1330,00 1530,00 )1430,00 40 0,33 83 0,69
ventas 6 [ 1530,00 1730,00 )1630,00 24 0,20 107 0,89
ventas 7 [ 1730,00 1930,00 )1830,00 9 0,08 116 0,97
ventas 8 [ 1930,00 2130,00 ]2030,00 4 0,03 120 1,00

Gráficos:
Histograma y polígono de frecuencia de la distribución de ventas diarias.

a) 22 días
b) El 18,33%
c) Ver figura
d) 10,83%
e) La distribución muestra las ventas entre $530 a $2130, presenta una
forma aproximadamente simétrica, observándose un pico en las ventas
entre $1330 y $1530.

Actividad 8:

a) Numero de intervalos =5
Amplitud = $18
Comenzando por el valor 41

Tablas de frecuencias

Variable Clase LI LS MC FA FR FAA FRA


Precios 1 [ 41,00 59,00 ] 50,00 8 0,20 8 0,20
Precios 2 ( 59,00 77,00 ] 68,00 4 0,10 12 0,30
Precios 3 ( 77,00 95,00 ] 86,00 11 0,28 23 0,58
Precios 4 ( 95,00 113,00 ] 104,00 11 0,28 34 0,85
Precios 5 ( 113,00 131,00 ] 122,00 6 0,15 40 1,00
61
b) Gráficos:
Histograma y Ojiva.

c) 11 casas
d) El 28%
e) Aproximadamente el 70%

Actividad 9:
a) La dirección en la que sería preferible calcular los porcentajes depende
del objetivo de investigación. Si lo que interesa es el estudio de los niveles
de producción por zona, entonces se deberá calcular los porcentajes en
columnas. Si se focaliza en el análisis de las zonas por nivel de produc-
ción, se deberá calcular el porcentaje en fila. Es posible también, que in-
terese el estudio de ambas distribuciones.

b) Tabla de frecuencias condicionadas (proporción filas).

NIVEL DE
ZONA “A” ZONA “B” ZONA “C” TOTAL
PRODUCCIÓN
Alto 49,64 33,81 16,55 100,00
Mediano 27,59 17,24 55,17 100,00
Bajo 35,85 30,19 33,96 100,00

Al analizar los establecimientos agropecuarios de la Provincia de Córdoba


(condicionadas a la fila) por nivel de producción, se observa que del total
de establecimientos agropecuarios con un alto nivel de producción, el
49,64% están ubicados en la zona A, el 33,81% en la zona B y el resto
(16,55%) en la zona C.

Del total de establecimientos agropecuarios con niveles de producción ba-


jo, el 35,85% se encuentra en la zona A, el 30,19% en la zona B y el
33,96% en la zona C.

También podemos concluir que la zona que tienen un mayor porcentaje de


establecimientos agropecuarios con niveles de producción alto, están ubi-
cados en la zona A, mientras que el mayor porcentaje de establecimientos
62 con niveles de producción medio, se encuentra en la zona C. Además, los
establecimientos con bajos niveles de producción, se distribuyeron con
porcentajes similares en todas las zonas.

c) Zona A: 69/38= 1,82 Zona B: 47/32= 1,47 Zona C: 23/36=0,64, se puede


observar que la razón entre el número de establecimientos con nivel de
producción alto y con respecto al nivel bajo, en la zona A es mayor que en
el resto de las zonas.
Unidad 1: El método estadístico. Organización y presentación de datos

Actividad 10:

Diagrama de dispersión:
Tasa de Desempleo – Tasa de Renuncia

Se puede concluir que hay una relación lineal inversa (o negativa) entre las
variables tasa de desempleo y tasa de renuncia, es decir, a medida que
aumenta (disminuye) la tasa de desempleo, disminuye (aumenta) la tasa
de renuncia.

Actividad 11:

Unidad es-
Caso Población Muestra Variable/s y su clasificación
tadística
Toda la producción Granos de trigo tomados Clasificación de la semilla
Cada semilla
A de trigo dispuesta en del camión para clasificar (excelente, muy buena, buena
de trigo
el camión. la semilla. o mala): variable cualitativa.
¿Cambió de trabajo el último
mes?: variable cualitativa
Todos los trabajado- Cada traba-
100 trabajadores selec- Sueldo mensual: variable
B res de la provincia jador de la
cionados. cuantitativa continua
de Córdoba. provincia
Número de horas trabajadas:
variable cuantitativa continua.
Todas las facturas
Clasificación de la factura (con
emitidas por la em- 50 facturas del último
C Cada factura error o sin error): variable cuali-
presa en el último mes seleccionadas.
tativa.
mes.
Los potenciales Grado de satisfacción con el
D 400 clientes a los que se
clientes del nuevo Cada cliente nuevo producto: variable cuali-
le regaló el producto.
producto. tativa(*)
Todos los clientes de 600 clientes de NVC
Grado de satisfacción con el
NVC que compraron seleccionados de los que
E Cada cliente producto que adquirieron en
electrodomésticos en compraron electrodomés-
NVC: variable cualitativa.
el último año. ticos el último año.
Todas las personas
en condiciones de
1000 personas en condi- Candidato que votó: variable
F votar al momento de
ciones de votar seleccio- Cada votante cualitativa 63
realizarse la elec-
nadas de Capital Federal.
ción, en la Capital
Federal.

(*) Por ejemplo, se pueden usar las siguientes categorías: “Muy satisfe-
cho”, “Moderadamente satisfecho” e “Insatisfecho”. Cuestionario del caso
D, a cargo del estudiante.
Actividad 12:

La empresa Nielsen trata de medir la cantidad de personas que ve cada


uno del programa de la televisión local, en la Ciudad de Córdoba. Además,
desea cuantificar como los televidentes califican a estos programas.

a) Conjunto de todas las familias de la ciudad de Córdoba que cuentan


con un televisor, en un momento determinado.
b) Es probable que se tome una muestra aleatoria, por limitaciones eco-
nómicas y de tiempo.
c) A cargo del estudiante.

Actividad 13:

De los 800 consumidores consultados:

- 600 manifestaron que les gustó el plato -------- Proporción = 0,75


- 200 manifestaron que no les gustó el plato ---- Proporción = 0,25

Teniendo en cuenta los resultados obtenidos, la consultora podría sugerir


al fabricante que implemente el nuevo plato de pastas ZIA MARIA ya que
será muy aceptado.

a) Es un ejemplo de Estadística Inferencial. El objetivo de la investigación


de mercado es generalizar los resultados obtenidos en la muestra a toda la
población de clientes potenciales que consumiría el nuevo plato de pastas
ZIA MARÍA.

b) Población: todos los potenciales consumidores del nuevo plato de pas-


tas ZIA MARÍA.
Muestra: los 800 consumidores consultados.
Unidad estadística: cada consumidor.

c) Parámetro: proporción de clientes potenciales que consumirían el nuevo


plato de pastas en la población.
Estadístico: proporción de clientes potenciales que consumirían el nuevo
plato de pastas en la muestra de 800 consumidores. El valor del estadísti-
co es 0,75.

Actividad 14:

La escala de medición es nominal, porque los medios de comunicación no


tienen implícito un orden lógico.

Actividad 15:

64 a) Variable Cualitativa – Escala Nominal


b) Variable Cuantitativa Continua – Escala de Razón
c) Variable Cualitativa – Escala Nominal
d) Variable Cuantitativa Continua – Escala de Razón
e) Variable Cuantitativa Discreta – Escala de Razón
f) Variable Cuantitativa Continua – Escala de Razón
g) Variable Cualitativa – Escala Nominal
h) Variable Cuantitativa Discreta – Escala de Razón
Unidad 1: El método estadístico. Organización y presentación de datos

Actividad 16:

a) Población: Conjunto de todos los compradores potenciales de cada ar-


tículo, de la ferretería en un periodo de tiempo determinado.
b) Seleccionar una muestra aleatoria de compradores de cada producto,
del fichero de clientes.
c) A cargo del estudiante.

Actividad 17:

a) Distribución de frecuencias relativas de la opinión de los habitantes.

b) Gráfico de Barras para la opinión de los habitantes.

Gráfico de torta para la opinión de los habitantes.

65

c) Ambos gráficos se pueden utilizar en forma indistinta ya que en este


caso son pocas categorías. En situaciones donde existan muchas catego-
rías es más informativo el gráfico de barras ya que permite una mejor vi-
sualización de las mismas.
Actividad 18:

ARCHIVO DE PERSONAL
Escala de medi-
Variable Tipo de variable
ción
Barrio donde vive el empleado Cualitativa Nominal
Salario Cuantitativa continua Razón
Días de vacaciones Cuantitativa discreta Razón
Días de ausencia por enfermedad Cuantitativa discreta Razón
Edad Cuantitativa continua Razón
Adelantos de sueldo en un mes determi-
Cuantitativa continua Razón
nado

REGISTRO DE LA PRODUCCIÓN
Escala de medi-
Variable Tipo de variable
ción
Tipo de producto Cualitativa Nominal
Cantidad mensual producida por produc-
Cuantitativa discreta Razón
to
Costo de la mano de obra Cuantitativa continua Razón
Costo de materiales Cuantitativa continua Razón

REGISTROS DE INVENTARIO
Escala de medi-
Variable Tipo de variable
ción
Existencia diaria por producto Cuantitativa discreta Razón
Existencia diaria por insumo Cuantitativa discreta Razón
Descuentos por producto Cuantitativa continua Razón

REGISTROS DE VENTAS
Escala de medi-
Variable Tipo de variable
ción
Ventas mensuales por producto Cuantitativa continua Razón
Ventas mensuales por región geográfi-
Cuantitativa continua Razón
ca
Ventas mensuales por tipo de cliente Cuantitativa continua Razón
Canales de venta Cualitativa Nominal

PERFIL DEL CLIENTE


Escala de medi-
Variable Tipo de variable
ción
Edad Cuantitativa continua Razón
Sexo Cualitativa Nominal
Nivel de ingresos (alto - medio - bajo) Cualitativa Ordinal
Zona donde vive Cualitativa Nominal

Actividad 19:

a) Se deberían analizar las principales características de los potenciales


66 clientes (adultos jóvenes) que se espera consuman la bebida dietética en
cuestión; por ejemplo: género, edad, nivel socio económico, si practica
deportes, si realiza algún tipo de dieta, entre otros.
b) La recolección de los datos se podría efectuar a través de una encuesta
administrada a una muestra representativa de adultos jóvenes.
Unidad 1: El método estadístico. Organización y presentación de datos

Actividad 20:
3 0
4
5
6
7 8
8 0 0 2 4 5 9
9 0 2 6 7 7 9
10 2 3 4 5 9
11 3 3 7
Se observa un valor extremo (3,0) que debería investigarse para determi-
nar si se trata de un valor atípico o es el resultado de un error en el registro
o en la carga de los datos. La distribución de las cotizaciones muestra una
asimetría izquierda.

Actividad 21:
Log natural
Total de energía Total de energía
Años Hidráulica Nuclear Hidráulica Nuclear
generada generada
2008 114724 31456 7330 11,65 10,36 8,90
2009 114337 35093 8162 11,65 10,47 9,01
2010 120011 33300 7171 11,70 10,41 8,88
2011 124802 31309 6371 11,73 10,35 8,76
2012 129007 29308 6395 11,77 10,29 8,76
2013 133705 33333 6207 11,80 10,41 8,73
2014 137181 33345 5514 11,83 10,41 8,62

La gráfica a valores aritméticos muestra un crecimiento en valor absoluto


de la energía total generada cada año, pero no se puede analizar esta va-
riación en términos porcentuales o relativos.

A continuación se grafican los logaritmos de la variable ( se puede hacer


también un gráfico semilogarítmico), en el cual se puede observar que la
energía total generada en términos porcentuales tuvo un descenso en el
año 2009, a partir del cual ha tenido un leve crecimiento hasta el año 2014. 67
A continuación se presentan los gráficos comparando la evolución anual de
la energía Hidráulica y Nuclear.

b) La variación anual promedio de la energía generada total fue de


3,02 % anual. La energía hidráulica no tuvo variación, esta fue en
promedio del 0,97% anual y la Nuclear tuvo un decrecimiento pro-
medio del 4,63% anual.

68
Unidad 1: El método estadístico. Organización y presentación de datos

Actividad 22:

Gráfico a) Gráfico b)

En Gráfico a) se representan ambas variables en términos logarítmicos.

En Gráfico b) se representan los valores originales de ambas variables.

Actividad 23:

Diagrama de dispersión:
Precio – Margen de Utilidad

Se puede concluir que hay una relación lineal directa (o positiva) entre las
variables precio y margen de utilidad de un producto, es decir a mayor
(menor) precio mayor (menor) margen de utilidad.

Actividad 24:
1) Distribuciones de frecuencias.

Tablas de frecuencias
69
Variable Clase MC FA FR FAA FRA
Zona Norte 1 4 3 0,15 3 0,15
Zona Norte 2 5 4 0,20 7 0,35
Zona Norte 3 6 6 0,30 13 0,65
Zona Norte 4 7 5 0,25 18 0,90
Zona Norte 5 8 2 0,10 20 1,00
Variable Clase MC FA FR FAA FRA
Zona Sur 1 2 1 0,05 1 0,05
Zona Sur 2 3 3 0,15 4 0,20
Zona Sur 3 4 4 0,20 8 0,40
Zona Sur 4 5 5 0,25 13 0,65
Zona Sur 5 6 7 0,35 20 1,00

Gráficos con las frecuencias absolutas simples

Gráficos con las frecuencias relativas acumuladas

2) En la zona norte se realizan entre 4 y 8 pedidos telefónicos por día mien-


tras que, en la zona sur, entre 2 a 6. La distribución de la cantidad de pedidos
de la zona norte es bastante simétrica alrededor de los 6 pedidos, mientras
que la de la zona sur presenta una marcada asimetría izquierda con un pico
en el mismo valor.

Actividad 25:

1) Zona A

Tabla de distribución de frecuencias del precio de venta (en miles de $) de


casas en Zona A.
70
Tablas de frecuencias

Variable Clase LI LS MC FA FR FAA FRA


Precio Zona A 1 [ 90,00 98,00 ] 94,00 10 0,33 10 0,33
Precio Zona A 2 ( 98,00 106,00 ] 102,00 8 0,27 18 0,60
Precio Zona A 3 ( 106,00 114,00 ] 110,00 6 0,20 24 0,80
Precio Zona A 4 ( 114,00 122,00 ] 118,00 4 0,13 28 0,93
Precio Zona A 5 ( 122,00 130,00 ] 126,00 2 0,07 30 1,00
Unidad 1: El método estadístico. Organización y presentación de datos

Histograma y Polígono de frecuencias del precio de venta (en miles de $)


de casas en Zona A.

La distribución de precios de venta (en miles de $) de casas en la Zona A se


encuentra entre 90 y 130, presentando una marcada asimetría derecha.
Además el 60% de las casas tienen un precio de venta entre 90 y 106.

Zona B

Tabla de distribución de frecuencias del precio de venta (en miles de $) de


casas en Zona B.

Tablas de frecuencias

Variable Clase LI LS MC FA FR FAA FRA


Precio Zona B 1 [ 100,00 110,00 ] 105,00 4 0,13 4 0,13
Precio Zona B 2 ( 110,00 120,00 ] 115,00 7 0,23 11 0,37
Precio Zona B 3 ( 120,00 130,00 ] 125,00 10 0,33 21 0,70
Precio Zona B 4 ( 130,00 140,00 ] 135,00 6 0,20 27 0,90
Precio Zona B 5 ( 140,00 150,00 ] 145,00 3 0,10 30 1,00

Histograma y Polígono de frecuencias del precio de venta (en miles de $)


de casas en Zona B.

71
Los precios de venta (en miles de $) de casas en la Zona B se encuentran
entre 100 y 150. La distribución es casi simétrica. La mayoría de las casas
tienen un precio de venta entre 120 y 130.

2) La distribución de precios de venta (en miles de $) de casas en la Zona A


es marcadamente asimétrica derecha, mientras que en la Zona B se advierte
una distribución casi simétrica alrededor de valores entre 120 y 130. Además,
en la Zona A los precios oscilan entre 90 y 130, mientras que en la zona B,
entre 100 y 150.

Actividad 26:

Corresponde interpretar el segundo gráfico con escala logarítmica.

Actividad 27:

a) 22 días

b) El 18,33 % de los 120 días

c)

72 d) El 10,83% de los días tienen un nivel de ventas de $1730 o más.

e) La distribución es simétrica.

También podría gustarte