Está en la página 1de 37

UNIVERSIDAD DE LOS ANDES

NÚCLEO UNIVERSITARIO "RAFAEL RANGEL"


DEPARTAMENTO DE CIENCIAS ECONÓMICAS Y
ADMINISTRATIVAS
ÁREA ESTADÍSTICA

CÁTEDRA DE ESTADÍSTICA BÁSICA

TEMA 1: INTRODUCCIÓN A LA ESTADÍSTICA Y ESTADÍSTICA DESCRIPTIVA


Sesiones 2, 3 y 4

MODULO INSTRUCCIONAL

ESTADÍSTICA DESCRIPTIVA

Profesora Ligia Margarita Becerra Sánchez

Trujillo – Venezuela
2001
Tema 1: sesiones 2, 3 y 4

ÍNDICE

Página
Presentación 3
Introducción 4
Usuarios 6
Orientaciones 6
Objetivos 7
Estadística descriptiva 8
Distribuciones de frecuencias 9
ƒ Distribución de frecuencias para variables cualitativas 11
ƒ Distribución de frecuencias para variables cuantitativas 12
Medidas de centralidad o tendencia central 21
ƒ Media aritmética 22
ƒ Mediana 22
ƒ Moda 23
ƒ Relaciones entre las medidas de tendencia central 29
Medidas de variabilidad o dispersión 30
ƒ Rango 30
ƒ Varianza 30
ƒ Desviación típica 31
ƒ Coeficiente de variación 31
Auto evaluación 35
Bibliografía 37
ƒ Básica 42
ƒ Complementaria 42

2
Tema 1: sesiones 2, 3 y 4

PRESENTACIÓN

Presento este módulo de Estadística Descriptiva, con el convencimiento de que es


una herramienta útil que contribuirá a un cambio en la condición académica y actitudinal de
los jóvenes universitarios.
El conocimiento y práctica de la estadística como una herramienta fundamental de
apoyo a las ciencias, permite a través de sus distintos instrumentos y métodos realizar la
selección, organización, cuantificación, análisis y presentación de los datos inherentes a un
problema o investigación de manera sistemática, al mismo tiempo que potencia al
estudiante para ejercer tanto una labor profesional en cualquier rama, como la función de
investigación, acerándolo al conocimiento de los distintos fenómenos o eventos de la vida
real.
En este sentido, este Módulo de Estadística Descriptiva constituye un aporte
interesante por varias razones:
¾ Porque constituye un esfuerzo en la forma de abordar las bases teóricas necesarias
para el aprendizaje de la estadística.
¾ Es un recurso bibliográfico compendiado de forma comprensiva, agradable y
fácil, sin redundar en demostraciones matemáticas complicadas, accesible a los
estudiantes, para la formación teórico-práctica en esta área de estudio
¾ Presenta recursos metodológicos didácticos, para instruir y motivar la misión del
estudiante
¾ Constituye también un material de apoyo bibliográfico para los docentes, y para
quienes se estén iniciando en las labores de investigación.
Este manual trata de cubrir los principales aspectos de la Estadística Descriptiva
contenidos en el Tema 1 del programa de Estadística Básica para la carrera de Contaduría
Pública, que se imparte en la Universidad de Los Andes, Núcleo Universitario Rafael
Rangel en Trujillo.
Los contenidos se exponen de una manera lógica, acompañándolos con una actividad
práctica, relacionada con situaciones que podrían presentarse en la vida real del mundo de
los negocios. Al final se incluye un ejercicio de auto evaluación para el estudiante y la
bibliográfica básica y complementaria que sustenta este Módulo.

3
Tema 1: sesiones 2, 3 y 4

INTRODUCCIÓN

En nuestros días, la estadística se ha convertido en un método efectivo para


describir los valores de datos económicos, políticos, sociales, psicológicos, biológicos y
físicos, sirviendo como herramienta para relacionar y analizar dichos datos. El trabajo
del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en
el proceso de interpretación de esa información. La materia prima de la estadística
consiste en conjuntos de números o atributos obtenidos al contar u observar cosas o
situaciones. Al recopilar datos estadísticos se ha de tener especial cuidado para garantizar
que la información sea completa y correcta.
La determinación de los métodos de análisis estadísticos más apropiados para enfrentar
un problema práctico o interpretar los resultados de una investigación requiere del
conocimiento, al menos a nivel conceptual, del fundamento de los mismos. La estadística
no es el conjunto de fórmulas “mágicas” que aparecen en los libros de texto, y que se
aplican indiscriminadamente a cualquier situación. Más aún, esos textos presentan los
métodos en términos muy generales que corresponden a cierto tipo de problemas
adaptables en un cierto grado a situaciones distintas; pero es precisamente por esta razón
que el uso de los métodos estadísticos requieren de experiencia, de inventiva, de un
conocimiento real para su adaptación, y de precaución para evitar errores o falacias.
Un camino didáctico que sirva de puerta de entrada a la metodología estadística
debería seguir el esquema siguiente:
1. El problema de la identificación del tipo de las variables.
2. Los métodos de resumen de las observaciones.
3. El concepto de error de muestreo.
4. El estudio de relaciones o asociaciones.
La distinción de las variables entre cualitativas y cuantitativas, y su identificación
como tales, es fundamental para el tratamiento estadístico de las mismas. Pues de las
variables depende el que se use una u otra metodología estadística.
Una vez recopilada las observaciones de las variables (datos), se hace necesario extraer
de ellas la información esencial, es decir, determinar algunos valores que representen esas

4
Tema 1: sesiones 2, 3 y 4

observaciones. No podemos pretender una síntesis contemplando, por ejemplo, 500


observaciones sobre el saldo de cuentas por cobrar en los libros de contabilidad de una
empresa; debemos mas bien, obtener algunas medidas que resuman esas observaciones. Así,
podremos comprender la necesidad de conceptos y aplicaciones tales cono distribución de
frecuencia, media aritmética, mediana, desviación típica, entre otras medidas descriptivas
que pueden resumir y representar el conjunto de los datos. Estas medidas las aporta la
Estadística Descriptiva, tema que será desarrollado en este Módulo Instruccional.

5
Tema 1: sesiones 2, 3 y 4

USUARIOS O AUDIENCIAS

La estructuración teórica y práctica y el diseño del presente Módulo de


Estadística Descriptiva, ha sido concebida a fin de promover el aprendizaje
significativo y facilitar el proceso de enseñanza aprendizaje tanto dentro del Aula de Clase
como fuera de ella, para los estudiantes de las cátedras de Estadística Básica y Estadística
I, de las carreras de Contaduría Pública y Administración del Núcleo Universitario “Rafael
Rangel” de la Universidad de Los Andes en Trujillo, estado Trujillo. Sin embrago, podría
ser utilizado igualmente por los estudiantes y profesores de Estadística de otras carreras.
Por lo tanto, este Manual está dirigido tanto a los profesores de las cátedras como a los
estudiantes.

ORIENTACIONES

Para orienta un mejor aprovechamiento de este manual se sugieren las siguientes


recomendaciones:

¾ Leer en forma individual y en grupo, los contenidos, discutiendo en cada uno


su aplicabilidad y utilidad.
¾ Luego se ser discutidos las herramientas teóricas, se debe proceder al análisis
y discusión de las actividades resueltas, con la interacción del profesor y los
alumnos.
¾ Durante el desarrollo del proceso de enseñaza aprendizaje, el profesor al
actuar como facilitador debe presentar y motivar al estudiante para que
presente ejemplos de la vida real, que fomenten en el grupo la participación
activa y motiven su interés por la aplicación y utilidad de la metodología
estadística.

6
Tema 1: sesiones 2, 3 y 4

¾ El profesor y los alumnos deben consultar, leer y discutir artículos de prensa


u otra fuente hemerográfica que presenten información procesada
estadísticamente mediante tablas y/o gráficos.
¾ Resolver, en grupos, la autoevaluación.
¾ Consultar algunos libros de la bibliografía básica y complementaria

OBJETIVOS DEL MÓDULO

¾ Facilitar el desarrollo del proceso de enseñanza aprendizaje, a través de la


interrelación entre los conocimientos teórico-prácticos recibidos en la clase teórica
y su aplicación en situaciones de la vida real, particularmente relacionadas con los
negocios.
¾ Proporcionar los fundamentos teóricos y prácticos que permitan la construcción de
conocimiento significativo orientado a la solución de las aplicaciones, la auto
evaluación y de los ejercicios propuestos.
¾ Enfatizar la importancia del uso y aplicación de los métodos de la Estadística
Descriptiva como herramienta facilitadora para el análisis y presentación de datos.
¾ Motivar el desarrollo de habilidades para el análisis, síntesis y presentación de
datos tanto cuantitativos como cualitativos, utilizando los métodos de la Estadística
Descriptiva.

7
Tema 1: sesiones 2, 3 y 4

ESTADÍSTICA DESCRIPTIVA

La mayor parte de la información estadística que aparece en los diarios, revistas,


informes y demás publicaciones consiste en datos resumidos y presentados en forma
comprensible para el lector. Estos resúmenes de datos, que pueden ser tabulados, gráficos o
numéricos se llaman estadísticas descriptivas.
En tal sentido, la sumarización y exposición de los aspectos más importantes de un
conjunto de datos es llamada estadística descriptiva; la cual incluye la condensación de datos
en forma de tablas, su presentación gráfica y el cálculo de indicadores numéricos de
centralidad y variabilidad. Para Berenson y Levine (1996) “la estadística descriptiva puede
definirse como aquellos métodos que incluyen la recolección, presentación y caracterización
de un conjunto de datos con el fin de describir apropiadamente sus diversas características”
(p. 3). Estos métodos pueden ser aplicados tanto a datos obtenidos por muestreo como a los
obtenidos de censos, ya sean cuantitativos o cualitativos.
Resumiendo estas definiciones, los principales aspectos en la descripción de datos
incluyen:

¾ La sumarización y descripción del modelo general de los datos, obtenido mediante:


ƒ La presentación de distribuciones de frecuencia mediante tablas y gráficos
ƒ El examen de la forma de los gráficos y estudio de características importantes como
simetrías o desviaciones de ellas.
ƒ El análisis de observaciones inusuales o muy alejadas de una concentración central.
¾ El cálculo de medidas numéricas que resumen y representan los datos, tales como:
ƒ Valores típicos o representativos que indican el centro de los datos - Medidas de
tendencia central -
ƒ La variación que presenten los datos -Medidas de dispersión o variabilidad -

8
Tema 1: sesiones 2, 3 y 4

DISTRIBUCIONES DE FRECUENCIA

El procedimiento más sencillo para ordenar sistemáticamente los datos es formar una
distribución, es decir, un agrupamiento de ellos. Una distribución de frecuencia es un cuadro
o tabla resumen de datos, en el que se presentan el conjunto de categorías o valores en que
se divide la variable que se estudia, asociada con sus respectivas frecuencias.

Frecuencia es el número de repeticiones de un dato u observación. El cálculo de la


frecuencia es el primer paso en la agrupación y ordenación de datos.
Actividad 1. Usted, como Contador Público, está interesado en estudiar el tiempo (en años
cumplidos) que a enero del año 2000 llevan las empresas comerciales compitiendo en el mercado del
Estado Trujillo; con este fin organiza una encuesta, aplica un cuestionario a una muestra aleatoria de
30 de estas empresas y obtiene los siguientes resultados:

2 8 8 6 1 3 8 1 1 7
1 7 3 3 7 4 4 5 4 3
5 5 3 6 7 2 7 5 7 4

En este conjunto de datos se observa, por ejemplo, que 3 de las empresas llevan 8 años compitiendo
en el mercado (dichas casos están encuadrados en el conjunto de datos). El valor 3 es el número de
veces que se repite el dato 8 años y representa la frecuencia de este dato.

Las frecuencias se clasifican en absolutas y relativas.


a) Frecuencias absolutas que pueden ser ordinarias o acumuladas
Ordinaria. Es el número de repeticiones de un valor o dato, es decir, el número de
veces que se presenta cada valor particular de una variable en una masa de datos, se
simboliza por fi. La suma de todas las frecuencias debe ser igual al número total de

datos n Æ ∑fi = n

Acumulada. Es la suma sucesiva de la frecuencia absoluta ordinaria y se simboliza


por Fi.

b) Frecuencias relativas que pueden ser igualmente ordinarias o acumuladas

9
Tema 1: sesiones 2, 3 y 4

Ordinaria. Es la proporción, peso o importancia de cada valor de la variable


sobre el total de observaciones, se simboliza por hi.
Para su cálculo se utiliza la fórmula siguiente:
hi = fi/n

La suma de todas las frecuencias relativas debe ser igual a la unidad Æ ∑hi = 1

Acumulada. Es la suma sucesiva de la frecuencia relativa ordinaria, se simboliza


por Hi . Para su cálculo también puede aplicarse la siguiente fórmula:
Hi = Fi/n

El Cuadro 1 resume esquemáticamente los diferentes tipos de frecuencias que se


han explicado.

Cuadro 1: Clasificación de las frecuencias


Simple: fi
Absoluta
Acumulada: Fi
Frecuencias
Simple: hi Porcentaje simple
Relativa
Acumulada: Hi Porcentaje acumulado

Usos de las frecuencias


ƒ La frecuencia absoluta expresa cuál o cuales valores son más frecuentes en la
distribución.
ƒ Al multiplicar por 100 las frecuencias relativas se obtiene el porcentaje, peso o
importancia de un valor o conjunto de valores sobre el total.
ƒ Las frecuencias acumuladas muestra cuántos valores o porcentaje existen por debajo
o por encima de alguno en particular.

10
Tema 1: sesiones 2, 3 y 4

Todas las frecuencias pueden ser calculadas y presentadas mediante tablas que
muestren las principales características de su distribución tanto para variables cualitativas
como para variables cuantitativas, aspectos que serán desarrollados en este módulo.

DISTRIBUCIONES DE FRECUENCIA PARA VARIABLES CUALITATIVAS

Una variable cualitativa representa un atributo o característica que no puede ser


expresado mediante un número, sino a través de una cualidad; por ejemplo el tipo de
financiamiento que puede utilizar una empresa, ya que éste podría ser de organismos
públicos, de la banca privada o de personas particulares entre otras posibles fuentes de
financiamiento. En este caso:
Variable: Fuentes de financiamiento utilizados por las empresas
Clasificación u opciones de la variable.
9 Financiamiento de organismos públicos
9 Financiamiento de la banca privada
9 Financiamiento de otras fuentes

Contar el numero de casos, frecuencia absoluta simple, en cada categoría de un


atributo, es la forma más elemental de resumir las observaciones de los atributos. A partir
de esas frecuencias se puede obtener porcentajes, proporcionas y razones. El ejemplo que
se presenta a continuación ilustra el cálculo de todos los tipos de frecuencia para una variable
cualitativa.

Actividad 2. Al mismo grupo de empresas encuestadas, a que se hace mención en la Actividad 1, se


les preguntó también acerca de sus fuentes de financiamiento. Los resultados se muestran a
continuación:

OP BP OP BP OF BP BP OP BP BP Donde:
OF BP BP OP OP OF BP BP BP OP BP: Banca Privada
OP OP BP BP OF OF BP BP OP OF OP: Organismos públicos
OF: Otra Fuentes

11
Tema 1: sesiones 2, 3 y 4

En la tabla 1 se muestra la distribución de frecuencias para esta variable.

Tabla 1
Fuentes de financiamiento de las empresas comerciales en el Estado Trujillo

Fuentes de Frecuencia absoluta Frecuencia Frecuencia relativa Porcentaje


financiamiento simple absoluta simple
acumulada
Organismos Públicos 9 9 0,3 30
Banca Privada 15 24 0,5 50
Otras Fuentes 6 30 0,2 20
Total empresas 30 1 100
Fuente: Encuesta aplicada a las empresas comerciales del Estado Trujillo, año 2000

Las frecuencias presentadas en la Tabla 1 fueron obtenidas aplicando las fórmulas para
el cálculo de frecuencias estudiadas en la clasificación de frecuencias.
En la columna de la frecuencia absoluta simple (fi) se muestra que 9 empresas reciben
financiamiento de Organismos Públicos, 15 de la Banca Privada y las restantes 6 empresas
obtienen su financiamiento de Otras Fuentes.
En la columna de la frecuencia absoluta acumulada (Fi), se observa que para la primera
opción, Organismos Públicos, sólo está acumulada la frecuencia para esta misma opción, por
ser la primera. Por otra parte, 24 empresas son financiadas tanto por Organismos Públicos
como por la Banca Privada y finalmente se acumulan las 30 empresas encuestadas con todas
sus opciones de financiamiento. Es importante recalcar que el último valor de la columna de
frecuencias acumuladas siempre deberá coincidir con el número total de datos (n).
La siguiente columna muestra la frecuencia relativa simple (hi) presenta el peso,
proporción o importancia de cada opción de financiamiento para las empresas, de manera
que la proporción de empresas financiadas por Organismos Públicos es 0.3, es decir, de las
30 empresas 9 son financiadas por estos organismos (9/30), mientras que 0.5 y 0.2 son las
proporciones de empresas financiadas por la Banca Privada y por Otras Fuentes
respectivamente.
Una interpretación de uso muy frecuente en todos los campos, particularmente en los
negocios, es el porcentaje (%), el cual se ilustra en la última columna de la Tabla 1; de

12
Tema 1: sesiones 2, 3 y 4

manera que podemos afirmar que un 50% de las empresas son financiadas por la Banca
Privada, un 30% por los Organismos Públicos y el 20% restante por Otras Fuentes.

Representación gráfica. Una forma de apreciar de manera inmediata las características


más importantes de una distribución de frecuencias es mediante las representaciones
gráficas. Es importante señalar que en el mercado existen diversos programa de computación
como Excel, PowerPoint, SPSS (Statistical Package for Social Sciences), SAS (Sistema de
Análisis Estadístico), entre otros de gran versatilidad que facilitan el diseño y presentación
de una gran variedad de gráficos.
Para el caso de una variable cualitativa las gráficas más apropiadas son las de sectores
(tortas) y las de barras. A continuación se muestran estas graficas, obtenidas mediante la
aplicación del programa SPSS, para la variable de la Actividad 2.

a) Gráfico de sectores o torta.

Gráfico 1
Fuentes de financiamiento de las empresas
del Estado Trujillo

Otras
Fuentes Organismo
20% s Públicos
30%

Banca
Privada
50%

Fuente: Tabla 1

13
Tema 1: sesiones 2, 3 y 4

b) Gráfico de barras.

Gráfico 2
Fuentes de financiamiento de las empresas
del Estado Trujillo
Número de empresas
16
14
12
10
8
6
4
2
0
Organismos Banca Privada Otras Fuentes
Públicos
Fuentes de financiamiento

Fuente: Tabla 1

Tanto en la gráfica 1 (de sectores) como en la 2 (de barras) se puede observar de


manera inmediata que la Banca Privada es la fuente de financiamiento más utilizada por las
empresas del Estado Trujillo, por su parte la menos utilizadas está representada por Otras
Fuentes diferentes a las opciones consideradas en la encuesta.

DISTRIBUCIONES DE FRECUENCIA PARA VARIABLES CUANTITATIVAS

Toda variable que pueda ser representada o medida mediante un número es


cuantitativa, tal es el caso presentado en la Actividad 1 en el cual se hizo referencia al
tiempo (en años cumplidos) que llevan las empresas comerciales compitiendo en el mercado
del Estado Trujillo, es obvio que los datos para esta variable se expresan mediante números.

La distribución de frecuencias para una variable cuantitativa puede diseñarse de dos


formas: agrupada en clases o intervalos y no agrupada en clases. La decisión de agrupar o no
en clases la toma quien la diseña de acuerdo con su criterio o con su interés por presentar sus

14
Tema 1: sesiones 2, 3 y 4

datos; sin embargo una regla práctica que puede ser útil es agrupar en clases cuando el
número de valores diferentes de la variable es numeroso, por ejemplo mayor que 10.

Distribución de frecuencias para una variable cuantitativa no agrupada en clases o


intervalos

El procedimiento para construir una distribución de frecuencias no agrupada en clases


o intervalos para una variable cuantitativa es similar al estudiado para una variable
cualitativa; sin embargo, dado que la variable es numérica debe presentarse ordenada, ya sea
en forma ascendente o descendente. Esta decisión depende de la forma se desee mostrar.

La tabla de distribución de frecuencias para este caso será ilustrado con la Actividad 3,
el cual utiliza los datos de la actividad 1.

Actividad 3. Con los datos de la actividad 1 se va a obtener la distribución de frecuencias para la


variable tiempo (en años cumplidos) que llevan las empresas comerciales en el mercado del Estado
Trujillo.
Tabla 2
Tiempo (en años cumplidos) que llevan las empresas comerciales compitiendo
en el mercado del Estado Trujillo.
Tiempo (años fi Fi hi % Hi %
cumplidos) acumulado
1 4 4 0,1333 13,33 0,1333 13,33
2 2 6 0,0667 6,67 0,2000 20,00
3 5 11 0,1667 16,67 0,3667 36,67
4 4 15 0,1333 13,33 0,5000 50,00
5 4 19 0,1333 13,33 0,6333 63,33
6 2 21 0,0667 6,67 0,7000 70,00
7 6 27 0,2000 20,00 0,9000 90,00
8 3 30 0,1000 10,00 1 100

Total empresas 30 1 100


Fuente: Encuesta aplicada a las empresas comerciales del Estado Trujillo, año 2000

15
Tema 1: sesiones 2, 3 y 4

En esta tabla se utiliza la simbología descrita en párrafos anteriores para referenciar a


los distintos tipos de frecuencia, con la finalidad de facilitar el manejo de la tabla y
familiarizar al lector con la simbología que será utilizada a partir de este punto. Por otra
parte, las frecuencias presentadas en la Tabla 2, al igual que las de la Tabla 1, fueron
obtenidas aplicando las fórmulas para el cálculo de frecuencias estudiadas en la clasificación
de frecuencias y su interpretación es igualmente similar, en consecuencia, a continuación se
analizan sus aspectos más relevantes.

En la columna de la frecuencia absoluta simple (fi) se muestra, como resultados más


importantes, que 6 empresas comerciales llevan 7 años compitiendo en el mercado del
Estado Trujillo (valor con mayor frecuencia) lo que representa un 20% de las empresas
encuestadas (columna de %), sin embargo, sólo 3 (10%) llevan 8 años y 4 (13,33%) llevan
sólo 1 año en este mercado.
En la columna de la frecuencia absoluta acumulada (Fi), se observa que de las 30
empresas encuestadas 27 llevan 7 o menos años en el mercado, lo cual representa una
proporción de 0,9000 (columna Hi), es decir, un 90% de las empresas. Es importante
recalcar que el último valor de la columna de frecuencias acumuladas siempre deberá
coincidir con el número total de datos (n) en este caso 30.

Representación gráfica. Para el caso de la distribución de frecuencias no agrupada en


clases para una variable cuantitativa pueden utilizarse diversas gráficas como la de sectores y
la de barras horizontales o verticales; sin embargo, la gráfica más apropiada es la de barras
en forma vertical. A continuación se muestran esta grafica para la variable de la actividad 3.

16
Tema 1: sesiones 2, 3 y 4

Gráfico 3

Número de empresas
Tiempo en el mercado del Estado Trujillo
7

1
1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00

Tiempo (años cumplidos)

Fuente: Tabla 2

Puede observarse en este gráfico que las principales características mostradas en la


tabla 2 pueden percibirse con mayor facilidad de interpretación, pues se revela sus máximos
y mínimos tanto en el valor de variable tiempo como en la cuantía de la frecuencia.

Distribución de frecuencias para una variable cuantitativa agrupada en clases o


intervalos

Una distribución agrupada en clases o intervalos es conveniente para simplificar la


presentación de los datos de manera que se revele aproximadamente el modelo de su
distribución, hacia donde se concentran y como es su dispersión atendiendo a los valores
máximos y mínimos, para ampliar el dominio de este punto se recomienda la lectura de
Flores y Lozano (1998).

Diseño y construcción de una distribución de frecuencias en clases o intervalos.


Para el diseño y construcción de una distribución de frecuencias en clases se
recomiendan los siguientes pasos:
1. Encontrar los valores máximo (Xmáx) y mínimo (Xmin) de la variable en el conjunto de
datos.

17
Tema 1: sesiones 2, 3 y 4

2. Determinar el número de clases (K) a utilizar. La selección del número apropiado de


clases o intervalos que se vaya a utilizar, depende del número de datos y observaciones
que esté contenido en la masa de datos a estudiar, del número de valores diferentes de la
variable y del juicio del investigador. Un gran número de clases puede que no condense
suficientemente los datos como para poseer un valor práctico; por otro lado, un número
de clases muy reducido tiende a resumir en exceso los datos, por lo que podría perderse
mucha información valiosa. Una regla empírica, recomendada por muchos autores, es que
el número de clases varíe entre 5 y 15. Si no se dispone de ningún criterio previo que
justifique el número de clases se puede utilizar la regla de Sturges como guía:
K = 1 + 3,3 log n
Donde: K es el número aproximado de clases y n el número total de observaciones o datos.
3. Determinar la amplitud (A) de la clase o intervalo. Si se desea que todas las clases tengan
igual amplitud puede utilizarse la fórmula siguiente:
X max − X min
A=
K
Es importante considerar que es conveniente, aunque no es indispensable, que todas las
clases tengan igual amplitud pues esto facilita las comparaciones de frecuencias entre
clases y el cálculo de medidas resumen.
4. Establecer los límites de cada clase: Limite inferior (Li) y Limite superior (Ls), de
manera que sean mutuamente excluyentes y contiguos, evitando ambigüedades al
momento de ubicar los datos en las clases.
5. Una vez obtenidos los límites de las clases, se realiza el conteo de las frecuencias
absolutas simple. El cálculo de las demás frecuencias requeridas es un proceso similar a
los estudiados en los casos de variable cualitativa y cuantitativa no agrupada en clases.

Actividad 4. Otra pregunta del cuestionario aplicado a las empresas del Estado Trujillo está
relacionada con el beneficio obtenido al finalizar el ejercicio económico del año 1999, expresado en
porcentaje sobre las ventas. Los resultados se muestran a continuación:
25 65 0,8 0,5 0,7 41 39 12 0,4 0,5
0,5 19 0,8 24 24 0,1 49 0,2 0,4 11
0,3 0,3 0,4 31 0,5 0,4 0 0,7 0,7 25

18
Tema 1: sesiones 2, 3 y 4

Una evaluación superficial de estos datos nos permite determinar que, aunque son
sólo 30, casi todos son diferentes, es decir, se repiten poco; argumento válido para decidir
que es conveniente diseñar una distribución por clases o intervalos para la variable
porcentaje de beneficio, de manera que se aplicarán los pasos señalados en su construcción.

1. Se detecta que sus valores máximo y mínimo son:


Xmáx = 65 y Xmín= 0
2. Se aplica la regla de Sturges, dado que no tenemos ningún criterio para establecer el
número de clases.
K = 1 + 3,3 log n = 1 + 3,3 log(30) = 5,87
De manera que, resulta 5,87 clases, valor que debe aproximarse a 6. Se recomienda
aproximar siempre por exceso, dado que de no hacerlo de esta manera podría resultar
que el valor máximo quedara fuera de la distribución.
3. Se calcula la amplitud
X max − X min 65 − 0
A= = = 10,83
K 6
La amplitud la aproximamos a 11 y vamos a establecer igual amplitud para todas las
clases.
4. Se establecen los límites de las clases de la siguiente forma:
ƒ El limite inferior de la primera clase será igual al valor mínimo: Li = Xmin =0
ƒ El límite superior de la primera clase será igual al límite inferior de la misma clase
más la amplitud: Ls= Li + A = 0+11=11. De manera que la primera clase quedará
desde 0% hasta 11%, simbólicamente 0 - 11
ƒ Los límites inferiores de las clases siguientes serán los límites superiores de las
clases inmediatamente anteriores y
ƒ Los límites superiores de las clases siguientes serán los límites inferiores de la
misma clase más la amplitud
En la primera columna de la tabla 3 se muestran los límites de las 6 clases
5. Se realiza el conteo de las frecuencias en los datos, considerando los límites inferiores
de las clases como cerrados y los superiores como abiertos a excepción del último que

19
Tema 1: sesiones 2, 3 y 4

siempre se considera cerrado. Esto permite ubicar con precisión cada dato en una y sólo
una clase, evitando así cualquier ambigüedad.
6. Se calculan las demás frecuencias aplicando las fórmulas estudiadas

Los resultados obtenidos se muestran en la tabla 3 y el gráfico 4.

Tabla 3
Porcentaje de beneficios obtenido por las empresas comerciales
en el Estado Trujillo. Año 1999

Limite Limite %
inferior superior fi Fi hi % Hi acumulado Xm
0 - 11 18 18 0,6000 60,00 0,6000 60,00 5,5
11 - 22 3 21 0,1000 10,00 0,7000 70,00 16,5
22 - 33 5 26 0,1667 16,67 0,8667 86,67 27,5
33 - 44 2 28 0,0667 6,67 0,9333 93,33 38,5
44 - 55 1 29 0,0333 3,33 0,9667 96,67 49,5
55 - 66 1 30 0,0333 3,33 1,0000 100,00 60,5
30 1 100
Fuente: Encuesta aplicada a las empresas del Estado Trujillo, año 2000

En la tabla 3 se ha agregado una columna adicional encabezada como Xm, que


contiene los puntos medios de cada clase o marca de clase, calculados a partir de la fórmula
siguiente:
Li + Ls
Xm =
2
El punto medio Xm es el valor representativo de cada clase. Este valor es muy
importante pues permite el cálculo de importantes medidas de tendencia central y
variabilidad como la media, varianza y desviación típica.

Representación gráfica. La distribución de frecuencias agrupada en clases o intervalo


puede representarse gráficamente mediante histogramas, polígonos y ojivas. A continuación
se presenta un histograma de frecuencias absolutas simples para la variable en estudio

20
Tema 1: sesiones 2, 3 y 4

Gráfico 4
Porcentaje de Beneficios de las empresasen el
Estado Trujillo. Año 1999
Número de empresas
20
18
16
14
12
10
8
6
4
2
0
0 - 11 11 - 22 22 - 33 33 - 44 44 - 55 55 - 66
Porcentaje de beneficios

La distribución de frecuencias de esta variable muestra una forma muy peculiar, a


simple vista se observa que los datos tienden a concentrarse en el primer intervalo o clase, es
decir, en el intervalo de porcentaje de beneficio 0 – 11 están concentradas 18 de las 30
empresas encuestadas, un 60%. Puede observarse igualmente que un número
considerablemente bajo de empresas, sólo 3, llegan a obtener porcentaje de beneficio entre el
33 y 66%.

MEDIDAS DE CENTRALIDAD O TENDENCIA CENTRAL.

Las medidas de centralidad son valores representativos en torno a los cuales se


distribuyen los valores u observaciones; en general se les llama promedios, medidas de
localización o de posición. Estos promedios están expresados en la misma unidad de medida
de la variable original. Estudiaremos, en este módulo, la media aritmética, la mediana y la
moda.

21
Tema 1: sesiones 2, 3 y 4

Media aritmética: X
La media aritmética representa el punto de equilibrio o centro de gravedad en la
distribución de frecuencias de una variable.
La media aritmética de un conjunto de n medidas x1, x2, ... xn, es la suma de estas
medidas dividas por número total de ellas n.

X=
∑X i i
; si se trata de toda la población: µ =
∑X
i i
es la Media poblacional
n N
donde: n tamaño de la muestra y N tamaño de la población.

Características:
ƒ La media está afectada por cada valor del conjunto, principalmente por los valores
extremos.
ƒ Es fácil de calcular y se presta a manipulaciones algebraicas, por esto es el
promedio más usado; pero no se puede calcular en clases abiertas (esto constituye
una desventaja).

Propiedades:
1.- La suma de las desviaciones a partir de la media aritmética es cero: ∑( X
i
i − X) =0

2.- K = K , si K es una constante.


3.- Si Y = Xi ± K, entonces Y = X ± K , si K es una constante.

4.- Si Y = KXi, entonces Y = KX ,si K es una constante.

5.- Si n1 datos tienen media X 1 , n2 datos tienen media X 2 , .............

X 1n1 + X 2 n 2 + .... X k n k
..... nk tienen media X k entonces la media general es: X g =
n1 + n 2 + .... + n k

Mediana Md o Me
La mediana de un conjunto de datos de una variable es el valor que divide en dos
partes iguales a su distribución de frecuencias, cuando los datos están ordenadas en forma
ascendente.

22
Tema 1: sesiones 2, 3 y 4

Características:
ƒ No se ve afectada por valores extremos.
ƒ Se puede calcular en intervalos abiertos.
ƒ En distribuciones muy asimétricas es una medida de centralidad más representativa
que la media.
ƒ Tiene las desventajas de no prestarse a manipulaciones algebraicas y no tomar en
consideración, para su cálculo, toda la información disponible.

Moda o Modo Mo
Es el valor de la variable que más se repite en una distribución de frecuencias (el valor
con mayor frecuencia). Una distribución puede tener más de un modo pudiendo ser:
Unimodal (si tiene sólo 1), Bimodal (si tiene 2) o multimodal o n-modal (si tiene n modos).

Características:
ƒ La moda no siempre ocurrirá como un valor central, sino que por lo general es un
valor extremo.
ƒ No se ve afectada por valores extremos, puede calcularse en intervalos abiertos,
siempre que la clase modal no esté abierta.
ƒ No se presta a manipulaciones algebraicas ni toma en cuenta, para su cálculo, toda
la información disponible.

Cálculo de las medidas de tendencia central


El cálculo de las medidas de tendencia central se ilustra mediante ejemplos para cada tipo
de variable y cada tipo de distribución de frecuencias.

1. Para variables cualitativas la única medida de tendencia central que puede calcularse es
la moda, dado que el cálculo de las demás medidas requiere que la variable sea numérica.

Actividad 5. En relación a la variable fuentes de financiamiento del grupo de empresas


encuestadas, a que se hace mención en las Actividades 1 y 2, la moda resulta ser la opción
Banca Privada, para su determinación basta con aplicar directamente su definición, pues se trata
de la opción con mayor frecuencia absoluta simple: fi =15 ver Tabla 1.

23
Tema 1: sesiones 2, 3 y 4

2. Para variables cuantitativas puede presentarse varios casos dependiendo del tipo de
distribución que se esté utilizando, así:

ƒ En distribuciones con frecuencias unitarias, es decir, variables con pocos valores


que se presenta una o muy pocas veces, como el siguiente ejemplo.

Actividad 6. Los registros de ventas totales diarias (en millones de Bs.) durante una semana
en una empresa son los siguientes:
lunes martes miércoles jueves viernes sábado
1,5 2 2,7 0,8 3,5 4
En esta Actividad cada valor aparece una sola vez, no se repite ninguno. Y deseamos calcular e
interpretar sus medidas de tendencia central.

Media: aplicamos la siguiente fórmula de cálculo

X=
∑X
i i
=
1,5 + 2 + 2,7 + 0,8 + 3,5 + 4
= 2,071428 millones de bolívares
n 7
Por tanto, esta empresa muestra un promedio de ventas diarias de 2.071.428 bolívares
en la referida semana

Mediana: para el cálculo de la mediana primero debe ordenarse la distribución en


forma ascendente,
0,8 1,5 2 2,7 3,5 4
Y luego
ƒ Si "n" es impar la Md es única y es el valor central de las observaciones.
En este caso el valor central de los datos es 2 (encuadrado en la serie de datos
ordenados) por lo tanto, la Mediana es 2 millones de bolívares y se interpreta como
que por debajo de ella queda aproximadamente un 50% de los datos y el restante 50%
está por encima de ella.

ƒ Si "n" es par hay dos valores medianiles y la MD es la media aritmética de


ambos.

24
Tema 1: sesiones 2, 3 y 4

Moda: En distribuciones unitarias no hay moda.

ƒ En distribuciones con frecuencias simples o no agrupadas en intervalos: Este caso


se ilustra con el siguiente Actividad.

Actividad 7. Utilizando la distribución de la actividad 3 (Tabla 2), calcular e interpretar las


medidas de tendencia central para la variable tiempo (en años cumplidos) que llevan las
empresas comerciales compitiendo en el mercado del Estado Trujillo.

Para el cálculo de las medidas de tendencia central se requiere los valores de la variable
Xi, las frecuencias absolutas simples fi, las frecuencias absolutas acumuladas Fi, valores
que trasladamos de la Tabla 2 a la Tabla 4.
Tabla 4
Tabla de cálculos para la determinación de las medidas de tendencia central para la
variable Tiempo (en años cumplidos).
Tiempo fi Fi Xifi
Xi
1 4 4 4
2 2 6 4
3 5 11 15
Mediana 4 4 15 16
5 4 19 20
6 2 21 12

Moda 7 6 27 42
8 3 30 24
Total empresas 30 137

Media. Para facilitar los cálculos agregamos a la tabla 4 la columna Xifi y luego se aplica la

siguiente fórmula: X =
∑Xi i fi
=
137
= 4,57 años
n 30
Es así como el tiempo promedio que llevan las empresas encuestadas en el mercado de
Trujillo es de 4,57 años

25
Tema 1: sesiones 2, 3 y 4

Mediana. Se siguen los siguientes pasos:


ƒ Ordenamos la distribución en forma ascendente y calculamos las frecuencias
absolutas acumuladas "Fi" (en este caso la distribución ya está ordenada en la Tabla 4
y la columna Fi ya está calculada).
ƒ Dividimos la distribución en 2 (calcular n/2 ) y este valor lo buscamos en la columna
Fi o su inmediato superior, para determinar cual es la posición de la mediana. En este
nivel el valor de la variable Xi es la mediana.
En este caso n/2= 30/2 = 15 es la posición de la y con una flecha se señala el valor de
la mediana igual a 4 años, marcado con un recuadro en la tabla 4. Entonces, la Mediana
es 4 años y significa que un 50% de las empresas encuestadas tienen menos de 4 años
en el mercado y el restante 50% tiene más de 4 años compitiendo en el mercado del
estado Trujillo.

Moda. En distribuciones simples la moda se obtiene por la simple aplicación de la


definición, en este caso el valor de la variable con mayor frecuencia es 7 años.

ƒ En distribuciones agrupadas en intervalos: Los detalles para este tipo de distribución


se discutirán mediante la aplicación de un ejemplo.

Actividad 8. Utilizando la distribución de la actividad 4 (Tabla 3), calcular e interpretar las


medidas de tendencia central para el variable porcentaje beneficio obtenido al finalizar el
ejercicio económico del año 1999, expresado en porcentaje sobre las ventas de las empresas
comerciales compitiendo en el mercado del Estado Trujillo.

Para el cálculo de las medidas de tendencia central se requiere los valores medios de las
clases Xm, las frecuencias absolutas simples fi y las frecuencias absolutas acumuladas
Fi, valores que trasladamos de la Tabla 3 a la Tabla 5.

Tabla 5
Tabla de cálculos para la determinación de las medidas de tendencia central para la
variable Porcentaje de Beneficio.

26
Tema 1: sesiones 2, 3 y 4

Li Ls fi Fi Xm Xmfi
Clase medianal 0 11 18 18 5,5 99,00
y 11 22 3 21 16,5 49,50
Clase modal 22 33 5 26 27,5 137,50
33 44 2 28 38,5 77,00
44 55 1 29 49,5 49,50
55 66 1 30 60,5 60,50
30 473,00

Media. Para facilitar los cálculos agregamos a la tabla 5 la columna Xmfi y luego se aplica

la siguiente fórmula: X =
∑X i mi fi
=
473
= 15,77 % de beneficios durante el año 1999
n 30
Es así como el porcentaje promedio de beneficios que obtienen las empresas encuestadas
durante el año 1999 15,77%.

Mediana. Se siguen los siguientes pasos:


ƒ Ordenamos la distribución en forma ascendente y calculamos las frecuencias
absolutas acumuladas "Fi" (en este caso la distribución ya está ordenada en la Tabla 5
y la columna Fi ya está calculada).
ƒ Dividimos la distribución en 2 (calcular n/2) y este valor lo buscamos en la columna
Fi o su inmediato superior. En este nivel determinamos la clase medianal o la
posición de la mediana En este caso n/2= 30/2 = 15 es la posición de la clase
medianil (0 – 11) señalada con una flecha.
ƒ Finalmente se aplica la siguiente fórmula de interpolación:
n / 2 − Faa
Md = Li + ( )A
fi
donde:
Li: límite inferior de la clase Medianil, Li = 0 en este caso

27
Tema 1: sesiones 2, 3 y 4

Faa: frecuencia absoluta acumulada hasta la clase anterior a la medianil, Faa = 0


porque la primera clase es la medianal para este ejemplo
fi: frecuencia. absoluta ordinaria de la clase Medianil, fi = 18
A: amplitud de la clase Medianil, A= 11
n / 2 − Faa ⎛ 15 − 0 ⎞
Sustituyendo: Md = Li + ( )A = 0 + ⎜ ⎟11 = 9,17 % de beneficios
fi ⎝ 18 ⎠
año 1999. Por lo tanto, aproximadamente un 50% de las empresas encuestadas
tendrán un porcentaje de beneficios inferior al 9,17% y el restante 50% estará por
encima de este valor.

Moda. Para el cálculo de la moda si sigue el siguiente procedimiento:


ƒ Se obtiene la clase modal como la de mayor frecuencia, en este caso es 0 - 11
d1
ƒ Se aplica la fórmula de interpolación: Mo = Li + ( )A
d1 + d 2
donde:
Li: límite inferior de la clase Modal, (0 – 11) en el ejemplo
d1 = fi - fa Æ a: clase anterior a la Modal. d1 =18-0= 18
d2 = fi - fp Æp: clase posterior a la Modal. d2 = 18-3= 15
A= Amplitud de la clase modal, A= 11
d1 ⎛ 18 ⎞
Sustituyendo: Mo = Li + ( )A = 0 + ⎜ ⎟11 = 6 % de beneficios año 1999
d1 + d 2 ⎝ 18 + 15 ⎠
Entonces la distribución del porcentaje de beneficio de las empresas comerciales en
el Estado Trujillo es unimodal y el valor que más frecuentemente se presenta es un
6%.

RELACIONES DE LAS MEDIDAS DE TENDENCIA CENTRAL CON RESPECTO


A LA SIMETRÍA DE LA DISTRIBUCIÓN

a.- Si se observa perfecta simetría respecto de un eje central, las tres medidas coinciden:
X = Md = Mo

28
Tema 1: sesiones 2, 3 y 4

fi

Variable
b.- Si la distribución está más extendida hacia valores mayores de la variable, la asimetría es
positiva o de cola derecha: X > Md > Mo
fi

Variable
c.- Si la distribución está más extendida hacia valores menores de la variable, la asimetría es
negativa o de cola izquierda: X < Md < Mo
fi

Variable
d.- Situaciones intermedias darán diferentes grados de asimetría positiva o negativa.

MEDIDAS DE DISPERSIÓN O VARIABILIDAD

Las medidas de dispersión a variabilidad son valores que indican que tan concentrados
o dispersos se distribuyen un conjunto de observaciones o datos de una variable. Estas
medidas tienen carácter comparativo; así cuando comparamos un conjunto de datos, aquel

29
Tema 1: sesiones 2, 3 y 4

donde estas medidas sean más elevadas reflejará mayor variabilidad o dispersión, lo
contrario es igualmente válido.

Las medidas de dispersión pueden ser:


Absolutas si están expresadas en las unidades de medida originales de la variable.
Entre éstas rango, varianza y desviación típica.

Relativas si están expresadas en porcentajes como el coeficiente de variación.

Rango o recorrido R
Es la medida de dispersión más simple, representa la variabilidad total de los datos, no
indica la dispersión respecto a un valor central. Es muy afectada por valores extremos.
R = Xmáx - Xmín

Varianza V(X) (σ² ó S²)


Es una medida de la concentración o dispersión de los valores de la variable con
respecto a la media.

∑( X i − X )2
La varianza de n medidas X1, X2, ...... Xn es: V ( X ) = i

n
Si se trata de toda la población de tamaño N:

∑( X i − µ )2
V (X ) = σ 2 = i
Varianza poblacional
N

∑( X i − X )2
Para cualquier muestra: V ( X ) = S 2 = i
es la varianza muestral insesgada.
n −1

Características:
ƒ La varianza es siempre positiva: V(X) ≥ 0
ƒ Tiene carácter comparativo y está medida en unidades originales al cuadrado.

Propiedades:

30
Tema 1: sesiones 2, 3 y 4

ƒ V(X) ≥ 0
ƒ V(K) = 0 ; si K es una constante
ƒ V(X ± K) = V(X); si K es una constante
ƒ V(KX) = K²V(X); si K es una constante
ƒ V(X ± Y) = V(X) + V(Y); si X y Y son variables independientes.

Desviación típica
La varianza dá origen a una medida que tiene gran utilidad e interpretación práctica: la
desviación típica o estándar.

σ = V(X ) = σ 2 Desviación típica poblacional;

S = V( X ) = S2 Desviación típica muestral

Este valor mide la dispersión o variabilidad en las mismas unidades que se mide la
variable original. Su utilidad se centra en el cálculo de variables estandarizadas normales
para la inferencia estadística.

Coeficiente de variación CV
Se define como la relación entre la desviación típica y la media aritmética medido
porcentualmente:
σ S
CV = 100 CV poblacional y CV = 100 CV muestral
µ X

Su uso se centra en la comparación de dos o más series con medias diferentes o


medidas en unidades diferentes.

Cálculo de las medidas de dispersión o variabilidad

El cálculo de las medidas de dispersión o variabilidad se ilustra mediante ejemplos para


cada tipo de variable y cada tipo de distribución de frecuencias.

31
Tema 1: sesiones 2, 3 y 4

1. Para variables cualitativas las medidas de dispersión no pueden calcularse, dado que su
cálculo requiere que la variable sea numérica.

3. Para variables cuantitativas puede presentarse varios casos dependiendo del tipo de
distribución que se esté utilizando, así:

a.- Para cualquier conjunto de datos:


Actividad 9. Con los datos de la actividad 6 sobre los registros de ventas totales diarias (en
millones de Bs.) durante una semana, calcular las medidas de dispersión o variabilidad. La
media de los datos es 2,071428 millones de bolívares calculada en la actividad 6.
En esta Actividad cada valor aparece una sola vez, no se repite ninguno. Y deseamos calcular e
interpretar sus medidas de variabilidad o dispersión.

Rango: R = Xmáx – Xmín = 4-0,8 = 3,2 millones de bolívares

∑ (X i − X )2
∑X 2
− nX 2
V (X ) = S = =
2 i i i
Varianza:
n −1 n −1

V (X ) = S 2
=
∑X
i i
2
− nX 2
=
1,5 2 + 2 2 + 2,7 2 + 0,8 2 + 3,5 2 + 4 2 − 7(2,071428)
= 2,06572
n −1 7 −1

Luego, la varianza es 2,06572 (millones de Bs)2

Desviación típica: S = V(X ) = S 2 = 2,06572= 1,43726


La desviación tipica es 1,43726 millones de Bs.
S 1,437261
Coeficiente de variación: CV = 100 = 100 = 69,39%
X 2,071428

b.- En distribuciones de frecuencias simples:

Actividad 10. Utilizando la distribución de la actividad 3 (Tabla 2), calcular e interpretar las
medidas de dispersión para la variable tiempo (en años cumplidos) que llevan las empresas
comerciales compitiendo en el mercado del Estado Trujillo.

32
Tema 1: sesiones 2, 3 y 4

Tabla 6
Tabla de cálculos para la determinación de las medidas de dispersión o variabilidad
para la variable Tiempo (en años cumplidos)
Tiempo (Xi) fi Xi2fi
1 4 4
2 2 8
3 5 45
4 4 64
5 4 100
6 2 72
7 6 294
8 3 192
Total 30 779

La media es de 4,67 años , calculada en la actividad 7


Rango: R = Xmáx – Xmín = 8-1 = 7 años

Varianza:

∑ (X i − X )2 fi
∑X 2
f i − nX 2 779 − 30(4,67)
V (X ) = S = = = = 4,3011
2 i i i

n −1 n −1 30 − 1

Desviación típica S = V(X ) = S 2 = 4,3011= 22,0739

S 2,0739
Coeficiente de variación CV = 100 = 100 = 44,41%
X 4,67

c.- En distribuciones agrupadas en intervalos:

Actividad 11. Utilizando la distribución de la actividad 4 (Tabla 3), calcular e interpretar las
medidas de variabilidad para la variable porcentaje beneficio obtenido al finalizar el ejercicio
económico del año 1999, expresado en porcentaje sobre las ventas de las empresas comerciales
compitiendo en el mercado del Estado Trujillo.

33
Tema 1: sesiones 2, 3 y 4

Tabla 7
Tabla de cálculos para la determinación de las medidas de dispersión o variabilidad
para la variable Porcentaje de Beneficio.

Li Ls fi Xm Xm2fi
0 11 18 5,5 544,50
11 22 3 16,5 816,75
22 33 5 27,5 3781,25
33 44 2 38,5 2964,50
44 55 1 49,5 2450,25
55 66 1 60,5 3660,25
30 14217,50

La media es 15,77 calculada en la actividad 8


Rango: R = Xmáx – Xmín = 65-0 = 65

Varianza:

∑ ( Xm i − X )2 fi
∑ Xm 2
f i − nX 2 14217,50 − 30(15,77) 2
V (X ) = S = = = = 232,99
2 i i i

n −1 n −1 30 − 1

Desviación típica S = V(X ) = S 2 = 232,99 =15,26

S 15,26
Coeficiente de variación CV = 100 = 100 = 96,79%
X 15,77

AUTO EVALUACIÓN

Usted como investigador requiere realizar un estudio sobre la situación financiera de las
empresas en el Estado Trujillo y su relación con la actividad a la cual se dedican y su tamaño, con
este fin planifica un estudio y entre Febrero y Marzo del año 1999, entrevista a los gerentes de una
muestra de estas empresas. La base de datos siguiente presenta sus resultados.

34
Tema 1: sesiones 2, 3 y 4

Variables consideradas:
IDEN_EMP Identificación (enumeración) de las empresas
SECTOR Actividad principal a la cual se dedica la empresa; 1: Construcción; 2: Comercio; 3
Alimentos; 4: Inmobiliaria; 5: Servicios públicos
VTAS1999 Ventas durante el año 1999, en miles de Bs.
BEN1997 % de beneficios antes del ISR (sobre las ventas) durante el año 1997
BEN1998 % de beneficios antes del ISR (sobre las ventas) durante el año 1998
N_TRABAJ Número de trabajadores. 1: de 5 a 20 (pequeña EMP); 2: de 21 a 100 (mediana EMP.); 3
más de 100 (gran EMP.)

Datos recolectados:
IDEN_EMP SECTOR VTAS1999 BEN1997 BEN1998 N_TRABAJ
1 3 191244,0 12 25 3
2 2 53539,0 63 65 3
3 2 147291,0 0.7 0.8 2
4 4 22957,0 0.6 0.5 1
5 3 40049,0 0.2 0.7 1
6 3 9624,0 0.7 41 1
7 2 28448,0 38 39 3
8 3 11425,0 11 12 1
9 1 33386,0 0.3 0.4 1
10 3 43253,0 0.4 0.5 1
11 1 53662,0 0.5 0.5 1
12 3 37438,0 17 19 2
13 3 34703,0 10 0.8 1
14 3 38067,0 20 24 2
15 5 1094,0 99 24 1
16 2 360252,0 0.1 0.1 1
17 3 59397,0 43 49 3
18 3 56661,0 -0.2 0.2 1
19 3 407013,0 0.4 0.4 3
20 3 144822,0 0.3 11 1
21 3 211385,0 0.3 0.3 2
22 3 410137,0 0.4 0.3 3
23 3 30887,0 0.4 0.4 1
24 4 58115,0 0.9 31 1
25 3 199485,0 0.6 0.5 2
26 3 6054,0 -0.4 0.4 1

35
Tema 1: sesiones 2, 3 y 4

27 2 671051,0 0.1 00 1
28 3 407808,0 0.7 0.7 3
29 3 231054,0 0.7 0.7 3
30 3 19656,0 25 25 1

Realice un análisis descriptivo de estos datos que incluya:


a) Clasificar las variables e identificar la escala de medición para cada una
b) Obtener y justificar, apropiadas distribuciones de frecuencia para cada una de las variables.
c) Representar gráficamente cada distribución y analizar las características más resaltantes
visualizadas en los gráficos.
d) Calcular e interpretar las medidas de tendencia central.
e) Calcular e interpretar las medidas de variabilidad.

Finalmente, resuma en un informe los aspectos fundamentales que caracterizan a estas


empresas.

36
Tema 1: sesiones 2, 3 y 4

BIBLIOGRAFÍA

BÁSICA

ANDERSON, D. R., SWEENEY, D. J. y WILLIAMS, Th. A. (1999). Estadística para


Administración y Economía. Internacional Thomson Editores. México
BERENSON, M. L. y LEVINE, D. M. (1996). Estadística básica en Administración,
conceptos y aplicaciones. Prentice Hall. México.
BERENSON, M. L., LEVINE, D. M. y KREHBIEL, T. (2000). Estadística para
Administración. Prentice Hall. México.
FLORES G., R y LOZANO de los S., H. (1998). Estadística aplicada para
administración. Grupo editorial Iberoamerica. México.
HILDEBRAND, D. K. Y OTT, R. L. (1997). Estadística aplicada a la administración y
a la economía. Adisson- Wesley Iberoamerican. Caracas, Venezuela.
KAZMIER, L. (1998). Estadística aplicada a la administración y a la economía.
McGraw-Hill. España
NAVARRO, A. (2000). Estadística Aplicada al área Económica y Empresarial.
Ediciones de la Universidad Ezequiel Zamora. Barinas. Venezuela.
NEWBOLD. P. (1998). Estadística para los negocios y la economía. Prentice Hall.
México.
WEBSTER, A. M. (2000). Estadística aplicada a los negocios y a la economía. Irwin
McGraw-Hill. México.

COMPLEMENTARIA
BRYMAN, A. Y CRAMER, D. (1990). Quantitative data analysis for social scientistis.
Routledge. London.
MARTINEZ B., C. (1998). Estadística y muestreo. Ecoediciones. Colombia
MORLES, Víctor. (1994). Planeamiento y análisis de investigaciones. Eldorado
Ediciones. Caracas. Venezuela.
MULLER, R. Y FAJARDO, M. D. (2000). Manual practico de estadística aplicada a
las ciencias sociales. Ariel Practicum. Barcelona.
PAGANO, R.R. (1999). Estadística para las Ciencias del Comportamiento. Thomson
editores. México
RITCHEY, F. J. (2000). Estadística para las Ciencias Sociales. El potencial de la
imaginación estadística. McGraw-Hill. México.

Prof. Ligia M. Becerra S.


ligiab@ula.ve
27/09/05 12:12:40

37

También podría gustarte