Está en la página 1de 95

Asignatura: Estadística I

ADM: 101
3ro. Semestre del Programa Administración de Empresas

APRECIACIONES GENERALES

A) COMPETENCIAS

Recopilar, procesar, describir, interpretar y analizar la información de variables para la


pertinente toma de decisiones de forma objetiva, reflexiva y con juicio crítico, aplicando
instrumentos cuantitativos de análisis.

B) ELEMENTOS DE COMPETENCIA
 C.D.1. Conceptualiza los elementos que componen la Estadística para la correcta
organización de datos que permitan facilitar su correcta interpretación.
 C.D.2. Aplica las diferentes medidas de la Estadística Descriptiva para el análisis e
interpretación de información de variables sistematizadas que permitan la resolución
de problemas económicos financieros de la organización.
 C.D.3. Analiza el comportamiento de las variables utilizando la teoría elemental de la
probabilidad para determinar de manera apropiada sus proyecciones en función a los
requerimientos de las áreas de la organización.

1.- INTRODUCCION

No es posible precisar con exactitud el origen de la estadística en el tiempo, su génesis se


remonta hasta los albores mismos de la humanidad. Se cree que éste surge como producto
de la necesidad que sintió el hombre primitivo de registrar en principio y luego controlar los
resultados de la caza y la pesca, que son las actividades primarias del ser humano. Sin
embargo, estas actitudes del hombre primitivo no fueron intencionadas sino intuitivas, que
con el pasar de los años y la evolución del ser humano se fue estructurando como técnica y
posteriormente como ciencia hasta constituirse, hoy en día, en un instrumento muy valioso
para el desarrollo científico.

1.2. Desarrollo Histórico de la Estadística.-

El desarrollo histórico de la estadística presenta tres etapas en su desarrollo. Estas etapas


son:

a) ETAPA INICIAL

Este período se extiende desde la antigüedad hasta mediados del Siglo XVIII. Se
caracteriza por que se asocia la estadística a los censos poblacionales y el registro de los
bienes y servicios de un estado o pueblo, para medir su poderío como estado. El desarrollo
de la estadística, en este período, se asocia con el “mercantilismo” como modelo de desarrollo
económico, donde la riqueza de un pueblo o estado se pretendía medir en términos de la
cantidad de metálico que este poseía, para ello obviamente los estados debían implementar
un sistema confiable de registro de manera tal que estén permanentemente informados de la
situación de un estado con respecto del otro.

1
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Los pasajes históricos más relevantes en esta etapa son:
 La cultura Egipcia muestra en la composición de su patrimonio cultural interesante y
abundante material sobre recopilaciones de datos estadísticos en su administración estatal,
e incluso divinizaron a SAPHKIT como diosa de los libros y de las cuentas.
 Los romanos, otra importante cultura de la humanidad, llevaron registros numéricos con
fines tributarios. El nacimiento de Cristo mismo, en esos tiempos, está relacionado con un
empadronamiento poblacional.
 En la época de los reyes católicos de España (SIGLO XV), se practicaron censos bastante
completos y sofisticados para su época y durante la vigencia del mercantilismo los estados
desarrollaron técnicas de registro para cuantificar el volumen de metálico que reflejaba el
poderío y riqueza de un estado.
 Para no ir muy lejos, en el imperio incaico, en lo que hoy es Latinoamérica, existen indicios
de que se practicaron registros de cuentas y población mediante los “quipus”, en la cultura
quechua.

a) ETAPA DE LA SISTEMATIZACIÓN

Esta etapa se caracteriza por la aparición de escuelas estadísticas cuya pretensión es la


de sistematizar el estudio de esta ciencia, desde una óptica científica. Se destacan en el
tiempo tres escuelas:

 La escuela Alemana.- Creó la primera cátedra de estadística, considerando esta disciplina


como la descripción de los fenómenos concernientes al estado y la administración estatal.

 La Escuela Inglesa.- Cuantificaron las leyes que rigen los fenómenos sociales, a través de
aritmetización de la estadística. En esta etapa se diseñaron modelos conductistas, vale
decir modelos estadísticos no paramétricos.

 La Escuela Francesa.- Introduce la teoría de las probabilidades asociándola con los juegos
de azar. La Place, famoso estudioso de la estadística, es el representante más destacado
de la época. En este período se desarrolla la inferencia estadística a partir del cálculo de
probabilidades, cuyo fundamento es la matemática.

c) ETAPA ACTUAL: Está comprendida entre principios del siglo XIX hasta nuestros días.
En esta etapa la matemática se plasma en la columna vertebral de la estadística y se
caracteriza por el gran desarrollo alcanzado como ciencia y como una metodología de la
investigación científica aplicada a todas las ramas del saber humano: Ingeniería, Biología,
Economía, medicina, agronomía, etc.

Se destacan estudiosos como: Pearson, Student, Newman y Fisher.

2
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
1.3. Definición de la Estadística

La palabra Estadística parece derivar de la palabra latina “Status”, que en el latín tenía el
sentido de estado político.

STATUS = ESTADO POLITICO

Luego, se usó la estadística en política económica y significaba la exposición sistemática y


ordenada de las características más notables de un estado, consistía en la recolección y el
análisis de los datos relativo a la población y riqueza para los fines de la guerra y de las
finanzas. Se trataba de los famosos censos para fines tributarios.

DEFINICIONES.- A continuación presentamos algunas definiciones de estadística:

DICCIONARIO LAROUSSE: “Es la ciencia cuyo objeto es reunir, clasificar y contar todos los
hechos en un mismo orden”.

GUALBERTO AGUIRRE: “Es una descripción numérica sucinta de las características de


grandes conjuntos de observaciones, que en algunos casos, se denomina reducción de datos
y condensa en algunos estadígrafos toda la información obtenida”.

KENDALL Y STUART.-“Es la rama del método científico que trata de los datos obtenidos al
contar o medir las propiedades de las poblaciones de fenómenos humanos”.

H. CRAMER.- “El objeto fundamental de la teoría estadística consiste en investigar la


posibilidad de extraer de los datos estadísticos inferencias válidas, elaborando los métodos
mediante los cuales pueden obtenerse dichas inferencias”

FILOMENO CARVAJAL.- “Por estadística entendemos a la ciencia o conjunto de


conocimientos que se ocupan de la recolección, tabulación, análisis e interpretación de datos
numéricos relativos a un conjunto de individuos y observaciones que nos permiten extraer
conclusiones válidas y tomar decisiones lógicas basadas en dicho análisis”.

HORACIO D’OTTONE.- “La estadística comprende el conjunto de métodos y procedimientos


para obtener, describir e interpretar conjuntos de datos y para basar decisiones y predecir
fenómenos que pueden expresarse en forma cuantitativa”.

MARIO MURILLO OPORTO.- “El significado de la estadística es mucho más amplio. Se refiere
también a un cuerpo de técnicas o metodologías para la recopilación, presentación y análisis
de los datos cuantitativos y cualitativos y al uso de tales datos para toma de decisiones.

Pero esto no es todo, ya que se refiere también a la predicción frente a la incertidumbre de los
fenómenos de la naturaleza. En otras palabras, podemos decir que la estadística es un
método que sirve para tomar decisiones cuando hay incertidumbre, sobre la base de datos
numéricos y calcular su riesgo”.

CELESTINO GARCIA ORE.- “Estadística es una disciplina que nos proporciona un conjunto
de métodos y procedimientos que permiten: recopilar , clasificar, presentar y describir datos

3
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
en forma adecuada para tomar decisiones frente a la incertidumbre o predecir o afirmar algo
acerca de la población o sus parámetros a partir de los datos extraídos de la misma”.

1.4. División de la Estadística

En un proceso de investigación, una vez definido el objetivo y delimitada claramente la


población, en muchos casos, resulta imposible o es sumamente difícil abarcar la totalidad de
los elementos de la población; esto debido a una serie de factores como ser:

 La distancia y dificultades de acceso a ciertos lugares.


 Carencia de recursos económicos
 Carencia de recursos humanos
 Otros factores limitantes
Para superar estas deficiencias, en vez de observar la totalidad de los elementos de la
población es posible referirse a una proporción adecuada de los elementos de la misma, la
cual recibe el nombre de MUESTRA.

ESQUEMA SIMPLIFICAD0O DEL CONTENIDO DE LA ESTADÍSTICA

MUNDO REAL
ESTADISTICA

ESTADISTICA DECRIPTIVA
TABULACION

INFERENCIAL
GRAFICOS
MUESTREO
REGULARIDADES
CALCULO PARAMETROS
ESTIMACION
AXIOMAS DE COMPORTAMIENTO
NUMEROS
CONTRASTACION
INDICES
HIPOTESIS MODELOS TEORICOS

MODELO PROBABILIDADES

MUNDO IDEAL MATEMATICO DISTRIBUCIONES


ESPECIALES

4
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

POBLACION.- Es el conjunto mayor de objetos (UNIVERSO) que poseen al menos una


característica común, cuyo estudio nos interesa o acerca de los cuales se desea información.
Los elementos de este conjunto se denominan unidades estadísticas.

MUESTRA: Es una parte representativa del universo y se recurre a ella cuando es dificultoso
utilizar todos los componentes de la población.

A partir de ello, podemos establecer la siguiente división de la estadística:


1.Estadística Descriptiva
2.Estadística Inferencial

1.4.1. Estadística Descriptiva: Es la parte de la estadística que toma en cuenta el total de los
elementos de la población en el proceso de análisis de un fenómeno en estudio. Se denomina
Estadística Descriptiva por que trata de la recopilación, clasificación, presentación y
descripción de los datos estadísticos provenientes de una población. Los datos o
características que se obtienen de la población se llaman PARAMETROS.

1.4.2. Estadística Inferencial: Nos proporciona la teoría necesaria para tomar decisiones
frente a la incertidumbre o afirmar algo acerca de la población a partir de los datos bajo estudio.
Los datos o características obtenidas de esta manera se llaman ESTADIGRAFOS.

1.5. Variable

Se denomina variable a una característica o un aspecto determinado de las unidades


elementales de una población, que cuantificados, toman diferentes valores dentro de ciertos
límites, cuyos valores son números.

* En este sentido, si la variable toma un solo valor se llama VARIABLE


CONSTANTE.
* Si la variable toma cualquier valor en un intervalo se llama VARIABLE
CONTINUA.
* Si la variable toma valores enteros se llama VARIABLE DISCRETA.

En consecuencia, las variables discretas surgen del proceso de conteo, en cambio las
variables continuas surgen de la medición.

Ejemplo de variable continua: Estatura de los estudiantes de la UAP.


Ejemplo de Variable Discreta: Número de hijos por familia: 0, 1, 2, 3,............ n

ATRIBUTOS: la variable atributo o cualitativa es la propiedad de los fenómenos susceptibles


de ser expresados cualitativamente, ejm:

 Profesión
 Color de la Piel
 Sexo
 Estado Civil
 etc.

5
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Las variables cualitativas pueden ser NOMINALES que no implican un orden y ORDINALES
donde existe algún orden o jerarquía entre atributos.

1.6. Datos Univariantes y Multivariantes.- En el estudio de un fenómeno puede interesar el


tratamiento de una sola variable o atributo o más de una variable o atributos.

De acuerdo a la forma como se encare el análisis se puede hablar de diferentes tipos de


distribuciones:

a) UNIDIMENSIONAL.- hace referencia a una sola variable o atributo. Ejm. Estatura de


alumnos (Variable)
Sexo ( Atributo)

b) BIDIMENSIONAL.- Hace referencia a una variable o atributo al mismo tiempo. Ejm.


Clasificación de los empleados por sueldos y por secciones.

c) MULTIDIMESIONAL.- Cuando al mismo tiempo se expresan más de dos atributos y/o


variables. Ejm. Edad, sexo, peso y estado civil.

1.7. Escalas de Medición

La asignación de valores a cada una de las unidades estadísticas mediante una variable, se
hace siguiendo determinadas escalas de medición.

1.7.1. Definición.- Se denomina escala de medición a un instrumento de medida, con el que


se asigna valores (cualidades o números) a las unidades estadísticas para una variable
definida. El conocimiento de las escalas de medición es muy importante, pues cada una de
ellas contiene métodos estadísticos específicos. Las escalas de medición son de los
siguientes tipos: Nominal, Ordinal, De intervalos, De razones

1.7.2. Escala Nominal.- Se tiene una escala NOMINAL si dos o más valores de una variable,
sólo permiten percibir las diferencias o semejanzas de las unidades estadísticas que se
midan. Tales valores son como etiquetas que identifican a las unidades estadísticas y las
hacen iguales o diferentes entre sí.

Si se asignan números a estos valores cualitativos (modalidades), con estos no se pueden


realizar operaciones aritméticas. Sólo son válidas las relaciones de igualdad (=) y no igualdad
(≠).

Por ejemplo, la variable “sexo” asigna a las personas dos valores: “masculino” y “femenino”,
que son de la escala nominal. Con los valores de esta variable las personas están en una
misma modalidad o en modalidades diferentes. Si se asigna un 0 al sexo masculino y un 1 al
sexo femenino, con estos números no se pueden realizar operaciones aritméticas. Sólo se
puede decir que el símbolo 0 es distinto al símbolo 1, pero no podemos decir que 1 es mayor
que 0, o que 0 es menor que 1. Las variables estadísticas: “estado civil”, “ideas religiosas”,
entre otras, tienen modalidades que son de escala nominal.

El método estadístico con datos obtenidos en escala nominal consiste básicamente en obtener
el número o porcentaje de casos en cada modalidad y obtener la moda (valor de mayor
frecuencia).

6
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

1.7.3. Escala Ordinal.- Una escala ORDINAL es una escala nominal donde los valores de la
variable se pueden ordenar en forma ascendente o descendente. En una escala ordinal los
valores o modalidades reflejan el orden de las unidades estadísticas. Si se asignan
números a tales modalidades, con estos, no se pueden realizar operaciones aritméticas. Sólo
son válidas las relaciones de igualdad (=), de no igualdad (≠) y de orden (=).

Por ejemplo, la variable “estatus económico” con sus modalidades de: clase baja, media y alta
se mide en escala ordinal. La variable “orden de mérito”, cuyas modalidades son: 1º,2º,3º etc,
miden las calificaciones de las unidades estadísticas en escala ordinal.

El método estadístico con datos obtenidos en escala ordinal consiste básicamente en obtener
el número o porcentaje de casos en cada modalidad y obtener la moda, la mediana, los
percentiles y el coeficiente de correlación por rangos.

1.7.4. Escala de Intervalos.- Una escala de INTERVALOS es una escala ordinal con cuyos
“valores” no sólo se pueden verificar: igualdad, no igualdad y orden, sino también, se puede
elegir una unidad de escala y comprobar cuántas veces la diferencia entre dos valores es
igual a la diferencia entre otros dos valores de la escala (es decir, podemos comparar
intervalos).

Esto es, si X1, X2 y X3 son tres valores en la escala de intervalo, se verifica por ejemplo, la
relación:

X3 – X1 = c (X2 – X1) ó X3 – X1 = c
X2 – X1
Donde c es una constante.

Esta relación se interpreta como que la escala de intervalos tiene un cero relativo. Este
cero no significa ausencia total de la propiedad que se observa.

Se miden en escala de intervalos, por ejemplo: La temperatura (grados, Celsius o Fahrenheit),


el tiempo, que se registra en nuestros calendarios, las calificaciones de una prueba de
conocimientos o de aptitud. Estas mediciones tienen un cero elegido arbitrariamente, por
ejemplo, el agua se congela a 0oC ( = 32oF).

La calificación “cero” de un alumno en un examen de matemática básica, no quiere decir que


no sabe nada de tal materia, pues con otra prueba más fácil podría tener otra calificación.

Con los valores de esta escala son válidas las relaciones de igualdad, de no igualdad y de
orden. También, son válidas las operaciones de adición y sustracción entre los valores de la
escala, y la multiplicación y división entre las diferencias de dos valores de la escala. Pero no
es válida la multiplicación y división entre los mismos valores de la escala.

Por ejemplo, si la variable X es el puntaje obtenido en un examen calificado de 2 a 20 donde


la unidad de medida es un punto a partir de 2 (cero relativo), entonces, se tiene una escala de
intervalos.
En efecto, si tres alumnos A,B y C han obtenido los puntajes: 2, 4 y 16 respectivamente, no
sólo se verifican las relaciones: 2 ≠ 4 ≠ 16 y 2 < 4 < 16, sino también: 16 – 2 = 7 ( 4 – 2); es

7
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
decir la diferencia de los puntajes de C menos A es igual a siete veces la diferencia de los
puntajes de B menos A. No es válida la división 16/4, pero si lo es : (16-2)/(4-2).
1.7.5. Escala de Razon o Proporción.- La escala de razón o proporción es una escala de
intervalo con cuyos valores además podemos comprobar cuántas veces un valor de la
escala es igual a otro valor de la escala. Esto es, si X1 y X2 son dos valores, en la escala
de razón se verifica la relación:
X2 = c X1 ó X2 = c
X1
Donde c es una constante, y X1 = 0.
La escala de razón tiene un cero absoluto (ausencia de la característica que se observa).
Con los números de esta escala son válidas las relaciones de igualdad, de no igualdad, de
orden y todas las operaciones matemáticas. Los valores de esta escala se obtienen en general,
por mediciones tipo conteo (discretos) o por mediciones tales como de longitud, peso,
volumen, vida útil, etc. (continuos).

Por ejemplo, si la variable X es la longitud (en metros) de un objeto, entonces, los valores de
esta variable son de escala de razón. En efecto, si tres objetos A, B y C miden 2, 4, y 16
metros, se pueden establecer las relaciones:

· 2 ≠ 4 ≠ 16
· 2 < 4 < 16
· 16 – 2 = 7(4 – 2)

Además: 4/2 = 2; 16/2 = 8; y 16/4 = 4

Es decir, la longitud de B es el doble que la de A, el de C es 8 veces que la de A y el de C es


4 veces que la de B.
En la siguiente tabla resumimos las principales características de las diferentes escalas
existentes:

2. PROCESO ESTADÍSTICO – RECOPLICACIÓN DE INFORMACIÓN

La Estadística Descriptiva, tal como se la definió en el capítulo anterior, básicamente


comprende cuatro fases:

a) Recopilación
b) Clasificación DE DATOS
c) Presentación
d) Descripción

2.1. Recopilación de Datos.-

Se denomina recopilación de datos a la operación que consiste en acopiar o recolectar datos;


dicha operación se la puede realizar de dos maneras: Si se toman en cuenta a todos los
elementos de la población y se registran sus características comunes, que pueden ser
variables o atributos, se denomina CENSO y la información obtenida de esta manera se llama
dato censal. En cambio, si se seleccionan sólo algunos elementos de la población se llama
muestra y la información obtenida a partir de ella se llama datos obtenidos por muestreo.

8
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

2.2. Técnicas de Muestreo

Una parte fundamental para realizar un estudio estadístico de cualquier tipo es obtener
resultados confiables y que puedan ser aplicables. Como ya se comentó anteriormente, resulta
casi imposible o impráctico llevar a cabo algunos estudios sobre toda una población, por lo
que la solución es llevar a cabo el estudio basándose en un subconjunto de ésta denominada:
muestra.

Sin embargo, para que los estudios tengan la validez y confiabilidad buscada, es necesario
que tal subconjunto de datos, o muestra, posea algunas características específicas que
permitan, al final, generalizar los resultados hacia la población en su conjunto. Esas
características tienen que ver principalmente con el tamaño de la muestra y con la manera de
obtenerla.

2.3. Importancia del Muestreo

Usualmente se hace referencia a dos tipos de razonamiento: el deductivo y el inductivo. El


primero está relacionado directamente con la teoría de probabilidad, y que a partir de las
características de la población se obtienen las posibles características de una muestra. El
segundo tipo de razonamiento se relaciona con la denominada inferencia estadística: utilizar
las características de un subconjunto de la población (la muestra) para hacer afirmaciones
(inferir) sobre la población en general. Éste será el caso de nuestro interés.

El muestro, como ya se mencionó, implica algo de incertidumbre que debe ser aceptado para
poder realizar el trabajo, pues aparte de estudiar una población resulta ser un trabajo en
ocasiones demasiado grande, para Wonnacott y Wonnacott las razones principales para
utilizar muestras son:

 Recursos limitados. Es decir, no existen los recursos humanos, materiales o


económicos para realizar el estudio sobre el total de la población. Es como cuando se
compra un aparato, un automóvil usado (por ejemplo), que se prueba unos minutos (el
encendido, una carrerita, etc.) para ver si funciona correctamente y luego se adquiere,
pero no se espera a probarlo toda la vida (encendiéndolo y apagándolo o, simplemente,
dejándolo encendida) antes de realizar la adquisición.
 Escasez. Es el caso en que se dispone de una sola muestra. Por ejemplo, para el
estudio paleontológico de los dinosaurios (el T. Rex por ejemplo) sería muy bueno
contar con, al menos, muchos restos fósiles y así realizar tales investigaciones; sin
embargo, se cuenta sólo con una docena de esqueletos fosilizados (casi todos
incompletos) de esas criaturas en todo el mundo.
 Pruebas destructivas. Es el caso en el que realizar el estudio sobre toda la población
llevaría a la destrucción misma de la población. Por ejemplo, si se quisiese saber el
conteo exacto de hemoglobina de una persona habría que extraerle toda la sangre.
 El muestreo puede ser más exacto. Esto es en el caso en el que el estudio sobre la
población total puede causar errores por su tamaño o, en el caso de los censos, que
sea necesario utilizar personal no lo suficientemente capacitado; mientras que, por otro
lado, el estudio sobre una muestra podría ser realizada con menos personal pero más
capacitado.

9
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

2.4. Tipos de Muestreo.- Deben seguirse ciertos procedimientos de selección para


asegurar de que las muestras reflejen observaciones a la población de la que proceden, ya
que solo se pueden hacer observaciones probabilísticas sobre una población cuando se usan
muestras representativas de la misma. Los tipos más comunes de técnicas de muestreo
aleatorios son: el muestreo aleatorio simple, el muestreo sistemático, el muestreo
estratificado y el muestreo por conglomerados.

a) MUESTREO ALEATORIO SIMPLE

Es aquella en la que los elementos se escogen del total de la población en forma individual
con una oportunidad igual e independiente para todas. Por lo general se utiliza una tabla de
números aleatorios.

Si la población es infinita el muestreo aleatorio ocurre cuando la extracción de los elementos


de la muestra se hace con o sin reemplazo. Si la población es finita de tamaño N, el muestreo
aleatorio ocurre también si la extracción es con o sin reemplazo.

Con reemplazo, la probabilidad de cada elemento de ser elegido es 1/N. Si es sin reemplazo,
la probabilidad de cada elemento de ser elegido es 1/N en la primera extracción, es 1/(N-1) en
la segunda extracción, es 1/(N-2) en la tercera extracción y así sucesivamente.

Si una muestra aleatoria se elige de tal forma que todos los elementos de la población tengan
la misma probabilidad de ser seleccionado, se llama muestra aleatoria simple.

Ejemplo:

Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadística de 20 alumnos. 20C5 da el número total de formas de elegir una muestra no
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos las
15,504 en trozos separados de papel, una tarea tremenda, luego los colocamos en un
recipiente y después los revolvemos, entonces podremos tener una muestra aleatoria de 5 si
seleccionamos un trozo de papel con cinco nombres. Un procedimiento más simple para elegir
una muestra aleatoria sería escribir cada uno de los 20 nombres en pedazos separados de
papel, colocarlos en un recipiente, revolverlos y después extraer cinco papeles al mismo
tiempo.

Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico, imposible
o no deseado; aunque sería deseable usar muestras aleatorias simples para las encuestas
nacionales de opinión sobre productos o sobre elecciones presidenciales, sería muy costoso
o tardado.

b) MUESTREO SISTEMÁTICO

Una muestra aleatoria sistemática es aquella en la que sus elementos se eligen de la población
a intervalos uniformes a partir de un listado ordenado. El k-ésimo elemento de la muestra es
k=N/n, donde n es el tamaño de la muestra y N el tamaño de la población.

10
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Por ejemplo: al elegir una muestra sistemática de 100 alumnos de una unidad educativa que
tiene 3000 estudiantes. K = 3000/100 =30, entonces el primero se elige en forma aleatoria de
los 30 primeros de la lista y los demás sistemáticamente cada 30 alumnos de la lista.

c) MUESTREO ESTRATIFICADO.- Primero se clasifican a los elementos de la población en


sub-grupos separados de acuerdo con una o más características importantes (estratos).
Después se obtiene por separado una muestra aleatoria simple o sistemática en cada estrato.
El tamaño de cada sub-muestra debe ser proporcional al tamaño del estrato para asegurar la
representatividad.

Por ejemplo: Para obtener una muestra aleatoria de 600 electores de una población de
600.000 electores de los cuales 300.000 son de clase baja, 200.000 de clase media y 100.000
de clase alta. Para ello, primeramente se obtiene el % de participación de cada estrato sobre
el total: 300.000/600.000 = 0,5 x 600 = 300; 200.000/600.000 = 0,33 x 600 = 200; y finalmente
100.000/600.000 = 0,166x600 = 100. Al interior de cada estrato se eligen en forma aleatoria
simple.

d) MUESTREO POR CONGLOMERADOS.- Los elementos de la población se dividen en


forma natural en sub-grupos o por conglomerados. Luego se eligen al azar los sub-grupos que
forman la muestra. Ejemplo: Al estudiar las pensiones que se pagan en los colegios
particulares donde no es posible tener la lista de todas las pensiones, pero puede obtenerse
una lista de los colegios particulares (grupos). Entonces, con esta lista puede obtener una
muestra aleatoria de colegios y así obtener las pensiones que se pagan en estos colegios.

El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de unidades
heterogéneas entre sí de la población llamadas conglomerados. Cada elemento de la
población pertenece exactamente a un conglomerado, y los elementos dentro de cada
conglomerado son usualmente heterogéneos o disímiles.

En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como sea
posible, a toda la población; entonces se usa una muestra aleatoria simple de conglomerados
para estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y
prisiones se realizan, generalmente, con base en el muestreo por conglomerados.

En la lección anterior analizamos las diferentes modalidades de muestreo y tipos de muestreo:


Muestra probabilística, muestra no probabilística, etc.

En este capítulo profundizaremos algunas consideraciones relativas a las distribuciones que


se dan dentro del muestreo.

2.5. Determinación del Tamaño de una Muestra.- Uno de los aspectos que deben definirse
en el proceso de muestreo, es el tamaño de la muestra. Para ello, deben tomarse en cuenta
los siguientes aspectos:

a) Tamaño del universo o población = N


b) Grado de heterogeneidad de dicho universo, expresado por el valor de la desviación
estándar de la variable aleatoria.
c) Magnitud del error estadístico que estemos dispuesto a aceptar en los resultados.
Dicho error dará lugar a un intervalo de valores en torno al valor medio que produzca

11
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
la muestra. Llamamos I a la amplitud total del intervalo, es decir, a la diferencia entre
sus límites superior e inferior.
d) Grado o nivel de confianza que quisiéramos poder depositar en los resultados. A dicho
nivel corresponderá el coeficiente z, dado que, según la ley de los grandes números,
la distribución de la media de muestras, en la que nos apoyamos conceptualmente para
el cálculo, es normal; a menos que se trate de una muestra pequeña (n<30), en cuyo
caso la distribución es de Student, y es necesario usar t en lugar de z.

FORMULA PARA DETERMINAR EL TAMAÑO DE LA MUESTRA

La fórmula para definir el tamaño de la muestra n, es la siguiente:

2
n= Z x p x qxN
2 2
Z xpxq+ NxE

Donde:

n= Tamaño de la muestra
Z = Variable Z
p= probabilidad de éxito
q= probabilidad de fracaso
N=Tamaño de la población
E= Error estadístico

Ejemplo: Sea la población de la ciudad de Cobija de 42074 habitantes. Se desea conocer el


ingreso familiar mensual promedio con un error promedio no mayor de 0,05 con un nivel de
confianza del 95 %. ¿Cuántos miembros se deben muestrear, sabiendo que se estima que la
probabilidad de éxito es del 80 % ?.

SOLUCIÓN

N = 42075 E = 0,05
Z = 1,96 p = 0,8 q= 0,2
2
n = (1,96) x 0,8 x 0,2 x 42074
2 2
1,96 x 0,8 x 0,2 + 42074 x 0,05

n = 245 miembros

12
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

3. PROCESO ESTADÍSTICO – PRESENTACIÓN DE DATOS

3.1. Clasificación de Datos.-

Esta fase es la continuidad de la primera; una vez recolectada la información en base a la


aplicación del Perfil de Investigación, el estudiante de Estadística elabora e interpreta cuadros
estadísticos y gráficos. Para tener una aproximación a la tarea en cuestión, tomemos el
siguiente ejemplo:

Ejemplo: Tenemos las calificaciones de 25 estudiantes, en la escala del 1 al 7, con datos


redondeados al entero para facilitar la comprensión y asimilación del ejercicio; estos datos los
hemos obtenido de la revisión de la nómina de calificaciones del profesor “X”, los resultados
están reflejados en la presente tabla:
6 5 6 6 5
6 7 6 5 5
5 4 6 6 6
5 7 4 5 7
7 4 3 7 7

Los datos presentados de esta manera, prácticamente no dicen mucho y no tienen mucha
utilidad para su aplicación. Por ello, la estadística descriptiva nos proporciona la segunda etapa
que está constituida por la “clasificación de datos”.

3.2. Cuando la Variable es Discreta y el Número de Datos no es Muy Grande

La clasificación de datos también recibe el nombre de tabulación. Cuando la variable es


DISCRETA y el número de observaciones no es grande, esta operación se la puede efectuar
de la siguiente manera:
a) Se ordenan los datos obtenidos en la fase de recopilación, ya sea en forma ascendente o
descendente:

3 4 4 4 5 5 5 5 5 5
5 6 6 6 6 6 6 6 6 7
7 7 7 7 7

b) Luego se determina el número de veces que se repite la variable. La característica que


queremos estudiar en el presente ejemplo son las calificaciones de 25 estudiantes,
característica que es cuantificable y según el supuesto asumido toma únicamente valores
enteros en la escala del 1 al 7. En consecuencia, los valores que toma la variable son:

Xi = 3,4,5,6,7

13
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
3.3. Cuando la Variable es Continua o para un Número Grande de Observaciones
Discretas

Cuando la variable es continua o el número de datos es grande, el procedimiento de la


clasificación o tabulación de datos se lo realiza mediante Intervalos de clase que se verá más
adelante.

PRESENTACION DE DATOS: La presentación de datos se lo efectúa a través de cuadros


denominados DISTRIBUCIONES O TABLA DE FRECUENCIAS, que a su vez comprende las
siguientes etapas en su elaboración:

PASO 1: Una vez establecido los valores que toma la variable, en la primera columna del
cuadro anotamos dichos valores de la siguiente manera:

CALIFICACIONES: Xi
3
4
5
6
7

PASO Nº 2: Una vez que se defina los valores que toma la variable, se debe establecer el
número de repeticiones para cada valor en particular, a estos valores se lo conoce como
FRECUENCIA ABSOLUTA o número de repeticiones. Ejemplo: El número 3 solamente se
repite una sola vez, el número 4 se repite 3 veces, el 5 se repite 7 veces y así sucesivamente.
Seguidamente estas repeticiones los anotamos en la segunda columna del cuadro.

CALIFICACIONES FRECUENCIA ABSOLUTA


Xi Ni
3 1
4 3
5 7
6 8
7 6
TOTAL 25

La suma de los valores de la Frecuencia Absoluta debe ser igual al número de personas
encuestadas.

PASO Nº 3: La tercera columna o casilla para la construcción de una distribución de


frecuencias cuando la variable es discreta y el número de datos no es grande, es el referido a
la Frecuencia Absoluta Acumulada, que no es más que la sumatoria sucesiva y acumulada de
las Frecuencia Absolutas (ni) y simbólicamente se representa por ( Ni ).

14
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
CALIFICACIONES FRECUENCIA FRECUENCIA ABSOLUTA
Xi ABSOLUTA ACUMULADA
Ni Ni
3 1 1+0 = 1
4 3 1+3 =4
5 7 4+7 = 11
6 8 11+8 =19
7 6 19+6 =25
TOTAL 25 .-.

PASO Nº 4: Otro concepto de fundamental importancia para la tabulación es la FRECUENCIA


RELATIVA (hi), que resulta del cociente entre cada una de las frecuencias absolutas y el total
de las observaciones de la población o la muestra estudiada (n).
hi = ni

Que una vez cuantificados se lo inserta en cuadro siguiente de la Tabla de frecuencias.

Xi Ni Ni FRECUENCIA
RELATIVA ( hi )
3 1 1 1/25 = 0,04
4 3 4 3/25 = 0,12
5 7 11 7/25 = 0,28
6 8 19 8/25 = 0,32
7 6 25 6/25 = 0,24
SUMA 25 -.- 1,00

PASO Nº 5: En la próxima columna se registran las FRECUENCIAS RELATIVAS


ACUMULADAS ( Hi ), que resulta de la suma acumulada de las Frecuencias Relativas: Hi
= h1 + h2 + h3 + ................... + hm

Xi Ni Ni hi FRECUENCIA RELATIVA
ACUMULADA Hi
3 1 1 0,04 0,04 + 0 = 0,04
4 3 4 0,12 0,04 + 0,12 = 0,16
5 7 11 0,28 0,04+0,12+0,28 =0,44
6 8 19 0,32 0,76
7 6 25 0,24 1,00
SUMA 25 -.- 1,00 -.-

15
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
En resumen tenemos como resultado la siguiente tabla:

TABLA DE DISTRIBUCION DE FRECUENCIAS


Xi Ni Ni hi Hi
3 1 1 0,04 0,04
4 3 4 0,12 0,16
5 7 11 0,28 0,44
6 8 19 0,32 0,76
7 6 25 0,24 1,00
SUMA 25 -.- 1,00 -.-

3.4. Interpretación de la Tabla:

a) En la primera casilla de la tabla están los distintos valores que toma la variable; en nuestro
ejemplo la variable calificaciones de 25 alumnos toma los siguientes valores: Xi
= 3,4,5,6,7

b) En el segundo se registran las Frecuencias Absolutas, ósea las repeticiones que se


presentan para cada valor de la variable Xi; en el ejemplo: 1 alumno obtuvo la calificación de
3; 3 alumnos la calificación de 4; 7 la calificación de 5 y así sucesivamente.
c) La casilla de frecuencias absolutas acumuladas nos indica que hasta la calificación de 3 se
tiene un solo alumno; hasta la calificación de 4 alumnos; hasta la calificación de 5 11 alumnos,
etc.

d) Las Frecuencias Relativas están expresadas en términos de porcentaje. Ejm. el 4 % de los


alumnos tienen la calificación de 3; el 12 % la calificación de 4; el 20 % la calificación de 5, etc.

e) Las Frecuencias Relativas Acumuladas, también expresadas en porcentajes, nos indica que
hasta la calificación de 3 se tiene al 4 % de los alumnos; hasta la calificación de 4 el 16 %, etc.

3.5. Propiedades y Relaciones de las Frecuencias: Las principales propiedades y


relaciones que suelen observarse en el análisis del contenido de una distribución de
frecuencias son las siguientes:

a) Las Frecuencias Absolutas ( ni ) y las Frecuencias Absolutas Acumuladas ( Ni ) son


números enteros y positivos o cero en algunos casos.
b) Las Frecuencias Relativas ( hi ) y las Frecuencias Relativas Acumuladas ( Hi ), son números
fraccionarios positivos que fluctúan entre 0 y 1.

0 < hi < 1

c) La suma de todas las frecuencias absolutas es igual al número de elementos que componen
la población o la muestra.

ni = n1 + n2 +n3 + .......... nm = n

n = número total de observaciones.

d) La suma de todas las frecuencias relativas debe ser igual a 1

16
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

hi = h1+h2+h3+.......+hm= n1+n2+n3+....nm
n
ni = n = 1

e) La última frecuencia absoluta acumulada es igual al tamaño de la muestra, ya que ella


incluye a todos los elementos.

Nm = n

f) Por último, la frecuencia relativa acumulada puede obtenerse dividiendo por n la


correspondiente frecuencia absoluta acumulada.

Hi = Ni
n

EJERCICIO EN CLASE: Los siguientes datos corresponden a la edad de 60 alumnos de un


curso de una escuela:

6,7,7,8,9,10,6,7,8,9,7,7,7,6,6,7,7,7,6,7,7,6,6,8,8,8,8,7,6,7,7,7,8,8,8,8,8,8,8,8,8,9,9,9,9,9,10,10
,10,10,8,10,8,8,9,9,8,8,9,10

Se pide: Elaborar la Tabla o distribución de frecuencias e interpretarla.

3.6. La Distribución de Frecuencias cuando la Variable es Continua y para un Número


Grande de Observaciones

Cuando se trata de datos continuos o cuando el número de datos discretos es grande y se


dificulta el conteo para la tabulación, no es posible asignar un solo valor o clase única a los
valores distintos de la variable; por esta razón los datos deben ser agrupados en un número
razonable de clases o intervalos, que generalmente varían entre 5 y 15.
Para ello se debe seguir el siguiente procedimiento:

PASO Nº 1: Primeramente se establecen los valores extremos, es decir el valor máximo y el


valor mínimo de los datos observados; luego se determina la diferencia existente entre ambos.
Ejemplo: Tenemos los datos siguientes:
2,0 3,2 3,5 3,6 4,1
4,3 4,6 4,6 4,7 4,8
4,8 4,9 5,0 5,2 5,3
5,6 5,8 5,9 5,9 6,0
6,1 6,2 6,5 6,8 7,0

Los valores extremos son: Valor Máximo 7,0 Ls


Valor mínimo 2,0 Li
DIFERENCIA 5,0

Al intervalo 7 - 2 se conoce como clase o familia. La diferencia entre ambos valores se


denomina como ancho de clase o amplitud de clase, en el ejemplo el ancho de clase es igual
a 5. Por otro lado el promedio o punto medio entre los valores extremos del intervalo se
denomina Marca de clase o punto medio. En nuestro ejemplo, la marca de clase es:

17
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
7,0 + 2,0 = 3,5
2
PASO Nº 2: La diferencia entre ambos extremos o ancho de clase se divide entre un número
que oscila entre 5 ó 15, dependiendo mucho del valor de la diferencia y el número de
observaciones; en el ejemplo que nos ocupa, el número indicado es el número 5, por cuanto
la diferencia es exactamente de 5.

 5 = 1 Entonces, 1 resulta ser el ancho de clase o amplitud de clase de


5 resulta ser el valor indicado.

PASO Nº 3: Seguidamente se organizan las familias o clases tomando en cuenta como límite
inferior del primer intervalo o familia el valor mínimo que toma la variable; en el ejemplo el
número 2,0. Luego como límite superior también del primer intervalo o familia se tendrá el
límite inferior más el valor del ancho de clase 1, el resultado final será: 2+1 = 3.

El anterior procedimiento se repite hasta concluir con el último intervalo o clase, que tendrá
como límite superior el valor máximo de la variable, además los límites superiores de cada
intervalo se toman como el límite inferior de la familia o clase siguiente. Con estos datos
estamos en condiciones de estructurar la primera columna o casilla de la distribución o tabla
de frecuencias. En nuestro ejemplo:

CALIFICACIONES
Xi
2 - 3
3 - 4
4 - 5
5 - 6
6 - 7

PASO Nº 4: Una vez confeccionado el conjunto de familias o intervalos, se procede con la


tabulación de los datos, teniendo en cuenta que en cada intervalo se incluyan los datos
comprendidos dentro de cada intervalo, convencionalmente, los datos que coinciden con el
valor del límite superior de una clase serán tomados en cuenta en la clase inmediata superior,
excepto en el último intervalo. Ejemplo:

CALIFICACIONES FRECUENCIA
Xi - Xj ABSOLUTA
Ni
2 - 3 / = 1
3 - 4 /// = 3
4 - 5 //////// = 8
5 - 6 /////// = 7
6 - 7 ////// = 6
SUMA 25
El conteo podrá efectuarse bajo cualquier procedimiento conocido o el que mejor convenga al
tabulador.

PASO Nº 5: Para completar con las casillas o columnas restantes se procede exactamente
igual que con el caso de las variables discretas o número pequeño de observaciones. El

18
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
resultado en el caso del ejemplo utilizado, nos permite estructurar la siguiente tabla de
frecuencias:

Xi - Xj ni Ni hi Hi
2 - 3 1 1 0,04 0,04
3 - 4 3 4 0,12 0,16
4 - 5 8 12 0,32 0,48
5 - 6 7 19 0,28 0,76
6 - 7 6 25 0,24 1,00
SUMA 25 -.- 1,00 -.-
El procedimiento convencional que se asumió en los capítulos anteriores, respecto al número
adecuado de familias o intervalos debía fluctuar entre 5 y 15, pero no explicamos como
establecer o determinar el número exacto para cada caso en particular. A continuación le
presentamos un procedimiento que constituye una buena aproximación para nuestro
cometido, el mismo se conoce con el nombre de Regla de Sturges.

REGLA DE STURGES: para determinar el número aproximado de clases o intervalos, se


puede utilizar como guía o referencia la Regla de sturges que está dada por la siguiente
fórmula:

Donde: K = 1 + 3,3 Log n


K = Número aproximado de intervalos o clases
n = Número total de observaciones o muestra
Log = Logaritmo de base 10

Ejemplo: Se tienen las calificaciones de 50 alumnos en una prueba de evaluación:

40 30 60 20 50 40 10 30 50 70
60 50 40 30 20 30 20 70 40 40
50 30 20 10 40 50 40 30 60 20
60 40 30 20 10 60 40 30 60 30
60 50 40 40 30 30 40 10 60 50

Utilizamos la Regla de Sturges para determinar el número K de intervalos o familias:


K = 1 + 3,3 Log 50
K = 1 + 3,3 x 1,7
K = 1 + 5,61 = 6,61

El número así obtenido es una aproximación del número de intervalos, en consecuencia en


nuestro ejemplo K podría ser o 6 o 7; la decisión final dependerá también de como se van
estructurando los límites inferior y superior de los intervalos. En el ejemplo optemos por 6.

Seguidamente definimos el ancho o amplitud de clase: c


c = Ls - Li = 70 - 10 = 10
K 6

Donde: Ls = Limite superior y Li = Límite Inferior

19
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Luego se estructuran los límites o intervalos de la siguiente manera:

Intervalo 1: Li + c = Ls y así sucesivamente.

Finalmente tenemos:
10 + 10 = 20 10 - 20
20 + 10 = 30 20 - 30
30 + 10 = 40 30 - 40
40 + 10 = 50 40 - 50
50 + 10 = 60 50 - 60
60 + 10 = 60 60 - 70

MARCA DE CLASE O PUNTO MEDIO: Otro concepto importantísimo cuando trabajamos con
distribuciones de frecuencias es el llamado MARCA DE CLASE o PUNTO MEDIO (xi), que
resulta de sumar los extremos de cada intervalo y luego dividirlos entre 2. En nuestro ejemplo:
La Marca de clase del primer intervalo será:
10 + 20 = 15
2
Una vez obtenidos los intervalos y las marcas de clase, se procede de la misma forma que en
el ejercicio o ejercicios anteriores, ósea:

Xi - Xj Xi Ni Ni hi Hi
10 - 20 15 4 4 0,08 0,08
20 - 30 25 6 10 0,12 0,20
30 - 40 35 11 21 0,22 0,42
40 - 50 45 12 33 0,24 0,66
50 - 60 55 7 40 0,14 0,80
60 - 70 65 10 50 0,20 1,00
SUMA -.- 50 -.- 1,00 -.-

3.7. Representaciones Graficas:

Generalmente, la interpretación de los datos de una tabla de frecuencias, así como otros
cuadros que contienen información en cifras numéricas demanda, de quien lo utilice, tener un
conocimiento previo sobre estadística; esta situación puede ser superada, haciendo que
dichas informaciones sean representadas en gráficos.

Las representaciones gráficas permiten visualizar de manera objetiva la forma en que se


distribuye un conjunto de observaciones; es decir, hace más simple la interpretación. Traduce
hechos numéricos a una forma más concreta y comprensible.

20
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

3.7.1. Metodología básica para la Elaboración de Gráficos:

La metodología básica para la elaboración de gráficos, contempla las siguientes etapas:

a) En primer lugar se debe trazar el eje de coordenadas cartesianas y tomar de ella sólo el
primer cuadrante, teniendo cuidado de que el eje de las ordenadas represente las ¾ del eje
de las abcisas:
y

0 x

b) Utilizar escalas adecuadas en base a los criterios siguientes:

- ESTETICA
- SIMETRIA
- PROPORCIONALIDAD ( y = ¾ x )

3.7.2. Tipos de Gráficos:

La elaboración de gráficos implica hacer la siguiente discriminación: Cuando la Variable es


Discreta y el número de observaciones es pequeña, tenemos los siguientes gráficos:

a) GRAFICO DE BARRAS:

Los pasos que se desarrollan para confeccionar los gráficos son los siguientes:

 Se divide el eje de las abcisas con relación a los distintos valores que toma la variable (xi).
 Se divide el eje de las ordenadas tomando en cuenta el mayor valor que toman las
frecuencias absolutas y distribuirlos proporcionalmente.
 Se levantan perpendiculares desde los diferentes puntos que representan los distintos
valores que toma la variable, hasta la altura que representan sus respectivas frecuencias.

21
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Ejemplo:

TABLA DE FRECUENCIAS DE CALIFICACIONES


DE 25 ALUMNOS

Xi Ni Ni hi Hi
3 1 1 0,04 0,04
4 3 4 0,12 0,16
5 7 11 0,28 0,44
6 8 19 0,32 0,76
7 6 25 0,24 1,00
SUMA 25 -.- 1,00 -.-

REPRESENTACION GRAFICA:

8
7
6
5
4
3
2
1
0
3 4 5 6 7

b) GRAFICO DE LAS FRECUENCIAS ABSOLUTAS ACUMULADAS ( Ni ):

Los pasos a seguir para la elaboración de un gráfico son los siguientes:

 Una vez trazado el plano y distribuidos las coordenadas, se marcan los puntos en la
intersección entre los valores de la variable y sus frecuencias acumuladas.
 Luego, se traza una línea paralela al eje de las abcisas, a partir de cada punto marcado
anteriormente, hasta el siguiente punto y así sucesivamente.

22
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Por estética se deja abierto a los extremos, lo que no altera la información original.
Ni

25

19

11

3 4 5 6 7 8 Xi

Cuando los datos están distribuidos en clases o familias, podemos estructurar los siguientes
gráficos:

a) HISTOGRAMA DE FRECUENCIAS:

Es una representación gráfica de uso muy frecuente y está formado por rectángulos contiguos,
que tienen como base una longitud igual a la amplitud de clase o intervalo, con una altura igual
al valor de su correspondiente frecuencia absoluta.

Una vez dividido el cuadrante y los ejes en forma proporcional, se trazan los rectángulos con
una base igual a la longitud de la amplitud de la clase y con una altura igual a sus frecuencias
absolutas (ni ).

23
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

REPRESENTACION GRAFICA:

6
5

2 3 4 5 6 7

B) POLIGONO DE FRECUENCIAS:

Esotro tipo de representación gráfica que tiene una superficie igual al histograma, pero
representada de manera global; permite tener una visión general del comportamiento de la
variable que se analiza.

PASOS:

 Se distribuyen proporcionalmente los ejes.

 El polígono se obtiene uniendo los puntos medios de cada rectángulo del histograma en su
parte superior. En los extremos se agrega un medio intervalo para cerrar el polígono.

24
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

REPRESENTACION GRAFICA:

6
5

3
2

2 3 4 5 6 7

3.7.3. Curva de Frecuencias Suavizadas o Ajustadas:

Este gráfico permite determinar si una distribución es SIMETRICA O ASIMETRICA.

Es SIMÉTRICA cuando el gráfico tiene una forma regular, similar a una campana y es
ASIMÉTRICA cuando se encuentra sesgada a la derecha o a la izquierda.

Para ajustar una distribución de frecuencias normalmente se siguen los pasos siguientes:

a) En vez de frecuencias absolutas se toma en cuenta las frecuencias SUAVIZADAS O


AJUSTADAS, que se obtienen con la siguiente fórmula.

Fs = Fa + F + Fp
Donde:
3
Fs = Frecuencia Suavizada
Fa = Frecuencia adyacente anterior
F = Frecuencia que se suaviza
Fp = Frecuencia adyacente posterior

25
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

EJEMPLO: Tenemos el siguiente cuadro de datos referidos a calificaciones:

CALIFICACIONES FRECUENCIAS SUAVIZADAS


Xi - Xj ni Xi Fs
0 1,5 ( 0 + 0 + 1) / 3 = 0,33
2 - 3 1 2,5 ( 0 + 1 + 3) / 3 = 1,33
3 - 4 3 3,5 (1 + 3 + 8) / 3 = 4,00
4 - 5 8 4,5 ( 3 + 8 + 7) / 3 = 6,00
5 - 6 7 5,5 ( 8 +7 + 6) / 3 = 7,00
6 - 7 6 6,5 ( 7 + 6 + 0) / 3 = 4,33
0 7,5 ( 6 + 0 + 0) / 3 = 2,00
SUMA 25 -.- = 24,99

EJEMPLO: Para encontrar la Frecuencia Suavizada para el intervalo ( 3 - 4 ):

Fs = 1 + 3 + 8 = 4,00
3
REPRESENTACION GRAFICA:

6
5

3
2

2 3 4 5 6 7

3.8. Diagrama Circular:

El diagrama circular, más conocido como TORTA ó PASTEL, es muy utilizado cuando la
variable o atributo toma pocos valores o características. La información se expresa en
términos de porcentaje, que gráficamente se representa como un sector ó parte del círculo.

26
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

ETAPAS PARA LA GRAFICACIÓN:

a) Se traza una circunferencia de tamaño proporcional al espacio destinado a la graficación.

b) Se distribuye la superficie entre el número de aspectos ó distintos valores que toma la


variable. Para determinar la superficie cada sector se define los ángulos en grados, para lo
cuál se aplica la siguiente fórmula:

α = Q x 360

100
Donde:
α = Ángulo correspondiente a cada sector (Grados)
Q = Porcentaje que representa la frecuencia de cada valor
particular de La variable con relación a la población total.
360 = Grados que corresponde a una circunferencia.

Ejemplo:

Tenemos datos de alumnos inscritos en una escuelita de Villa Busch con tres cursos.

CURSO NUMERO DE PORCENTAJE GRADOS


XI ALUMNOS Q PARA CADA
Ni CURSO
PRIMERO 20 18,2 65,5 º
SEGUNDO 30 27,3 98,3 º
TERCERO 60 54,5 196,2 º
SUMA 110 100,0

Q1 = ni x 100 = 20 x 100 = 18,18 = 18,2


n 110

Determinamos ahora los grados:

α1 = Q1 x 360 = 65,5 º
100
α2 = Q2 x 360 = 98,3 º
100
α3 = Q3 x 360 = 196,2 º
100

27
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

REPRESENTACION GRAFICA:

196,2
Gr

EJERCICIO EN CLASES:

Una encuesta sobre preferencias en el consumo de detergentes de cinco marcas arroja los
siguientes resultados:

MARCAS AMAS DE CASA


ARIEL 30
ACE 50
OMO 45
ÑA PANCHA 25
TOPAZZ 28
TOTALES 178

Se pide: Graficar la torta.

4. MEDIDAS DE TENDENCIA CENTRAL

4.1. Introducción:

En el tema anterior nos planteamos como objetivo “desarrollar habilidades para la recolección,
clasificación y presentación de datos estadísticos”; con la resolución de muchos ejercicios
prácticos y evaluatorios creo firmemente que el mismo ha sido logrado en forma satisfactoria.

Viene ahora a correlación una etapa posterior a la presentación de datos, la llamada


“Descripción de datos”, ósea que a partir de los datos tabulados y ordenados el estudiante
debe describir los datos así obtenidos. Para ello, debemos incorporar nuevos conceptos en
nuestro instrumental estadístico, conceptos que nos permitirá obtener indicadores o
parámetros cuantitativos sobre una o varias características de la población y/o muestra
estudiada.

28
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

En general, las medidas más usuales en el análisis estadístico son:

a) MEDIDAS DE POSICIÓN O LOCALIZACION: En este grupo tenemos:

* Medidas de Tendencia Central: 1) PROMEDIOS: Media Aritmética, Media


geométrica, Media Armómica y
Media Cuadrática.

2) MEDIANA

* La Moda
* Cuantilas o Fractilas

b) MEDIDAS DE DISPERSION O VARIABLIDAD:

* Varianza, Desviación Típica, Desviación Media, Coeficiente de Variación y Rango.

c) MEDIDAS DE ASIMETRIA Y KURTOSIS


d) MOMENTOS

4.2. Medidas de Tendencia Central:

Llamadas también media o promedio, son medidas de tendencia central que intentan localizar
el “centro físico” de la distribución de los datos. Entre las medidas de tendencia central más
utilizadas tenemos:

 La media Aritmética
 La Media Geométrica
 La Media Armónica
 La Media Cuadrática

Además están:

 La Mediana
 La Moda
 Las cuantilas o fractilas

4.3. La Media Aritmética:

Es una de las medidas de tendencia central de mayor aplicación en el campo de la estadística,


y se define como:

“ LA SUMA DE TODOS LOS VALORES OBSERVADOS, DIVIDIDO ENTRE EL NÚMERO


DE OBSERVACIONES”

Ejemplo: Si; x1, x2, x3, x4, ........................., xn son los valores observados

29
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Entonces:
ó M(x) = Σ xi
n
Donde:
n es igual al total de las observaciones o tamaño de la muestra.
Además n = N, cuando se refiere a todos los valores de la población.

4.4. La Media Aritmética para datos no Agrupados:

Sean: x1, x2, x3, ..............,xn una muestra de tamaño n

= Σ xi
n

Ejemplo: Se tienen las calificaciones de 10 alumnos: 3,4,5,4,6,5,4,,,6,7, y 3


Calcular la Media Aritmética de x.

Para ello: = 3+4+5+4+6+5+4+6+7+3 = 47 = 4,7


10 10

4.5. La Media Aritmética para Datos Agrupados:

En este acápite distinguimos dos situaciones:

a) CUANDO LA VARIABLE ES DISCRETA Y EL NUMERO DE OBSERVACIONES ES


PEQUEÑA:

Cuando la variable es discreta y los datos están agrupados en una distribución de frecuencias
o familias, se utiliza la siguiente fórmula:

M(x) = = Σ Xi ni
Donde:
n
M(x) = = Media Aritmética muestral
ni = Frecuencia Absoluta
n = Tamaño de la muestra

30
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Ejemplo:
CALIFICACIONES FRECUENCIA ABSOLUTA
Xi Ni Xi ni
3 1 3
4 3 12
5 7 35
6 8 48
7 6 42
SUMA 25 140

Aplicando la fórmula tenemos:

M(x) = = 140 = 5,6


25

b) CUANDO LA VARIABLE ES CONTINUA O CUANDO EL NÚMERO DE


OBSERVACIONES ES GRANDE:

En este caso los datos están agrupados en familias o intervalos; entonces el procedimiento es
algo distinto. Ejemplo tenemos las calificaciones de 25 alumnos que fue abordado en el
anterior ejemplo, sin embargo en este caso las calificaciones están agrupadas en intervalos o
clases.

Para calcular la , cuando los datos son agrupados, previamente debe determinarse o
calcularse la Marca de Clase o Punto Medio.

CALIFICACIONES DE 25 ALUMNOS

MARCA DE CLASE
Xi - Xj Xi Ni xi ni
2 - 3 2,5 1 2,5
3 - 4 3,5 3 10,5
4 - 5 4,5 8 36,0
5 - 6 5,5 7 38,5
6 - 7 6,5 6 39,0
SUMA -.- 25 126,5

 M(X) = = 126,5 = 5,06 = 5,1


25
Por otro lado, cuando se tienen frecuencias relativas, se utiliza la siguiente fórmula:
M(X) = = Σ xi hi

EJERCICIO: Calcular la media aritmética para el ejercicio anterior a partir de la frecuencia


relativa.

31
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

4.6. Propiedades de la Media Aritmética:

PRIMERA: “La suma algebraica de un conjunto de datos o números, respecto de su media


aritmética, es igual a cero “.

Si: di = ( Xi - ) Para todo i = 1,2,3,.........,n

di = Σ ( Xi - ) =0

DEMOSTRACION:

Σ ( Xi - ) = Σ ( Xi ) - Σ
n
= - n = 0
n

SEGUNDA: “la media aritmética de una constante (K) es igual a la misma constante”.
M(K)= K
DEMOSTRACION:

M(K) = Σ Ki = nK = K
n n

TERCERA: “La media aritmética de una constante multiplicada por una variable es igual a la
constante multiplicado por la media aritmética de la variable”.

M (KX) = K M (X)
M(KX) = M ( K Xi ) = K M( Xi ) = K M ( X )
n n

CUARTA: “La media aritmética de dos variables Y e Y es igual a la suma de las medias
aritméticas individuales”.
M(X+Y) = M(X) +M(Y)

M(X+Y) = Σ (Xi + Yi) = Σ Xi + Σ Yi


n n n

M(X+Y) = M(X) + M(Y)

4.7. Media Aritmética Ponderada: En la vida real, a veces, las variables estudiadas o
analizadas no todos tienen el mismo peso específico, sino que tienen una ponderación distinta,
entonces el cálculo de la media aritmética se obtiene a través de la siguiente fórmula:

M(X)= = w1.x1 + w2.x2 + w3.x3 + ............... + wn xn


w1 + w2 + w3 + ....... + wn

32
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

M (X) = Σ wxi
wi

Donde: xi = los valores de la variable


wi = La ponderación que tiene cada valor de la variable

EJEMPLO: Si el examen final de un curso vale más que un parcial, digamos tres veces más,
que un parcial y un estudiante tiene calificación de 85 en el examen final y 70 y 90 en los dos
parciales. Calcular la calificación media.

M(X) = = Σ wi.xi
wi

M(X) = (1x70) + (1x90) + (3x85) = 415 = 83


1 + 1+ 3 5

En cambio la media común nos da:

M(X) = 85 + 70 +90 = 81,67


3
4.8. La Media Global: Una ventaja que ofrece la media aritmética es que si una muestra se
particiona en K sub-muestras y se conocen las medias y los tamaños de cada sub-muestra,
se puede determinar la media de toda la muestra sin necesidad de conocer los datos
originales. Esta media así determinada se llama Media Global o Promedio Global.

MUESTRA
SM1 SM2 SMk
n1 n2 ....... ........ nk
_ _ _
X1 X2 Xk

Entonces, la media global estará dada por:

G = Σ ni Xi
n

EJEMPLO: Determinar la media global, para una muestra de tamaño 40 que se particiona en
tres sub-muestras de tamaños: 10, 16, 14 con medias: 15,14 y 12, respectivamente.

n = 40 MEDIAS
n1 = 10 X1 = 15
n2 = 16 X2 = 14
n3 = 14 X3 = 12

= (15+10) + (16x14) + (12x14) = 13,55


40

33
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

EJERCICIOS EN CLASES:

1.- Tres profesores de Estadística dieron notas medias en sus cursos, con 32, 25 y 17
estudiantes, de 79, 74 y 82 puntos, respectivamente. Hallar la puntuación media de los tres
cursos.

2.-- El salario medio anual en una empresa es de Bs 15.000. Los de hombre y mujeres fueron,
respectivamente, de Bs 15.600 y 12.600 en media. Hallar el porcentaje de mujeres empleadas
en esa empresa.
4.9. La Media Geométrica:

La media geométrica se define como la raíz enésima del producto de los n valores observados:
n ____
G (X) = x1. x2. x3..........xn = v ?xi

a) LA MEDIA GEOMETRICA PARA DATOS NO AGRUPADOS:

Cuando los datos no están agrupados y son menores que dos, se tiene:

EJEMPLO: Tenemos las calificaciones de 2 alumnos:

x1 = 4
x2 = 7

Hallar la media geométrica:

G (x) = vx1 . x2 = v4x7 = v28

G (X) = 5,29

En cambio, la media aritmética es = M(X) = 4+7 = 5,5


2
En consecuencia: G(x) < M(x)

Ahora bien, cuando el número de observaciones es mayor que 2, se aplican logaritmos para
facilitar los cálculos.

a) PARA DATOS NO AGRUPADOS: Cuando tenemos datos no agrupados, se utiliza la


siguiente fórmula:

Log G(x) = 1 Σ Log Xi


n

b) PARA DATOS AGRUPADOS EN UNA DISTRIBUCION DE FRECUENCIAS:


Cuando se tienen datos agrupados en una tabla de distribución de frecuencias, se incorporan
las frecuencias absolutas.

34
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Log G(X) = 1 Σ ni x Log Xi
n

EJEMPLO: Determinar la media geométrica para la siguiente distribución de frecuencias:

Xi Ni Log xi ni x Log xi
3 2 0,4712 0,95424
4 3 0,60206 1,80618
5 2 0,69897 1,39794
6 2 0,77815 1,55630
7 1 0,84510 0,84510
Σ 10 -.- 6,55976

Log G(X) = 1 ( 6,55976) = 0,655976


n

Para determinar G(X) necesitamos calcular el Antilogaritmo correspondiente, que en este caso
es igual a:
x
G(X) = 4,53 Antilog= 10

La conclusión importante a la que podemos arribar, es el siguiente:

Que: M(X) > G(X)

USOS DE LA MEDIA GEOMÉTRICA:

Se usa el promedio geométrico cuando los datos observados presentan una progresión
geométrica de donde deriva su nombre, ó cuando los datos presentan razones de cambio o
porcentajes.

EJEMPLO: Supóngase que la población de cierta ciudad tuvo un incremento de 100.000 a


120.000 habitantes, durante el período 1920-1950. ¿Cuál es la razón o índice promedio por
década?

SOLUCION: Normalmente hacemos esta operación: El valor posterior lo decidimos entre el


valor inicial. Esto dará:
120.000 = 20 % = 6,67 % por década.
100.000 3

Nos preguntamos ahora ¿Es correcta esta operación? No, por que la población crece a
razón compuesta. Entonces, para responder adecuadamente tendremos que aplicar otra
fórmula: El razonamiento para la resolución de este problema es el siguiente:

SOLUCION: Denotemos el crecimiento medio de cada década por ( r ), luego tendríamos:


1
Al finalizar la primera década = 100.000 + 1000r = 1000 ( 1 + r )
2

35
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Al finalizar la segunda década = 100.000 (1 + r) + 1000(1+r) r = 1000(1+r)
2 2 3
Al finalizar la 3ra década = 100.000(1+r) + 100.000(1+r) r = 100.000(1+r)
3
Esta última expresión debe dar 120.000. Por tanto, 100.000( 1 + r) =

EJERCICIO DE APLICACION EN CLASES:

1.- Los siguientes datos son las velocidades ( Km/hora) de 30 carros que pasaron por un punto
de control de velocidad:

60 30 38 60 45 20 55 20 40 54 38 35 40 10
45 60 49 49 30 55 46 29 38 80 40 28
15 82 72 65
Hallar la media geométrica.

Xi - Xj xi Ni Log xi ni x Log xi
10 - 20 15 2 1,176091 2,352182
20 - 30 25 4 1,397940 5,59176
30 - 40 35 6 1,544068 9,264408
40 - 50 45 8 1,653212 13,225696
50 - 60 55 3 1,740363 5,221089
60 - 70 65 4 1,812913 7,251652
70 - 80 75 3 1,875061 5,251652
SUMA -.- 30 -.- 48,53197
Aplicamos la fórmula de la media geométrica para datos agrupados:

G(X) = 1 Σ ni x Log xi Respuesta: G(x) = 41,46


n

2.- Que capital final se tendrá al cabo de 6 años, si se invierten $u$ 1.000 al 8 % de interés
anual?

Calcule a partir de la aplicación de la media geométrica.

4.10.-- La Media Armonica: La media Armónica H(x), de una serie de datos: x1, x2, x3,..........,
xn, se define como LA INVERSA DE LA MEDIA ARITMETICA DE LOS VALORES
INVERTIDOS y que corresponden a los datos observados.

H(X) = 1 = 1 = n =
1 + 1 + 1+ .........+ 1 1 1
x1 x2 x3 xn xi xi
n n

En general tenemos:

H(x) = n .

1
36
xi
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

EJEMPLO: Si x1 = 4
x2 = 7 n=2

H(x) = . 2 . = . 2 . = 56 = 5,09
1 + 1 7+4 11
4 7 28

 G(X) = 5,29 M(X) = 5,5 H(X) = 5,09

Ósea: M(X) > G(X) > H(X)

b) LA MEDIA ARMÓNICA PARA DATOS AGRUPADOS: Cuando los datos están agrupados
en una distribución de frecuencias, la fórmula para calcular la media armónica es el siguiente:

H(X) = . n .
ni
xi

EJEMPLO: se tiene la siguiente distribución de frecuencias:

Xi Ni ni xi ni Log xi ni Log xi
xi
3 2 0,67 6 0,47712 0,95424
4 3 0,75 12 0,60206 0,80618
5 2 0,40 10 0,69897 1,39794
6 2 0,33 12 0,77815 1,5563
7 1 0,14 7 0,84510 0,8451
? 10 2,29 47 -.- 6,55976

H(X) = 4,37
M(X) = 4,7
G(X) = 4,53

Entonces corroboramos que:


M(X) > G(X) > H(X)

La relación anterior se explica, por que la M(X) es la más afectada por los valores extremos o
pronunciados, que la media geométrica (G(X) y la Media Armónica H(X). Si bien, estas últimas
G(X) y H(X) son también afectadas por los valores extremos, el uso del producto y la raíz en
el caso de la G(X) y el inverso en el caso de la H(X), amortiguan de algún modo la incidencia
de los valores extremos.

37
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

APLICACIONES DE LA MEDIA ARMONICA: La Media Armónica H(X) es útil para promediar


razones al igual que la media geométrica G(X). En el caso en que se trata de:

a) Promediar velocidades
b) Promediar rendimientos laborales

EJEMPLO: Una fábrica de muebles de madera ha asignado a cinco de sus trabajadores para
completar una orden de 200 sillas de un cierto tipo. Las razones de productividad de los cinco
trabajadores están dadas por la siguiente relación.
TRABAJADOR RENDIMIENTO/OBERO
A 5 HRS/SILLA
B 8 “
C 6 “
D 12 “
E 4 “

Hallar el rendimiento promedio de los trabajadores.

M(X) = 5 + 8 + 6+ 12 +4 = 35 = 7 sillas/hora
5 5

G(X) = Log G(X) = Log xi


n

H(X) = . 5 . = . 5 . = 6,06
1 + 1 + 1 + 1 + 1 0,825
5 8 6 12 4

SUPUESTO: Todos los trabajadores ha laborado el mismo número de horas.

4.11. La Media Cuadrática.

DEFINICION: “La Media Cuadrática de n valores se define como la raíz cuadrada de la media
aritmética de los cuadrados de las observaciones”.

a) PARA DATOS SIN AGRUPAR:

2
Mc (X) = Σ xi
n
b) PARA DATOS AGRUPADOS:

2
Mc (X) = Σ xi . ni
n

38
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
EJEMPLO: Se tiene los siguientes datos

5, 8, 6, 12, 4

 Mc (X) = 5 + 8 + 6 + 12 + 4 = 285 = 7,54


5 5
La aplicación de la Media Cuadrática MC (X) se verá en los próximos capítulos, en el
tratamiento de las medidas de dispersión.

EJERCICIO DE APLICACION EN CLASES DE LA MEDIA ARMONICA: Una Cia. de compra-


venta de terrenos ofrece en venta 400 metros cuadrados de terreno desértico a 0,5 dólares
cada metro cuadrado, 1000 metros cuadrados de terreno cultivable a 10 dólares cada metro
cuadrado y 500 metros cuadrados de terreno urbanizado a 400 dólares cada metro cuadrado.
Se pide calcular el precio promedio por metro cuadrado de los terrenos ofertados. Calcule la
media armónica y la media aritmética y luego compare los resultados.

Como usted explica las diferencias entre ambos resultados? Cuál es la medida o promedio
más acertado? Explique por que.

4.12. La Mediana:

ALGUNAS CONSIDERACIONES PREVIAS: Se ha podido apreciar que las medidas anteriores


están influenciadas, en mayor o menor grado, por los valores extremos, entonces cuando esto
acontece la media aritmética y otras medidas estudiadas no constituyen un indicador
adecuado.

EJEMPLO: Si un obrero produce diariamente 4 sillas de lunes a jueves, pero el día viernes por
una dolencia apenas produce 1 silla, entonces su rendimiento promedio desciende
considerablemente. Una forma de evitar la influencia perniciosa de los valores extremos,
cundo se calcula un promedio, es utilizando la medida alternativa, que viene a ser la MEDIANA.

LA MEDIANA- DEFINICIÓN

“La mediana (Me) es un valor de las observaciones que divide en dos partes iguales el número
total de observaciones cuando éstos están ordenados de acuerdo a sus valores”.

a) LA MEDIANA PARA DATOS SIN AGRUPAR:

Para calcular la mediana cuando los datos no están agrupados, se sigue el procedimiento
siguiente:

EJEMPLO 1: Tenemos los siguientes valores.

4, 5, 8, 2, 7, 2, 3

¿ Que valor es la Mediana ?

1) Previamente se ordenan los datos en forma correlativa:

39
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
2, 2, 3, 4, 5, 7, 8

2) Se elige el valor que divide exactamente en dos partes iguales la información:

Entonces la Mediana = Me = 4

EJEMPLO 2: Tenemos las siguientes observaciones:

3, 4, 6, 7, 7, 8

¿ Cuál es la Mediana ?
En este caso dos valores se ubican físicamente en el medio 6 y7. Cuando ello acontece, se
toman ambos valores y se promedia entre dos para hallar la mediana:

Me = 6+7 = 6,5 llega a ser la mediana.


2
La característica típica de la Mediana es que divide al conjunto de las observaciones
exactamente en dos partes iguales.

50 % 50 %
______________________x__________________________

Que viene a ser el punto de equilibrio que balancea el número de observaciones de la serie
estadística.

b) LA MEDIANA PARA DATOS AGRUPADOS: Cuando la mediana está representada en


una distribución de frecuencias, es posible distinguir dos situaciones:

b.1. CUANDO LA CLASE ES UNICA Y DISCRETA: Cuando ello acontece, es preciso seguir
los siguientes pasos:

1º SE DEBE CALCULAR LA FRECUENCIA ABSOLUTA ACUMULADA Ni


2º SE CALCULA EL VALOR DE n/2

40
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

GRAFICAMENTE TENEMOS:
Ni

Nj

n/2

N j-1

X j-1 Xj Xi

3º SE APLICAN LAS SIGUIENTES REGLAS:

a) Si: n > N Mediana = Me = X


2 j-1 j

X + X
b) Si: n = N Mediana = j-1 j
2 j-1 2

EJEMPLO:

41
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Se tienen las calificaciones de 50 alumnos distribuidos de acuerdo a la siguiente distribución


de frecuencias:

CALIFICACIO FRECUENCIA FREC.


NES ABSOLUTA ABSOLUTA
Xi Ni ACUMULADA
Ni
10 4 4
20 6 10
30 11 21
40 12 33
50 8 41
60 7 48
70 2 50
? 50 -.-

Calculamos n/2 = 50/2 = 25

Entonces: Como n/2 > N = Me = X


j-1 j

Ósea: Me = 40

b.2. CUANDO SE TIENEN INTERVALOS DE CLASE:

Cuando se tienen intervalos de clase, se aplican los siguientes pasos:


Paso Nº 1.- Se calcula n/2
Paso Nº 2.- Se ubica n/2 entre las frecuencias absolutas Acumuladas Ni
Paso Nº 3.- Se identifica la CLASE MEDIANA

Si n/2 está o se ubica en un punto intermedio, la clase mediana será la que corresponde a la
frecuencia Absoluta Acumulada Inmediata Superior.

En cambio, si n/2 coincide con un punto de las Frecuencias Absolutas acumuladas, la Clase
Mediana será la que corresponde a este punto.

Paso Nº 4: Luego se desarrolla una de las siguientes fórmulas:

X + c n/2 - N
a) Si: n/2 > N Me = j-1 j j-1
j-1 N - N
j j-1

b) Si: n/2 = N Me = X
j-1 j-1

42
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

GRAFICAMENTE TENEMOS:

Ni

Nj

n/2

N j-1

X j-1 cj Xj Xi

EJERCICIO:

CALIFICACIONES
Xj-1 - Xj Ni Ni
2 - 3 1 1
3 - 4 3 4
4 - 5 8 12
5 - 6 7 14
6 - 7 6 25
SUMA 25 -.-

n/2 = 25/2 = 12,5

En este caso:
n/2 - N
n/2 > N Me = X + c j-1
j-1 j-1 N - N
j j-1

43
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Remplazando datos tenemos:

12,5 - 12 = 5 + 0,5 = 5,07


Me = 5 + 1 19 - 12 7

Entonces: Me = 5,1

EJERCICIO PARA RESOLVER EN CLASES:

Se tiene la siguiente distribución de frecuencias correspondiente a los salarios semanales de


100 obreros.

INGRESOS Nº DE OBREROS
Xj - 1 - Xj ni Ni
280 - 295 4 4
295 - 310 5 9
310 - 325 10 19
325 - 340 9 28
340 - 365 13 41
365 - 370 15 56
370 - 385 18 74
385 - 400 12 86
400 - 415 8 94
415 - 430 6 100
SUMA 100 -.-

Calcular la mediana:

n/2 = 100/2 = 50
n/2 - Nj - 1
Entonces: Xj - 1 + cj Nj - Nj - 1

Me = 15 + 50 - 41 = 364
56 - 41

44
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

4.13. Cuantilas o Fractilas

A.- INTRODUCCION: En forma similar a la definición de Mediana, pueden derivarse otros


estadígrafos llamados genéricamente: CUANTILAS O FRACTILAS, que cumplen con la
condición de superar a no más de un cierto porcentaje de las observaciones y de ser superado
simultáneamente por no más del porcentaje complementario de las observaciones. Entre
estos tenemos:

 Los cuartiles
 Los deciles CUANTILAS O FRACTILAS
 Los percentiles

B.- CUARTILES:

Como su nombre lo indica, divide en cuatro partes iguales al conjunto de las observaciones:
0 1Q 2Q 3Q 4Q

Por lo tanto, existen tres cuartiles que responden a las siguientes definiciones:

B.1. LOS CUARTILES PARA DATOS SIN AGRUPAR:

Los pasos para determinar los cuartiles cuando los datos se presentan sin agrupar, constan
de las siguientes etapas:

1º Paso: Se ordenan los datos en forma correlativa y ascendente.


2º Paso: Se determina el cuartil j-ésimo, que viene a ser el valor del dato que
ocupa la posición , para ello recurrimos a la siguiente relación:

(j/4)(n+1)

EJEMPLO: Dado el siguiente conjunto de datos: 15, 13, 2, 4, 10


Calcular los tres cuartiles.

SOLUCION.-

Primero ordenamos los datos:

2 4 13 15 19

x1 x2 x3 x4 x5

45
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

PRIMER CUARTIL:

Para el primer cuartil tenemos los siguientes datos: j = 1 y n=5

 ( 1 / 4 ) ( 5 + 1 ) = 1,5 valor que no es un entero, por lo tanto el primer cuartil estará entre
las observaciones x1 y x2. Para ello efectuamos la siguiente operación:
2 4 13 15 19

x1 x2 x3 x4 x5

Posición: 0 Q1 Q2 Q3 posición n+1

Me

Para calcular el 1er cuartil extrapolamos las proporciones:

Q1 - x1 = 0,5 Q1 = x1 + (x2 + x1) (0,5)


x2 - x1 1

Remplazamos datos: = 2 + ( 4 - 2 ) ( 0,5 ) = 3

Entonces el primer cuartil es igual a 3

SEGUNDO CUARTIL:

El 2o cuartil es igual a la mediana, y se calcula de la siguiente manera:


j=2 n= 5

Q2 = Me = (2/4) + ( 5 + 1) = 2/4 . 6 = 3 , Osea x3 viene a ser el 2do


Cuartel.

Entonces Q2 = x3 = 13
TERCER QUARTIL.- Para calcular el 3er cuartil tenemos:

j=3 n=5

( 3/4) (5+1) = 3/4.6= 4,5 Que no es un valor entero, entonces el 3er cuartil está entre x4 y
x5

Para ello extrapolamos: Q3 - x4 = 0,5


x5 - x4 1

Despejamos Q3:
Q3 Q3 - x4 = (0,5) ( x5 - x4 )

46
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Q3 = x4 + 0,5 . x5 - 0,5 . x4
Q3 = 15 + (0,5) (19) - (0,5) ( 15)
Q3 = 15 + 0,5 ( 19 - 15)
Q3 = 15 + 2
Q3 = 17

B.2. LOS CUARTILES PARA DATOS AGRUPADOS: Cuando los datos están distribuidos
en una tabla de distribución de frecuencias, el procedimiento que se sigue para determinar
los cuartiles es similar al utilizado para calcular la mediana para datos agrupados, Ósea:

1º .- Se calculan las Frecuencias Absolutas Acumuladas


2º .- Se calcula n/4 ( Q1 = ¼ ; Q2 = 2/4 = ½ = Me ; Q3 = ¾ )
3º .- Se ubica n/4 entre las frecuencias absolutas acumuladas Ni
4º .- Se determina la clase del cuartil
5º .- Se aplica la siguiente regla:

PRIMER CUARTIL:

Para el primer cuartil Q1 = ¼ Osea; n/4 = ¼

n/4 - Nj - 1
Q1/4 = Xj -1 + c Nj - Nj - 1

EJEMPLO:
Se tienen los siguientes datos, organizados en una tabla de distribución de frecuencias:
Xj-1 - Xj Ni Ni
2 - 3 1 1
3 - 4 2 4
4 - 5 8 12
5 - 6 7 19
6 - 7 6 25
SUMA 25 -.-
n/4 = 6,25

Remplazamos Datos:

Q1/4 = 4+1 6,25 - 4 = 4 + 0,28


12 - 4

Q1/4 = 4,28

SEGUNDO CUARTIL:

El segundo cuartil o cuartil medio coincide exactamente con la Mediana, para lo cual se utiliza
el mismo procedimiento de la mediana.

47
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Q2/4 = Q ½ = Me

TERCER CUARTIL:

El Tercer Cuartil ( Q 3/4) o cuartil superior es un valor que supera a no más del 75 % de las
observaciones y es superado por no más del 25 % de las mismas.

3n/4 = Q3

Q3/4 = Xj-1 + c 3n/4 - Nj-1


Nj - Nj-1

EJEMPLO: Calculamos el Q3 para el ejercicio anterior:

Xj-1 - Xj Ni Ni
2 - 3 1 1
3 - 4 3 4
4 - 5 8 12
5 - 6 7 19
6 - 7 6 25
SUMA 25 -.-

Q3/4 = 3n/4 = 3 x 25 = 18,75


4
Q3/4 = 5 + 18,75 - 12 = 5 + 0,96 = 5,96
19 - 12
Q3/4 = 5,96

4.14. Los Deciles: Los deciles dividen en 10 partes iguales al conjunto de las observaciones.
Por lo tanto, existen los siguientes deciles:

PRIMER DECIL : P 1/10


SEGUNDO DECIL: P 2/10
TERCER DECIL : P 3/10
.
.
NOVENO DECIL: : P 9/10

0 1 2 3 4 5 6 7 8 9

El 5to. decil coincide con la Me

48
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

El procedimiento tanto para datos sin agrupar y agrupados es axactamente el mismo que se
aplica a los cuartiles.

4.15. Los Percentiles: El uso de los percentiles o centiles solo es justificable cuando existen
tantos numerosos valores de la variable, como una frecuencia total bastante alta. Los
percentiles dividen en 100 partes iguales el número de observaciones.

PRIMER CENTIL : P 1/100


SEGUNDO CENTIL : P 2/100
TERCER CENTIL : P 3/100
CUARTO CENTIL : P 4/100
.
.
.
NOVENTA Y NUEVE CENTIL : P 99/100

El procedimiento al igual, que en el caso anterior es el mismo.

EJERCICIOS EN CLASES:

Sea el siguiente conjunto de datos:

3, 10, 0, 9 8, 4, 4, 3, 10, 15, 20, 18

Calcular: Decil 2, Decil 9, Percentil 50, Percentil 80

SOLUCION:

Ordenamos los datos:

0 3 3 4 4 8 9 10 10 15 18 20

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12

DECIL 2:
j=2 n = 12

D2 = (2/10)(12+1) = 2,6 Entonces: D2 estará entre x2 y x3

D2 = D2 - x2 = 0,6
x3 - x2 1

D2 - x2 = 0,6 ( x3 - x2)
D2 = x2 + 0,6 (x3 - x2)
D2 = 3 + 0 = 3

49
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

DECIL 9:

J=9 n = 12

(9/10)(13) = 11,7 Entonces el decil 9 estará entre x11 y x12

D9 = x11 + (x12 - x11) 0,7


D9 = 19,4

PERCENTIL 50: j = 50 n = 13

(50/100)(13) = 6,5 Entonces P50 estará entre x6 y x7

P50 = x6 + ( x7 - x6 ) 0,5 = 8,5

PERCENTIL 80:

j =80 n = 13

P80 = (80/100) (13) = 10,4 Entonces P80 estará entre x10 y x11

P80 = x10 + ( x11 - x10 ) 0,4 = 16,2

4.16. La Moda

DEFINICION: La Moda llamada también: MODO, MODO PROMEDIO, VALOR TIPICO o


VALOR MODAL ( Mo), es una medida de tendencia central, que viene a constituir el valor más
frecuente de una serie de datos; ósea el que más veces se repite.

a) LA MODA PARA DATOS NO AGRUPADOS:

Para determinar la Moda de un conjunto de datos sin agrupar, previamente se ordenan los
mismos en forma ascendente o descendente, respetando la correlatividad de los mismos.

EJEMPLO:

1) 2, 2, 5, 7, 9, 9, 9, 9, 11, 12 En este primer ejemplo el valor que más


frecuentemente se repite es el 9, Entonces la Mo = 9

2) 3, 5, 8, 10, 12, 15, 16 En este ejemplo, podemos decir que no existe


MODA

3) 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 En este tercer ejemplo, dos son los valores


que se repiten más veces : 4 y 7, Entonces existen 2 modas.

50
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Cuando un conjunto de datos presentan dos modas, se dice que es BIMODAL; si son más de
dos modas se llama MULTIMODAL.

b) LA MODA PARA DATOS AGRUPADOS:

Cuando los datos están expresados en una tabla de distribución de frecuencias, es posible
diferenciar dos situaciones:

b.1. CUANDO LA CLASE ES UNICA:

Cuando la clase es única y discreta, entonces la MODA es la frecuencia que más veces se
repite.

EJEMPLO:
Xi ni
3 2
4 3
5 2
6 2
7 1
SUMA 10

En el presente ejemplo, la frecuencia que más veces se repite es el 4; ósea este valor se
repite tres veces.

 La moda = Mo = 4

b.2. LA MODA PARA INTERVALOS DE CLASE:

Cuando se tiene intervalos de clase, la MODA se determina por interpolación; Ósea:

Mo = X j-1 + c . d1 .
d1 + d2

Donde: X j-1 = Límite inferior de la clase modal, ósea el intervalo que tiene
Mayor frecuencia.
d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia
pre-modal.
d2 = Diferencia entre la frecuancia de la clase modal y la frecuencia
de la clase post-modal.
c = Tamaño del intervalo de la clase modal.

51
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

GRAFICAMENTE TENEMOS:

Ni

Clase modal

d2

d1

X j-1 Xj Xi

Me

PROCEDIMIENTO PARA DETERMINAR LA MODA PARA INTERVALOS DE CLASE:


Cuando los datos están distribuidos en una tabla de frecuencias, para calcular la Moda se
procede de la siguiente manera:

PASO 1: Se identifica el mayor valor entre las frecuencias absolutas.


PASO 2: Se determina la clase modal, que será aquel intervalo que tiene la mayor frecuencia
absoluta.
PASO 3: Luego, se determinan los datos que serán utilizados para aplicar la fórmula:

EJEMPLO:
X j-1 - Xj ni
2 - 3 1
3 - 4 3
4 - 5 8
5 - 6 7
6 - 7 6
SUMA 25

Mo = X j-1 + c . d1 .

52
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
d1 + d2

Donde:
X j-1 = 4
c = 1
d1 = 8-3=5
d2 = 8-7=1

Mo = 4 + 5 = 4 + 0,83 = 4,83
6
Mo = 4,83 Mo = 4,8

ALGUNAS CARACTERISTICAS MÁS RELEVANTES DE LA MODA:

1. La Moda le sigue en importancia a la media y a la mediana, su uso se hace imperativo


cuando los datos son de tipo CUALITATIVO. Su fácil interpretación y su cálculo sencillo
hacen de la moda una medida de tendencia central más usual y práctico. De esta manera,
un fabricante de muebles puede estar interesado en saber que tipo de muebles se venden
más; esta medida estará representada por la Moda.

2. No es una medida única como la media y la mediana. Un conjunto de datos puede tener
más de una moda.
3. El cálculo de la Moda es independiente de la magnitud de las observaciones. Como tal,
puede permanecer igual variando los valores o incrementando el
4. número de ellas.

RELACIONES ENTRE LA MEDIA, MEDIANA Y LA MODA:

En una distribución UNIMODAL, si la distribución es simétrica, entonces la Media, la mediana


y la Moda son iguales. En cambio cuando la distribución es casi simétrica, la Mediana se
localiza aproximadamente a un tercio de la distancia entre la Media y la Moda. La fórmula que
describe esta relación es la siguiente:

Moda = Media - 3 ( Media - Mediana)

EJERCICIO EN CLASES: Calcular la Moda para los salarios semanales de 100 obreros, que
trabajan en distintas empresas constructoras de viviendas:

INGRESOS Nº DE OBREROS
280 - 295 4
295 - 310 5
310 - 325 10
325 - 340 9
340 - 355 13
355 - 370 15
370 - 385 18

53
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
385 - 400 12
400 - 415 8
415 - 430 6
SUMA 100

Me = 364
Mo = 375
M(x) = 360,85
Mo ( aproximado) = 370,30

Asimismo, calcular la Moda utilizando la relación Moda = Media - 3 ( Media - Mediana )

5. MEDIDAS DE DISPERSION Y VARIABILIDAD

5.1. Definición.- Las medidas de dispersión o variabilidad, a las que convencionalmente


llamaremos indicadores estadísticos de dispersión, miden el grado de dispersión o
concentración de los datos estadísticos en torno a un valor de medida de tendencia central
previamente seleccionado.
Esta medida es particularmente importante por que permite corroborar o desestimar una
medida de tendencia central como indicador adecuado de la representatividad de un conjunto
de datos, en consecuencia, cuando los indicadores de dispersión reflejan una alta variabilidad
o dispersión la media aritmética no suele ser una medida adecuada para medir el grado de
representatividad de los mismos, al contrario una baja dispersión hace que la media aritmética
se constituya en una medida eficaz para medir el grado de concentración de los datos
estadísticos.

EJEMPLO:

1. Una baja dispersión de los salarios mensuales de un grupo de trabajadores indica que los
salarios son aproximadamente iguales.

2. En cambio, una alta dispersión indica que los salarios son muy diferentes.

Por otro lado, estas medidas de dispersión son utilizadas para complementar una medida de
tendencia central, como por ejemplo la Media, y también para comparar una información con
otra.

Como regla general, se puede señalar:

- CUANDO LA DISPERSIÓN ES BAJA, ENTONCES EL VALOR PROMEDIO ES


ALTAMENTE SIGNIFICATIVO.

- CUANDO LA DISPERSIÓN ES ALTA, LA MEDIA ES POCO REPRESENTATIVA.

EJEMPLO: Se tienen las calificaciones del 1 al 10 en dos cursos diferentes:

4, 2, 9 =5 Hay mayor dispersión.

3, 6, 6 = 5 Son menos dispersos.

54
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

¿ Que conclusiones importantes podemos extraer de esta información ?

a) Que en ambos cursos se tuvo igual aprovechamiento en promedio.


b) Que probablemente se utilizó igual metodología.
c) Que los profesores tienen igual experiencia, ósea las condiciones en ambos cursos son las
mismas.

Por eso es importante contar con otras medidas complementarias que nos permitan salir de
esta disyuntiva, en particular en situaciones como el presente las medidas de dispersión suelen
jugar un papel importantísimo para dirimir la disyuntiva.

5.2. Clasificación de las Medidas de Dispersión o Variabilidad:

Las medidas más comúnmente usadas son:

1. El Recorrido = R
2. La desviación Media = DM
3. La varianza = V(x)
4. La Desviación Estándar o Típica = 
5. El Coeficiente de Variación = CV

5.2.1 El Recorrido:

El Recorrido o rango es la medida más simple de dispersión y está dada por la diferencia entre
el mayor y menor valor de las observaciones.

Ósea:

R = X máximo - X mínimo
Donde: R = Recorrido
X max = Valor máximo observado
X min. = Valor mínimo observado

Ejemplo:
Si: X máximo = 430
X mínimo = 280

Entonces el recorrido será igual a: R = 430 - 280 = 150

Sin embargo, como esta medida no contempla todos los valores contemplados entre el valor
máximo y el mínimo, se dice que no es un indicador de dispersión muy relevante.

EJEMPLO DE APLICACIÓN:

Se tienen los siguientes datos de salario medio en 2 fabricas:

FABRICA “ A “ FABRICA “ B “

55
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

a = 50 b = 50
Ra = 20 - 65 = 45 Rb = 35 - 65 = 30

Entonces, podemos señalar a partir del análisis del recorrido que la media de “B” es más
representativa que la media de “A”, ósea hay mayor dispersión en la fábrica “A”.

5.2.2. La Desviación Media

DEFINICION.- La Desviación Media ( DM ) es la media aritmética de los desvíos de los valores


individuales observados, con respecto al promedio de los mismos.

DM
Me Sin embargo, los más usual es con
respecto a la Media Aritmética.

Pero se sabe, por la primera propiedad de la sumatoria de los desvíos respecto a la media
aritmética es igual a cero, por esta razón es que se utilizan los desvíos en su valor absoluto.

DM = M ( / d / ) =  | Xi - |
n

LA DESVIACIÓN MEDIA PARA DATOS SIN AGRUPAR:

La fórmula para calcular la desviación media para datos sin agrupar está dada por:

DM =  | Xi - |
n

LA DESVIACIÓN MEDIA PARA DATOS AGRUPADOS:

DM =  | Xi - | ni
n

EJEMPLO DE APLICACIÓN:

a) Se tiene el conjunto de calificaciones de 10 alumnos en una prueba de Estadística:

3, 4, 5, 4, 6, 5, 4, 6, 7, 3

56
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Calcular la desviación Media para datos sin agrupar.

Xi |Xi - |
Xi -
3 - 1,7 1,7
4 - 0,7 0,7
5 0,3 0,3
4 - 0,7 0,7
6 1,3 1,3
5 0,3 0,3
4 - 0,7 0,7
6 1,3 1,3
7 2,3 2,3
3 - 1,7 1,7
SUMA 0 11

= 47 = 4,7
10
Entonces, La DM = 11 = 1,1
10
a) Sea la información expresada en la siguiente tabla de distribución de frecuencias:

Xi ni
3 2
4 3
5 2
6 2
7 1
SUMA 10

Calcular la Desviación Media DM:

SOLUCIÓN:
Utilizamos la fórmula de la DM para datos agrupados y calculamos previamente |Xi - |y
luego multiplicar la relación por la frecuencia absoluta ni.

Xi ni Xi . ni |Xi - | |Xi - |. ni
3 2 6 1,7 3,4
4 3 12 0,7 2,1
5 2 10 0,3 0,6
6 2 12 1,3 2,6
7 1 7 2,3 2,3

57
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
SUMA 10 47 -.- 11

= 47 = 4,7 DM = 11 = 1,1
10 10

LIMITACIONES DE LA DESVIACION MEDIA:

Si bien la desviación media como medida de dispersión toma en cuenta todos los valores
observados, la misma es poco frágil debido a que ignora el signo de los desvíos, lo que hace
que se tenga que recurrir a otra medida alternativa.

EJERCICIO EN CLASES:

Hallar la desviación media para la siguiente distribución de frecuencias:

INGRESOS Nº DE OBREROS
280 - 295 4
295 - 310 5
310 - 325 10
325 - 340 9
340 - 355 13
355 - 370 15
370 - 385 18
385 - 400 12
400 - 415 8
415 - 430 6
SUMA 100

5.2.3. La Varianza y La Desviación Standar

DEFINICIÓN.- La Varianza y la Desviación Estándar son las medidas de dispersión más


utilizadas en la estadística y entre todas, se trata de medidas de variabilidad cuyos valores
indican si los datos están bastante concentrados o dispersos con respecto a su media. Los
simbolizaremos por:
2
Varianza : V(x) = 
Desviación Standar : DS = 

“Se denomina Varianza a la media aritmética de los cuadrados de las desviaciones respecto
a la Media Aritmética de dichas distribuciones”.

“Se denomina Desviación Standar ó Desviación Típica a la raíz cuadrada de la Varianza.

Cuanto mayor sea la magnitud de la varianza los datos están más dispersos o diseminados
con respecto de la media y cuanto menor sea la varianza los datos estarán más concentrados
al rededor de la media.

58
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
a) LA VARIANZA Y LA DESVIACIÓN STANDAR PARA DATOS SIN AGRUPAR:

2 2 2 2
V(x) = S =  =  ( Xi - ) = M ( Xi - )
n
_____
DS = S =  =  V(x)

b) LA VARIANZA Y LA DESVIACION STANDAR PARA DATOS AGRUPADOS:

Las formulas que determinan la Varianza y la desviación Standar para datos agrupados son:
2 2
S = V(x) =  ( Xi - ). ni
n

_____
S =  =  V(x)
EJEMPLO: Del conjunto de calificaciones de 10 alumnos: 3,4,5,4,6,5,4,6,7,3. Calcular la
varianza para datos agrupados y para datos sin agrupar.

PARA DATOS SIN AGRUPAR:

2
Xi ( Xi - )
3 2,89
4 0,49
5 0,09
4 0,49
6 1,69
5 0,09
4 0,49
6 1,69
7 5,29
3 2,89
SUMA 16,1

= 47 = 4,7
10
2
V(x) = ( Xi - ) = 16,1 = 1,61
10 10

PARA DATOS AGRUPADOS:

2 2
Xi ni Xi . ni ( Xi - ) (Xi - ) ni
3 2 6 2,89 5,78

59
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
4 3 12 0,49 1,47
5 2 10 0,09 0,18
6 2 12 1,69 3,38
7 1 7 5,29 5,29
SUMA 10 47 -.- 16,1

=  Xi . ni = 47 = 4,7
n 10

2 2
V(x) = S = ( Xi - ).ni = 16,1 = 1,61
n 10
_____
DS = S =  1,61 =

PROPIEDADES DE LA VARIANZA:

A continuación se mencionan las propiedades más importantes de la varianza que obviamente


implican las propiedades de la Desviación Standar.

Propiedad Nº 1.- Para un conjunto de datos observados:

x1, x2, x3, ................, xn

V(x) > 0

DEMOSTRACIÓN:
2
Por definición sabemos que la M (d) = 0, pero si elevamos al cuadrado M(d)
Entonces: 2
(Xi - ) > 0 Cualquiera sea el valor de di
2
M(d ) > 0

Propiedad Nº 2.-- Si todos los valores de Xi son iguales a una constante k, entonces:

V(k) = 0

DEMOSTRACION: Por definición sabemos que:

2
V ( k ) = M k - M( k )

Pero como M ( k ) = k

Entonces: V (k ) = M ( k - k ) = M(0) = 0

60
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
PROPIEDAD Nº 3.- Si k es una constante cualquiera, entonces:

V ( X + k ) = V (x)

DEMOSTRACION:
2
V ( X+k) = M[ (x+k) - M ( x+k) 
2
V(X+K) = M (X+K) - M(X) - M(K)
2
X(X+K) = M ( X+K-M(X) - K )
2
V(X+K) = M ( X - M(X) = V(X)

PROPIEDAD Nº 4.- Sea K una constante cualquiera, entonces:


2
V(K.X) = K . V(X)

DEMOSTRACION:
2 2
V(X.K) = M [KX - M(KX)  = M[XK - KM(X)
2
Sacamos fsctor comun K
2 2 2 2
M [ K ( X - M(X)  = M [ K ( X - M(X)

2 2
V(K.X) = K M [ X - M(X)

VK.X) = K V(X)

PROPIEDAD Nº 5.-
2 2
V(X) = M(X) - [ M(X) 

DEMOSTRACION: Por definición tenemos:


2 2
V(X) = M( X ) - [ M(X) 
DEMOSTRACIÓN: Por definición de Varianza sabemos que:
2 2 2
V(x) = (Xi - ) = [Xi - 2Xi . +( )
n n

2 2
V(x) =  Xi - 2 . Xi +
n n n

2 2
V(x) = M( X ) - [ M(x) 

61
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Esta última propiedad es muy útil para fines prácticos, la gran ventaja radica en que no es
necesario el cálculo de los desvíos. Entonces alternativamente se puede usar las fórmulas
siguientes:

PARA DATOS SIN AGRUPAR:

2 2
V(x) =  Xi - [Xi
n n

PARA DATOS AGRUPADOS:


2 2
V(x) =  Xi . ni - [  Xi . ni 
n n

EJERCICIO: Calcular la Varianza utilizando el método abreviado, para la siguiente distribución


de frecuencias:

2 2
Xi Ni Xi . ni Xi Xi . ni

3 2 6 9 18
4 3 12 16 48
5 2 10 25 50
6 2 12 36 72
7 1 7 49 49
SUMA 10 47 135 237

= Xi . ni = 47 = 4,7
n 10
Xi . ni = 237 = 23,7
n 10
2 2
 V(X) = M ( X ) - [ M(X) 
2
V(X) = 23,7 - ( 4,7 ) = 23,7 - 22,09
V(X) = 1,61

5.3. El Coeficiente de Variación

Las medidas de variabilidad absolutas, llámese: RANGO, DESVIACIÓN MEDIA, VARIANZA


Y LA DESVIACION STANDAR, no siempre son posibles de utilizar en todos los momentos y
circunstancias, sobre todo si los fenómenos estudiados tienen distintas unidades de medida,
ó dicho de otro modo, los datos están expresados en unidades de medida diferentes y su

62
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
comparación se dificulta (Sólo es posible comparar dos fenómenos si existen características
comunes entre ambos).

Por ejemplo, ¿ como comparar números de libros con horas de viaje, o como comparar horas
de estudio con número de automóviles en una ciudad ? .

En consecuencia, si dos conjuntos de valores se comparan, los valores absolutos son


convenientes solamente cuando los indicadores de los dos conjuntos son aproximadamente
del mismo tamaño y las unidades de medida son idénticas.

Debido a esta limitación, es que se requiere de medidas de dispersión que se expresen en


términos relativos para efectuar las comparaciones como en los casos citados. Trabajar con
medidas expresadas en unidades relativas y no absolutas, permite efectuar comparaciones
entre dos conjuntos de valores o datos expresados en medidas distintas.

5.3.1. El Coeficiente de Variación - Definición:

El Coeficiente de Variación (CV) es una medida de dispersión relativa y está dada por la
siguiente expresión:

CV = _s_ = %

Donde:
CV = Coeficiente de Variación
s = Desviación Standar
= Media Aritmética

EJEMPLO DE APLICACIÓN:

El ingreso mensual de cierto grupo de trabajadores adultos es de M(X) = 1.875 Bs con una
desviación Standar de s=285 Bs. En tanto que el ingreso medio mensual para un grupo del
mismo tamaño de voceadores es de M(X) = 315 y la Desviación Stándar es de s = 80 Bs.

ADULTOS NIÑOS VOCEADORES


= 1.875.-- = 315.--
S = 285 S = 80

¿Podemos afirmar categóricamente que el salario de los adultos tiene mayor dispersión? La
respuesta es: ! no !

Por que estaríamos comparando dos grupos heterogéneos ó diferentes, ósea adultos y niños
y las ocupaciones son distintos. En consecuencia, no sirven mucho en estos casos las
medidas de dispersión absolutas, como la Varianza, la desviación Standar o el Rango.
Para estos casos es que utilizamos el CV.

CVa = 285 = 15,2 % CVb = 80 = 25,3 %


1.875 315

63
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Entonces, podemos afirmar definitivamente que los salarios de los niños presentan mayor
variabilidad que los adultos.

EJERCICIOS PARA RESOLVER EN CLASES:

1.- Hallar la Varianza mediante el método abreviado para la siguiente distribución de


frecuencias:

INGRESOS Nº DE OBREROS
280 - 295 4
295 - 310 5
310 - 325 10
325 - 340 9
340 - 355 13
355 -- 370 15
370 - 385 18
385 - 400 12
400 - 415 8
415 - 430 6
SUMA 100

Interpretar el resultado obtenido.

2.- Una región se divide en dos zonas: A y B. En la zona A existen diez cooperativas con una
producción promedio de arroz de 100 TM y una desviación Standar de 10 TM. En la zona B
existen 15 cooperativas con una producción promedio de 120 TM de arroz y una desviación
Standar o típica de 9 TM. Determinar el Coeficiente de Variación de la región.

Interprete el resultado obtenido.

6. DISTRIBUCIONES BIDIMENSIONALES

6.1. Introducción.- Hasta ahora nos hemos limitado al estudio de datos


UNIDIMENSIONALES o UNIVARIANTES, ó dicho de otra manera, nos hemos concretado a
estudiar una sola característica asociada a cada observación, ya sea variable o atributo,
dependiendo de la unidad estadística objeto de estudio.

Ejemplo: LA ESTATURA DE LOS ESTUDIANTES DE UN CURSO

Sin embargo, en la vida real los fenómenos no suelen presentarse solos, a menudo es preciso
estudiar más de una característica u observación ligada a un fenómeno. Ejm. La estatura y el
peso de los estudiantes de una unidad educativa. En este caso, se trata de distribuciones
bidimensionales o bivariadas.

En el caso que nos ocupa, una muestra de tamaño n se representa como un conjunto de pares
ordenados de la siguiente forma:

(X1, Y1) (X2,Y2) (X3, Y3),.........................., (Xn,Yn)

64
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
El par ordenado ( Xi,Yi) representa la estatura y el peso de cada estudiante.

6.2. Característica de los Datos Bidimensionales.-

Dadas las observaciones bivariadas:

(X1,Y1) (X2,Y2) (X3,Y3),........................, (Xn,Yn)

Considerando en forma separada cada una de las variables o atributos (X1 ,X2 ,X3,.......Xn) o
(Y1, Y2, Y3,..........Yn), como valores independientes de la variable univariante X o Y, se
pueden calcular todas las medidas descriptivas hasta ahora estudiadas, como ser:

= Media Aritmética V(x) = Varianza de X


Me = Mediana Gx = Desviación Standar
Mo = Moda CV = Coeficiente de variación

En forma análoga puede suceder con la variable Y, donde también se pueden calcular por
separado los mismos estadísticos o indicadores.

Sin embargo, al analizar las observaciones bivariadas conjuntamente surgen otras medidas
que relacionan ambas variables. Estos son:

 LA COVARIANZA O CORRELACION
 LA REGRESION

La Covarianza y la correlación miden el grado de asociación entre las variables. Ejemplo, los
alumnos más altos suelen ser los más pesados y los más bajos son generalmente de menos
peso.

Por otro lado, si nos interesa el grado y tipo de relación funcional que se presenta entre las
dos variables estudiadas (X,Y), estamos frente a un problema de REGRESION, es decir si la
variación conjunta la podemops establecer mediante una relación funcional y estimar el peso
de un alumno sobre la base de su estatura, entonces es un problema de REGRESION.

6.3. Correlación Lineal - Covarianza:


Si representamos las observaciones bivariadas en el plano cartesiano se obtendrá un conjunto
de puntos que se conoce como DIAGRAMA DE DISPERSION O NUBE DE PUNTOS.
Este diagrama nos sugiere dos aspectos:

a) La tendencia que siguen la nube de puntos.


b) El grado de asociación o correlación lineal entre las variables X e Y

65
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Este segmento también se llama relación cualitativa. En cambio la medida cuantitativa del
grado de correlación lineal entre las variables es proporcionada por el coeficiente de
correlación lineal de PEARSON, denotado por la siguiente fórmula:

COEFICIENTE DE CORRELACIÓN DE PEARSON:

r = n  Xi Yi -  Xi .  Yi .
xy
2 2 2 2
n [  Xi - (  Xi )  [ n  Yi - (  Yi ) 

Llamado también coeficiente de Pearson o Covarianza.

El Coeficiente r puede tomar diferentes valores:

r=1 Existe correlación positiva perfecta

r r=0 Correlación Nula

r=1 Correlación negativa perfecta

Normalmente “r” fluctúa entre 0 y 1

0<r>1

Entonces, cuando r = 1 o r = - 1, se dice que X e Y están perfecta y linealmente relacionadas


o correlacionadas. En este caso, todos los puntos están alineados o contenidos en la misma
recta.

Y Y

r=1 r
= -1

66
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
X
X

El primer gráfico está referido a una CORRELACION LINEAL PERFECTA O DIRECTA ( + ) y


el segundo se refiere a una relación PERFECTA NEGATIVA O INVERSA ( - ). En cambio si
r = 0 , entonces se dice que las dos variables no están correlacionas linealmente:

+ +

r=0 + + +

+ +

+ +
X

NO EXISTE CORRELACION LINEAL

Los casos analizados anteriormente son casos extremos, lo normal es que r fluctúe entre 0 y
1:

+ +
+ + +
+ + +
+ + +
+ + r = 0,95 + + r = 0,95
+ + +
+

CORRELACION LINEAL ALTA CORRELACION LINEAL ALTA


POSITIVA NEGATIVA

67
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
NOTA.- El Coeficiente de Correlación de PEARSON ( r ), refleja únicamente la relación lineal
entre las dos variables ( X e Y ). Sin embargo, puede ser que las dos variables estén
relacionados en forma no lineal, por ejemplo: exponencial.
En este último caso, la “r” de Pearson no será una medida apropiada para establecer el grado
de correlación entre las variables.

EJEMPLO.- Tomando los siguientes datos sobre estaturas y pesos de 10 estudiantes


seleccionados al azar, calcular el coeficiente de correlación lineal de Pearson.

( 1,54 - 60 ) ( 1,82 - 94 ) ( 1,57 - 65 ) ( 1,60 - 66 ) (1,75 - 85 )

( 1,65 - 72,50 ) ( 1,69 - 77 ) ( 1,62 - 70 ) ( 1,77 - 89,5 ) ( 1,70 - 80 )

SOLUCION:

PASO Nº 1.- Representamos los datos obtenidos en un eje de coordenadas cartesianas:

Y = Peso

100

+
90 + +
+ NUBE
DE PUNTOS
80
+
+
70 +
+
60 +

1,5 1,6 1,7 1,8 1,9 2,0

X =
Estatura

CONCLUSIONES DE LA GRAFICA:

a) La tendencia que se observa en el diagrama de dispersión es de tipo lineal.


b) Entonces, lo que se desea saber es cuál es el grado de correlación existente entre la
estatura y los pesos de los estudiantes; ósea, saber la relación entre X e Y. Para ello
calculamos el Coeficiente de Correlación de Pearson ( r ), utilizando la fórmula ya conocida.

r = n  Xi Yi -  Xi  Yi .

68
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
2 2 2 2
[ n  Xi - ( Xi)  [ n Yi - (Yi) 

PASO 2.- Determinamos el valor de r

Para ello debemos calcular previamente los valores que requiere la fórmula de r, dado en la
expresión anterior:

ESTATURA PESO 2 2
Xi Yi Xi Yi Xi Yi
1,54 60 92,40 2,3716 3.600
1,82 94 171,08 3,3124 8.836
1,57 65 102,05 2,4649 4.225
1,60 66 105,60 2,5600 4.356
1,75 85 148,75 3,0625 7.225
1,65 72,5 119,62 2,7225 5.256,25
1,69 77 130,13 2,8561 5.929
1,62 70 113,40 2,6294 4.900
1,77 89,5 158,41 3,1329 8.10,25
1,70 80 136,0 2,8900 6.400
 16,71 759,0 1.277,45 27,9973 58.737,50

n = 10

r= 10 ( 1.277,45) - (16,71)(759) .= 91,61 = 0,9959


91,978
2 2
[10 ( 27,9973) - (16,71)  [10(58.737,50) - (759) 

CONCLUSION: Existe alta correlación lineal directa entre estatura y peso de los alumnos
estudiados.

EJERCICIO PARA RESOLVER EN CLASES: Una agencia de control de tráfico vehicular ha


compilado la siguiente información estadística:

VEHICULOS ACCIDENTES DE
AÑOS MATRICULADOS CARRETERA
( EN MILLONES) ( EN MILES )
1947 352 166
1948 373 153

69
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
1949 411 177
1950 441 201
1951 462 216
1952 490 208
1953 529 227
1954 577 238
1955 641 268
1956 692 268
1957 743 274

Calcular “r”:

6.4. Analisis de Regresion.- El objeto del análisis de regresión es establecer una relación
funcional matemática entre variables, de manera que seamos capaces de predecir el valor de
una variable en base al comportamiento de otra u otras variables, es decir una relación
funcional del siguiente tipo:

Y = f(X)
Donde:
Y = Variable dependiente o ENDOGENA
X = Variable Independiente o EXOGENA

En el mundo real los fenómenos se presentan relacionados o interrelacionados de diferentes


maneras unos con otros, entonces es posible estructurar diferentes tipos de relaciones entre
variables; entre estos podemos identificar las siguientes:

CLASES DE DEPENDENCIA.- Los tipos de dependencia entre variables se clasifican de la


siguiente manera:

SIMPLE : Y = f (X)

Relación de dependencia MULTIPLE: Y = f ( X1 , X2, ......,Xn )


CLASIFICACION

Lineal : LINEA RECTA

Tipo de relación
No lineal : PARABOLA, LOGARITMICA,
HIPERBOLICA.

70
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

GRAFICAMENTE TENEMOS:

Y Y

2
Y = a + bX Y=
a+b+cX

X
X LINEA RECTA PARABOLA
Y Y = . 1 . Y
a+bX Y = a + b Log X

X
X
HIPERBOLA LOGARITMICA

6.5. Regresión Lineal Simple o Línea Recta.-

La relación de dependencia más simple y la más utilizada por el método científico es el modelo
de regresión lineal simple o LINEA RECTA y está dada por la siguiente expresión algebraica:
Y = a + bX

71
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Donde:
Y = Variable dependiente (ENDOGENA)
a = Ordenada en el origen; ósea el punto donde la línea recta corta
al eje de la ordenada.
b = Pendiente o grado de inclinación de la RECTA
X = Variable Independiente (EXÓGENA)

EJEMPLO: La relación funcional entre el nivel del salario y la antigüedad o años de servicio,
esta dada por:

SALARIO = f (AÑOS DE SERVICIO O ANTIGÜEDAD )

Y = f (X)

6.5.1. Tipos de Relacionamiento Funcional Lineal.-

De acuerdo al grado de relacionamiento y/o asociación de dos variables, es posible identificar


tres tipos de relacionamiento lineal:

 Dependencia Total
 Independencia total
 Dependencia estadística parcial

a) RELACION LINEAL DE DEPENDENCIA TOTAL.- Este tipo de relación se da cuando


ambas variables están representadas por una línea recta, aquello se da cuando los datos
caen exactamente sobre una LINEA RECTA, de modo que ambas variables están
relacionadas por una línea Recta.

EJEMPLO: La relación entre el nivel del salario y la antigüedad o años de servicio, están dados
por la siguiente tabla:

SALARIO/HORA ANTIGUEDAD
12 1
16 3
18 4
22 6
28 9

Ahora bien, para determinar como están relacionadas ambas variables primeramente se
deben identificar la variable dependiente y la variable independiente. En el caso que nos ocupa
estos son:

 Salario = Variable Dependiente = Y


 Años de servicio = Variable Independiente = X

72
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Entonces los salarios dependen de los años de servicio: Y=f(X)

Cuando relacionamos ambas variables en forma directa, estamos asumiendo el supuesto de


que el nivel de salario o ingreso de un trabajador únicamente depende de los años de servicio,
en la práctica no suele ser así. De hecho, si hacemos un análisis de Causa-efecto vamos a
ver que el salario no sólo depende de los años de servicio sino de muchas otras variables
como ser: Formación profesional, cargo, Ocupación, lugar donde trabaja, etc. Entonces la
relación entre ambas variables no es tan simple, sino compleja:

Y = f (X1, X2, X3,.................,Xn)


Donde:
Y = Salario
X1 = Años de servicio o antigüedad
X2 = Profesión
X3 = Cargo
X4 = Ocupación
X5 = Otros

Sin embargo, para no complicar el análisis de la relación lineal entre ambas variables podemos
asumir el supuesto de que los salarios únicamente dependen de los años de servicio, mientras
las otras variables permanecen constantes; estamos aplicando acá uno de los supuestos
básicos de economía cual es el concepto de CEATERIS PARIBUS.
Una vez definidas ambas variables, el paso siguiente de la metodología es graficar la relación
funcional en un eje de coordenadas cartesianas para determinar la forma y el tipo de relación
existente entre ambas:

SALARIO

30
+
25

+
20
+

15
+   = 8 = 2
10 4
4
5

1 2 3 4 5 6 7 8 9 10 ANTIGUEDAD

73
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
En el ejemplo que nos ocupa, podemos advertir que los puntos o pares ordenados trazados
en la gráfica coinciden exactamente sobre una línea RECTA, que cortan al eje de las
ordenadas en el punto 10 y la recta tiene una pendiente de 2; con estos datos estamos en
condiciones de establecer la relación funcional del siguiente tipo:
Y = 10 + 2 X
La ecuación anterior corresponde a una línea recta y se dice que entre ambas variables existe
DEPENDENCIA TOTAL.

b) RELACION DE INDEPENDENCIA TOTAL:

Supongamos ahora, que los datos del ejemplo anterior son los siguientes:
SALARIO/HORA ANTIGÜEDAD
16 1
10 3
13 4
10 6
16 9

Para determinar el tipo de relacionamiento entre ambas variables trazamos los puntos o pares
ordenados en un eje de coordenadas cartesianas.

SALARIO

16 + +

12 +

+ +
8

1 2 3 4 5 6 7 8 9 10
ANTIGUEDAD

En este segundo caso, tenemos el otro extremo del ejemplo donde ambas variables no
muestran ningún tipo de relación funcional ni lineal ni no lineal entre ambos, vale decir no hay

74
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
lógica de los pares ordenados. Ejemplo, un obrero con 1 o 9 años llega a ganar el mismo
nivel de salario o uno con 4 años de antigüedad gana más que otro de tres años. En
consecuencia, cuando no existe una relación de dependencia entre ambos se dice que entre
ambos existe INDEPENDENCIA TOTAL de variables.

c) RELACION DE DEPENDENCIA ESTADISTICA PARCIAL:

Los dos casos anteriores son casos extremos, lo normal es que exista una relación más o
menos fuerte entre dos variables relacionadas. Esta relación por tanto hace que el coeficiente
de correlación r fluctúe entre 0 y 1.

EJEMPLO.- Utilizando el mismo ejemplo anterior, tenemos los siguientes datos:

SALARIO/HORA ANTIGÜEDAD
10 1
18 3
16 4
20 6
30 9

Graficamos luego la nube de puntos:

SALARIO
30 +

25

20 +
+
+
15

10 +

1 2 3 4 5 6 7 8 9 10
ANTIGUEDAD

CONCLUSIONES: De la gráfica anterior podemos establecer las siguientes conclusiones:


a) Existe una tendencia creciente de los salarios al aumentar los años de antigüedad.
b) Existen algunas pequeñas salvedades como el obrero que teniendo 4 años gane menos
que el de tres.

75
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
c) Pero en general existe una tendencia a crecer cuando se incrementa la antigüedad.
d) A diferencia del primer ejemplo, en este caso no se puede directamente ajustar una recta
en base a los datos cuantificados.

En consecuencia, cuando la relación no es EXACTA, se elige aquella función que mejor se


ajuste al conjunto de datos sea: lineal, parabólica, hiperbólica, etc. Ósea, aquella función que
mejor represente al conjunto de datos.
6.5.2. Metodología de los Minimos Cuadrados para Ajustar una Función de la Línea
Recta:

Existen dos métodos para ajustar una ecuación de la línea recta para una nube de puntos que
muestren dicha tendencia, estos son:

1.-- Método de estimación gráfica.


2.- Método analítico

Debido a que el segundo método es el más utilizado, en este texto solamente trataremos el
método analítico.

6.5.2.1. Método Analítico de los Mínimos Cuadrados:

En general, la esencia del Método de Mínimos Cuadrados consiste en minimizar la sumatoria


de las diferencias entre los valores reales (+) y los valores teóricos expresados o
representados por la línea recta punteada. En términos de análisis matemático, el problema
se plantea de la siguiente forma: Teniendo en cuenta que la ecuación de la recta está dada
por:

Y = a+ bX

Si: Y es la Variable Dependiente y X la variable independiente, entonces para construir una


expresión del tipo Y = a + b X, debemos estimar los parámetros a y b, es decir la ordenada en
el origen (a) y la pendiente o grado de inclinación de la Recta que está dada por (b).

SALARIO

+
+
+

 = CO
+ CA
a
+

76
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

1 2 3 4 5 6 7 8 9
10 ANTIGUEDAD
Para estimar los parámetros a y b a través del método analítico de los mínimos cuadrados,
debemos partir de la siguiente expresión matemática de la recta de los valores teóricos:

(i) Y = a + bX Ecuación de valores teóricos

Luego minimizamos la sumatoria de los desvíos:


2
(ii) Di = ( Yi - Yi )
Donde:
Di = Desvíos
Yi = Los valores reales
Yi = Los valores teóricos

Remplazando i en ii tenemos:
2
Di =  ( Yi - a - b Xi )

Esta función luego debemos minimizarla; para ello hay que saber si cumple las condiciones
de un mínimo, que son las siguientes:

1RA. CONDICION: La primera derivada parcial de la función debe ser igual a cero.
2DA, CONDICION: La segunda derivada parcial de la función debe ser mayor que cero

Aplicamos entonces las derivadas parciales de D respecto de a y b.


2
Di =  ( Yi - a - b Xi )

D = -2  ( Yi - a - b Xi) / -2
a
D = -2 ( Yi - a - b Xi ) Xi / -2
b

Al dividir ambas expresiones entre -2, e igualamos a cero para que cumpla la primera condición
de un mínimo, tenemos:

 ( Yi - a - b Xi ) =0
 ( Yi - a - b Xi ) Xi = 0

Aplicando cálculo de sumatorias en ambas expresiones tenemos:

 Yi - na - b  Xi = 0

77
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
2
Yi Xi - a xi - b  Xi = 0

El sistema de ecuaciones más llamada como ECUACIONES NORMALES de la recta se


escribe así:

 Yi = na + b Xi
2
Yi Xi = a Xi + b Xi

Ahora veamos si se cumple la condición segunda de un mínimo, Ósea:

D > 0 D > 0
a b
Comprobamos a partir del resultado obtenido con la aplicación de la primera derivada:
D = -2 ( Yi - a - b Xi )
a
Previamente hacemos operaciones en la sumatoria y obtenemos la segunda derivada parcial
respecto de a:

D = - 2 Yi + 2 na + 2b Xi
a

Entonces: 2
D = 2n que es mayor a cero, por que siendo n el tamaño de la muestra
a en ningún caso puede ser menor que 1.

Veamos que sucede ahora con b:

D = -2 ( Yi - a - b Xi ) Xi
b
Haciendo operaciones tenemos:
2
D = -2 Yi + 2na + 2b Xi
b

2 2
D = 2 Xi > 0
b

Es mayor que cero, por que tratándose Xi de una observación o dato no puede ser menor que
cero, por cuanto si así fuera utilizando el cuadrado automáticamente se vuelve positivo.

RESOLUCION DEL SISTEMA DE LAS ECUACIONES NORMALES:

 Yi = na + b  Xi / Xi
78
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
2
Yi Xi = a Xi + b  Xi / -n

Por el método de igualación tenemos:


2
 Yi  Xi = na  Xi + b ( Xi )
2
- n  Yi Xi = - na  Xi - nb  Xi
2 2
 Yi  Xi - n  Yi Xi = b ( Xi ) - nb  Xi

2 2
 Yi  Xi - n  Yi Xi = b (Xi ) - n  Xi

Finalmente tenemos:

b =  Yi  Xi - n  Yi Xi
2 2
( Xi ) - n  Xi

El valor de (a) lo obtenemos remplazando el valor obtenido para (b) en cualquiera de las
ecuaciones normales, con ambos parámetros cuantificados estamos en condiciones de
construir la ecuación de la recta ajustada o de los valores teóricos.

EJEMPLO: Tenemos los datos referidos al nivel de salarios y la antigüedad o años de


servicios, reflejados en el siguiente cuadro:

SALARIO ANTIGÜEDAD
10 1
18 3
16 4
20 6
30 9

Se pide calcular los parámetros (a) y (b) y ajustar la función lineal.

SOLUCION:

Paso Nº 1: Primeramente representamos los datos en un eje de coordenadas cartesianas:

SALARIOS

30
+
25

79
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
20 +
+
15 +

10 +

1 2 3 4 5 6 7 8 9 10

ANTIGUEDAD

Como podemos apreciar en la gráfica anterior, la nube de puntos nos señala que los puntos
tienen una tendencia muy cercana a la línea recta, por tanto es posible ajustar una función de
Línea Recta del tipo: Y = a + b X

Paso Nº 2.- Determinamos los parámetros (a) y (b), a través de la resolución de las ecuaciones
normales:
El parámetro (b) se calculará a partir de la siguiente expresión matemática:

b = Yi Xi - n  Yi Xi
2 2
(Xi) - n Xi

De acuerdo con los requerimientos de la fórmula se deberán calcular los datos solicitados de
la siguiente manera:

2
Yi Xi Yi . Xi Xi
10 1 10 1
18 3 54 9
16 4 64 16
20 6 120 36
30 9 270 81
94 23 518 143
n=5
Remplazamos los datos en la fórmula:

b = (94) (23) - 5 (518) = - 428


2 - 186
(23) - 5 (143)

b = 2,30

Seguidamente el valor de: (b) remplazamos en cualquiera de las ecuaciones normales:


Yi = na + b  Xi

80
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
94 = 5 (a) + 2,30 (23)
94 - 52,9 = 5a
41,1 = 5a
a = 41,1 a = 8,22
5

Con los dos parámetros calculados podemos finalmente estructurar la ecuación de la Recta:

Yi = 8,22 + 2,30 Xi

A partir de la ecuación anterior es posible estimar valores de Yi dando valores a Xi. Esta
operación se conoce como PRONOSTICO ESTADISTICO.

EJERCICIO PARA RESOLVER EN CLASES: La siguiente tabla contiene las estaturas y los
pesos de una muestra de hombres adultos:

ESTATURA PESO
Cms Kgs
155 61,5
152 50,0
152 54,5
155 57,5
157 63,5
152 59,0
157 61,5
165 72,0
162 66,0
178 72,0
183 84,0
178 82,0
Se pide:

a) Graficar el diagrama de dispersión


b) Obtener la Recta de Regresión Estimada del tipo Y = a + b X
c) Predecir el peso de un individuo que tiene una estatura de 168 cms.
d) Calcular el coeficiente de correlación r e interpretarla
e) Estimar la altura de un hombre cuyo peso registrado es de 77,5 Kgs.

81
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

SOLUCION

90

80

70

60

50
PESO

40

30

20

10

0
0 20 40 60 80 100 120 140 160 180 200
ESTATURA

6.7. Aplicación a Series de Tiempo

Cuando una de las variables es el tiempo (En días, meses o años), la regresión se denomina
SERIE DE TIEMPO. Supongamos que la producción (En millones) de un determinado artículo
fabricado por una compañía durante los años 1980-1989 es como sigue:

Años 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989
Producción 92,2 92,3 80,0 89,1 83,5 68,9 69,2 67,1 58,3 61,2

82
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Primeramente debemos trazar el diagrama de dispersión para determinar la tendencia de los
puntos y el grado de correlación entre ambas variables.

PRODUCCIÓN DE X EN 10 AÑOS

100
90
80
70
PRODUCCION

60
50
40
30
20
10
0
1978 1980 1982 1984 1986 1988 1990
AÑOS

Serie1

Seguidamente hacemos los cálculos para hallar los valores de “b” y “a”, utilizando las fórmulas
del método de mínimos cuadrados:

AÑOS No PRODUCCIÓN 2 2
X Y XY X Y
1980 1 92,2 92,2 1,0 8.500,8
1981 2 92,3 184,6 4,0 8.519,3
1982 3 80,0 240,0 9,0 6.400,0
1983 4 89,1 356,4 16,0 7.938,8
1984 5 83,5 417,5 25,0 6.972,3
1985 6 68,9 413,4 36,0 4.747,2
1986 7 69,2 484,4 49,0 4.788,6
1987 8 67,1 536,8 64,0 4.502,4
1988 9 58,3 524,7 81,0 3.398,9
1989 10 61,2 612,0 100,0 3.745,4
SUMA 55 761,8 3.862,0 385,0 59.513,8
b= 10 (3.862) – 55(761,8) = - 3,97
2
10(385) – (55)

Remplazamos el valor de “b” en la primera ecuación normal:

83
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
 Yi = na + b  Xi

761,8 = 10 a + (- 3,97)(55)

a = 98
Entonces la Recta de Regresión estará dada por:

Y = 98 – 3,97 X

A partir de esta Recta de Regresión podemos hacer proyecciones estadísticas: Ejemplo, para
el año 1990, X = 11, la producción para este año será:

Y´= 98 – 3,97(11) = 54,33

Regresión y Correlación Lineal Múltiple

CONCEPTO.- Las consideraciones efectuadas hasta ahora en torno a la Regresión Lineal


Múltiple del tipo: Y = a + b X, donde están involucradas solamente dos variables: (Y) Variable
Dependiente y (X) la Variable independiente, tienen la limitación de no reflejar la realidad con
la debida aproximación posible.

Existe necesidad de incorporar en el análisis más de dos variables, con lo cuál ingresamos a
la regresión lineal múltiple, donde participan más de dos variables; ósea, una variable
dependiente y más de una variable independiente:

Y = f( X1, X2, X3………., Xn)

EJEMPLO:

 El peso (Y) depende de la estatura (X) y de la edad (Z).


 El consumo de un determinado producto (Y), depende de su precio (X) y el ingreso del
consumidor (Z).
 El salario (Y), depende de la antigüedad (X) y el cargo (Z).
 La producción agrícola de un producto (Y), depende de la precipitación pluvial (X) y el uso
de los fertilizantes (Z).

En todos los ejemplos señalados anteriormente tendremos una función lineal múltiple del
siguiente tipo:

Y = a + b X + cZ
Donde:

Y = Variable Dependiente
a = Es la intersección entre el plano y el eje Y o la ordenada.
b y c = Son los coeficientes de regresión parcial que miden:
b= Es el estimador que mide la cantidad por el cuál un cambio
unitario en X, provoca un cambio en Y, cuando Z permanece
constante.
c = Mide la cantidad de cambio en Y provocado por un cambio unitario

84
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
en Z mientras permanece constante X.

Geométricamente hablando se trata de un PLANO:

Y
x

x a Y=a
+ bX +c Z

En el caso de la ecuación lineal múltiple Y = a + b X + c Z, debemos estimar los parámetros


(a), (b) y (c). En consecuencia, la función de nuestro interés será:

Y =a+bX+cZ

La estimación de los parámetros se lo hace mediante el método ya conocido de los mínimos


cuadrados.

DERIVACIÓN DE LAS ECUACIONES NORMALES PARA LA REGRESIÓN LINEAL


MULTIPLE:

Para obtener las ecuaciones normales de regresión lineal múltiple recurrimos al criterio de los
mínimos cuadrados, ósea minimizamos la siguiente función:
2
Di = ( Yi - Yi )
Remplazando términos tenemos:

85
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
2
Di =  ( Yi - a - b Xi - c Zi)

La primera condición de un mínimo exige que las primeras derivadas parciales con respecto a
los parámetros: a, b, y c deben igualados a cero.

D = - 2  ( Yi - a - b Xi - c Zi) /-2
a
D = - 2  ( Yi - a - b Xi - c Zi) Xi /-2
b
D = - 2  ( Yi - a - b Xi - c Zi) Zi /-2
c

Ahora bien igualamos las derivadas parciales a cero:

D = ( Yi - a - b Xi - c Zi) = 0
a
D =  ( Yi - a - b Xi - c Zi) Xi = 0
b
D =  ( Yi - a - b Xi - c Zi) Zi = 0
c
Haciendo operaciones de sumatoria tenemos:

 Yi - na - b xi - c  Zi = 0
2
 Yi Xi - aXi - bXi - c Zi Xi = 0
2
 Yi Zi - a  Zi - b  Xi Zi - c  Zi = 0

Finalmente tenemos las ecuaciones normales:

 Yi = na + b xi + c  Zi
2
 Yi Xi = a xi + b  Xi + c  Zi Xi ECUACIONES NORMALES
2
 Yi Zi = a  Zi + b  Xi Zi + c  Zi

Las ecuaciones normales pueden ser resueltas mediante los métodos de Eliminación y
Cramer.

EJEMPLO: En base a la información proporcionada en el cuadro siguiente:

CONSUMO DE INGRESO IMPORTACIÓN DE


AÑOS PRODUCCION DISPONIBLE PRODUCTOS
AGROPECUARIA AGROPECUARIOS
1967 39 48 9
1968 40 54 10
1969 45 55 12

86
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
1970 43 58 11
1971 50 62 14
1972 53 64 18
1973 62 69 20

Se pide: a) Ajustar la función de la forma Y = a + bX + c Z, estimando los parámetros a, b, y c


para:
Y = Consumo de Productos agropecuarios
X = Ingreso Disponible
Z = Importación de productos agrícolas
b) Estimar a cuanto ascenderá el consumo de productos agrícolas en 1975, si el ingreso
disponible sube a 75 y la importación de productos agrícolas a 30
SOLUCION: Y = na + b X + c Z (I)
2
YX = a X + b X + c ZX (II)
2
YZ = a Z + b  XZ + c Z (III)

Teniendo las ecuaciones normales anteriores calculamos las equivalencias de cada


componente:

AÑOS Y X Z YX X2 ZX Z2 YZ
1967 39 48 9 1872 2304 432 81 351
1968 40 54 10 2160 2916 540 100 400
1969 45 55 12 2475 3025 660 144 540
1970 43 58 11 2494 3364 638 121 473
1971 50 62 14 3100 3844 868 196 700
1972 53 64 18 3392 4096 1152 324 954
1973 62 69 20 4278 4761 1380 400 1240
SUMA 332 410 94 19771 24310 5670 1361 4658

Remplazamos los datos en las ecuaciones normales:

332 = 7a + 410 b + 94 c (I)


19.771 = 410 a + 24.310 b + 5.670 c (II)
4.658 = 94 a + 5.670 b + 1.366 c (III)

Calculamos el valor de los parámetros a, b y c por eliminación o el método de Cramer. Los


resultados obtenidos por cualquiera de los métodos arrojan los siguientes resultados:
a = 12,24
bc = 1,53
0,25
Con los parámetros a, b y c estamos en condiciones de elaborar la ecuación de regresión
múltiple del siguiente tipo:

a) Y = 12,24 + 0,25 X + 1,53 Z


b) Si X = 75 y Z = 30

Remplazando estos datos en la Ecuación de regresión múltiple tenemos:

87
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas

Y (1975) = 12,24 + 0,25 (75) + 1,53 (30)


Y (1975) = 12,24 + 18,75 + 45,9

Finalmente: Y (1975) = 76,89

COEFICIENTE DE CORRELACION MULTIPLE


El coeficiente de correlación múltiple rxyz mide el grado o porcentaje en que las variables
independientes (X) y (Z) explican a la variable dependiente Y. Esta dada por la siguiente
expresión:

2
 ( Yi - a - b Xi - c Zi )
rxyz = 1 - n
__ 2
 ( Yi - Y)
n
Al igual que el concepto de coeficiente de correlación lineal simple ( r ), mientras más próximo
se halle a 1 se dice que las dos variables independientes explican de manera casi total a la
variable dependiente Y, ósea existe plena dependencia entre las tres variables. Cuando r está
próximo a cero, existe escasa correlación entre las tres variables o si es cero la correlación
es NULA.

EJEMPLO; Calcular r xyz del ejercicio anterior:

2 _2
AÑOS Y X Z bX cZ (Yi-a-bc+cZ) (Y - Y)
1967 39 48 9 12 13,77 0,98 70,56
1968 40 54 10 13,5 15,3 1,08 54,76
1969 45 55 12 13,75 18,36 0,42 5,76
1970 43 58 11 14,5 16,83 0,32 19,36
1971 50 62 14 15,5 21,42 0,70 6,76
1972 53 64 18 16 27,54 7,73 31,36
1973 62 69 20 17,25 30,6 3,65 213,16
SUMA 332 410 94 102,5 143,82 14,88 401,72

Donde:

a = 12,24 Y = 12,24 + 0,25 X + 1,53 Z


b = 0,25 _
c = 1,53 Y = 47,4

Remplazamos en la fórmula de r los datos anteriores:

14,88

88
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
r= 1 - 7 . = 1 - 104,16 = 1 - 0,037 = 0,963
401,72 2.812,04
7

r = 0,98
EJERCICIO PARA RESOLVER EN CLASES: El gerente de una Compañia de seguros desea
estimar el monto total de préstamos que hará durante el año 1974, sobre las pólizas emitidas
por su compañia; para esto, los consejeros de inversiones de la Cia., decidieron efectuar un
estudio al respecto en base a los resultados obtenidos durante los primeros 10 años de
existencia de la compañia; tomando en cuenta además otras variables como ser: el ingreso y
la población estimada. Las estadísticas recopiladas se detallan en el cuadro siguiente:

AÑOS PRESTAMOS INGRESO POBLACION


( En miles de Bs) ( En miles de Bs) ESTIMADA
( En miles)
1964 3,6 5 127
1965 3,5 7 128
1966 3,4 6 129
1967 3,3 6 130
1968 3,3 7 131
1969 3,2 8 133
1970 3,0 10 134
1971 2,9 13 136
1972 2,6 16 138
1973 2,3 18 140
SUMA 31,1 96 1.326
En base a los datos anteriores, se pide:

a) Ajustar la recta de regresión lineal múltiple.


b) Calcular el coeficiente de correlación múltiple.

NOCIONES DE REGRESION NO LINEAL:

En muchos casos cuando los valores en parejas de las variables X e Y, no se ajustan a una
línea recta, se puede conseguir una relación lineal mediante una transformación de estos
valores.

A continuación se dan algunas ecuaciones no lineales y su transformación lineal. Ejemplo:

ECUACION TRANSFORMACION LINEAL


x
Y = AB (Exponencial) Log Y = Log A + (Log B) X
B
Y = AX (Potencial) Log Y = Log A + B Log X
Y=. 1 . (Hiperbólica)
(A + BX) Y´ = A + BX, Siendo Y´= 1/Y

89
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
EJEMPLO: Ajustar por el método de mínimos cuadrados una curva de la forma:
B
Y = AX

A los siguientes pares de datos:

X 1,5 2,0 3,0 3,5 4,0 5,0


Y 2,6 2,4 1,2 1,8 1,6 1,4

Gráficamente tenemos:

2,5

1,5 Serie1

0,5

0
0 1 2 3 4 5 6

SOLUCION: La transformación de la regresión lineal es:

Y´= Log Y X´= Log X A´= Log A B´= B

Seguidamente obtenemos los valores transformados en la siguiente tabla:

CALCULOS PARA LA REGRESION NO LINEAL

X Y X´=LogX Y´=Log Y X´.Y´ X´2 Y´2


1,5 2,6 0,1761 0,4150 0,07131 0,0310 0,0172
2,0 2,4 0,3010 0,3802 0,1144 0,0906 0,1446
3,0 1,2 0,4771 0,0792 0,0378 0,2276 0,0063
3,5 1,8 0,5440 0,2553 0,1378 0,2959 0,0652
4,0 1,6 0,6021 0,2041 0,1229 0,3625 0,0417
5,0 1,4 0,6990 0,1461 0,1021 0,4886 0,0213
∑ 2,7993 1,4799 0,5891 1,4962 0,4513

90
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Entonces:

∑X´= 2,7993 ∑Y´= 1,4799 ∑X´.Y´= 0,5891 ∑X´2=1,4962 ∑Y´=0,4513

b = n∑X´∑Y´- ∑X´∑ Y´ = 6(0,5891) – (2,7993)(1,4799) = - 0,532


2 2 2
n∑X´ - (∑X´) 6(1,4962) – (2,6993)
_ _
a = Y´- X´ = 0,24665 – (-0,532)(0,46665) = 0,4949

La ecuación lineal de regresión es:

Y´= 0,4949 – 0,532 X´

La ecuación NO LINEAL de regresión se obtiene utilizando antilogaritmos:


-0,532
Y´= antilog (y´) = (3,125) = X

Donde: A = Antilog(a) = Antilog(0,4949) = 3,125

6.8. Números Índices

Uno de los métodos estadísticos que se utilizan con mayor frecuencia en economía,
administración de empresas, demografía y otros campos de la estadística aplicada, son los
números índices.

Básicamente un NUMERO INDICE, es el cociente de cualquier medición de una variable (o


más variables) con respecto a una de sus mediciones que se toma como base.

El objetivo de los números índices es cuantificar variaciones de las mediciones de una


variable a través del tiempo. En este sentido, el número índice es el cociente de la medición
de la variable en un período determinado con respecto a un período base. Los números
índices se clasifican en índices simples o elementales e índices compuestos y agregados.

El número índice simple se calcula a partir de una sola variable, mientras que un índice
compuesto se calcula a partir de dos o más variables.

INDICES SIMPLES

Sea Xt la medición de una variable cuantitativa X registrada en un período determinado t (año,


mes , día) y Xo la medición de una variable para el período base to. Se denomina Índice Simple
de X para el período t con respecto al período base to, al número que denotaremos por:

It/to = Xt x 100 %
Xo

Si el porcentaje de variación es positivo se dice que ha habido un incremento, si es negativo


se dice que ha habido una baja.

91
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
EJEMPLO: En el cuadro siguiente se muestran los promedios de los salarios, en dólares, de
los trabajadores de una empresa, de 1975 a 1983. Calcular los correspondientes índices para
cada uno de los nueve años utilizando como base:

a) 1975 b) 1978 c) 1983

AÑOS SALARIOS INDICES


1975 = 100 1978 = 100 1983 = 100
1975 310 100,0 81,6 54,4
1976 330 106,5 86,8 59,7
1977 370 119,4 97,4 64,9
1978 380 122,6 100,0 66,7
1979 430 138,7 113,2 75,4
1980 450 145,2 118,4 78,9
1981 480 154,8 126,3 84,2
1982 540 174,2 142,1 94,7
1983 570 183,9 150,0 100,0

Interpretación de la tabla.- La primera columna del cuadro se obtuvo dividiendo cada cifra
anual entre 310, que corresponde al salario del año base 1975 (1975=100), lo que es lo mismo
que multiplicar cada cifra anual por su recíproco: 100/300=0,323

La interpretación es como sigue: El índice 183,9 por ejemplo, significa que en 1983 ha habido
un aumento respecto a 1975 de 83,9 %. Por otra parte, si la cifra resultante es negativa se
dice que ha habido una baja.

INDICES COMPUESTOS:

La finalidad del índice de precios consiste en combinar movimientos de muchos precios a fin
de estimar el movimiento promedio de algún grupo en particular de precios.

El procedimiento para estimar variaciones de precios consiste en utilizar varias medidas


alternativas o índices de dichos cambios.

Ejemplo, supongamos que nos interesa el comportamiento de los precios de los productos
cerealeros entre 1955 y 1963. Para ello elegimos el trigo, el maíz, el centeno y la cebada como
cereales típicos y recogemos los siguientes datos referentes a los precios y las cantidades que
se consumieron en los dos años seleccionados:

PRODUCTO 1955 1963

92
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Precio Cantidad Precio Cantidad
(en dólares) Consumida en (En dólares) consumida en
Tn Tn
Trigo 1,75 100 2,10 90
Maíz 1,20 90 1,80 120
Centeno 0,50 30 1,50 50
Cebada 1,00 20 0,80 40
TOTALES 4,45 240 6,20 300

Ahora queremos calcular un número índice del precio de los cereales para 1963 usando 1955
como período base. La forma más sencilla de hacerlo sería calcular una razón de precios para
cada uno de los cuatro cereales y promediarlas en forma conjunta. Las relaciones de precios
son las que aparecen a continuación:

PRODUCTO RAZON DE PRECIOS


Precio de 1963/precio de
1955 x 100
TRIGO 2,10/1,75X100=120
MAÍZ 150
CEBADA 300
CENTENO 80
TOTALES 650

Los precios relativos obtenidos son en realidad números índices para cada mercancía en
particular, y expresan tan solo el precio de ella en 1963 como un porcentaje de su precio en
1955. El precio del trigo en 1963 era el 120 % de su precio en 1955, etc. El número índice
global lo obtenemos con solo sumar las cuatro relaciones de precios y dividiendo el resultado
entre cuatro. De esta manera, el número índice es 162,5 (650/4=162,5).

Como el número índice para el año base (1955 en este caso) es siempre 100, el cálculo sugiere
que el precio de los cereales era en 1963 un 62,5 % superior al de 1955.

El índice así calculado, si bien es legítimo, tiene sus restricciones por cuanto no refleja o no
acompaña las cantidades de cada cereal en la construcción del índice de precios, por tanto
introduciremos otro índice compuesto más realista denominado INDICE AGREGATIVO
PONDERADO. Para ello hacemos las siguientes operaciones:
P1963 = 2,10 x 100 + 1,80 x 90 + 1,50 x 30 + 0,80 x 20 = 433 = 136,2
1,75 x 100 + 1,20 x 90 + 0,50 x 30 + 1,00 x 20 318

El número índice 136,2 representa que el promedio de los precios de los cereales ha
aumentado cerca de un 36,2 % entre 1955 y 1963. Esta estimación es muy inferior a la
anteriormente calculada, sobre todo por que atribuimos al centeno una ponderación menor
con relación a la importancia de su consumo en 1955. Este índice emplea las ponderaciones
del año base y tiene una significación precisa, que puede explicarse de la siguiente manera:

“ En 1963, la compra de la cantidad de cereales que en realidad se consumieron en 1955,


hubiera costado a los consumidores un 36,2 % más que en este año”.

93
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Con los datos ya presentados, podemos calcular también un índice agregativo ponderado
usando las cantidades de 1963 como ponderaciones. La estimación de dicho número índice
es el siguiente:

P1963 = 2,10 x 90 + 1,80 x 120 + 1,50 x 50 + 0,80 x 40 = 512 = 139,7


1,75 x 90 + 1,20 x 120 + 0,50 x 50 + 1,00 x 40 366,5

El significado de este resultado es “La compra de cantidades realizada durante 1963 cuesta a
los consumidores un 39,7 % más de lo que les hubieran costado en 1955”.

Los dos números índices agregativos o compuestos ocupan un lugar importante en la teoría
de los números índices. El índice con ponderación del año base se determina por la siguiente
fórmula:

Pg = ∑pg.qb
∑pb.qb
Donde:
g = Significa el año dado ósea el año del cual se computa el número
índice.
b = El año base
p = Significa el precio
q = La cantidad
P = El número índice

Así pues, el numerador de la fórmula nos dice que hay que multiplicar el precio en determinado
año de cada mercancía por su cantidad en el año base, y sumar luego estos productos para
todas las mercancías. El denominador, en cambio, indica multiplicar el precio en el año base
de cada mercancía por su cantidad en el año base y sumar luego esos productos por todas
las mercancías.

Por otro lado, la fórmula para el índice ponderado de determinado año es la siguiente:
Pg = ∑pg.qg
∑pb.qg

Para los ejemplos anteriores, en consecuencia, las fórmulas generales serían las siguientes:

a) P1963 = ∑p1963.q1955 Índice ponderado por el año base


∑p1955.q1955

b) P1963 = ∑p1963.q1963 Índice ponderado por un año determinado


∑p1955.q1963

INDICE DE PRECIOS AL CONSUMIDOR

El índice de precios al consumidor (IPC) se construye para medir los cambios de precios en
los bienes y servicios que adquieren los asalariados urbanos y los trabajadores. El IPC se
calcula mensualmente empleando el año base con ponderaciones del año seleccionado. Así
para marzo de 1969, el número índice se calculó a través de la siguiente fórmula:

94
Asignatura: Estadística I
ADM: 101
3ro. Semestre del Programa Administración de Empresas
Pmar1969 = ∑pmar.1969.q1960
∑pbase1955.q1960
La muestra utilizada para preparar el índice contiene más de un centenar de bienes y servicios
(alimentación, vivienda, vestimenta, transporte, salud y recreación).

TAREA PARA INVESTIGAR: Investigar como se calcula el IPC en nuestro país y explicar
con ejemplos.

BIBLIOGRAFIA

 Spiegel, (2001). Estadística, España ,Editorial: McGRAW-HILL

 Castro, (2012). Estadística I, Bolivia, Editorial: Leonardo

 Mercado, (1991). Principios Básicos de Estadística: Instituto Nacional de Estadística

95

También podría gustarte