Está en la página 1de 294

Elementos de

Estadística para Preparación y


Evaluación de Proyectos

5
Elementos de
Estadistica para Preparación y
Evaluación de Proyectos
9,10 E 1/2,
O •••-•
V eIt YR: A

171 F raeha

muto mirilla norte

„ mt.:1 •

la Pat - Mirla -18811


//:'■
tY

Tqflí fe rri-!) ; • C;

od7
REGISTRO No.
r

7
Primera Edición, 1974
Segunda Edición Revisada, 1977
Tercera Edición Corregida, 1990

Prohibida la Reproducción
. Total o Parcial
PROLOGO

Es posible prescindir del con-


curso de la Estadistica en la tarea de Preparación y Evalua -
alón de Proyectos 7 ...., indudablemente que no.

Es innegable que una de las herramientas principales pa-


ra la elaboración de todo trabajo de investigación, donde los
factores que intervienen sufren cambios constantes que impli -
can incertidumbre y que frente a ellos hay necesidad de hacer
predicciones para tomar la acción adecuada en una política de
decisiones, es la Estadística.

El presente trabajo fuá realizado tomando como base las


notas de las clases que me correspondió dictar en la Universi-
dad Mayor de San Andrés, Universidad Católica Boliviana y en
el primer Curso de Preparación y Evaluación de Proyectos (Pro-
grama BID-ISAP-CONEPLAN-OEA - Ciudad de La Paz, 1973). Se han
incluido los temas que se consideraron más importantes, tra -
tando de dejar claras las ideas centrales y sus aplicaciones,
sin entrar a muchas demostraciones matemáticas, de acuerdo al
objetivo perseguido. Se recomienda a los estudiantes ampliar
la lectura de cada Capítulo, al menos con uno de los textos
mencionados en la bibliografía.

Deseo resaltar la persona de Don Hugo Javier Ochoa G. ,


Director del Curso de Preparación y Evaluación de Proyectos,
citado anteriormente, de quién surgió la idea de realizar el
presente documento. Para él , mis mejores palabras de elogio
y agradecimiento por su colaboración desinteresada , toleran-
cia y estímulo constante de que fuí objeto durante el tiempo
que duró mi labor.

La Paz - Bolivia
1974

PROLOGO
A LA TERCERA EDICION

Al presentar esta nueva edi-


ción, deseo expresar especialmente mi más profundo sentir de
agradecimiento a todos cuantos me honraron con la lectura de
Tes dos impresiones anteriores.
La aceptación que tuvo el texto y el actual interés ma-
nifestado por contar con el, sobre todo por estudiantes de ca
rrera y muchos egresados, han constituido motivos suficientes
para haber emprendido la tarea de hacer las correcciones que
eran necesarias y de añadir las soluciones de ejercicios se-
leccionados.
Abrigo, nuevamente, la esperanza de que esta obra en
el nivel dado, pueda servir de un elemento más de apoyo para
quienes están incursionando en el conocimiento de la Estadís-
tica y sus aplicaciones; entre ellos, a estudiantes de la Uní
versidad Boliviana y de otras Instituciones donde se enseña
esta ciencia.

Mario Murillo Orto

La Paz - Bolivia
Agosto, 1990
CONTENIDO

CAPITULO 1

PROBLEMAS DE DECISION ESTADISTICA

1.1 Introducción
1
_1.2 Significación y Naturaleza de la Estadistica 2
1.3 Etapas de la Investigación Estadística-- 3
1.4 Población, Medidas Elementales y Observaciones - 5
1.5- Medidas de las Unidades Elementales-- 7
1.6 Distribución de Observaciones y Distribución''
de Frecuencias c-
8
1.7 Especificación de Parámetros de Decisión'. 9
El Agregado, la Proporción, la Media Aritméti-'
ca,-la Varianze y la Desviación Estándar 10
CAPITULO 2

DISTRIEUCION DE FRECUENCIAS

2.1 Construcción de Distribuciones de Frecuencias • 14


2.2 Propiedades y Relaciones de las Ft¿cuencias 18
2.3 Distribución de Frecuencias para un Número Gran-
de de Observaciones y para Variables Continuas'''
2.4 Representación Gráfica de Distribuciones de Fre- 19
cuencias
2.5 Ejercicios 22
25
°

li

CAPITULO 3

MEDIDAS DE TENDENCIA CENTRAL


4>

3.1 Tipos de Promedio / 28


3.2 Media Aritmética t' 29
3.3 Propiedades de la Media Aritmética-- 32
3.4 Media Geométrica ' 34
37
3.5 Media Armónica /
3.6 Media Cuadrética i„.. 39
39
3.7 Mediana 45
3.8 Cuartiles, Deciles y Percentileá
45
3.9 Moda -1
3.10 Relaciones entre la Media, Mediana y Moda.-- 47
3.11 Ejercicios j
49,
!

CAPITULO 4

MEDIDAS DE DISPERSION

53
4.1 Recorrido 54
4.2 Desviación Media
4.3 Desviación Estándar y Varianza 56
62
4.4 Dispersión Relativa(
65
4.5 Ejercicios

CAPITULO 5

TEORIA DE PROBABILIDADES

5.1 Noción de Conjuntos 68


77
5.2 Operaciones Booleanas
5.3 Relaciones entre Conjuntos- 79
Ejercicios 5.1 83
86
5.4 Probabilidad
5.5 Espacio Muestral y Sucesos- 87
5.6 Axiomas de Probabilidad 91
5.7 Sucesos simples y el caso de Igual Proba- 95
bilidad
5.8 Probabilidad Condicionada 98
5.9 Teorema de Bayas 101
5.10 Sucesos Independientes 104
Ejercicios 5.2 106
iii

CAPITULO 6

VARIABLES ALEATORIAS Y PUNCIONES


DE DISTRIBUCION

6.1 Int.roducción . 108


6.2 Funciones de Probabilidades y'Distribuciones'
para Variables-Aleatorias Discretas. 110
6.3 -Funciones de Densidad y Distribucioñes para
frr Variables Aleatorias Continuas, 116
6.4 Operaciones con Variables Aleatorias ."" 119
6.5 Valores Esperados 120
6:6 Variables Aleatorias Estándar 124
6.7 Distribución Conjunta de Variables Aleatorias 125
6.8 Ejercicios 133

CAPITULO 7

'MODELOS DE DISTRIBUCIONES
DE PROBABILIDADES

7..1 Modelo de Bernoulli 136


7.2 Modelo Binomial . 137
7.3 Modelo Eipergeométrico 142
7.4 Modelo de Poissbn 144
7.5 Modelo Exponencial 148
7.6 Modelo Normal General y Estándar 151 ;
7.7 Ejercicios 156

CAPITULO 8

MUESTREO Y DISTRIBUCIONES
EN EL MUESTREO

8.1 Introducción 158


8.2 Funciones de Variables Aleatorias 159
8.3 Desigualdad de Chebychev 162
8.4 Ley de Los Grandes Números 162
8.4* Teorema Central del Limite 163
8.5 Distribución Muestral de una Proporción 165
8.6 Distribución Muestra' de la Media 166
8.7 Distribución Muestral de la Diferencia de
dos Proporciones 167
8.8 Distribución Muestral de la Diferencia de
dos Medias 168
iv

8.9 Distribución Muestral de la Varianza 169


8.10 Distribuciones: Chi-Cuadrado, V y t-Student 170
8.11 Ejercicios 175

CAPITULO , 9\:

ESTIMACION DE PARAMETROS

9.1 Estimación Puntual 178


9.2 Máxima Verosimilitud 179
9.3 Propiedades de los Estimadores 183
9.4 Estimación de Intervalos de Confianza 186
9.5 Ejercicios 197

CAPITULO 10

PRUEBA DE EXPOTESIS ESTADISTICA

10.1 Análisis General 199


10.2 Prueba de Hipótesis para /4=i% 210
10.3 Prueba de Hipótesis para P = Po 214
10.4 Prueba de Hipótesis para 01= 92 217
10.5 Comparación de dos Medias Poblacionales 218
10.6 Ejercicios 220

CAPITULO 11

MODELOS DE REGRESION

11.1 Asociación entre Variables . 222


11.2 Modelos de Regresión Lineal Simple Bi-
variante 224
11.3 Estimaciones para el Modelo de Regresión
Lineal Simple 227
11.4 Método de los Mcnimos Cuadrados 228
11.5 Inferencias Relativas a la Regresión y
Correlación Bivariante 236
11.6 Distribuciones Muestrales de 1+ y lif 236
11.7 Intervalo Confidencial para b+ 237
11.8 Prueba de Ripótesis para b = bo 239
11.9 Distribución Muestral de Yc 240
11.10 Intervalo Confidencial para Yc 241
11.11 Correlación: Coeficiente de Correlación 243
11.12 Inferencias acerca de /3 244
11.13 Prueva de Hipótesis para /o= p% 245
11.14 Ejercicios 247
11.15 Modelos de Regresión Múltiple y No Li -
neales 250
11.16 Regresión Lineal Múltiple 250
11.17 Regresión No Lineal 254
11.18 Ejercicios 256

CAPITULO 12

NÚMEROS INDICES

12.1 Introducción 258


12.2 Números Indices Simples 259
12.3 Indices de Relativos Ponderados 263
12.4 Indices de Valor y Pruebas de Consistencia 266
12.5 Otros Aspectos Relacionados con Números
Indices 267
12.6 Ejercicios 270'

APENDICES

I Tablas de Probabilidades 275


II Respuestas de Ejercicios Seleccionados 279
III Bibliografía 283
CAPITULO 1

PROBLEMAS DE DECISION ESTADISTICA

1.1

Introducción

Intuitivamente, desde muy temprana e-


dad, casi todos hemos utilizado medidas estadísticas sobre la base de una co
lección de datos obtenidos de alguna manera. Así por ejemplo, desde que es-
tuvimos en la escuela, ya se sabía que para aprobar una materia o un curso,
era necesario un pxonedío mínimo; promedio que aprendimos a calcular divi-
diendo la suma total de las notas parciales entre el número de ellas. Una
verdulera sin ninguna instrucción escolar es capaz de predecir cuáles serán
sus ventas en un día dado, sobre la base de sus experiencias pasadas en días
similares. Un campesino agricultor está en condiciones de decir que en cada
nidada de huevos de gallina, generalmente el cuarenta por ciento resultan ga
líos.

Así como los tres casos mencionados anteriormente, podemos citar miles
de ejemplos en los que está implícita la idea intuitiva de observaciones, me
didas y predicciones estadísticas. Como puede apreciarse, no se tratan de
hechos recientes, toda una vida seguramente se ha estado frente a razonamien
tos iguales, los mismos que forman parte de lo que nosotros actualmente lla-
mamos astadateca. No se trata de algo nuevo ni reciente, como la teoría de
la relatividad, la teoría de conjuntos o la gramática estructural. Quíén
nos dice si no se trata de una de las disciplinas más antíguas, puesto que
se tienen indicios de que en sociedades como la Egipcia, mucho antes de co-
nocer los jeroglíficos, tenían ya alguna forma de registro de datos estadís-
ticos; lo propio ocurre en nuestro continente con la civilización "Quechua",
que antes de conocer la escritura ya utilizaban los "Quipus" para coleccio-
nar informaciones relacionadas con la producción agrícola y otros.

La importancia que tiene, sobre todo, la Estadística moderna en el dese


rrollo de la vida actual, es simplemente singular. Es posible que ninguna
actividad en cualquier campo de la investigación científica marche adelante
sin el concurso de las estadísticas, particularmente en el estudio de merca-
dos, instrumento de mucha utilidad para la Evaluación de Proyectos. La gran
importancia de la Estadística y sus múltiples aplicaciones podrán apreciarse
'7"-T-77"17 P7 T4.-

a medida que vayamos estudiando cada uno de los capítulos del presente traba
jo.

1.2

Significación y Naturaleza
de la Estadística

Como se ha dicho, en la vida moderna


la influencia de la estadística es tal, que son muy pocas las personas que
no han escuchado la palabra "estadística", o que están en medio de fenóme-
no estadísticos, o que utilizan la estadística de alguna manera. En prime
ra instancia, casi todos creen que la estadística consiste únicamente en la
recolección de un conjunto de datos, la presentación de éstos en tablas o
gráficos y el cálculo de totales, promedios, porcentiles, proporciones, etc.
Así por ejemplo, las estadísticas económicas para algunos consiste tan sólo
en tener datos numéricos sobre empleo, ingresos, precios de ventas, importa.
cienes, ventas, etc. Es como si la estadística tratara únicamente de pre -
sentar una información acerca de cualquier actividad expresada en números.
Aún hay quienes creen ciegamente en las frases clásicas "las cifras hablan
por sí mismas" o "los números no mienten". Esto es relativo, ya que es po-
sible presentar datos malamente llamados estadísticos, que aparenten infor-
mar algo que no es real. El significado de eatadatíca es mucho más amplio
y va más allá de lo que se indicó anteriormente. La estadística se refie-
re también t un cuerpo de técnicas o metodología para la recopilación, pre-
sentación y análisis de datos cuantitativos y cualitativos, y al uso de ta-
les datos para tomar decisiones. Pero esto no es todo, ya que se refiere
también a la predicción frente a la incertidumbre de los fenómenos de la na
turaleza.

En otras palabras, podemos decir que la e-atad:atad es un método que


sirve para tomar decisiones cuando hay incertidumbre, sobre la base de da-
tos numéricos, y calcular su riesgo. La importancia de la estadística como
un procedimiento para tomar decisiones, es obvio si consideramos que esta- '
mos viviendo en un mundo donde los sucesos futuros están llenos de varia-
ción e inceritidumbre.*

* Quedará más clara la idea de lo que significa realmente la eatadatíca,


conforme se vayan viendo los temas que siguen.
Cuando hablamos de tomar decisiones, nos referimos a las detidíottz4 C4-
t4datíca¿, que estén basadas en datos numéricos y sus probabilidades de ocu
rrencia.

Gracias a la estadística será posible contestar preguntas como estas:


Están aumentando los costos de mano de obra por unidad producida? Qué inci-
dencia tiene el incremento de producción de las materias primas en el Produc
to interno Bruto (PIB)? Ea cuánto debe incrementarse la producción de cercen
to para cubrir la demanda de viviendas ocasionada por una explosión deMogrg:
fica? Cuál será la proporción de artículos defectuosos producidos por un
nuevo sistema de producción?. Una buena respuesta para éstas y muchas otras
preguntas, lógicamente dependerá de cuán bien haya sido elegido el método y
formulación del procedimiento estadístico a seguir.

1.3

Etapas de la Investigación
Estadística

Cualquiera que sea el campo de aplica-


ción estadística, el procedimiento a seguir básicamente es el mismo. Las e-
tapas principales son cinco, cuyo orden lógico es el siguiente: 1) formula-
ción o definición del problema; 2) disefto del experimento; 3) recolección de
los datos; 4) clasificación, tabulación y descripción de los resultados; y
5) generalización o inferencia final.

En estadística, la totalidad de datos pertinentes que pueden ser reco


lectados y observados para un problema dado, se llama pollea:clan o UMAJWAAO.
En otras palabras, se trata de un conjunto de elementos de los cuales desea
mos saber alguna característica particular. Así por ejemplo, si deseamos co
nocer el porcentaje de desocupados en la ciudad de La Paz, los componentes
de la población serán todas las personas en edad de trabajo que viven en La
Paz, de los cuales se puede obtener la información respectiva para averiguar
el porcentaje de los que no trabajan.

El segundo paso consiste en determinar cómo se obtendrá la infórmalión


para el estudio de alguna característica de la población. Para ello, se. de-
berán registrar los datos correspondientes a las untdadenelementas de la
población o solamente a una parte de estos. En el primer caso el proceli -
miente se denomina enumeración completa o censo; y el segundo, mutante). El
método a seguir dependerá de una serie de factores. En la práctica, por ra-
zones de costo, tiempo requerido e imposibilidad de.realizar un censo, se
usa el muestreo como método adecuado de estudio. Así por ejemplo, se puede
tomar sólo una parte de las personas en edad de trabajo residentes en La Paz
para averiguar el porcentaje de desocupados. Sobre la base de una muestra,
tratamos de tomar una decisión acerca de la población de la cual se toma la
muestra. Entonces, es obvio que la muestra debe representar adecuadamente a
la población. La obtención de una muestra representativa es uno de los com-
ponentes más importantes de la teoría estadística, la cual implica preguntas
como estas: Cuál debe ser el tamaño de la muestra?. Qué tipo de datos deben
ser coleccionados? . Cuáles son los datos a coleccionarse?, Estas preguntas
pertenecen al daeffo de expeximento4 en estadística. En el capítulo corres-
pondiente veremos este método.

Cuando se siga el procedimiento de tomar una muestra, ésta debe ser a-


leatoria. Una mue4tna aeatottia puede definirse como un experimento en el
cual cada elemento de la población ea elegido al azar con la misma chance.
Enfatizamos ésto, debido al hecho de que sólo las muestras aleatorias pueden
tratarse con probabilidades, y la consideración de probabilidades es la base
para tomar inferencias válidas.

La tercera etapa es la recolección de los datos de acuerdo al experimen


to diseñado. El método para la obtención de la información dependerá de la
magnitud y características peculiares del problema que se quiera estudiar.
Esta parte corresponde a las técnicas estadísticas de recopilación de datos
propiamente dicha. Sin entrar en detalles, podemos mencionar en líneas gene
tales los más usados: 1) Obtener datos de publicaciones o de registros, y 2)
Mediante encuestas (las que pueden ser por medio de entrevistas personales,
por teléfono o por correspondencia). Dependerá también de los recursos econó
micos y tiempo disponibles para la ejecución de encuestas y el procesamiento
de los datos obtenidos.

La cuarta etapa consiste en organizar adecuadamente la información. La


organización de los datos a su vez implica los siguientes pasos: 1) Los da -
tos deben ser colaegidod cuidadosamente, de tal manera que las omisiones, in-
consistencias, respuestas irrelevantes y cálculos equivocados en la encues-
ta, no den lugar a resultados erróneos. 2) Debe hacerse una e/a4L6íeación a
decuada, y presentar la información en tablas de una manera sistemática,
pues de ello dependerá una buena interpretación de los datos. 3) Consiste
en la tabulación de los datos clasificados, la que se puede hacer en forma
manual o mecánica mediante computadoras electrónicas. De aquí se obtendrán
medidas que describan, por ejemplo: porcentajes, promedios, desviaciones es-
tándar, etc.

Una medida derivada de una muestra se denomina e4tadatLeo *. Sí una


medida es calculada de las observaciones de la población entera, se dice que
es un pa44metto. En el ejemplo cuando tratamos de estudiar el desempleo, el
resultado del porcentaje de personas sin trabajo puede obtenerse de una mues
tra: El proceso de esta cuarta etapa, alcanza a definir lo que se llama eó-
tadatLea deiscitip•íva.
Cuando la muestra incluye a todos los elementos de la población, esto
es, cuando una investigación se efectúa por enumeración completa, el estudio
de la última etapa, se reduce a la estadística descriptiva. Entonces cuando

* Otros autores utilizan la denominación, 2a.`ad•trca.


se tiene la información de todo el conjunto, las decisiones no tendrán ningu
na dificultad de ser formuladas.

Mientras que si la información proviene sólo de una parte de la pobla -


cidn, el estudio no termina únicamente con las medidas descriptivas. Con
los resultados de.la muestra se trata de conocer el verdadero estado de la
población. En otras palabras la última etapa consiste en intentar una res-
puesta sobre la base del estadístico muestra:1, respecto de la pregunta origi
nalmente formulada, la cual está relacionada con el parámetro de la pobla -
ojón. Así por ejemplo si suponemos que de una muestra se obtuvo que el 20%
son desocupados en la ciudad de La Paz. Entonces este resultado, es un edtí
madot del porcentaje total de desocupados. En el fondo, con esto se está hi
ciendo una generalización (o inferencia) sobre los otros trabajadores no ob-
servados.

El estudio de la metodología para obtener conclusiones de generaliza -


ción, se llama edtadatíea linductíva, que no sólo es el modelo estadístico
más valioso sino también la parte másfascinante de la estadística. El valor
de la estadística inductiva descansa en el hecho de que es característicamen
te un método científico de investigación. También, en este caso, los concep
tos se aclararán mucho más en los capítulos corr spondientes a la vez que se
vaya presentando la metodología para resolver pub/onda de decidían.

Población, Medidas Elementales


y Observaciones

Conviene ampliar un poco más algunos


conceptos que si bien son intuitivos, en muchos casos suelen presentar ambi-
gleda& En estadística, el término poblacían comunmente se usa para desig -
nar una colección o reunión de eleméntos individuales, como personat, anima-
les, cosas, que serán observados según se tenga un problema especial de in -
vestigación. Los objetos individuales en una población se llaman unidadu
dementa/es. Las unidades elementales poseen ciertas estaca/Latinas, algu-
nas veces se las consideran como rasgos o propiedades, las cuales pueden ser
cualitativas o cuantitativas. Por ejemplo, un problema de decisión puede
consistir en observar la efectividad de una máquina laminadora de madera; a-
quí, la población incluye todas las unidades elementales de láminas de made-
ra hechas por dicha máquina, y la característica de la unidad elemental es
su cualidad observada, es decir si está bien o mal laminada. Otro problema
puede tratarse del ingreso familiar en una ciudad dada; aquí la población in
cluye a todas las viviendas familiares de dicha ciudad, y la característica
a observarse es la cantidad del ingreso familiar de las unidades elementales
Que son las viviendas familiares.
El resultado de observar una unidad elemental se llama una Ob4e4vacWn.
Notemos que la definición de una población y la característica de la unidad
elemental a observarse dependerá de la naturaleza del problema de que se
trate. Aclaremos estos conceptos con los siguientes ejemplos, dada la im -
portancia que revisten:

Ejemplo 1.1 Zapatos para niños.

a) Problema de decisión: Decidir la cantidad apropiada de producción


de zapatos para niños de acuerdo al tamaño

b) Población: Todos los niños de Bolivia

c) Característica: Tamaño del píe de cada niño

Ejemplo 1.2 Pronóstico de ventas.

a) Problema de decisión: Estimar lí demanda futura de los consumido-


res.

b) Población: Todos los almacenes de venta

c) Característica: Volumen de ventas

Ejemplo 1.3 Inversión Personal

a) Problema de decisión: Determinar la inversión de capital

b) Población: Listado de capitales invertidos en La Paz

c) Característica: Tasas de dividendos.

Ejemplo 1.4 Pronóstico de Turismo

a) Problema de decisión: Esti:Mar la demanda de hospedaje de los tu-


ristas.

b) Población: Todas las hospederías (hoteles, alojamientos, residen-


ciales, etc.)

c) Característica: Transito de turistas.

Las poblaciones pueden clasificarse en infinitas y finitas. Una pobla


CLGn 62)t ta es aquella población que contiene un número finito de unidades
elementales; mientras que pob/ación inlíníta es una población que contiene
un número infinito de unidades elementales.
1.5

Medidas de las Unidades


Elementales

Las características de las unidades e-


lementales pueden ser expresadas en términos de números de modo que ellos
proporcionen mediante métodos estadísticos indicadores de análisis. Díjímos
que las características de las unidades elementales pueden ser cualitativas
o cuantitativas, Las características cuantitativas pueden transformarse en
datos numéricos directamente midiendo cada unidad elemental, tal como metros,
onzas, $b., grados centigrados, etc. De esta manera los resultados de
las medidas de las unidades elementales forman la totalidad de observaciones,
las cuales sor expresadas numéricamente en términos de la unidad de medida
usada. Los valores que las observaciones cuantitativas pueden tomar, suelen
llamarse variantes, y el conjunto de ellas, vahíabLe. Esto se debe al hecho
de que generalmente de unidad a unidad elemental tomarán distintos valores;
y es justamente éste el caso interesante, puesto que se trata también de me-
dir dichas variaciones. Sí una variable toma un mismo valor, se dice que es
una conatante por ejemplo, si la edad de los niños al iniciar un curso de
pre-Kinder, es la misma.

Cuando los valores de una variable son arreglados en algún orden ascen-
dente o descendente, se forma una 4exa. Wad/Ataca. Una serie puede ser
contínua o discreta. Una atCe contfrua es una variable que puede tomar
cualquier valor numérico comprendido en un determinado recorrido. Es el ca-
so en que los valores sucesivos de la serie pueden diferir en cantidades in-
finitesimales. En otras palabras una serle continua es tal que la unidades
elementales pueden tomar valores divididos entre dos valores contiguos. Ejem
plos & series continuas, son las medidas de peso, estatura, tiempo, longitud.-
o temperaturas.

Pero no toda unidad de medida es divisible, esto es, la unidad de medi-


da puede definirse solamente en términos de enteros. Así por ejemplo, el nú
mero de hijos; podrán ser 1, 2, 5 o 10, pero nunca 1/5, pues no es posible
admitir una fracción de niño. Las series en las cuales no es posible que ha
yan medidas continuas se denominan 4•24a5 tac/teta&

No obstante que teóricamente hay una distinción clara y precisa entre


variaciones continuas y discretas, en la práctica para trabajos estadísticos
se suelen realizar aproximaciones relativas, asumiendo que una seria discre-
ta, se aproxima a una serie continua y viceversa, según sea el tratamiento
estadístico a emplearse. Así, una serie continua, puede transformarse en
discreta a fin de facilitar las medidas de la población; por ejemplo cuando
se toman las estaturas redondeando únicamente en centímetros (pues no tiene
sentido decir que una persona mide 175,405671 cros. ).
Otras veces series discretas se aproximan a continuas con el fin de uti
Tizar, por ejemplo, la curva normal de probabilidades. También, esta parte,
se aclarará más adelante sobre todo desde el punto de vista práctico.

En el caso de tener características cualitativas no es posible medirlas


directamente. Para salvar este problema se clasifican las unidades elementa
les en dos o más grupos con cierta cualidad o propiedad particular, las cua-
les se llaman atAibataé, y luego se asigna un valor a cada grupo. Así por
ejemplo, si se trata de un conjunto de artículos producidos por una máquina,
éstos pueden clasificarse en malos, regulares y buenos, y entonces podemos
asignar el numero O cada vez que aparece un artículo malo, el 1 si es regular
y el 2 si el artículo es bueno. Este tipo de cuantificación de caracte -
rísticas cualitativas, es muy al' para poder hacer inferencias estadísticas.

Muchas de las unidades elementales tienen características tanto cuanti-


tativas como cualitativas, por ejemplo si la unidad elemental es una perso-
na, su estatura será una característica cuantitativa, mientras que su deseo
por consumir lecheono hacerlo, es una característica cualitativa, etc. Por
esta razón es muy importante definir con precisión la característica que se
desea estudiar.

1.6

Distribución de Observaciones y
Distribución de Frecuencias

Al conjunto de observaciones numéricas


de una serie, llamaremos datoz eotadatíesa. Además sabemos que esas obser-
vaciones varían de valor de elemento a elemento. Nuestro interés no es cono
cer valores individuales separadamente, porque la estadística se refiere
esencialmente a la información de toda la población. De esta manera, noso-
tros usualmente intentamos resumir las observaciones individuales en una u
otra forma cuando estudiamos una población. El resumen más comprensivo de
una colección completa de observaciones se llama díotAiluei6n de 6Ateueneta4.
En el capítulo siguiente discutiremos detalladamente la construcción y uso
de las distribuciones de rrecuencias. Aquí usaremos este concepto solamente
en relición al problema de aplicación a la población.

Así por ejemplo, cuando se miden las estaturas de 350 estudiantes y los
resultados son ordenados en una serie en orden ascendente, primero que todo
advertimos el AwonAído de la serie, que es la diferencia entre el mayor y.me
nor valor de la serie. Entonces podemos proceder a dividir el recorrido en un
número de partes o aloma, sobre la cual se distribuyen las informaciones.
Cada clase evidentemente tienen su propia frecuencia, ya que el numero de me
didas que caen en cada clase posiblemente diferirán de una clase a otra.
Una distribución de frecuencias puede presentarse en forma tabular, en una
tabla de diotnAlueídn de 19teeueneía4. Sin embargo también es importante co-
nocer la distribución de Ptecu.encias Aaatíva4, que no son otra cosa que la
proporción del total de unidades de una clase en relación al total de unida-
des observadas. En la tabla 1.1 se representan estos conceptos. En estudios

TABLA 1.1 Distribución de frecuencias de 350 estudiantes cla-


sificados según sus estaturas.

Estatura Frecuencia Frecuencia


(en metros) Absoluta Relativa

15411 (1.40 - 1.44) 3


1.45 - 1.49 11
1/450 0,0086
0,0314
1.50 - 1.54 25 0,0714
1.55 - 1.59 42 0,1200
1.60 - 1.64 67 0,1914
1.65 - 1.69 84 0,2400
1.70 - 1.74 73 0,2086
1.75 - 1.79 35 0,1000
1.80 - 1.84 8 0,0229
1.85 - 1.89 2 0,0057
s o

posteriores podremos apreciar la analogía que tienen las frecuencias relati-


vas con el concepto de probabilidad. En síntesis, la distribución de frecuen
ciar, a menudo se utiliza para resumir datos para posteriores análisis.

1.7

Especificación de parámetros
de Decisión

Como hemos explicado al principio, to-


da vez que un problema puede ser resuelto con la ayuda de datos numéricos,
la primera cosa es definir el problema estadísticamente; esto es, definí: la
población estadística y especificar el parámetro de decisión. Hasta altos he
mos discutido varios aspectos relacionados con la definición de una pobl,
ojón estadística, ahora estudiaremos el problema de seleccionar parámetros
de decisión.

Frecuentemente un parámetro se llama también vato4 vekdadeno. Se trata


de un valor simple obtenido por métodos estadísticos que describe en forma
resumida la característica en estudios de una población. Una población puede
tener muchas características, por lo tanto, habrán muchos parámetros. A mena
- 10 -
do ee desea conocer, un valor mínimo, un valor máximo, un recorrido, el va-
lor total de todos los valores individuales (o el agregado), un valor prome-
dio de todos los valores individuales, etc. Un paildmetto de decaían es una
característica o propiedad de una población que se requiere como base para
tomar una acción de decisión. Es claro que no todos los parámetros de una
población son parámetros de decisión dada la situación de un problema. De
la misma manera que es importante definir la l'Oblación, la selección del pa-
rámetro de decisión apropiado dependerá de la naturaleza del problema en ma-
nos. Otras veces son necesarios varios parámetros de decisión, para resol-
ver un problema de deciSión estadística.

Para terminar este capítulo, definiremos a continuación algunos paráme-


tros de decisión más usuales. La discuslaadetallada de todos los paráme -
cros y sus propiedades se verán en el capítulo 3.

1.8

El Agregado, La Propociln, La Media


Aritmética, La Varianza y la
Desviación Estándar .

Seré importante para el estudio de los


métodos estadísticos, fijar bien los conceptos y los símbolos que representa
rán a las diferentes medidas, con el fin de facilitar la relación entre ellas
mediante fórmulas. Así, generalmente para los parámetros de decisión pobla-
cional, suelen usarse letras griegas, pero por razones tipográficas, no siem
pres será posible recurrir al alfabeto griego, en un caso tal, recurriremos a
las letras latinas. Un símbolo muy usado para la operación fundamental de
stand es la letra griega mayúscula 21(sigma), la cual indica que deben atta -
dirse un conjunto de observaciones elementales, previamente definidos.(Se re
comienda estudiar el texto sobre Sumatorias y Productorias citado en la Bi-
bliografía).

Ahora definamos los parámetros de decisión indicados en el titulo de es


ta sección. El agugado de una población es simplemente el total o la 4UPla
de los valores numéricos de las observaciones individuales en la población.
Sea T la suma de los N valores de la variable, entonces

N
T xl + x2 + ...+ 35,1 = x. (1.1)
i=1
donde cada x. (i=1, 2,.., N) representa el valor individual de la iésima ob-
servación. 1Tomemos un ejemplo sencillo: Se trata de saber el ingreso to -
tal por mes de una familia en la que trabaja los padres y los tres hijos
mayores, sabiendo que:
el ingreso mensual del padre es = x2 1.200 $b.
el ingreso mensual de la madre es = x2 = 850 $b.
el ingreso mensual del ler. hijo es x3 = 1.250 $b.
el ingreso mensual del 2do. hijo es = x4 = 1.300 $b.
el ingreso mensual del 3er. hijo es = x5 = 750 $b.
Entonces el ingreso total de la familia es

5
T e: x. =x+x+x+x+ x
1 2 3 4 5
i=1

= 1.200 + 850 + 1.250 + 1.300 + 750 = 5.350

Antes de continuar, vale la pena hacer alguna referencia repecto del nú


mero de elementos de la población (N) , y el número de elementos de la muestra
(n). Usaremos N sólo cuando se está especificando que el número de las unida-
des elementales observadas son todas las de la población. En cambio usaremos
generalmente n, no solamente para indicar que las observaciones provienen de
una muestra, sino que eventualmente puede ser igual a N (o sea que puede coin
cidir el tamaño de la muestra con el tamaño de la población). Además, como
haremos máshincapié en la estadística inferencíal, trabajaremos partícularmen
te con muestras. Entonces, el agregado de una muestra será

T= x + x + + x = 5--- x. (1.2)
1 2 n
i=1

es decir, que se suman los valores de las n obsevaciones disponibles. Si en


el contexto se está trabajando con n observaciones, podemos simplificar la no
tación de la sumatoria poniendo únicamenteEx.

Cuándo se usará el agregado como parámetro de decisión? A menudo, por


ejemplo en el campo económico, se desea saber algunos totales, como ser: El
Producto Nacional Bruto, el total de los ingresos personales de cierto sector
de trabajo, el valor total de las importaciones de artículos suntuarios efec-
tuados en un año determinado, etc. Casi en todos los campos de investigación
una primera medida que se desea conocer, es precisamente el agregado o total
de los valores que presentan los elementos simples de la población.

Otro parámetro de decisión es la ptopohcien de una población (la designa


remos con la letra mayúscula P), que es la razón del número de unidades elemen
tales A, que poseen un cierto atributo, entre el número total de unidades ele-
mentales de la población N. Simbólicamente,

A
= — (1.3)
N

Por ejemplo, si examinamos la conducta de los consumidores de carie, y


hallamos que 90 personas de 150 personas encuestadas prefieren carne de res,

entonces A = 90 y N = 150, y P = A = 90
150 = 0,60, 6 60%
- 12-

Si bien la proporción es uno de los conceptos mis simples, se trata de


uno de los parámetros más importantes de decisión. Así por ejemplo, a menu-
do se desea saber el porcentaje de reprobados de un curso universitario; la
proporción de desocupados en una ciudad; la proporción de artículos defectuo
sos con un cierto proceso de producción; la proporción de personas que están
de acuerdo con un sistema de precios; el porcentaje de personas afectas al
uso de cierta marca de cigarrillos, etc.

Otra propiedad de una población usada frecuentemente como parámetro de


decisión es la medida de un "promedio". En estadística, como veremos más a-
delante, hay muchos tipos de promedios. El más simple como también el más
importante, es la media atitmItica, que es la suma de los valores observa -
dos de la población dividida entre el número total de observaciones. A la
media aritmética poblacional, la designaremos con la letra griega"-

Entonces la media aritmética poblacional será

-' xl 4- x2 4- "' xN Ex
N (1.4)
N
La media aritmética a menudo es el parámetro clave para muchos proble-
mas estadísticos. Prácticamente se usará este concepto en todo el presente
trabajo, por su gran utilidad en la estadística inductiva. Este parámetro
de decisión se usa en muchísimos casos de problemas estadísticos; por ejem-
plo, cuando se desea saber el ingreso promedio de las personas no asalaria-
das, el tiempo promedio de duración de un cierto artículo, la producción pro
medio de artículos manufacturados, el consumo promedio de carne de pescados,
el promedio de personas que enferman de cáncer a los pulmones de una pobla-
ción con hábito de fumar, etc. Seguramente no hay una persona adulta, con o
sin preparación estadística, que no hable del concepto de promedio en alguna
actividad de su vida cotidiana.

En el ejemplo del ingreso familiar que se dió anteriormente, podemos me


dir el ingreso promedio de las cinco personas que trabajan, o sea

2::xi 5.350 1.070 $


N 5
> de marera que los cinco miembros de la familia que trabajan, ganan mensual-
mente en promedio 1.070 $

Hay otros parámetros de decisión también de gran importancia, como aque


líos que miden el grado de variación de los valores de las unidades elementa-
les en investigación. Dada una serie estadística, el valor de una variable
generalmente difiere de otra dentro de la misma serie. Es obvio que sí el
valor observado de todas las unidades elementales de la población es único,
no existirá ninguna variación. Para medir una variación de valores, debe ha
cerse con repecto a algún punto de referencia. La medida que tiene mayor
importancia, es aquella que nos mide las variaciones (o desviós, o diferen-
cias) de cada unidad elemental respecto de la medía aritmética de todas las
obsecraciones. Además, será el promedio de las variaciones quien nos propor
cione un mejor indicador de las variaciones poblacionales. La medida más
- 13 -

usada para este fin, es la vatíanza de la población, que es simplemente el


promedio de los cuadrados de las desviaciones de los valores individuales
2
" respecto de la media. A la varianza poblacional, la designaremos por Cr
entonces
2
(x -jul + (x -,m)2 + . . + -Ax)2
2
1 2 Px
- - AA- )
G2 N N
(1.5)

Como esta medida cambia el valor original de las unidades elementales (al
ser elevados al cuadrado), una medida que se deduce directamente de la va-
rianza, es la desviación utandan, que es la raíz cuadrada de la varíanza,
o sea :

j E (xs. -A) 2
N

La desviación estándar 0-, es una de las medidas más importantes que sirve
como indicador de la variabilidad de una población; además, se verá que es
un parámetro de múltiples aplicaciones.

Si consideramos la información de nuestro ejemplo, la varianza y des-


viación estándar del ingreso familiar serán:
2 2.
72
11(x.-1070) (x1-1070) b(x2-1070)2+(x3-1070)2+(x4-1070);-(91070)2
iN
..- C
5
2
(130) + (-220)2+ (180)2 + (230)2 + (-320)2
5 = 50.600
De donde

cr= ,/717650 = 224,94

Entonces la variación de los ingresos de las cinco personas, ea de


224,94 S.
- 14-

CAPITUL02

DISTRIBUCION DE FRECUENCIAS

Tal como habíamos adelantado en la


sección 1.6 del capítulo anterior, las decisiones estadísticas están basadas
sobre datos numéricos; los mismos que pueden presentarse en forma resumida en
una trata de dattikueLdn de Ikeemeneíae, cuya importancia es innegable, en
virtud de que nos proporciona una primera aproximación respecto de la forma
en que están distribuidas las series de datos estadísticos. Por otro lado ,
la representación gráfica de una distribución de frecuencias también es rail,
puesto que ello nos dará una primera idea del tipo de distribución de que se
trata,

Recordemos sin embargo, que a los datos se los necesita sólo cuando los
estados de la naturaleza son desconocidos. Por otro lado, los tipos de datos
que se requieren dependen sobre todo del problema de decisión a resolver. Así,
muchas veces inclusive es necesario recoger varias características simultánea.;
mente de cada elemento de la población, Cuando obtengamos un sólo valor de
las unidades elementales, llamaremos datos unívarcíantee, si obtenemos dos va-
lores, diremos datos bívartíantes; y en general, sí obtenemos dos o más valores,
diremos datos muitivaradmteá. En el presente cap£tulo, ilustraremos las dis
tribuciones de frecuencias y sus características, utilizando una sola varizlit

2.1

Construcción de Distribuciones
de Frecuencias

Se ha visto que los datos recogidos de


las unidades elementales de la población o de la muestra, individualmente sil
nifican poco para el investigador. En cambio, prestan gran utilidad, cuando
éstos se hallan ordenados o clasificados de alguna manera sistemática. Las
distribuciones de frecuencias dependerán del tipo de series que son posibles -
de obtener para resolver un problema estadístico. Así, las series pueden ser
discretas o continuas. En el caso de tener valores discretos, de acuerdo a
su número, pueden ser clasificados en asees o grupos.
41-171.5 bVp.
./e>
° yrwIrh :AD< 1

1 Fecha._ ...........
- 15-
47
Empezaremos por ver el caso más simple de las di trikucionek frecue:
cias. Partiremos de la siguiente información correspon e ,s califica.
ciones (redondeadas) obtenidas en una prueba por 50 alumnos, el la escala
del 10 al 70.

TABLA 2.1 Calificaciones obtenidas por 50 alumnos en una prue-


ba de evaluación, en una escala del 10 al 70.

40 40 60 30 so 50 60 50 60 30
30 10 50 20 30 40 40 40 50 40
60 20 40 70 30 30 30 30 40 10
20 50 30 40 10 60 20 60 40 60
50 70 20 40 40 20 10 30 30 50

De acuerdo a los conceptos y definiciones anteriores, cada uno de los


elementos de la Tabla 2.1 corresponden al valor de cada una de las 50 unida-
des elementales de la población, a los que simbólicamente designaremos por
x. (en este caso, i varía de 1 a 50, o sea que hay x , x50 valores).
1
Los valores de la Tabla anterior, pueden resumirse en una Tabla de Distribu.-
ojón de Frecuencias, agrupando a todos aquellos valores iguales, en cáda una
de las categorías de calificaciones, como se ve en la Tabla 2.2

TABLA 2.2 Distribución de Frecuencias Absolutas corres-


.
pondiente a las calificaciones abtenidas por
50 alumnos en una prueba de evaluación
(Escala, 10 al 70).

Registro o cómputo de
Calificación las repeticiones de Frecuencias
X los valores distintos Absolutas
que toma la variable n. = f
1
xl = 10 //// n = 4
x la 20 ///// / n
1
x
2
= 30 ///// ///// / 2 = 6
n = 11
x3 = 40 ///// ///// // n3 12
4 4
x = 50 ///// /// n = 8
x5 5
= 60 ///// // n = 7
x6 = 70 - // n6 = 2
7 7

En la Tabla 2.1 vemos que hay varios x. iguales. Sin embargo, en la Ta-
bla 2.2, en la primera columna aparecen tah sólo siete valores para los x.;
esto se debe a que se han clasificado a las x., sólo en los distintos vilóres
que ella toma, ya que en la columna de las frécuencias absolutas aparecen el
número de veces que se repite un valor x. particular. Algunos autores, usan
otra letra para designar a los diatinto41valores que toma la variable X, por
ejemplo, la letra Y; de manera que en este caso tendríamos y l, y2, ..., y7
- 16-

para la primera columna de la Tabla 2.2. Nosotros usaremos la misma letra pa


ra designar la variable que se esté considerando, sea que tengamos el conjura
to de datos originales sin agupac, o cuando los tengamos agrupados.

Para la notación de las frtecuencia.4 abeclutta, usaremos n., que nos indi
cara: el número de veces que aparece repetido un valor x.; detesta manera, en
nuestro ejemplo, n4 s. 12 significa que se han encontrado112 alumnos con una
calificación de 40. En la columna central de la Tabla 2.2 se lleva la cuenta
mediante rayas, las que son marcadas a medida que aparece un valor x.(De la
misma manera que se hace un recuento de votos, en una elección cualcitiera).
Esto es lo que se llama también computacíón de la información original, que
de acuerdo al 'volumen de los datos puede realizarse en forma manual o mecáni-
ca.
Por otro lado, podemos representar graficamente una distribución de fre-
cuencias absolutas, como se ve en la Figura 2.1
n.
1
Número de
alumnos

10

, x. calificacio-
10 20 30 40 50 60 70 nes.

Figura 2.1 Gráfico de barras correspondientea las calificaciones


obtenidas por 50 alumnos en una prueba de evaluación.

Otro gráfico que también es útil, es el que corresponde a las frecuencias


acumuladas, (Ver Figura 2.2)
Una tabla de distribución de frecuencias es mis completa cuando además in
cluye otros conceptos en base a las frecuencias absolutas. La 6ftecuencía hela.
Uva (o simplemente 6neeuenbía] de un valor observado distinto, es la razón
que existe entre el número de repeticiones de un x. y el número total de elemer
tos de la población, la que representaremos por hile ni/n. Una tabla de distri-:
bución de frecuencias, también puede incluir las acumulaciones de las frecuen-
cias , tanto absolutas como relativas. As!, N representará la 6.teeuencía abac
...Uvas acimut/acida. La
/uta acumulada, y H. representará a las Ptecuelum /Lar
Tabla 2.3 nos ilustla estos conceptos para el ejemplo de las calificaciones de
los 50 alumnos.
- 17 -

50

r---.
20
;
10
;

mi calificaciones
10 20 30 40 50 60 70
Figura 2.2 Gráfico acumulativo de las calificaciones obte-
nidas por 50 alumnos en una prueba de evaluación
TABLA 2.3

Acumulación
Calificaciones Frecuencia de las Fre- Frecuen- Acumulación de
Absoluta cuencias cia las Frecuencias
," Absolutas 1
/1.
10 4 4 0,08
20 0,08
6 10 0,12 0,20
30 11 21 0,22
40 0,42
12 33 0,24 0,66
50 8 41 0,16
60 0,82
7 48 0,14 0,96
710 2 50 0,04 1
1
'5'dc

Eh general, si se tienen n valores observados, una tabla de distribición


de frecuencias, simbólicamente estará dada por: (Ver Tabla 2.4)

Donde m índica el número de valores distintos que toma la variable. Cuan


do se dice, dibtribución de frecuencias, se entiende también la ifohmee en que
están distribuidas las repeticiones de cada valor distinto de la poblacik;n.
- 18 -
TABLA 2.4 Distribución de Frecuencias y Frecuencias Acumuladas.
Valores de Frecuencias Frecuen- Frecuencias Frecuencias
la variable Absolutas cias Absolutas Acumuladas
ni hi Acuibuladas
xi

xl ni hl nlin = ni H1 = hi
x2 n2 h2 = n2/n 272 = nl+n2 E2 hl+h2
x3 n3 h3 = n3/n 273 = ni+n2+n3 H3 = hi+h2+h3

xm nm hm = nm/n Nm = n1+..+nm=n 1m = hy+..+hm=1

2.2

Propiedades y Relaciones
de las Frecuencias

Vale la pena hacer algunas consideracio


nes sobre los elementos que constituyen una Tabla de Distribución de Frecuen- .
cies. Los valores xi de la variable no tienen restricción alguna, puesto que
pueden ser números enteros negativos o positivos, o números fraccionarios.
Asi por ejemplo, si la variable representa al numero de hojas, de más o de me
nos, en un proceso mecánico de empaquetado de 1.000 hojas, las xi pueden to -
mar valores como x =-2, x = 0 6 x = 4; lo que significa respectivamente que
faltan dos hojas, que está exacto o que hay 4 hojas demás.
Las frecuencias absolutas o repeticiones ni, y las frecuencias absolutas
acumuladas Ni, son números enteros positivos. Las frecuencias hi y las fre -
cuencias acumuladas Ri, son números fraccionarios positivos no mayores que 1.
De esta manera, se tienen las relaciones:
O hi 4 1
m
h« = 3.
i=1
ni =n
i=1
Por otro lado, para un Ni y Hj cualquiera

Ni =-Y:: ni ,=
11 hi
i=1 i=1
- 19 -
También
Nm = n Hm = 1
Finalmente,
n1 N1 1 N2 Nm = n
hi = Hl 1 H2 1 ... 1 Hm = 1

Todas estas relaciones o propiedades, pueden observarse en las Tablas


2.3 y 2.4

2.3

Distribución de Frecuencias para un


Número grande de Observaciones
y para Variables Continuas

Eh la mayor parte en que se tratan da-


tos continuos, o cuando se tiene un número grande de datos discretos, no es
posible asignar una clase Única a todos los valores distintos de la variable
- (sobre todo si son muchos). La única novedad que aparece, en relación a lo
estudiado en las secciones anteriores,, es que los datos se agrupan en un nú-
mero razonable de clases que usualmente es de 5 a 15.
. la cecee es un intervalo dentro del zual situamos todos los valores
:ndidos entre los Límíteh de /a etase. La amplitud de una clase se lla
tekvato de etaoe, la cual es la diferencia entre los límites superior e
:ior, de la clase. El número de valores de una serie que caen en una
ie, se llama 6/teeueneía de ctdde. Para fines de cálculos, como Yermos
adelante, se usará el punto medio de la clase (que algunos autores llaman
ted de e/a4e), que es el promedio de los límites de una clase. Así, en
s cálculos basados en datos agrupados, se asigna el valor del punto medio
.e la clase a todas las observaciones contenidas en ésta:. b este caso el
' zratamiento para los datos continuos o discretos es la misma.

Consideremos la información de la Tabla 2.5 para tratar todos estos con


ceptos.
-20-

TABLA 2.5 Salarios semanales de 100 obreros, que trabajan en


distintas empresas constructoras de viviendas


°(:1 . 405 '300 / 330 7 -295 /
3.290 / 420 9305 320 • 365
360 370 405 330 --- 375
355 355 400 335 ,' 380
375 .305/ 380 355 390 „
410 420 375 370 1.300'7
400 390 385 385 315
390,/ 385 .395 380 340
q5310 380 360 370 365
.0290/ 320 375
360 j:10 3
:(-------455-1— 330 385 /
370 350 '110 315' 330 /
420 400 325 -/ 380 315 .7".
e 285 380 335 -' 345 320
370 370 410 360 • 340
390 350 390 345 350
415 345 360 340 345
345 430 .310 395 365
350 415 325 . 375 355 ,
410 380 320 395 335

Pera determinar el número aproximado de clases, el estudiante puede usar


la Regla de Stakges como una gula, la que esta dada por

k= 1 + 3,3 log n
donde
k = nGtero aproxitado de clases
n = número total de observaciones en la muestra
log = logaritmo de base 10

Por ejemplo para la información de la Tabla 2.5 tendremos

k 1 + 3,3 log 100 = 1 + (3,3) . 2 1 8

Entonces, el número de clases para los salarios semanales de los obreros


será 8. Esto no es rigido,puesto que se trata solo de una aproximación, por
tanto, si es necesario sq. pueden tomar 7,90 10 clases.

La selección del número de clases puede establecerse también tomando


las siguientes dos consideraciones: 1) procurar una distribución tal que
haya una frecuencia mayor que las demás, 2) que el punto medio de la cla-
se tome un valor fácil de trabajar en cómputos. Otro aspecto importante,
es propender a que todas las clases en que se divida un conjunto de obser
vaciones, tengan el mismo intervalo. Finalmente, si llamamos c al tamaño
del intervalo de una clase, los limites de la primera clase o intervalo se de
- 21 -

terminan a partir del menor valor observado mía la amplitud. En nuestro e-


jemplo, el tamaño de la clase es

Vs - VI 430 - 280
e - - 18,5 ( 181i5
k 8
donde VS es el valor superior y V/ el valor inferior, que toman las observa
ciones. Luego, el primer intervalo de clase será de '280 a 298,5; el segun-
do de 298,5 a 317; y así sucesivamente.

Por otro lado, el punto medio de la primera clase es

LI + Ls 280 + 298,5
2 2 - 289,25

donde la y Ls son los límites inferior y superior, respectivamente del in


tervalo de clase. Como el valor medio de la clase en este caso es un núme-
ro no muy maniobrable, podríamos cambiar el numero de clases, por ejemplo
a 10 en'lugar de 8. Eh tal caso el tamaño del intervalo de clase es:

c = 430 - 280
-15
10
De modo que el primer intervalo ;será de 280 a 295, y el punto medio 287,5.
De manera que la talla de distribuci6n de frecuencias de datos agrupados
para nuestro ejemplo será:

TABLA 2.6 Distribución de Frecuencias de los salarios semanales de


100 obreros.

Intervalos Punto me- Número Acumulas. Frecuencia Acumula°.


de clase dio(o mar de de número del nÚmero de frecuen
Ingresos ca de ola Obreros de obreros de obreros ciar
se) xl °ft? 7,..]: Y' I
280 - 295 287,5 o 4 0,04 0,04
295 - 310 302,5 5 9 0,05
310 - 325 0,09 s'
317,5 10 19 0,10 ' 0,19
325 - 340 332,5 9 28 0,09 p'
340 - 355 347,5 0,28
13 41 0,13 0,41
355 - 370 362,5 15 56 0,15
- 370 - 385 0,56
377,5 18 74 0,18 0,74
385 - 400 392,5 12 86
400 - 415 0,12 0,86
407,5 8 94 0,08 0,94
415 - 430 422,5, 6 100
Le3C 0,06 1
-22-

Para calcular algunas medidas de los datos observados, los puntos medios
de clase equivalen a los x.. Este concepto se usará bastante en el proximo
capitulo.
De Tabla 2.6 pueden obtenerse muchas informaciones respecto de los va-
lores observados de la población; como por ejemplo, el número y porcentaje de
los obreros que ganan entre 340 y 355 $, el porcentaje de obreros con ingreso
inferior a 370 $, etc.
Hay una observación importante que debe hacerse cuando se confecciona
una distribución de frecuencias por intervalos de clase para una serie conti
nua. En nuestro ejemplo el limite superior de un intervalo, coincide con el
límite inferior del intervalo inmediato que sigue, lo cual da lugar a la si-
guiente pregunta: Si un obrero gana, digamos 295 $, será incluido en el pri
mer intervalo o en el segundo?. Nosotros convencionalmente lo incluiremos en
el intervalo inmediato superior. Algunos autores para salvar este tipo de di
ficultad trivial, clasifican los intervalos, de la siguiente manera:

Intervalo de Clase

280 a 294,99
295 a 309,99
310 a

Como puede apreciarse, con la salvedad del caso, podemos evitar el uso
de números como 294,99, etc.

2.4

Representación Gráfica de Distribu


ciones de Frecuencias

No sólo una Tabla de distribución de


frecuencias presta una información adecuada para un primer análisis del con-
junto de observaciones de una población, también la representación gráfica
de la distribución de frecuencias, permite visualizar la forma en que se dis-
tribuye un conjiinto de observaciones. Los gráficos más usuales son los lla-
mados: kl4togiuma de IxecueneAa4 y polígono de Oteueneía4. Hay una serie de
técnicas para ésto, sobre todo cuando los intervalos de clase son diferentes.
Nosotros veremos únicamente el caso en que los intervalos de clase son igua-
les, puesto que es el más frecuente y además, siempre es posible condicionar
- 23 -

cualquier conjunto de observaciones en intervalos iguales. La representación


gráfica, se hace básicamente utilizando los ejes coordenados en un plano car-
tesiano, tomando una escala adecuada.

El histograma de frecuencias para la Tabla 2.6 estará dada por


n.
Número
de
obreros

-w 1c, salarios en $
280 295 310 325 340 355 370 385 400 415 430 -

Figura 2.3 Histograma de frecuencias absolutas.

Mientras que el polígono de frecuencias será

n.
Número
de
obreros

x. salarios en
280 295 310 325 340 355 370 385 400 415 430

Figura 2.4 Polígono de frecuencias absolutas

El polígono se traza uniendo los puntos medios de las marcas de clase


respectivas. Además, para cerrar el polígono, se toman los puntos medios
anterior y posterior al primer y último intervalos.
-24-
Si se tomaran los valores de las frecuencias relativas, BU histograma
y su polígonc de frecuencias, tendrían la misma forma de las Figuras 2.3 y
2.4 por la proporcionalidad entre todas las frecuencias absolutas y relati-
vas (Tabla 2.6), además que realizando un cambio de escala adecuado en el
eje de las ordenadas, los gráficos serán iguales. También es posible grafi
car fácilmente las frecuencias acumuladas.

Insistimos en la importancia de hacer un gráfico, tan pronto se tengan


los datos de un experimento dado, puesto que ello ayudará bastante a tener
una idea objetiva de la forma en que están distribuidas las frecuencias, lo
cual es útil para el análisis estadístico.

Consideramos que no es necesario especular más sobre el tema, de mane-


ra que terminaremos este capítulo mostrando algunas curvas que representan
los principales modelos poblacionales.

al Curva normal b) Sesgada a la derecha a) Sesgada a la izquier


da

d) Curva de lorza J ) Forma J invertida f) Curva de forma U

g) Curva bimodat h) Curva multimodal .) Curva logarítmica


Figura 2.5 Curvas que representan las principales formas que toman
:as distribuciones de frecuencias poblacionales.
-25-

2.5

Ejercicios

1.Cuándo es aconsejable usar distribuciones de zrecuencias?


2.Cuáles son las ventajas y desventajas del ordenamiento -de datos?
Es el orden necesario para la construcción de una Tabla de distri-
bución de frecuencias?
3.Qué rol importante juega el punto medio en una distribución numéri
ea?
4.Indique 4 ejemplos de distribuciones unidinensionales, 3 de bidi -
mensionales y 2 de multidimensionales, relacionados con la econo -
mía del país.
5.Determine si las siguientes relaciones son posibles y justifique
su respuesta.

5.1 H4 = 0,30 n = 10 n3= 31


5.2 hl = 4 h = 12 h4 = 15
3
5.3 h2 = 0,40 n = 50 ni = 20
5.4 hl+h2+h3+h4 = 1 n6 3 115 = 1
5.5 H4 = 0,20 86 = 0,12 h5 = - 0,08
5.6 m =6 52 m 0,6 h1 = 0,20
H3+H4 el 1,90 h4 * 0,2

6.Comente las siguientes afirmaciones:

6.1 No tiene mayor importancia el criterio que se tome para deter


minar a cuál intervalo pertenece un elemento cuyo valor coin-
cide con el límite de la clase.
6.2 La suma de lee frecuencias absolutas es siempre igual a 1.
6.3 N7 indica la frecuencia relativa de valores de la variable ma
yores que x7.
6.4 Mientras mayor es el número de intervalos elegidos para la
formación de una distribución de frecuencias menor es la exac •
titud de los estadísticos que se calculan.
6.5 Hi > hi (para todo i)
6.6 Es preferible trabajar siempre con pocos intervalos.
6.7 El número de intervalos en que se clasifican un conjunto de
datos, depende de la cantidad de éstos.

7.Indicar cuáles de las siguientes variables pertenecen a series con


firmas y cuáles a discretas: a) tiempo; b) sueldos en una empresa
pública; c) magnitudes de grados; d) edad; e) datos de censo; fi
distancia recorrida por un móvil; g) pontajes de futbol; h) peso;
i) edades mentales; j) ingreso per capita.

8. Reducir las distribuciones A y B que siguen, a frecuencias de por-


centajes y trazar los polígonos de frecuencia sobre los mismos ejes.
-26-
Qué consecuencias puede concluir al respecto?
PunSes Grupo A Grupo B
16 - 19 4 0
20 - 23 3 5
24 - 27 2 15
28 - 31 8 10
32 - 35 12 22
36 - 39 20 40
40 - 43 10 58
44 - 47 5 12
48 - 51 o 5
52 - 55 1 8
9. Completar los datos que faltan en la siguiente distribución:
Xi ni Ni lis.
ile,

1 1 4 .3 0,08
2 4 9 MI
3 g 16 0,16
14 7 23 0,14
5 5 28 040. 1
6 /e 38 1. 2 O',"
7 7 45 0,14
8 5 U. ' 0' -
511

10. La duración en horas de una muestra de lámparas incandescentes de 40


watts y 110 voltios en pruebas forzadas de control de calidad fueron
las siguientes:
Duración de los elementos.

1 1,10 ' • 1,26 0,83 -, 1,30 - 1,25 .1,49 • 1,19


t 1,30' 1,23' 0,81" 1,36'' 0,94' . 1,21' 1,23/
1 1,24' 1,10' 1,23 • 1,32- 0,99-1 1,39. '... 0,95
‘ 1,20' 0,931. 1,18 d 1,31; " 0,92•• 1,02. - 0,77
'1,20' 1,05 ~` 1,23 - 1,26 1,20 - 1,08 ' 1,11
‘0,82e 0,98" 1,02 -C 103' 0,82 i 0,91•' 1,16 •
0,76' 1,24' 1,00" ;11 0,96-- 1 0,83' -. 1,22 --
1,40 1,33' 1,12-1- 1,23 - 1,25, 1,42 - 1,38 /
0,94i, 1,17.- o,98 (- . 1,,.-
« 1,40 - 0,97 ' 1,30'.
1,34 7 0,99 1 1,08 / 1,0, 1,24 - 0,87 / 1,11 '

10.1 Construir una distribución de frecuencias sobre la duración de las
lámparas en la muestra.
,o g C
5 .
-27-

10.2 Cuántas clases usaría usted para la distribución de frecuencias?


Justifique el número de clases que haya seleccionado.

10.3 Us6 usted intervalos de clase iguales o desiguales? Por qué?

10.4 Se le presentó algún problema especial al seleccionar los límites


de clase?
10.5 Represente gráficamente el histograma y polígono de frecuencias.
10.6 Represente gráficamente la distribución de frecuencias acumulativa.
10.7 En los puntos 10.5 y 10.6, trabajó usted con absolutas o relativas?
Explique su elección,
10.8 Analice sus gráficos y escriba un breve comentario para presentar
sus descubrimientos.

al. Tome 15 monedas y después de mezclarlas, eche sobre una superficie pla
na y anote el número de caras resultantes. Repita este experimento
100 veces y construya con los resultados una distribución de frecuen -
cies.
12. Cuarenta familias escogidas al azar, que viven en un campamento minero,
incluían los siguientes números de miembros por familia:

6,4, 5, 4, 4, 3, 5, 3, 6, 5, 4, 5, 5, 6, 3, 4, 3, 2, 6, 3,
4, 3, 9, 3, 5, 3, 2, 4, 5, 3, 5,3, 5, 3, 11, 3, 4, 4, 3, 5.
12.1 Hacer un histograma de frecuencias, que muestre las frecuencias de
las familias según el número de miembros.

12.2 Construir un polígono de frecuencias basado en los datos anteriores.

12.3 Qué da mayor imagen de los distintos tamaños de las familias, el


histograma o el polígono de frecuencias? Por qué?

12.4 Qué tipo de datos se han tabulado?


-28-

CAPITUL03

MEDIDAS DE TENDENCIA CnníTY.AL

3.1

Tipos de Promedio

La distribución de frecuencias, tal co


mo hemos estudiado en el capítulo anterior, no sólo es un resumen de los da
tos observados, también ella nos muestra la forma en que se distribuye la
población; pero es mis, cada uno de los valores incluidos en la Tabla de Die
tribución de Frecuencias, proporciona una información estadística. De mane-
ra que se tiene un conjunto de datos estadísticos descriptivos, ya que cada
uno de ellos nos describen la densidad de observaciones que caen en una cla-
se o varias clases. Sin embargo, frecuentemente se necesita tener una sola
medida que describa la naturaleza de los datos en su conjunto, es decir, un
número simple que a su vez sea "representativo" de todas las observaciones.
Ser representativo significa, que el número debe reflejar la tendencia de
los valores individuales que están distribuidos alrededor de cierto valor
central. Es obvio que el valor más representativo para un conjunto de núme-
ros normalmente no es el valor más pequeño ni el mée grande, sino que es un
número cuyo valor está en algún punto intermedio del grupo. Por esta razón,
un número representativo es aquél que indica una medida de tendncia centnaL,
conocido comunmente como pumedio.

El promedio se emplea con frecuencia como mecanismo para resumir un con


junto de cantidades o números, sobre todo si es grande, a fin de describir
los datos estadísticos. Así por ejemplo, la edad promedio de los estudian -
tea de una universidad, el salario mensual promedio de los artesanos en una
ciudad; el promedio. de quintales de papa producida por hectárea, el promedio
de gastos en consumo de los trabajadores mineros, etc. Los promedios tam -
bién se utilizan para comparar una población con otra; por ejemplo, el prome
dio general de calificaciones obtenidas en un colegio comparado con el prome
dio de otro colegio; comparar los rendimientos promedios de unidades produci
das por distintas fábricas, etc.

Un promedio se dice también que es una medida de pozición, en crazón de


que las formas en que estén distribuidas las series estadísticas pueden ser
e

-29-

iguales, diferenciándose finitamente en el valor promedio, como se verá en


las secciones que siguen.

Las medidas de tendencia central más utilizadas son: la Media Arito*


tica, la Media Geométrica, la Media Armónica y la Media Cuadrática. Se in-
ciuye también en esta categoría a la Media:uy10%de, que tienen su carac-
terística particular a diferencia de las tres primeras.

3.2

Media Aritmética

La medida de tendencia central más útil


y la más usada, es la "Media Aritmética", que algunas veces se la llama
iiMpIementé "media" o "promedio".

DEFINICION 3.1 La meaía axitmética es la suma de todos los valores observa


dos dividido por el número de observaciones. Si x,, x ...
2'
x son los valores observados de una muestra, entonces la media aritmé
tica (designada por x) es
xi
- i=1

Algunas veces utilizaremos un "operador" que indique la operación de calcu-


lar una medida. Así, para la media aritmética, se usará la letra M, de ma-
nera que MEX) nos representará la media aritmética de la variable X-(que es
una característica cualquiera de la población); entonces,
x.
4-r
M(X) - (3.1)
n

Si se tomaran a todos los valores de la población, tendríamos


N
E x 1.
Del
M(X) (3.2)
N

Las fórmulas (3.1) y (3.2) se utilizan para calcular la media aritméti


ca, cuando se tiene la información original, es decir, sin necesidad de ha-
Darlos agrupado en una tabla de distribución de frecuencias.
-30-
Ejemplo 3.1 Supongamos que se tiene el siguiente conjunto de califica-
ciones que obtuvieron 10 alumnos en una prueba de matemáti
ces: 3, 4, 5, 4, 6, 5, 4, 6, 7, 3. Entonces, si X es la variable que indica
las calificaciones, tendremos
xi
xi + x2 + x10
1=
lo 10

3+4+5+4+6+5+4+6+7+3 47 4 7
10 10 . 1'

Luego 4,7 es el promedio de las calificaciones de los 10 alumnos.


En el caso de que se tenga una distribución de frecuencias absolutas,
la media aritmética se calculará, como sigue:

m
1:: xi ni
(x) 7 . 1=1
M n

donde m indica el número de clases o valores distintos que toma la:variable


y ni las veces que,se repite un valor xi distinto.
Ejemplo 3.2 Tomemos la información del ejemplo 3.1, pero esta vez se
tiene a los datos agrupados en una tabla, tal como sigue:

TABLA 3.1 Frecuen,3ias de calificaciones de 10


alumnos.

Número de
Calificación alumnos Frecuencia
X ni hi

x1 = 3 nl ' 2 hl = 0,20
n2 = 3 h2 = 0,30
x2 = 4 n3 = 2 h3 = 0,20
x3 = 5
=6 = 2 = 0,20
x5 2 7 n5 = 1 h5 = 0,10

10 1
E
Entonces, la media aritmética es

ni x/ n1 + x2n2+...+ x5 n5
M (X) = i= 1=110 10
3 x 2+4 x 3+5 x 2+6 x 2+7 x 1
10
= 6+12+10+12+7 = 47 _ 4 7
10 10
- 31 -

Cuando se tiene la distribución de frecuencias relativas, el cálculo de


la media, seré

24 (X) = x = 2:::xi h. (3.4)


i=1
donde n.
h =
i n

Ejemplo 3.3 Consideremos nuevamente la información del Ejemplo 3.1 y


calculemos la media con las frecuencias de la Tabla 3.1

N (X) =1 0 55— x.h oxl% + x2h +..+x h


i 1 1 2 2 5 5
i=1

= 3(0,2)+4(0,3)+5(0,2)+6(0,2)+7(0,1)

0,6+1,2+1,0+1,2+0,7 = 4,7

Obséyvese que por los tres métodos el resultado es el mismo.

La expresión (3,3),puede también escribirse


Xin
-
(X) X
n
iel i

expresión que recibe el nombre de media aritmética ponde.&ada,cuyos pesos


oppenderecioneanfrecnimciasabsolutasn..La media aritmética ex-
presada en (3.4) también resulta ser una media ponderada con sus frecuen
cies relativas h..
1.
Hasta aquí, vimos el cálculo de la media, tanto para datos sin agru-
par como para datos agrupados. En este áltimo caso sólo para cuando las
clases son Ónices. Nos preguntamos ahora, cómo se calculará si se tiene
una distribución con intervalos de clase. No hay ningún problema, pues,
para ello se toman los puntos medios de clase como valores de la variable,
y se calcula de manera idéntica a los ejemplos anteriores.

Ejemplo 3.4 Calculemos la media aritmética tomando en cuenta la in-


formación de las columnas 2 y 3 de la Tabla 2.6. Como
los valores del punto medio de clase, juegan el mismo papel de la variable,
entonces

Lxi ni (287,5)4+...+(422,5)6 36.085


K %) E 100 100 100
360,85 $
-32-

Existen varios métodos abreviados de :aculo, que en la actualidad pier


den algo de importancia, dado que casi siempre es posible contar con una cal-
culadora sea mecánica o electrónica. De manera que le prestaremos más aten -
cien a las propiedades de la medía y sus consecuencias. Es increíble cómo
ayuda el tener dominio de todo lo relacionado con la medía aritmética, en es-
pecial para estudios posteriores.

3.3

Propiedades de la Media Aritmética

La medía aritmética es un valor repre-


sentativo en el sentido de que es el centro de gravedad puesto que balancea;
a todos los valores de las observaciones que están a ambos lados de esta me-
dida.

Una primera observación, es que conociendo la media aritmética y sabien


do cuál es el número de observaciones, fácilmente se obtiene el agregado o
total de los valores, es decir

Como x = x = nx (3.5)
Por ejemplo, si se sabe que en promedio un vendedor de loterías gana u-
na comisión de 35 $ diarios, entonces, el distribuidor de billetes de lote
rías,' pagará a sus 120 vendedores, 35 x 120 = 4.200 $

Antes de ver otras propiedades, definamos lo que se entenderá por des-


víos (o desviaciones). Un deevío es la diferencia de un valor observado res-
pecto de algún otro valor. Los dos tipos de desvíos más importantes son a-
quellos en que el punto fijo de referencia es el origen (o punto cero) y a -
quellos en que el punto de referencia es la media.

Desviaciones respecto de la media: Si x. (i=1, 2, ..., n) son los n valores


obselvados, entonces los desvíos respec-
to de su media, se define

c1. 4 x.-x para cada 1=1, 2, ..., n (3.6)

1) La propiedad más importante de estos desvíos, es que la suma de to


dos ellos es nula. Es decir, para datos sin agrupar se tiene

d = X) = o (3.7)
i=1 i=1
-33-
y para datos agrupados

m m
2:: di ni = (xi - 17) ni = O
i=1 i=1
Se demuestran fácilmente aplicando las propiedades de snmatorias, por ejem-
plo para (3.7), se tiene

ras = Etxi - 3-z) = Exi - DX = nx - nx = O


Como una consecuencia lógica de esta última parte tenemos que. la media
aritmética de los desvíos es nula, o sea
EN
M (d) . — o
0 (3.8)
n n
Podemos construir una tabla de distribución de frecuencias, incluyendo
una columna para los desvíos respecto de la media. Asi, para la Tabla 3.1
tendremos.

TABLA 3.2 Desvíos respecto de la media

Observaciones Desvíos
ni
xi (xi -

3 4:# 2 - 1,7
14 3 - 0,7
5 2 0,3
6 2 1,3
7. 1 2,3

2) Si todos los valores observados son iguales, naturalmente que su


media será el valor común. Si K representa el valor observado de todas
las unidades elementales, entonces
(K) LK_nK = K
n ( 3.9)

Esto es lógico. Por ejemplo, si todos los empleados de una oficint„ gá


flan 2.000 $, entonces la media de lo que ganan es 2.000 $.

3) Si existe un factor constante en todos los valores observados, en-


tonces,

M (KX) = K M (X) (3.10)


-34-
4) La media de la suma de dos variables eseequivalente a la suma de
sus medias individuales, de esta manera,

(x + Y) = M (X) + M (Y) . (3.11)


Si se tienen r submuestras y se calculan sus respectivas muestras, en-
tonces, la media general de la muestra se obtiene promediando las metas
submuestrales ponderadas con sus tamaños correspondientes,. es decir:

n(1)M [X(1)1 + + n(r) M [X(r)]


M (x) - (3.12)
21(1) + l(r)

donde M [X(j)] es la media de la submuestra j-ésima

n(j) es el tamaño de la submuestra j-ésima

5:: n = n tamaño de la muestra.


(i)
i=1
Las identidades (3.10), (3.11) y (3.12), se demuestran fácilmente apli
cundo la definición de media aritmética y las propiedades de sumatorias

Ejemplo 3.5 La media de los salarios en una fábrica A que cuenta con
125 obreros es 875 $; y la media de los salarios de otra
fábrica similar 3, que tiene 53 obreros es 1.050 $. Cuál es el salario pro
medio de los trabajadores de ambas fábricas?. La solución es sencilla. Te
mando la relación (3.12) se tiene

125 x 875 + 53 x 1050 165.025


m (XI = :25 + 53 178 - 927,1 $

3.4

Media Geométrica

DEFINICION 3.2 La medía geométnica se define como la raíz enésima del pro-
ducto de los n valores ob'servados, o sea,

G (X) = '
12
,7x1 .1(2 xn = TT xi (3.13)
n
i=1
- 35 -
cuando los datos no están agrupados.

Si se tiene una distribución de frecuencias, entonces

G (X) = n.
xi 1 (3.14)
i=1
m

donde m es el número de valores distintos que toma la variable.

Cuando el número de observaciones es mayor que dos, se pueden transfor


mar las fórmulas anteriores mediante la aplicación de logaritmos decimales,
o sea:

log G (X) = — rn-- log x.


n i.1
(3.15)
Y

log C (X) =
n >
i.1 n. log
lo xi (3.16)

que sirven para calcular la media geométrica para datos sin agrupar y para
datos agrupados, respectivamente.

Ejemplo 3.6 Determinemos la media geométrica para la información del


Ejemplo 3.1. Como no ofrece dificultad calcular G (X)
directamente con los datos observados, veamos cómo computaríamos si se tie-
nen los datos agrupados (Tabla 3.3)

TABLA 3.3 Cálculo de la media geométrica para da


tos agrupados.

xi n. logxi ni log x.

3 2 0,47712 0,95424
4 3 0,60206 1,80618
5 2 0,69897 1,39794
6 2 0,77815 1,55630
7 1 0,84510 0,84510
10 6,55976

de manera que log G (X) = 1— (6,55976) = 0,653976


10

Luego G (X) 1 4,53


-36-
La aplicación más útil de la media geométrica, es para promediar razo-
nes de cambio.
Ejemplo 3.7 Supongamos que la población de cierta ciudad tuvo un in -
cremento de 100.000 a 250.000 habitantes durante el perío
do 1920 - 1970. Cuál es la razón promedio de cambio por década?. Si calcu
lamos mediante la media aritmética, tendremos 150 % = 5 = 30%; medida que
no es correcta, puesto que la población crece con razón compuesta. La si -
guiente Tabla muestra cómo se obtiene la razón promedio de cambio correcta:
TABLA 3.4 Cálculo de la media geométrica de cambio de
la población de cierta ciudad para las déca
das 1920 - 1970
Cambios relativos Logaritmo de los
Años Población de la población cambios relativos
(x)

1920 100.000
1930 115.000 1,150 0,06070
1940 140.000 1,217 0,08529
1950 175.000 1.250 0,09691
1960 215.000 1.229 0,08955
1970 250.000 1,163 0,06558

Total • 0,39803
I:log x 0,39803 = 0,0796
Luego log G lX2 = n 5
de donde
G (X) = 1,201, o sea alrededor de 20,1% por década,
La razón promedio de crecimiento de la población para la última década
es
lag G (x) Max. 0,06558 . 0,
006558
10

o sea G (X) = 1,015, o aproximadamente 1,5 % por ano.


Estos cálculos de lea razones de cambio promedio, se basan baje el su-
puesto de que la razón de cambio es constante. Cuando el cálculo implica
un número considerable de atas, generalmente se usa la fórmula

Po = Po (1 + r)n
donde r es la razón de cambio.
-37-
3.5

Media Armónica

DEflNICION 3.3 La medía arunióníca de una serie de valores xl, x,..., xn,
se define como el recíproco de la media aritmética de los
recíprocos de los valores observados. Así, para datos sin agrupar, se tie
ne

( x) = 1 _ 1 _ n
1/xl + 1/x2 +...+ 1/xn n (3.17)
2::1/xi
i=1

y para datos agrupados

:i (X) 1

I: 1 n E n2. ix (3.18)
1=1 xi 1 1=1

Ejemplo 3.8 Nuevamente tomando la información del Ejemplo 3.2, ten -


draMos:

H (X) = 10
2 +3— 2 10 - 4 36
— + +2— 1
+ —2 293
1
3 4 5 6 7

De la misma manera que la media aritmética y la media geométrica, la


media armónica es también afectada por los valores de
cada elemento observa
do. La media aritmética es la más afectada por los valores extremos
que
la media geométrica, y ésta a su vez más afectada que la media armónica.
Las magnitudes de las tres diferentes medidas para los mismos datos, tienen
la siguiente relación:

M (X) ) G (X) ) H (X)


Si observamos los resultados de los ejemplos 3.2, 3.6 y
3.8, efectivamentl,
M (x) = 4,7)0 (X)
= 4,53) E (X) = 4,36
GOD?1(70(
La media armónica es útil para promediat principalmente razones. Es
el caso en q ue se trata de promediar velocidades y tiempos promedio de tra-
bajo.
- 38 -

Ejemplo 3.9 Una fábrica de muebles de madera, ha asignado a cinco de


sus trabajadores para completar una orden de 200 sillas de
un cierto tipo. Las razones de productividad de los cinco trabajadores es-
tán dados como sigue:

TABLA 3.5

Trabajador Tiempo de
Producción

A 5 horas por silla


8 horas por silla
C 6 horas por silla
D 12 horas por silla
E 4 horas por silla

Se trata de encontrar el promedio de horas por silla para el grupo de


trabajadores.
Utilizando como medida la media armónica, tenemos
5 600 6,0606 horas
H (X) 1 + 1 + 1 , 1 + 1 = 24 + 15 + 20 + 10 + 30 - por silla
5 -r I "r .2
r -17
Este resultado es correcto solamente si suponemos que cada uno de los
obreros ha trabajado el mismo número de horas, o sea,
6,0606 x 200 = 1.212,12 horas (requeridas para completar
la orden)
1 212 ----=
12 242,42 horas por trabajador
luego, L---1
5

En la práctica, es posible que cada obrero de una fábrica trabaje la


misma cantidad de tiempo pero produzca diferente número de sillas. Es justa
mente en este caso que la media armónica es más realista que la media aritmé
tica, ya que
5 + 8 + 6 + 12 + 4 7 horas por silla
M (X) 5

supondría que a cada uno de los trabajadores se le asignó el mismo número de


sillas para cumplir la orden.
-39-

3.6

Media Cuadrática

DEFINICION 3.4 La medía cuadAdtíca de n valores se define como la raíz


cuadrada de la medía aritmética de los cuadrados de las ob
servaciones.

Para datos sin agrupar, se tiene

x?
M (E .1=1 1
c (3.20)
y para datos agrupados

Me 00
( 3.2 1)

Ejemplo 3.10 Tomando la información de la Tabla 3.1, se tiene que

M = 9 x 2 + 16 x 3 + 25 x 2 + 36 x 2 +49 x 1
c 10 = 4,87
La aplicación de la medía cuadrática se verá en el proximo capítulo,
cuando estemos tratando los cálculos de las medidas de variación.

3.7

Mediana

Hemos visto que


laslas medidas anteriores
están influenciadas particularmente por los
va/o4e4 de observaciones. De
esta manera, cuando hay valores extremos, generalmente la media no es una
buena medida, así por ejemplo, si la producción diaria de un obrero es nor-
mal durante 4 días de la semana, y el So. día tiene un rendimiento
casi nulo,
su rendimiento medio desciende considerablemente. Esta influencia profunda
de los valores extremos sobre la media aritmética, implica que este promedio
-40-

frecuentemente no proporcione una medida significativa de la tendencia cen-


tral, es decir, que indique un punto cercano a aquél en que la mayor parte
de los elementos están localizados, si la distribución es marcadamente obli
cua. En estos casos, a menudo se utiliza otro tipo de medida que no está
influenciada por los valores extremos, o sea que es un valor que esté situó
do en el centro del número de datos. Esta medida recibe el nombre de media-

DEFINICION 3.5 La medían (M ) es un valor de las observaciones que divide


en dos parteseiguales al número total de observacíones,cuan
do éstos están ordenados de acuerdo a sus valores.

Es decir que cuando la serie de observaciones está 4Adtttaáa según sus


valores, la mediana es un valor observado, tal que antes y después de éste
valor, hay el mismo número de observaciones. Así por ejemplo, supongamos
que se tienen lossiguientes valores observados: 4,5,8,2,7,2,3. Previamente
se los ordena, o sea, 2,2,3,4,5,7,8; luego, la mediana es 4. Ya que antes
del 4 hay 3 observaciones, igualmente hay 3 observaciones por encima del 4.

Cuando se tiene un número par de observaciones ordenados, por ejemplo,


3,4,6,7,7,8, no hay un valor observado que satisfaga plenamente la defi -
ción de mediana. En este caso, podría ser cualquier valor comprendido en -
tre 6 y 7; pero en la práctica, se usa el punto medio de entre los dos valo
6+7
res centrales, por tanto, la mediana será Me = 2— - 6,5
La característica típica de la mediana es que divide al conjunto de ob
servaciones en dos partes iguales; es decir que el 50% de las observaciones
tienen valores menores que la mediana, y el otro 50% de las observaciones
tienen valores mayores. En cierto sentido, la mediana es también un punto
de equilibrio, puesto que balancea al número de elementos de la serie esta-
dística.
Una propiedad interesante que tiene la mediana es que ,"la suma de los
desvíos respecto de La mediana en valor absoluto, es menor que la suma de
los desvíos respecto de cualquier otro punto én la distribución." Es decir
que Elx. - m I es un mínimo. Una aplicación simple de esta propiedad, es
la locaulacmal óptima de un punto.
Ejemplo 3.11 Supongamos que en las inmediaciones de una carretera hay
siete poblaciones, cuyas distancias en kilómetros son la
siguientes:
Poblaciones: PI P2 P3 P4 P5 P6 P7
I 1 r 1

Kilómetros: 0 10 42 72 94 130 136 150

Cada población debe surtirse diariamente de un frigorífico distribui-


dor de carne. Para minimizar el total de las distancias de las siete po
blaciones al frigorífico, ¿dónde debiera estar localizado éste? Natural -
- 41 -

mente que no serán las poblaciones extremas, como PI o P7. Recordando que
la SUMA de los desvíos absolutos respecto de la mediana es un mínimo, es fá
cil decidir que el frigorífico será localizado en la poblción P4 (o en su
vecindad). La mediana es 94 kilómetros, ya que el camino total a recorrer-
se hasta este punto de las otras poblaciones es de 292 Km. Si se localiza,
el frigorífico en cualquier otro punto, la suma de las distancias será mayor.
Por ejemplo, para la población P3, la suma es 314 Km. La siguiente Tabla
nos muestra dichos cómputos:

TABLA 3.6 Cálculo de la distancia mediana

Población Localización Distancia


de P3 de P4

P1 10 62 84
P2 42 30 52
P3 72 0 22
P4 94 22 0
P5 130 58 36
P6 136 64 42
P7 150 78 56

Total Kms. 314 292

Si se probara localizar en cualquier otra población la distancia total a


recorrerse, será mayor que si el frigorífico está localizado en la "pobla -
ción 4".

Hasta aquí, unicamente nos hemos referido a la determinación de la media


na, cuando los datos no están agrupados. Ahora nos toca ver cómo se calcula
rá en el caso de tener una distribución de frecuencias, cuando la clase es
única y cuando se tienen intervalos de clase.

1) Cuando la clase es Gníca: Sea N. la j-ésima frecuencia absoluta acumu


lada inmediata superior a n , entonces:
2
a) Si — ), N. M = x.
2 3-1 e
x. + x.
b) Si — = N. Me 1-1 3
2 3-1 2 (3.22)

donde x. y .son los valores j-ésimo y (j-1)-ésimo delas l N. y N.


x3-1 ces-
3-1
pectivamente. Esto mismo, en términos gráficos (Ver figura (3.1)
-42-

Ni

Nj

n/2

1j-1

X
xj_1
Figura 3.1 Localización de la mediana para una distri-
bución de frecuencias como el de las Tablas
2.3 y 2.4
Entonces, para calcular la mediana se debe determinar previamente n, y
2
luego ver si éste valor es menor o igual que una j-ésima frecuencia acumula
da, y luego seguir la regla (3.22)
Ejemplo 3.12 Utilicemos la información de la Tabla 2.3, que es:

TABLA. 3.7
Frecuencias Frecuencias
Calificación Absolutas Absolutas
X ni Acumuladas

10 4 4
20 6 10
30 11 21, - -- ?S
.40 12 33
50 8 41
60 7 48
70 2 50

Vemos que 1= 25 es un valor que estl comprendido entre 21 y 33 de las


frecuencias acumuladas, es decir 21425(33 (lo que equivale en símbolos a
Nj_a < 1421j).
Entonces, como 25)21, o sea plIj_i,por a) de (3.22), se tiene Me = xj

en consecuencia, Me = 40
-43-

2) Cuando se tienen intervalos de clase: Bajo los mismos supuestos del


caso (1) la mediana se obtiene como sigue:
- N.
_n > Ni
a) Si i
1
2
He = xj-1 + ej N. - N.
3-1
(3.23)
j 3-1

b) Si -11
2 = Ni_1==>Me = x.

donde c. es el tamaño del intervalo de clase. Todo esto, se deduce de la


-. Figura 3.2
N.
3.

Ni

n/2

X
x Me x.
j-1
C.
3
Figura 3.2 Localización de la mediana cuando se tiene una varia-
ble continua o una distribución con intervalos de cla
se.
Vemos que la mediana será

Me = x. +d
j-1
El cálculo de d, es como sigue:

N1 N. n
1 j-1 _ 2 i-1
c.
3
de donde n
d =
- -1
cj N. - N. ,
J J-1

Entonces, para calcular la mediana cuando se tiene una tabla de distribu


ción de frecuencias con intervalos de clase, es necesario utilizar la e
liorna de frecuencias absolutas acumuladas, luego encontrar la clade cue con-
tiene la mediana y finalmente interpolar la mediana a partir de los valores
incluidos en dicha clase. Este procedimiento lo ilustraremos en el siguien-
te ejemplo:
Ejemplo 3.13 Tomemos la Tabla 2.6 que corresponde a la distribución de
frecuencias de salarios semanales de 10C obreros.

TABLA 3.8

Ingresos Número de Acumulación


(intervalo de Obreros del número
clase) de obreros

260 - 295 4 4
295 - 310 5 9
310 - 325 10 19
325 - 340 9 28
340 - 355 Y. 13 41

15 56 Clase mediana
1755
...., - 370 ,,

Y(r, 370 - 385 y e La. 74 ..


' %e .. '385 • 400 ' I 12 86
400 - 4.0 8 94
415 .. 430 6 100

Hay 100 obreros en la distribución. La mediana debe ser al final dt1


50 aND elemento en la distribución. Entonces Nj =56 y Ki_i = 41, luego
Lfe = 355 + a.

Como o. = 15, entonces, aplicando el cálculo de d, tenemos


d. = 15 51Lz12.-
56 - 41 = Y

En consecuencia, 14 = 355 + 9 = 364 $


-145-

3.8

Cuartiles, Deciles, Percentiles

Como hemos visto, cuando se trata de


encontrar un valor que divida al número total de observaciones en dos partes
iguales, la medida adecuada para este fin es•la mediana. Pero otras veces
_ puede uno estar interesado en hallar un valor que esté situado, ya no al cen
tro del número de observaciones, sino por ejemplo, en la primera cuarta•par-
te o en la tercera cuarta parte. Las medidas para este fin, se denominan
cuantites. El método para hallar un cuartil, es completamente pálogo al ca
so de la mediana; o sea utilizando n para el primer cuartil, y n para el
tercer cuartil. Podemos observar, de inmediato, que el segundo cuartil, 16-
gicamente, coincidirá con la mediana, puesto que an1=.1.1-
1-- 2 •
Si los porcentajes de división fueran del 10%, entonces las medidas que
separen el número de observaciones e4 décimas de parte, se llaman decaC4.
.Ea este caso también, se calcula en forma idéntica que para la Me, con tal
que se use parael primer decil, para el segundo decil, etc.
10
10
Finalmente, los centites se interpretan en forma análoga, utilizando a
Esto es lo que se llama también percentiles o porcentiles.

3.9

Moda

Otra medida de tendencia central, es la


moda o (modo o valor modal), que se define como sigue:
DEFINICION 3.6 La moda es un valor distinto observado de una serie estat.Isti
ca que se repite más veces.

De esta manera, el valor modal es el valor más frecuente en una seria de


datos. Es evidente que la moda no siempre estará en el centro, sino que, co-
mo ocurre a menudo, puede ser un valor extremo.

La moda para datos no agrupados de unos pocos valores pued!obtenerse por


simple inspección, así por ejemplo, si tenemos las series:
- 46 -

, 2,5, 7, 9, 9, 9, 9. 11, 12 : la moda es Flo = 9

3, 5, 8, 10, 12, 15, 16 : no existe la moda

2, 3,4,4, 4, 5, 5,7, 7, 7, 9: tiene dos modas, o sea Mo= 4 o 7

Cuando hay dos modas, se dice bímodal, y en el caso de existir más de dos
se conoce con el nombre de mita:SU.
Si se tienen datos agrupados, tal que los valores de la clase son únicos,en-
tonces la moda, es obvio que sea la que tiene mayor frecuencia, así en el
ejemplo 3.2, la moda es 4.
Cuando se Cene una distribución de frecuencias con intervalos de clase,
la moda se determina por interpolación, es decir

di
mo = xj -1 (d, d2 c (3.24)

donde = límite inferior de la clase modal (o sea el intervalo que tiene


mayor frecuencia)

d1 = diferencia. entre la frecuencia de la clase modal y la frecuencia


premodal
d2 = diferencia entre la frecuencia de la clase modal y la frecuencia
de la clase post modal.

c = tamaño del intervalo de la clase modal.

Esto mismo, gráficamente, se tiene:

Clase
Modal

/ 32

xj_i u o xj xd

Figura 3.3 Interpolación geométrica de la Mo, para una distribución


con intervalos de clase.
- 147 -
Ejemplo 3.14 DetermineMbs la Moda para la información del ejemplo 3.13
Vemos que en la Tabla 2.6 (la misma del ejemplo 3.13), la clase modal
es 370-385, ya que en este intervalo hay e2 mayor nlmero de observaciones.
Entonces

xj = 370
= 18 - 15 = 3
= 18 - 12 = 6
e = 15

Ahora, aplicando la fórmula (3,2W), tenemos

Mo = 370 +
3+6 . 15 = 375 $

Hagamos una observación importante: si se tomara directamente la informa -


clon original (Tabla 2.5), hay valores de los ingresos que se repiten más
veces que 375, así por ejemplo, el 380 se repite 7 veces, mientras que 375
solamente 5. Dejamos al estudiante la interpretación y análisis de este he
cho.

3.10

Relaciones entre Media,


Mediana y Moda

De acuerdo a la simetría o asimetría


de los datos observados, podemos ver la relación empírica entre la media,
mediana y moda (Figura 3.4).

En general, cuando la distribución es casi simétrica, la mediana se lo


caliza aproximadamente a un tercio de la distancia entre la media y la moda.
La fórmula que describe esta relación es

Moda = Media - 3 (Media - Mediana)


(3.25)
Para el ejemplo de los salarios semanales de los 100 obreros, la moda
aproximada será

Mo = 360,85 - 3 (360,85 - 364) = 370,3

Es
importante notar que la moda obtenida por este método aproximado,
no necesariamente coincide con la moda calculada mediante la interpolación.
-48-

Media
Mediana
Moda

Moda t r Media
Mediana

Figura 3.4 Ejemplos de distribuciones de frecuencias: simétrica,


asimétrica a la derecha y asimétrica a la izquierda.
-49-
3.11

Ejercicios

1. Calcular la media aritmética, mediana y la moda, tomando la informa-


ción de los ejercicios 8, 10, 11 y 12 del Capítulo 2.

2. Calcular la media, la mediana y la moda de las siguientes distribu -


ciones de frecuencias:

2.1 Puntajes No. de alumnos 2.2 Salarios


S
No.de obreros
40 - 44 2/2 2 Z 60 6
45 - 49 2( 0 0 70 1
50 - 54 ,..?. 5 ?
IV 80 3
55 - 59 , 7 132 1
60 - 64 er? 9 13
150 1
65 - 69 (.:; 11 74 500 1
70 - 74 1¿ 6 9°
75 - 79 /1 8 4i
80 - 84 4 5?
85 - 89 z' 2 $9
90 - 94 2 S

Cuál es su opinión sobre los resultados?

3. Señale y justifique la respuesta correcta de las siguientes asevera-


ciones:

3.1 La media aritmética debe coincidir con algunos valores que toma
la variable, si ésta es discreta.

3.2 El promedio de las notas de un curso fué de 58. Las mujeres ob-
tuvieron un promedio de 38y los hombres un promedio de 64. Lue
go, el curso tiene más de 90 alumnos.

3.3 Mientras menos intervalos se empleen, más precisa es la media a-


ritmética calculada.

3.4 El ingreso real medio de los obreros agrícolas es S 350, el de


los mineros $ 540 y el de los industriales $ 640; es decir, el
ingreso medio del conjunto de obreros es de $ 510.
3.5 La suma de los desvíos respecto de la mediana es cero.

3.6 Para calcular la media geométrica, es preciso que todos los in -


tervalos sean iguales.
-50-
3.7 El 75% de los empleados públicos son hombres, mientras que en el
sector privado es el 81%. Esto es, hay un 22% de mujeres emplea
das en ambos sectores.
3.8 La media arm5nica de una constante es igual al recíproco de la
constante.
3.9 Los siguientes datos son consistentes:

a)h2 = 0,4 ; hl = 0,2 ; H3 = 0,8 ; n = 50 ; n4 = 5 ;

= 25 ; t = 30
2- 2
b)m = 5 ; 2 Xi ni = 400 ; X = 5 ; h5 = 0,1
i=1

H3 = 0,5 ; n4 = 8

4.En una oficina de empleados públicos hay 35 hombres con una edad me-
dia de 27,5 años y 15 mujeres las que, en promedio, son un 22% más
jóvenes. Cuál es la edad media de los empleados?

5.Un auto sube a La Cumbre a 30 Kms por hora y baja a 60 Kms por hora.
Cuál es la velocidad media?

6.Las distribuciones de los ingresos de dos ciudades son las alguien -


tes:

CIUDAD "A" CIUDAD "E"

Población Ingresos Anuales Población


Ingresos Anuales Remunerada
por habitante Remunerada por habitante
(ea miles de $) (en miles de $)
3.000 6-9 1.000
8-10 2.000
10 - 12 8.000 9 - 12
4.000 12 - 15 5.000
12 - 14 2.000
14 - 16 1.000 15 - 18
400 18 - 21 1.500
16 - 20 1.000
20 - 22 100 21 - 24
24 - 27 400

6.1 Calcule el ingreso promedio del 40% de la población de mayores


ingresos en cada ciudad. Compare los resultados y discuta sus
conclusiones. Realice el mismo cálculo para el 50% de la pobla
ción de menores ingresos.
6 2 Cuál es el ingreso promedio de las dos ciudades en conjunto?
- 51 -
6.3 Suponiendo que la ciudad B devalúa su moneda en 30% y la ciudad
A en 5%, calcule los nuevos ingresos promedio en ambos países.
7. Al revisar algunos archivos de datos estadísticos, se halló la si -
guiente información:

Tipos de Alquiler Uslero de


$b. Familias
100 - 300 200 20 L

300 - 500 <kW 120


500 - 700 top 160
700 - 900 600 .
900 - 1.100 1000 30
1.100 - 1.300 1200 10

Se trata de averiguar el número de familias que pagan alquileres en


tre $b. 700 y $b. 900, sabiendo que el promedio de alquileres es de
$b. 670.

8. Un Club de tenis tiene socios en las villas A(12%), B(15%), C(13%),


D(25%), E(9%), F(11%), 0(7%) y H(8%), situadas a lo largo de una ca
rretera. Las distancias entre las villas son: 6 Km. de A a 8; 3 Km.
de B a e; 8 Km. de C a D; 7 KM. de D a E; 6 Km. de E a P; 15 Km. de
FaGy9 Km. deGaH. Dónde debe situarse el campo deportivo de
manera que minimice los gastos de transporte si todos los socios
concurrir/u habitualmente, Suponga que el costo de transporte por
cada Km. es constante en toda la región.
- 52-

CAPITULO 4

MEDIDAS DE DISPERSION

En el presente capítulo estudiaremos


una característica importante de las distribuciones de frecuencias que es
el grado de variación o de variabilidad, que algunas veces se llama «OCA
&eón de los valores observados. Una medida de dispersión es importante
desde dos puntos de vista: en primer término, puede ser usada para mostrar
el grado de variación entre los valores de los datos observados. Por ejem
plo, una pequeña dispersión de los salarios mensuales de un grupo de traba
jadores en una fábrica, indicará que a los obreros se les paga salarios a-
proximadamente iguales;yor otro lado, una dispersión grande, dará la idea
de que los salarios son muy diferentes. En segundo lugar, puede ser usada
para complementar un promedio,para describir un conjunto de datos o para
comparar una serie de informaciones con otra. Cuando la dispersión es bar
ja, el valor promedio se vuelve altamente significativo, o sea que la me -
dia es un valor realmente representativo; en cambio, si la dispersión es
alta, la media se vuelve poco o nada representativa.

Si por ejemplo, se tuvieran loa números 1, 3 y 11, la media de ellos


es 5; mientras que la media de los números 3, 6 y 6, tadoién es 5. En el.
primer caso, el valor de la media no está próximo a ningún número del gru-
po, por tanto, se espera una alta dispersión; en cambio en el segundo caso,
la media está próximo a cada número del grupo, por lo que se espera una me
nor dispersión. El hecho de que la medida de dispersión del primer grupo
de números es más alta que el de la segunda, da una mejor comprensión en
la comparación de las medidas de los dos grupos de datos (el ejemplo 4.8
aclara más esta idea).
Cuando se habla de dispersión, es natural que se trate de medir las
diferencias o comparaciones respecto de algún valor, tal que nos indique
en promedio las variaciones que existen entre los valores observados compa
radas con dicho valor. Generalmente para medir las variaciones se toma co
mo referencia un punto central de los valores observados, tal como la me -
dia. Una de las medidas de dispersión más importantes es la desviación es
ténder, que es una medida que considera qué tan lejos de la media estén lo
calizados cada uno de los valores de la serie estadística en observación.
De esta manera, parece lógico pensar que mientras menor sea la desviación
estándar de una distribución de frecuencias, más significativo será gene -
ralmente un promedio como medida de la tendencia central para dicha distri
bución. El uso de esta medida es grande debido a que nos permite tomar en
cuenta los elementos de variación para extraer conclusiones sólidas y to -
mar decisiones apropiadas de la información disponible. En los capítulos
subsiguientes, se verán muchas aplicaciones de esta medida.
-53-

Veremos a continuación con cierto detalle, cada una de las distintas me


didas de dispersión y sus propiedades.

4.1

Recorrido

La medida más simple de la dispersión


de un conjunto de observaciones es el Aecohaída (o rango), que es la diferen
cia entre el mayor y menor valores observados.

DEFINICION 4.1 Si denominamos R al recorrido, xmax al valor máximo observa-


do y xmin al menor valor observado, entonces

R = xmax xmin (4.1)


Ejemplo 4.1 De los valores dados en la Tabla 2.5 se observan que,
4.

xmax = 43° Y xmin = 280

luego el recorrido es

R = 430 - 280 = 150

Esta medida no está afectada por los valores comprendidos entre el valor
más alto y más bajo, por tanto, el recorrido no es un estimador muy relevan-
te.

El recorrido es la medida más simple que sirve como complemento de la me


dia, por ejemplo: el promedio de producción de un grupo de trabajadores en
una fábrica A, puede ser 50 unidades diarias con un recorrido de 20 a 65 uni
dates; y el promedio en una fábrica B, puede ser también 50 unidades, pero
con recorrido de 35 a 60 unidades. Considerando loa dos diferentes recorri-
dos, podemos concluir que el proiedio es más representativo de las unidades
producidas por los trabajadores de la fábrica B comparado con la producción
promedio de la fábrica A.
-54-

4.2

Desviación Media

Una primera medida basada en todos los


elementos observados y diseñada para medir la dispersión alnededox de un
promedio, es la llamada deevide./An mita o desviación pAomedío. La medida
de referencia puede ser la media o la mediana. Por ser de mayor aplicación,
veremos la.desviación media (DM) respecto de la media.
DEFINICION 4.2 La desviación media es simplemente la medía aritmética de
los desvíos de los valores individuales con respecto al promedio de
ellos mísmos.
Como teóricamente la suma de los desvíos respecto de la medía es nula
(Sección 3.3 del capítulo 3), es decir Ed = 511(x - x) = O, para el cálculo
de la desviación media, se usan los valores absolutos de los desvíos; de
esta manera, si se tiene un conjunto de valores sín ordenar, la DM será:

i=1 Ixl - xl (4.2)


DM a M(Idi) -

y para datos agrupados,

DM= 24( VII i-1 (4.3)

En ambos casos, se supone que se está trabajando con n observaciones.


Como puede apreciarse por (4.2), el cálculo de la DM es muy simple. Prime-
ro se calcula la media aritmética de los valores observados; luego los des- •e
víos de las observaciones respecto de la media y, finalmente se determina
la media aritmética de los valores absolutos de los desvíos. Ilustraremos
este proceso con los siguientes ejemplos:
Ejemplo 4.2 Sea la información del ejemplo 3.1 del capítulo anterior
:Ver Tabla 4.1)..
-55-

TABLA 4.1 Cálculo de la desviación media, pa


ra datos sin agrupar

d=x-1 ¡di =jx-il

3 - 1,7 1,7
4 - 0,7 0,7
5 0,3 0,3
4 - 0,7 ' 0,7
6 1,3 1,3
5 0,3 0,3
4 - 0,7 0,7
6 1,3 1,3
7 2,3 2,3
3 - 1,7 1,7

E 0 11

De manera que la desviación media es

DM =
E Id I 11
- 1,1
10
Desde el punto de vista práctico, puede obviarse la segunda columna.
Ejemplo 4.3 Sea ahora la información del Ejemplo 3.2 y la Tabla 3.2

TABLA 4.2 Cálculo de la desviación media pa


ra datos agrupados

Xi ni Vil ni
3 2 1,7 3,4
4 3 0,7 2,1
5 2 0,3 0,6
6 2 1,3 2,6
7 1 2,3 2,3

E 10 11

Luego, Dm = Diluí - 11 = 1
- 4,1
10
Como se ha visto, la DM considera a todos los valores observados para su
cálculo, por lo tanto, da una mejor descripción de La dispersión. De manera
que nos mide la dispersión alrededor del valor promedio. Sin embargo, esta
medida es un poco débil puesto que se ignora el signo positivo o negativo de
las desviaciones.
-56-
Una medida más fina o más adecuada de la dispersión, es la que recibe el
nombre de daviacían U-tanda/t.

4.3

Desviación Estándar y Variarme.

La medida del grado de variación de una


distribución de frecuencias más comunmente usada en el análisis estadístico,
es la deusLacíM utand44 •. Es la más importante de entre todas las medí -
das de dispersión, de ahí que, le prestaremos la mayor atención posible,
puesto que de ello dependerá nuestro éxito cuando se hagan aplicaciones y se
puedan tomar conclusiones sólidas de decisión. Una medida que en cierto mo-
do es previa a la desviación estandar, es la varianza, que es una medida de
dispersión de excepcional importancia. La ventaja de estas dos medidas, a
diferencia de la DM, es que consideran a los desCros con sus respectivos sig.
nos.

Cuando se toman a todeA los elementos de una población en estudio, se u-


san los símbolos cr2 y Cr, respectivamente, para indicar a la varianza pobló
cional y desviación poblacionel. En cambio, si los valores provienen de una
muestra de n observaciones, se usará s2 y a, para indicar a la varianza mues
tral y desviación estandar muestra', respectivamente. En general, usaremos
el operador V(X) para indicar la varianza-de una variable X que indica una
característica cualquiera de la población en estudio.

DEPINICION 4.3 La vaaíanza de n observaciones de una variable X, está defi-


nida como sigue:
E (Ai - 1
7)2
2
s = V (X) a M(d2)- isl - M [(X - M (49 (4.4)

--yseala desviación estándar, se define como la raíz cuadrada de la varianza, o


E(X' 5C1 2
5 = FT ai 1 (4.5)
Las expresiones (4.4) y (4.5), se utilizan para calcular la varianza y
desviación estándar de datos sin agrupar, es decir cuando se tiene el conjura
to de observaciones originales. ,En el caso de tener una distribución de fre
cuencias, es decir datos agrupados, entonces la varianza y la desviación es-
• Algunos autores llaman también desviación Uptca o
-57-
tíndar se Calculan segán las fórmulas
2
7-- oci z ni
2
s = V(X) = i-1 n (4.6)

-2
21:(xi - x) ni
s

Loe dos ejemplos siguientes nos muestran el procedimiento general de


cálculo.
Ejemplo 4.4 Tomemos la información del ejemplo 4.2
TABLA 4.3 Cálculo de la variansa para da-
tos sin agrupar

-2
xi d.=x.-x¿=(x.-x)
2.

3 - 1,7 2,89
4-- - 0,7 0,49
5 0,3 0,09
4 - 0,7 0,49
6 1,3 1,69
5' 0,3 0,09
4 - 0,7 0,49
6- 1,3 1,69
7 2,3 5,29
3 - 1,7 2,89

n 0 16,10

De manera que 16 1
V(x) - M (d2) --I— 1,61
10
y la desviación estándar será

.1767 = 1,2689

Ejemplo 4.5 Sea el ejemplo 4.3


- 58 -

TABLA 4.4 cálculo de la varianza para datos agrupados

xi ni d d2=( xi-x) 2 ni
kxrx).

3 2 - 1,7 2,89 5,78


4 3 - 0,7 0,49 1,47
5 2 0,3 0,09 0,18
6 2 1,3 1,69 3,38
7 1 2,3 5,29 5,29

5:: 10 16,1

Luego, V1X) = E(71- 7)2 ni - 16,1


n 10 = 1,61

8 =.5703
,171 = 1,2689
Y

A continuación veremos las propiedades más importantes de la varianza,


que obviamente implican las propiedades de la desviación estándar.
PROPIEDADES:

En lo que sigue, supondremos que se tienen n valores observados xl, x2,


xn de una característica particular X de la población.
TEOREMA 4.1 V(X) / 0 (4.7)
Demostración: Por definición, V (X) = M (d2), y cono dl = (xi - i)2 ) O
cualquiera que sea el valor de di, entonces M (d2)) O
TEOREMA 4.2 Si todos los valores de X son iguales a una constante K, enton
ces
V (K) = O (4.8)
Demostración: Por definición, V (K) = MRK - M (10 , pero como

M (K) = K (por 3.9), entonces


M (K - K)2 = M (0) =0
TEOREMA 4.3 Si K es una Constante cualquiera, entonces
(x + K) = V (X) (4.9)

- 59 -
Derostracióc: V (X + K) • M {[(X + K) - M (X + K)] 2}

•M {[X + K - /I (X) - M (K)] 2}

•M [X - M (XB 2}• V (X)

TEOREMA 4.4 Si K es una constante cualquiera, entonces

✓ (KX) at K2 V (X) (4.1C)

Demostración:. Por definición

✓ (KX) [(►CC- M (KX)) 21= M [(KX - KY.(X)) 21


/.1 ([1( (X-14(X») 21= M [K2 - M (X» 21
K2n [(K M(X))) 21= K2 V (X)

TEOREMA 4.5 V (x) ■M (I2) - (M (XII (4.11)


+ (702)
Demostración: Y (x) I:(xi-1) 2 .

▪ - 271::x1 n (1)2

2 _ — 2 r 2 .7,42
- 2x x + (x) -

▪ M (x2) - (M (X)) 2

Esta última propiedad, que es una forma equivalente de escribir la va -


rianza, es muy Uta para trabajos de computación. La gran ventaja, radia
en que no es necesario el cálculo de los desvíos. Entonces, para fines de
cálculo recomendamos usar las siguientes fórmulas:
Para datos sin agrupar 2
[4- ai 1/ n
4
V (X) • (4.12)

y para datos agrupados


m 2 2
m'
1.n' xini
1=1
(x)
(4.13)

Ejemplo 4.6 La siguiente Tabla nos muestra ejemplos prácticos para ac-
tas últimas tres propiedades.
TABLA 4.5 Cálculos para la propiedad (4.11) aplicados a los teoremas
4.3 y 4.4

Cada valor de X es Cada valor de X es


Datos Originales
incrementado en 5 multiplicado por 3

Valor
X X2 X + 5 (X + 5)2 3X (3X)2

1 1 6 36 3 9
2 4 7 49 6 36
4 16 9 81 12 144
5 25• 10 100 15 225
E 12 46 32 266 36 414

14(X) =1= 3 M (X+5) 11= 8 M (3X) = 46 = 9

M(X2) = X
46 = 11,5 M (x4.92 = 266 = 66'5 m (3X)2 w111. .103,5
'

VeX1 = 11,5-9 = 2,5 V(X+5) = 66,5-64 = 2,5 V(X) = 103,5-81=22,5


= 32 (2,5)

Nota: Eh el caso de tener datos agrupados, los cálculos son idefiticos, te-
niendo únicamente cuidado no olvidar de multiplicar los valores por
sus frecuencias '(n-
1)•
' Ejemplo 4.7 Calculemos las varianzas para los Ejemplos 4.4 y 4.5, apli-
cando la propiedad 4.11.

TABLA 4.6 TABLA 4.7


m2 2
xi X2
i x ni i mi ni

3 9 3 2 9 18
4 16 4 3 16 48
5 25 5 2 25 50
4 16 6 2 36 72
6 36 7 1 49 49
5 25
4 i6 E 10 237
6 36
7 49
3 9
E 147 237
- 61 -
Entonces pare la primera Tabla (datos sin agrupar), tenemos

V(X) = 237
- - (4,7)2 = 1,61
10
y para la segunda
V(X) = glI - ( 4,7)2 = 1,61
10
E emmlo 4.8 Los salarios percibidos por un grupo de 25 empleados en
dos empresas privadas se da en la siguiente Tabla.

TABLA 4.8 Comparación de salarios de los empleados de dos empresas


privadas

SALARIOS EMPRESA A EVPRESAB


(En cientos de $) xi 11;desEm- 2 ni No. de Em- 2 ni
x; Aleados xi

5 a 10 7,5 1 56,25 5 281,25


10 a 15 12,5 3 468,75 1 156,25
15 a 20 17,5 8 2450,00 3 918,75
20 a 25 22,5 5 2531,25 7 3543,75
25 a 30 27,5 6 4537,50 5 3781,25
30 a 35 32,5 2 2112,50 4 4225,00

E 25 12156,25 25 12906,25

STA 27'50 - 21,1


- - ' 25
xAA * 2.'
110 $
r. 527,50 = 21,1 13 .
1 2.110 $
i1 2

. sA = 12.156,25 (21,1)2 = L86,25 - 445,21 = 41,04


25

SA = 41,04 o. 6,4063 ===> 640,63 S

-2 = 12.9c.6,25
S2
25 _ 445,21 = 516,25 - 445,21 = 7144

S3 = 1/7174. 8,4285 842,85 $

Como puede apreciarse, si bien el ingreso promedio de los empleados en


ambos empresas son iguales, vemos que hay mayor dispersión en salarios que
perciben en la empresa B.
-62-
Es importante notar que la desviación estándar, como una medida descrip-
tiva, es esencialmente una media; y como se trata de una media de desviacio-
nes, una desviación estandar pequeña indica un alto grado de uniformidad de
las observaciones ¿e la serie estadística; y si la desviación estándar es
un valor grande,nos indica poca uniformidad en los datos observados. De es-
ta manera, si se comparan dos o ale series, que tienen aproximadamente la
misma media, el más representativo será aquél que tenga menor desviación es-
tándar. (Ver ejemplo 4.8).

4.4

Dispersión Relativa

Las medidas de variabilidad absolutas,


como las que acabamos de ver, no siempre son posibles de utilizar, por ejem-
vio, para comparar dos conjuntos de valores, sobre todo si éstos tienen dis-
tintas unidades de medida. Por ésto, en muchos problemas, una medida de va-
riabilidad relativa para distribuciones de frecuencias suele ser más signifi
dativa que la variabilidad absoluta.

Si dor conjuntos de valores se están comparando, loa valores absolutos


son convenientes solamente cuando los promedios de los dos conjuntos son
aproximadamente del mismo tamaño y las unidades de medida son idénticos. E-
fectivamente, la comparación de dos diferentes unidades de medida, tales co-
mo némero de libros comparados con el número de horas de viaje, no tiene sen
tido. Incluso cuando las unidades son las mismas, la comparación del grado
de dispersión basados en los valores absolutos de los diferentes conjuntos
suele ser aún difícil. Así por ejemplo, supongamos que se tiene la siguien-
te información: El ingreso medio mensual de cierto grupo de trabajadores a-
dultos es x 1.875 $ con una desviación estandar s= 285 $; en tanto que el
ingreso medio mensual para un grupo del mismo tamaño de voceadores, es 315 $
con una desviación estihdar de 80 $. No se puede concluir que la desviación
estándar más alta (285 $)de el más alto grado de dispersión (en los ingresos
de los trabajadores adultos). La desviación estándar es significativa sola-
mente en relación con la media respecto a la cual se calcula.

De esta manera es que se requiere de una medida de dispersión que expre-


se en términos relativos, para comparaciones como los casos indicados ante -
riormente. En general, una dispersión relativa es el cociente de una medida
dada de dispersión dividida por el promedio con respecto al cual las desvia-
ciones fueron medidas.

La medida de dispersión relativa más usada es el coeficiente de varia -


ej.& (CV)
- 63 -
DEFINICION 4.4 El cc:Aliciente de vaMacíón está dada por

(4 .14)

donde s es la desviación estándar y 171a media aritmética, de un mismo


conjunto de observaciones. O también 1.100% *(en términos de porcen
taje).

Así, en nuestro ejemplo hipotético, para los trabajadores adultos, se


tiene Ov -421- =0,152 o sea 15,2 %, mientras que el coeficiente de varia -
-1075
ción de los ingresos de loa voceadores es CV = —80= 0,254 o sea 25,4 %. De
515
esta manera, es posible hacer comparación de la variabilidad de los ingre -
nos promedio de ambas poblaciones. Como puede apreciarse, la variabilidad
de los ingresos de los voceadores es mayor que la de los trabajadores adul-
tos.

Otro coeficiente también usado con bastante frecuencia, es el cogíaían


te de deevíaeLdn mod7a, que esta definida por:
CD DM
(4.15)
Se interpreta en forma análoga al caso anterior.

Vale la pena mencionar algunos otros tipos de medidas, pero que no son
de dispersión propiamente dicha. Así por ejemplo, tenemos el esegteZente
de asiMetta (cAs)

CAs - M (X)
3 - Eb (4.16)
que nos mide el grado de asimetría. Pb general se presentan los tres casos
de la Figura 4.1.

* Finé Pearson quién usó por primera vez este coeficiente.


-64-

Mo
CAse O

M No
o
CAs <o C Ao > O
Figura 4.1 Ejemplos de asimetría: El primer caso muestra sim
tría perfecta. El segundo caso se dice que tiene
asimetría negativa; y el tercer caso indica asimet
positiva.

Una medida dula mayor o menor concentración alrededor de la media, es


el coellieLente de apuntamiento, que es
4
M (d ) (4.17
CAp (Xf

que cumple las siguientes relaciones:

Si C = 3 indica distribución normal


Ap
Si CAp > 3 indica apuntamiento hacia arriba

nC
Si C < 3 indica apuntamiento hacia abajo
Ap
>3
Ap

Ap = 3

Figura 4.2 Ilustración aproximada del mayor o menor apuntamiento


relativo
-65-

Ejercicios

1. Determinar el recorrido, la desviación media, la desviación estándar


y el coeficiente de variación para los Ejercicios 8, 10, 11 y 12
propuestos en el Capítulo 2.

2. Si las calificaciones numéricas obtenidas en los exámenes finales de


un curso, cuyo promedio aritmético es 5,3 con 52 • 0,2 fuesen modifi
cedas:

a)por adición de un punto a cada una de ellas, ó


b)por elevación general de un cinco por ciento.

Qué efecto producirían estas modificaciones en la nota media y en la


desviación estándar de dichas notas?.

3. En el país. A el ingreso per-cápita es de $ 2.000 y $ = 500 $. En el


país B se tiene el mismo ingreso por persona, pero la desviación es-
tándar es S 1.000. En qué país es más uniforme la distribución del
ingreso?

4. La variante de dos números es 1 y su media aritmética 8. Calcule


los números.

5. Las notas de 50 alumnos se clasifican en una tabla de frecuencias


con cuatro intervalos de igual magnitud. Se pide calcular la va-
riante sabiendo que:

x2_,• 50 ; nl = 4 ; N2 = 20 ; n3 = 25 y SZ - 62

6. En un estudio se obtuvo el resultado del cuadro siguiente:

1 1 i /1 1-1
2 6 ,..1 é
3 7 21 ri
4 Lly O
5 I -1
'59

Si se sabe que la medía es 3 y la variante 0,95, se pide calcular


las frecuencias absolutas. que faltan.

7. El coeficiente de variación de los sueldos de 200 empleados de una


empresa es 57%. Después de reajustar todos los sueldos en $ 110,
-66-
el coeficiente vale 50%. Además, la gerencia fija un sueldo mínimo
de $ 710, lo que veneficia a 35 empleados, que antes del reajuste
ganaban menos de $ 600, con un sueldo medio de $ 400. Se desea sa-
ber cuál será el pago mensual total de la empresa, después del rea-
juste.
8.Determine si las siguientes relaciones son posibles:
8.1 2 ni = 3.000; n = 50 ; ;ro 62

8.2 DM= 47 ; S = 38 ; n = 17
8.3 M (x2) = 300 g = 74
8.4 Elxi - 41 - 3.000; n • 15 ; DM • 220 ; S = 210
9.Determine si las siguientes afirmaciones son correctas:
9.1 Si todos los valores de la variable de una distribución, cuya
desviación estándar es 30, se aumentan en 30%, la nueva varien-
za es 1521.
9.2 Si los ingresos de la población activa en Bolivia se expresan
en dólares, la varianza entes de la devaluación ea mayor que
después de ella.
9.3 Si cierta distribución tiene una varianza igual a 144 y otra
una desviación estándar igual a 11,5 puede afirmarse que la pri
mera tiene mayor dispersión.

9.4 Cuando la variable se multiplica por una constante, todas las


siguientes medidas cambian de valor: media aritmética, mediana,
coeficiente de variación y moda.
9.5 La varianza es siempre mayor que la desviación estándar.
10.Sea X una variable con mediar y desviación estándar Sx- Si defini
mor la nueva variable Y, tal que

Y =
x-
Sx
Demostrar que la media y la varianza de Y son iguales a cero y a
uno, respectivamente.
11. Determinar el coeficiente de asimetría y el coeficiente de apunta -
miento para los ejercicios 8 y 12 propuestos en el Capítulo 2.
- 67 -

CAPITULO 5

TEORIA DE PROBABILIDADES

Una de las herramientas fundamentales


para el estudio de la estadística moderna, es la temta de pubabL/Máde6.
a diferencia de la Istadística descriptiva que está relacionada con el re-
sumen de datos y la descripción de éstos mediante algunas medidas, la uta
dt4tica ín4e4encía/, es una generalización hecha sobre la base de datos
muestrales respecto del comportamiento de alguna característica particular
de la población. En vista de que los datos obtenidos de una muestra nos
dan una información incompleta de todo el conjunto de elementos de una po-
blación, tomar decisiones de generalización para la población, implica el
riesgo de hacer una inducción falsa; la medida para esta incertidumbre es
la probabilidad. Generalmente la incertidumbre se debe al carácter a/eato-
ki0* de que no se sabe con certeza cuál será el resultado que se obtendrá
de una muestra, y además si el resultado coincide o nó con el que se obten
dría tomando en cuenta a todos los elementos de la población.

Más adelante, en los capítulos respectivos veremos con detalle la a-


plicación de las probabilidades a la estadística inferencia', concretamen-
te en lo relacionado a la estimación estadística y la docimasia de hipóte-
sis.

Para el estudio de la teoría de probabilidades y de la teoría estadía


tica, un instrumento matemático muy importante, es la Teoría de Conjuntos.
Entonces, antes de entrar al estudio de la probabilidad, esbozaremos en
forma sintética los conceptos y propiedades de los conjuntos, que nos per-
mitirán comprender con mayor facilidad el tratamiento de las probabilida-
des.

El término aleatorio, que se usará en el contexto del presente trabajo,


debe tomarse como sinónimo de azar, es decir que del conjunto de resul-
tados posibles de un experimento, ocurre uno de ellos, pero no se sabe
cuál. Así•por ejemplo, decir que se he/eccionan a/ aza4 dos personas de
diez (todas seleccionables), para que formen parte de un tribunal califi
cador, significa que no se sabe a priori cuáles serán las dos selecciona
das; esto mismo se quiere decir con la palabra aleatorio en lugar d2
azar.
-68-

5.1

Noción de Conjunto

En esta sección veremos de la teoría de


conjuntos solamente la parte necesaria para comprender el concepto de las
probabilidades modernas, o sea, desde un punto de vista abstracto, que con -
siste en partir de un conjunto de axiomas o postulados, de los que se dedu -
ten sus propiedades y aplicaciones. Este método axiomdtícoseréel que uti -
limaremos, sin descuidar desde luego los otros métodos, como ser: el método
de la 4necuenela nelativa de un duceaO y el método combínaton2o.

La noción de conjunto es, tal vez, una de las más difíciles de explicar
y comprender de todas las matemáticas. Sin embargo, se puede decir también
que es lo más sencillo del mundo, ya que todos sabemos intuitivamente, que
se entiende per la palabra conjunto. Así, cuando decimos que un conjunto de
palabras forma una oración, que un conjunto dé cabellos de un hombre consti-
tuye su cabellera o que una máquina está formada por un conjunto de piezas ,
etc., son expresiones que no ofrecen dificultad alguna de comprensión para
nadie. Es precisamente esta noción intuitiva que aprovechó la matemática mo
derna para establecer una de las teorías más generales y fecundas de gran a-
plicación en las probabilidades y en la estadística, que es la teokta de los
conjuntos.
Una definición simple de conjunto será entonces:
DEFINIC/ON 5.1 Conjunto es la reunión (o colección) de objetos bien de-
terminados y capaces de diferenciarse unos de otros.

Un objeto que pertenece a un conjunto determinado recibe el nombre de


elemento ( o componente) del conjunto . Es evidente que los elementos de
un conjunto no han de ser necesariamente objetos concretos, perceptibles
por alguno de nuestros cinco sentidos; así, se puede hablar de conjuntos abs
tractos como el conjunto de los puntos de una recta-o el conjunto de los dío
sea de la mitología griega. Estos son conjuntos cuyos objetos se deben a nues
tra intuición o nuestro pensamiento. De esta manera, los objetos que pertene-
cen a un conjunto detei:Minado, pueden ser reales o ideales; por ejemplo: le-
tras, personas, plantas, fábricas, números, ideas, etc.

En general, usaremos letras mayúsculas (A, E, C, X, Y,...) para designar


conjuntos, y letras minúsculas (a, b, c, x, y, ...) para indicar a los ele-
mentos del conjunto. Para especificar que ciertos objetos pertenecen a
un conjunto dado, se usan corchetes f . Existen dos formas clásicas de re-
presentar un conjunto, según sea posible describir sus elementos; estos son:
por extendión y por ~Una En el primer caso se trata de un listado
de todos los elementos componentes de un conjunto; mientras que en el segun-
do caso, se trata de una especie de regla que nos indica cuáles son los com-
ponentes, sin necesidad de describirlos a todos. Por ésto, todo conjunto de
be estar bien definido en relación a sus elementos. Así por ejemplo, si de -
-69-
seamos escribir el conjunto A cuyos elementos son a, b, c y d, y el conjunto
B cuyos elementos son los primeros cinco números enteros positivos, tendre -
mos:

A= {a, b, c, d}

= {1, 2, 3, 4, 5}

que es la forma extensiva. Si tuviésemos un conjunto C, cuyos elementos son


los primeros 100 números naturales, es más conveniente expresarlo en forma
comprensiva, o sea:

C = : x = 1, 2, .., 100}

que se lee, "C es un conjunto de elementos x, tal que x = 1, ó x = 2, ó x= 3,


y así sucesivamentee ó x = 100".

No todo conjunto puede ser descrito en forma extensiva, así por ejemplo,
un conjunto D cuyos elementos son todos los números reales comprendidos entre
0 y 1, sólo es posible expresarlo en forma comprensiva, o sea

D= {x : 0< x< 1)

que se interpreta: "D es un conjunto de elementos x, tal que x es mayor que


cero y menor que uno". El estudiante, con un poco de práctica, podrá fácil -
mente decidir cómo expresar y escribir un conjunto.

Usaremos los símbolos e y 1 para indicar, "pertenece a" y "no pertenece


a", respectivamente. Entonces, en relación a los conjuntos A, B, C y D defi-
nidos anteriormente, podemos escribir:

a e A, 5e B, 57 c c, 1/4eD,

57 Y A, 1/4 10, - 2 1 D, etc.

Cuando un conjunto contiene un número finito de elementos se dice que es


línít0; en caso contrario, se dice que es inlímíto. Así por ejemplo, el núme
ro de trabajadores de una fábrica es finitc, el número de piezas de una máqui
na es finito, el conjunto de números naturales es infinito, el número de los
puntos de un segmento de línea es infinito, etc.

Se dice que un conjunto es encame/tala/e • cuando se pueden "enumerar" sus


elementos; así, el conjunto E de los números positivos múltiplos de 2:

E = 10, 2, 4, 6, 8, ...

otras veces se dice tambign,~able.


-70-

es numerable, Un conjunto es no enumekabie, en caso contrario.


Antes de seguir, hagamos referencia al digno de ímpticacídn( ==*). Es
te símbolo se emplea para expresar la consecuencia de un hecho, es decir
que se trata de una "inferencia lógica", que puede leerse "implica", "ile -
va a", "tiene por consecuencia", "si ... también", o "si... entonces". Por
ejemplo, si (x = y) (3x = 3y); Si A = (a, b, cira E A, etc. El símbo
lo (4=1) indica una equivalencia lógica (se trata de una doble implicación)
o también una condición necesaria y suficiente, que puede interpretarse co-
mo "si y solamente si" (o abreviadamente "sir.).
DEFINICION 5.2 Dos conjuntos A y B son íguales si cada elemento que
pertenece a A, también pertenece a B, y cada elemento
que pertenece a B también pertenece a A.

Es decir, que dos conjuntos A y B son idénticos o iguales si están com


puestos de los mismos elementos. En símbolos, A= B 4=1 x e A x6 B y
si x é B ==0.x e A. Esto, sirve para demostrar que dos conjuntos son igua -
les. Cuando dos conjuntos son desiguales se representa:

A 1 B.
Notamos cue el orden del listado de elementos de un conjunto no tiene
importancia, así
A = {1, 2, a, 3} y B = la, 3, 1, 2)

son iguales. También O número de veces cue un mismo elemento es listado


en'un conjunto, no tiene importancia, así,

E = {1, 2, 2, 1, 3, 1} y F = (1, 2, 3}

son iguales. Como puede apreciarse, el conjunto E comete redundancia en


cuanto a la descripción de sus elementos. De manera que si consideramos un
conjunto con n elementos, estos en general deben ser distintos y los elemen
tos iguales no deben aparecer más de una vez. Esto es también importante
para determinar el náthent de elementos que tiene un conjunto; por ejemplo
en el caso anterior, erróneamente podría decirse que el conjunto E tiene 6
elementos, siendo lo correcto decir que tiene 3 elementos.
DEFIBICION 5.3 Sean los conjuntos A y B. A es un subconjunto de B
(representado por Ac:B) si y sólo si cada elemento que
pertenec- a A pertenece también a B.
En otras palabras, A es un subconjuntó de B si B contiene a A (repre -
sentado por B A). Para demostrar que un conjurto A está contenido en un
conjunto B, basta comprobar la implicación siguiente para un elemento a
cualquiera:
alA=.a6B
- 71 -

El conjunto la) es un subconjunto de ja, b) , y el conjuntota, b) es


un subconjunto dt (a, b, El ccnjunto'de todas las personas residentes
en La Faz es un subconjunto de todos los residentes de Bolivia; el conjunto
de todos los trabajadores mineros es en subconjunto de todos los trabajado-
res.

Cuando un conjunto A no está contenino en el conjunto S, se denota por


A It B.

Tomando en cuenta el concepto de subconjunto, la igualdad de dos conjura


tos A y B, también se define: "Dos conjuntos son iguales si cada uno de
ellos está contenido en el otro, es decir, A = B4>AC:B y Bc:A".

Debe tomarse en cuenta la diferencia importante que existe entre los


conceptos, pertenencia e inclusión. Si por ejemplo tenemos los conjuntos

A = 11, 2, 3, 4.
; , B = (1, 2, 4) y C = (1) ,

entonces es correcto decir BcA y Cc:A, ya que cada elemento de B pertenece


a A, y cada elemento de C pertenece a A; mientras que es incorrecto decir
que AC.0 o que BC:C, ya que A y B no están contenidos en C. También es co-
recto decir que 3tA y l£C, y es incorrecto expresar que 3C:C y ICC, ya
que 3 y 1 no son subconjuntos. Así, podemos decir que el conjunto de todos
los estudiantes de economía es un subconjunto de todos los estudiantes, pero
no podemos decir que el conjunto de todos los estudiantes de economía perte-
necen al conjunto de todos los estudiantes. Un estudiante particular de eco
nomía pertenece al conjunto de todos los estudiantes de economía, pero dicho
estudiante no es un subconjunto de ellos.

A veces se suelen utilizar los dia94~4 de Ditet (que en algunas par-


tes se llama diagramas de Venn), para visualizar gráficamente algunas cazac-
terísticas de los conjuntos. Así por ejemplo, si un conjunto A está conteni
do en el conjunto E, se tiene

(
AC B

Figura 5.1

De las definiciones anteriores, es fácil ver que cada conjunto es igual


a al mismo, y que cada conjunto es un subconjunto de sí mismo, es decir que
dado un conjunto A, se tiene:

A-A VA

A CA VA
- 72-
El símbolo (Y), indica "para todo" 6 "cualquiera que sea"
Un conjunto que contiene todos los elementos de un cierzo tipo, que sir
ven de base para una discusión particular, recibe el nombre de conjunto ung
~Zeit (llamado también conjunto 4undamental). A este conjunto lo designare
mos con la letra omega mayúscula n , y a sus elementos con omega minúscula
, de manera que &men. Así por ejemplo, si se está discutiendo la pro -
ducciót de zapatos, el conjunto universal estará compuesto de todos los zapa
tos producidos por las distintas zapaterías de cierta localidad.
Por otro lado, un conjunto que no tiene elemento alguno, se llama COn -
junto vagto ( o también conjunto nato), y se lo representa con la notación é,
o sea O í
A continuación estudiaremos un poco del étgebna de conjuntoá (llamadas
también operaciónesbooleanas). Al igual que en el álgebra de los números re
alee que está relacionada con operaciones realizadas con números y sus cunee
cuenciae, el álgebra de conjuntos está relacionada con conjuntos y sus impli
°aciones-a

DEMICION 5.4 Se llama unión (o también, reunión) de dos conjuntos A y


B al conjunto formado por los elementos que pertenecen
al menos a uno de los dos conjuntos A y B.
La notación de unión es AUB, donde el símbolo U significa "unión". Pa
ra fiaos de demostraciones, la unión de dos conjuntos A y B se define:
A V B• (x : xdA v x s B}
donde v indica "o bien" o "y/o".
La representación gráfica para la unión de los conjuntos A y 13, será

AU B

Figura 5.2
En relación a la unión, se tienen las siguientes propiedades lógicas:

AU9inA
AUAnA
A V E- E, si ACE
Veamos el siguiente ejemplo que nos aclarará la operación de unión:
- 73 -

Si A • {1, 2, 3) , B - {1, 3} y C ={0} , entonces AUB mil, 2, 3},


A UC {0, 1, 2, 3} y BUC (0, 1, 3). Adate AUBtiC =10,1,2,3).

Una propiedad inmediata, que se ve de la definición, es la conntatatividad


de la operación de unión, es decir que A UB BIJA. Dado que el orden del
listado de los elementos no tienen importancia. Además), la :adán de conjuntos
ea asochati.ma, puesto que

(A U 13) UCLUCE U C)

Una segunda operación, es la llamada intersección de dos conjuntos.

DEFINICION 5.5 Se denomina ate.4.5ecei.on de dos conjuntos A y B al con -


junto formado por todos los elementos comunes de A y B.

La notación de intersección es AnB, donde el símbolo ()significa "in-


tersección". Para fines de demostraciones, se define equivalentemente:

Ana- {x : x€A,xEB}

donde el símbolo n, indica "y".


Para este caso, el diagrama euleriano, será

tr

Af113
A

Figura 5.3
En este caso, se tienen las siguientes propiedades lógicas:

Arld d
A (1A • A
A ()E = A, si ACE

Si por ejemplo, A • fl, 2, 3) B 40, 2) y C - II. 3) 1, entonces


A/1/3 al (2), At1C u•{1, 3), Bnc - La operación intersección al igual
que la unión, se también conmutativa y asociativa, ésto es

Ar1B = B.:A y An(Br)C) a (An11)/IC

por otro lado, vemos que

AnBCP. y que AnBi-A

Una propiedad relacionada con las operaciones de unión e intersección, ea la


d'Entibo/Uva, ésto es
A u (Bn c) n v
Anon) - (A/113)u(Anc)
Esto mismo en términos del diagrama de Euler, se tiene:

A U (B E) A fl 1.1C)

Figura 5.4

donde las partes achuradas corresponden a las operaciones indicadas.


Si la intersección de dos conjuntos es vacía, es decir, si
A(18 =
entonces A y B son conjuntos de.éjuntee, (6 incompatibles, o excluyentes en -
tre sí). Por ejemplo, si A = 11, 2) y B = 13, 4) , se tiene A/1B = 95, luego
A y B son disjuntos.
Si consideramos un conjunto universo particular ti , entonces un conjun-
to A incluido en 11 , especifica automáticamente un segundo conjunto distinto
de A, al que se lc llama conjunto complementario, o simplemente complemento.
DEFINICION 5.6 Dado un conjunto universo fly un conjunto A tal que
A cn , entonces el conjunto de los elementos dell:que
no pertenecen a A se denomina cemptemento de A, y se escribe Ac. Es de
cir,
pc = {x : x 1f A piara todo ACf1}

Figura 5.5
Por ejemplo; sin = (a, b, c, d, e, f, g) , y A = (b, d, g), entonces
Ac = (a, c, e, f) . -Si el conjunto universal') comprende todos los números
naturales y A el conjunto de los números pares, entonces Ac es el conjunto
de todoi los números impares.
Un subconjunto y su complementario tienen las siguientes propiedades
lógicas:
Si A = ti entonces Ac = d
Si B = Ac, entonces A = EP .(Ac)c
-75-
c
A l/A e n
A (lAc

También puede observarse en relación al conjunto vació, que

AU0 = A
An# fi
De la definición de subconjunto, podemos admitir que licA para todo A,
ya que cada elemento perteneciente a % (ninguno) también pertenece a A. De
safortunadamente, el conjunto vacío # no se puede ilustrar en un diagrama.

DEFINICION 5.7 t Se denomina díleitencía *entre dos conjuntos A y B, al


conjunto formado por los elementos de A y no de B, y se
representa por A.R.

Simbólicamente se tiene:

= {x : x€A, x4 B)

y graficamente

A \ B

Figura 5.6

De acuerdo con la definición se cumple:

ANB ANA/1B (Fig. 5.6)

También

A \B = AilBe

Veamos algunos ejemplos: Si A = (a,b,d, e, f, hj y B = {b,c,d,f,r)


entonces ANB e {a,e,h) y B \A = {c, r)

Se observa también que

A\ B # BNA (excepto si A B)

* Algunos autores llaman, complemento relativo.


- 76-

En efecto,
A•.B ANAnB
B's,A = BN.Ar111

Y (Ama) n (8\ A) - 6 (figura 5.7)

de donde se desprende:

Si A si B ./L\B = E\ A =

Si AN.B=ly ENAlé~ACB

Si A C. B~A B = eS

Si A \ A=9B = 6 y/o Ana-é

(A \ V (B \ A)

Figura 5.7

DEFINICION 5.8

1) Cuando los conjuntos Al, A2,.., A son tales que su unión AlUA2 U
= fl, se dice que forman unatcubítímíentede

2) Cuando además se añade la condición de ser disjuntos dos a dos, es


decir Ain Ai = é para todo i é j, donde i y j varían de 1 a n, el re
cubrimiento se llama paAticiónde fl.

Un recubrimiento y una partición de fl, suponiendo que sólo nay cuatro


conjuntos Ai, será
n 11
Al A2
A

A
4

ReCubrimien:o de fl Partición de 11

Figura 5.8
- 77 -

Por ejemplo si (-1= (1, 2, 3, 4, 5, 6, 7, 8, 9), entonces, los conjuntos
A = {1, 2, 3, 4) , B =(3, 4, 5, 6, 7) , C ={4, 5, 6, 7, 8) y D = 19), for-
man un recubrimiento, mientras que los conjuntos A ={1, 2, 7} B = {3, 4, 5)
C ={8, 9) y D - {6} forman una partición. Las divisiones del territorio
boliviano en departamentos es una partición del suelo de Bolivia.

Cuando tengamos una unión sucesiva de n conjuntos, simbolizaremos


n
U A. = A U A u U An
i=i 1 2

y para la intersección sucesiva


n
n
i-i
A. le Al (1A
2 ñ (1A
n

Para finalizar esta primera parte de la teoría de conjuntos, haremos


un resumen de las operaciones que forman parte del álgebra booleana.

5.2

Operaciones Booleanas'

Consideremos un conjunto referencia'


C1 y todas sus partes. Las operaciones .intersección, unión y complemento
efectuadas con las partes de fl , se denominan openacione4 booleanas.

Las principales propiedades algebraicas de las operaciones booleanas


se examinarán como sigue, considerando los conjuntos A, B y C como partes
de n .

A cla of B,nA lt
conmutativa
A La B •JA

(Ans)(1C = Arl(anc)
asociativa
UB) C = A U (E UC) j

A rl A a A 1.
idempotencia
A UA = A f

• O

- 78 -
arl(BLAC) = (A/13)1./(At1C) Distributiva (de la intersección
con relación a la unión y de la
A u(8 nc) - (ata) n(Auc) ) unión con relación a la intersen
alón).
Ano a /

AUAc ca
Ano
AU$ * A
-1
Afin = A
AVfl
(Ac )c = A involución

(Amo° • act/Be I
teoremas de Margen
(A UB)c =AC ABO
Las leyes de Morgan en forma general se expresan

( Ai)c = !1 4
i=1 i=1
( (1 A C = („) Al
1=1 1=1
las demostraciones de todas las identidades anteriores., ae dejdlcomo
ejercicio.

DEFINICION 5.9 Una acide (O &main), ea un conjunto, tal que sus e-


lementos son conjuntos.
Asi, los conjuntos

, (2)}
{ s, (i) , (2) , (1,2)}
a. tal , ti)) , {a ;la )
son clases. Un conjunto que tiene como elenmntos todos los subcon-
juntos de B = (1,2,3), o sea

#15 j$,(1), ( 2), (3), (1,2), 1113),(2.3), B}


es una clase

todo conjunto A y B que pertenece a la clase lr.


y An..r
DEPINICIOY 510 Una clase Tes cateada con respecto a las uniones e in
terseccicnes si y sólo si AUBE para

Por ejemplo, en relación a los ejemplos de la definición anterior, la


clase )4' no es cerrada porque [1)1./ 12) = [1,2)0e. La clase44es cerrada,
-79-

puesto que la union o intersección de dos cualesquiera de sus elementos, tam


bién pertenecen a46. La clased?es cerrada con respecto a la unión, pero
no es cerrada con respecto a la intersección, ya que ta}h{b} = 1/ (,de
manera que no se puede decir que la desean cerrada. En cuanto al con-
juntop , se vé claramente que es una clase cerrada.

Algunos autores llaman conjunto potencía, a una clase cerrada. Es muy


importante tener claro el concepto de clase (o familia) cerrada, en razón de
que será de gran utilidad para el cálculo de "probabilidades" y para el con-
cepto de "variable aleatoria" que es muy importante en el estudio de la teo-
rfa estadística.

Supongamos se tiene un conjunto definido como A= b}, entonces la


clase cerradat?de A, que también se simboliza INA), será

a= 9(A) • tí , {a} , {b} , ta,bi)

El Ramito de elementos de una familia cerrada/1de un conjunto.A, es


simplemente

n(di) - 2n(A)

donde n(6) y n(A) indican el número de elementos que tieneety A, respecti-


vamente.

En relación al número de elementos de un conjunto, existen conjuntas (11.-


nitas y conjuntas in4Aítods. Un conjunto es finito se es vacío o si consiste
exactamente de n elementos, donde n es un número entero positivo; y un conjura
to es infinito en caso contrario. Ásf por ejemplo, el conjunto de todos los
estudiantes de una universidad, es finito; mientras que el conjunto de puntos
de un segmento de recta, es infinito.

Por otro lado, se dice que un conjunto es enuntertabte cuando se puede "e-
numerar" sus elementos. Todo conjunto finito es enumerable, mientras que no
todo conjunto infinito se puede numerar, ast por ejemplo, el conjunto de los
números reales no es enumerable.

5.3.7

Relaciones entre Conjuntos

Ahora veremos algunos conceptos básicos


respecto de la relación entre conjuntos. En primer lugar definamos n-tuplos
ordenados.
-8o-
DEFINICION 5.11 Un n-tuplo es un vector fila ordenado de n elementos,
que se escribe

(xl, x2, xn)


Así por ejemplo, (1,2), (a,b), (0,40), (xl, x2) son 2-tuplos, que co -
rrientemente se llama pan ohdenddo; los vectores (1, 2, 3), (a, b, c),
(1, 1, 1), (8, 1, 0), son 3-tuplos. Dos n-tuplos son diferentes inclusive
si tienen los mismos elementos pero están en distinto orden. Por otro lado,
un n-tuplo y un (n+l)-tuplo son también diferentes, ya que tienen diferente
número de elementos. De esta manera, diremos que dos n-tupíos son iguales,
o sea
(xl, x2,....›Xn) (Yll
si y sólo si xl = y', x2 = y2,..,yn xn. Entonces,

(1,2) O (1,2,3)

(4,5) O (5,4)

(1, 1, 3) 1 (3, 1, 1)

(3, 4, 5) = (3, 4, 5),


Es frecuente el uso de pares ordenados; así por ejemplo, si deseamos
observar el conjunto de matrimonios que viven en la ciudad de La Paz, cada
pareja es un elemento del conjunto, entonces nosotros estemos en presencia
de pares ordenados, en la que el primer elemento puede ser el nombre del es
poso y el segundo elemento el nombre de la esposa. Notemos que un esposo
individual que vive en La Paz no pertenece al conjunto, es un componente del
par ordenado que pertenece al conjunto. Un ejemplo clásico, es el conjunto
de puntos situados en un cuadrante del plano Cartesiano, ya que cada punto es
tá representado por el par (x, y), donde x es la coordenada horizontal e y la
coordenada vertical.

Una operación de interés entre conjuntos, es el -producto Cartesiano, de-


finido como sigue.

DEFINICION 5.12 Si A y B son dos conjuntes, se llama moduci:o cantuíano


de A y B, que se indica A x 11, al conjunto de todos los
posibles pares ordenados (a, b) cuyo primer elemento a pertenece a A y
el segundo elemento b pertenece a B.

Simbólicamente esta definición puede escribirse

A x B ={(a, b) : a s A, be S1

Veamos algunos ejemplos, bajo el supuesto de que se tienen los conjuntos


A = {1, 2, 3}, B = {4, 5} y C = {0}, entonces:
- 81 -

A x B = {(1, 4), (1, 5), (2, 4), (2, 5), (3, 4), (3, 5))

A x C = 1(1, 0), (2, 0), (3,0)}

C x A = 1(0, 1), (O, 2), (O, 3)}

x C = 1(4, 0), (5, 0)1

B x B = 1(4, 4), (4, 5), (5, 4), (5, 5))

C x C 1(0, 0)/
+
Si IR es el conjunto de número positivo, entonces IR+ x7R+ es el con
junto de puntos en el primer cuadrante del plano cartesiano.

En general A x B y B x A son distintos: Entonces, el producto cartesia-


no no es conmutativo°

Es fácil generalizar el producto cartesiano para cualquier número de


conjuntos. AeíAx8xCes un conjunto de 3-tuplos, yA, xA, x A ea
un conjunto de n-tuplos. Por ejemplo, tomando los conjuntos, éefinidosnante
riormente, tendremos

A x B x C = j(1,4,0), (1,5,0,) , (2,4,0), (2,5,0), (3,4,0), (3,5,0)}

ExCxAg. 1(4,0,1,), (4,0,2), (4,0,3),(5,0,1), (5,0,2), (5,0,3))


DEFINICION 5.13 Una fianeían elemento f, (real-valorada),definida sobre
un conjuntoOes una regla que asocia un número (real) a
cada elemento del conjunto. El numero asociado a un elemento particu-
lar se llama el valor de la función para ese elemento y es denotado por
f (w) para todo wen

Pueden definirse muchas funciones para los elementos de un mismo conjun-


to (ésto es, pueden usarse distintas reglas). Nótese que puede asociarse un
mismo número a más de un eletento.

Por ejemplo, si consideramos el conjunto de personas que residen en un


cierto lugar, se pueden usar distintas reglas para asociar un número real a
cada elemento del conjunto; tales como la edad de las personas, el peso de
las personas, la estatura; los años de estudio, los ingresos, etc. Cada una
de estas reglas, edad, peso, estatura, etc., se llama función elemento de 1-
nide sobre el conjunto de esas personas.

Supongamos ahora que tenemos un conjunto de pares ordenados

c1={(xl, x2) : xl = 1, 2, 3; x2 = 2, 3, 4}

La regla f (x x ) = x + x2 para (x1, x )e(), asocia la suma de los


1, 2par del
dos elementos de cada 1 conjunten. Entonces,
2
- 82 -

f (1,2) = 1 + 2 = 3; f(2, 3) = 2 + 3 = 5; f(3, 2) = 5, etc.

Una segunda función elemento definida sobre el mismo conjunto, puede


ser

g (xl, x2) - x .x para (x1, x )(l'u


1 2 2
Entonces

g (1, 2) = 1.2 = 2; g (3,3) = 3.3 - 9, etc.

Dos conjuntos que son de íntergs para cualquier función, son: su domi-
nio de definición y su recorrido.

DEFINICION 5.14 El domínto pata una función elemento definida sobre un


conjunto( es simplemente el mismo conjuntoll el hCCO-
May de una función elemento definida sobre un conjuntoOes el conjunto
de número reales asociados con los elementos de .

Respecto del recorrido, podemos decir que es el conjunto de valores de


la función.

De esta manera, en relación al primer ejemplo dado anteriormente, el do


minio de cada una de las funciones dadas, es el conjunto de personas que vi-
ven en dicho lugar. El recorrido de la función edad, es el conjunto de eda-
des de los residentes en ese lugar; el recorrido de la función peso, es el
conjunto de los pesos; el recorrido de la función años de estudio, es el
conjunto del número de años estudiados; el recorrido de la función ingreso,
es el conjunto de las cantidades monetarias obtenidas; etc. En el segundo'
ejemplo, el dominio de definición para ambas funciones f y g, es el conjun-
to(); el recorrido de f es el conjunto (3, 4, 5, 6, 7} y el recorrido de s.
es el conjunto {2, 3, 4, 6, 8, 9, 12} .

Otra función importante, es la función conjunto, que está relacionada


con la clase cerrada a.
DEFINICION 5.15 Una regla f que asocia un número real a cada AE a
(de
notado por f(A) , se llama una ilunción conjunto (real
valorada) sobre a.

Sea la clase ede subconjuntos de A = {1, 2, 3},"entonces

a- (es, 0.), {2} , (3) ,{1,2} ,{1,3} , t2,33,11,2,3)}


Como en el caso de las funciones elemento, hay muchas diferentes f*incio-
nes conjunto, que pueden definirse sobre a Por ejemplo,

f(A) = O si le A
= 1 si 1 A
-83-
es una regla que puede ser usada para asociar un número con cada conjunto
A a . Entonces f se llama una función conjunto definida sobre a. En for-
ma similar,
g(A) ■
número de lementos de A, A E a
h(A) ■
cuadrado del número de elementos pertenecientes
a A, A 6a
son funciones conjunto definidas sobre a. En este caso, el dominio de defi
:Ación en cada caso es entonces:tia. El recorrido de f es el conjunto(0,1),-
... el recorrido de g es el conjunto{0, 1, 2, 3j, y el recorrido de h ea el con
junto (0, 1, 4, 9j.

Ejercicios 5.1

1. Si A = (x: x - 1,0,1} , B = (-i, 0,1) , C = {0,1,-1} y D -{ -1, 1, -1}


Marque cuáles de las siguientes proposiciones son verdaderas y cuáles fal
saa:

.2 1.1 A = B F 1.6 BCC V 1.11 A - D


1.2 A C 1.7 CCA 1.12 D C A -
1.3 B C‘ 1.8 CCB V 1.13 B C D
1.4 A C B 1.9 oes t- 1.14 D E C
1.5 A E B F 1.10 occ 1.15 B # C -
2. Si E - {x: 04x11), F = ly: Olyll) , G - {x: 0<x<1} y B (.1) ,
Marque cuáles de las siguientes proposiciones son verdaderas y cuáles fal
sas:
2.1 E= F 2.4 G C F '2.7 H I F
1 2.2 F= G , i 2.5 H C G 2.8 E C F
2.3 FCC 2.6 HCE V2.9 H/ E
3. Es el conjunto de todos los estudiantes un subconjunto del conjunto da to-
da la población de personas? Es éste un subconjunto de toda población de per
sonas menores de 36 años de edad? Debajo de 50 años de edad?
4. Demostrar queACIBCACAuB yque At1BCBCAUB
5. Si A = {1,0}, B - (x: 0<x<1}, C = (1/2} , computar
A U B, A U C, BUC Y A (1 B, A n C, Bn C,
- 84 -

6. Verificar que BUB=13/18=8 para todo B


7. Qué implican las siguientes igualdades:
7.1 E nr - F? 7.2 E U F = E?

8. Definidos los conjuntos;


A = (x: x = 1,2,3 ..... 101, E ={x: 14x110}
C = (x: x = 0,1,2,3,4,5,6) y D =(0, 10,20,30)

Calcular:
8.1 AU B 8.7 B tiC 8.13 AUBUC
8.2 A/1 B 8.8 B nC 8.14 Anca U C)
8.3 AU C 8.9 B U D 8.15 AU(B n
8.4 A nC 8.10 Bn D 8.16 Ananc
8.5 A U D 8.11 C U D 8.17 CUCA n D)
8.6 A AD 8.12 C D 8.18 (A U B) n (C U B)

9. Dado el conjunto universal iá = (1,2,3,..., a)


y los conjuntos A = (1,2,3) y B = (2,3,n),

Calcular Ae, Be y ACUBe . Compare este ultimo conjunto con (A(18)e


10.Podemos definir un conjunto A, tal que A = Ae? Tal que A C Ae?
11.Ilustrar con diagramas de Venn los conjuntosAn Be, Ae n Be, A U B U C
A /BO C, (A Lia)nc, (Anc) u ca C)
12.Dados los conjuntos A = (1,21,B =12,1) y C = (10,12),
formar los productos Cartesianos AxB, Axe, BxC, BxA, CxA, CxB, AxA, BxB,
CxC, AxBxC, CxBxA, CxAxB.
13.Cuáles son las condiciones para que AxB = BxA?
14.Si A es el conjunto de hombres casados en La Paz y B el conjunto de muje
res casadas que viven en La Paz, es Ax.8 el conjunto de parejas casadas
que viven en La Paz?
15.Sea A el conjunto de personas de mi familia y definida la función f(w) =
edad de w para vil A. Especificar el recorrido de f.
16.Sean B = (1,2,3,4,5,6} y C = BxB
Si se define la función elemento

g [(xl, x2)) = xl + x2 para (xl, x2)6 C,


Cuál es el rango de g?
-85-
17. Si C = ((x1, x2): xl = 1, 2, 3, 4, 5, 6; x2 = 1, 2, 3, 4, 5, 6)y
dada la función g x2)] = xl + x2, para (xl, x2) a O.
Especificar
Al = ((xl, x2): (xl,
[ = 7)
A2 = {(xl, x2): 8 [(x1, x2)] = 3)
A3 = ((xl, x2): 8 [(xl, x2)] = 10}
18. Sea rla clase de todos los subconjuntos de S = (1,2, ..., . Defini
do n(A) = minero de elementos en A para A E f . Cuál es el recorrido
de n?
19. Sean 8 y n definidos como en el problema anterior. Uostrar que
19.1 n (A) 1 n(B), si A c
19.2 n (A V a) = n(A) + n(B), si A fl a = of
-86-

5.4

Probabilidad

Hemos mencionado que existen tres maca-


dos para llegar al concepto de probabilidad: La primera forma, y la más an-
tigua, consiste en repetir muchas veces un experimento o juego en las mismas
condiciones, y calcular la frecuencia relativa con que ocurre un resultado
(evento o suceso); es decir, dividir el número de veces que ocurre un suceso
deseado entre el número de casos posibles. Esto es lo que suele llamarse
"casos favorables entre casos posibles" (medida que recibe el nombre de lit-e-
a/encía Aetataa del suceso). Este método históricamente comenzó con el es-
tudio de los juegos de azar, tal como los dados, las cartas, la ruleta, etc.
Sin embargo aran sigue siendo de gran utilidad, particularmente en los casos
en que se asigna la misma posibilidad de ocurrencia a todos los resultados
posibles de un experimento.

Otro método para llegar a la noción de probabilidad, sobre todo desde


el punto de vista computacional, es el método combinatatio, muy útil pero de
aplicación limitada, dado que este modelo parte del principio de que todos
los sucesos son "igualmente posibles"; pero en la práctica, no siempre ocu-
rre este hecho.

En el presente trabajo, dadas las limitaciones de los dos métodos ante


riores, trataremos de llegar al concepto de probabilidad, mediante el mé5dc:
maimatíco. Es decir, que se parte de un conjunto de axiomas que nos permi-
ten deducir las propiedades y aplicaciones de las probabilidades.

La probabilidad es una herramienta indispensable para toda clase de in


vestigaciones que implican incertidumbre. Si se está frente a experimentos
cuyos resultados están completamente determinados, es decir que de antemano
se sabe qué suceso ocurrirá, entonces desaparece el problema de predicción y
por lo tanto no hay necesidad de recurrir al cálculo de probabilidades. Sin
embargo, como hay una infinidad de fenómenos en la naturaleza los cuales im-
plican insertidumbre, la importancia de considerar la teoría de probabilida-
des en nuestro estudio, es realmente relevante.

La teoría de probabilidades se emplea en el tratamiento y solución de


muchos problemas de peso, particularmente en casi todos los campos de la in-
vestigación científica.
La Inferencia Estadística, básicamente recurre de este modelo matemáti
co. Las probabilidades están relacionadas íntimamente, por ejemplo, con proble
mas de toma de decisiones, tanto a nivel empresarial como a nivel guberna
mental. Sirve para la formulación de modelos econométricos, para fines de
planificación económica, evaluación de proyectos, estudios de futuros merca-
dos, controles da producción, estimaciones de accidentes en general, para de
terminar disturbios en mecanismos eléctricos, etc.,etc.
-87-
En la sección que sigue, introduciremos algunos conceptos previos al
desarrollo del cálculo de probabilidades, y en los capítulos siguientes dis-
cutiremos las aplicaciones que serán de nuestro mayor interés.

5.5

Espacio Muestral y Sucesos

Como se ha mencionado en la primera par


te de este capítulo, la teoría de conjuntos es un auxiliar ideal para un es-
tudio eficiente de la teoría de probabilidades. Después de las siguientes
definiciones básicas, veremos de qué manera se utiliza la noción de conjun -
tos.

Para nosotros, un expentnento, será cualquier operación cuyos resulta-


dos no son posibles de predecir con certeza.

En otras palabras, supongamos que estemos interesados en saber qué ocu


rrirá si se realiza un cierto acto. Se procede a realizar el acto una o más
veces bajo las mismas condiciones. Un proceso tal, se llama un proceso alea
torio. Cada ejecución, se llama jactaba. Todas las pruebas efectuadas bajo
las mismas condiciones forman un experimento. De manera que diferentes ti -
pos de pruebas dan lugar a diferentes experimentos. Vemos que un experimen-
to puede consistir de una sola prueba. El acontecimiento de una prueba se
llama un Alomando, un punto mueátnal, o un ULOCAO e/menta/. La colección,
o el conjunto, de todos los resultados posibles de un experimento (ésto es,
el conjunto de puntosmuestrales) constituirá un eapacío muutnal.

Para fines de especulación teórica y práctica, los experimentos pueden


ser reales o conceptuales. Un experimento es k€ttt, cuando ejecutamos una
operación con objetos tangibles desde el punto de vista físico; así por ejem
plo: tomar una moneda y lanzarla, ingerir un medicamento, inyectar un virus
en un animal para ver su reacción, preguntar a algunos de los obreros de una
fábrica lo que ganan mensualmente, medir el tiempo de duración de un artefac
to eléctrico, medir los pesos de un conjunto de naranjas, etc., etc. Por o-
tro lado, un experimento será conceptual, si es posible realizarlo sin nece-
sidad de tomar los objetos físicamente; así por ejemplo, imaginar que se lan
za un dado, y hallar todas las conclusiones tal como si se realizara el expe
rimento físicamente.

En algunos casos, bay objetos que se destruyen cuando son sometidos a


un experimento determinado, así por ejemplo, cuando se prueba la resistencia
de duración de ciertos artefactos eléctricos. Por esta razón, es aconsejable
probar solamente con algunos artículos, cuando se desea saber la bondad de
un cierto proceso de producción. Más adelante, veremos cómo se obtienen in-
ferencias si se sigue este método de investigación.
-88-

Finalmente, los experimentos que tienen un único resultado, no serán


de nuestro interés, ya que, los casos más importantes son acuellos en que
no es posible conocer apriori cuál de los sucesos posibles ocurrirá, por lo
que es mucho más fascinante, predecir o hacer inferencias sobre algún resul-
tado particular y poder hallar una medida mínima para el riesgo de cometer
un error de apreciación.

Para facilitar nuestro estudio utilizaremos muchas veces ejemplos tri-


viales, como ser; lanzamiento de una moneda, selección de una carta, etc.
Puesto que de su comprensión demenderá el poder generalizar a cualquier tipo
de experimentos, sean sociales, biológicos, sicológicos, económicos, etc.;
es decir, a cualquier experimento que sea posible hacer en el campo de la in
vestigación científica.

DEFINICION 5.15 Se llama edpacío muedtna/ fl , al conjunto de todos los


resultados posibles de un experimento; y cada esa
es un elemento (o punto? mutat/nal del experimento,

Los resultados posibles del experimento deben estar bien definidos.


Por ejemplo, al lanzar una moneda, ésta puede quedar parada de un borde, re-
sultado que no servirá de nada si nuestro interés es saber si aparece cara o
sello.

Veamos algunos ejemplos que nos acláren estos conceptos.

Ejemplo 5.1 Si lanzamos un dado una vez, entonces el experimento es el


lanzamiento del dado. Un espacio muestral rara este expe-
rimento será
Cl= {1,2,3,4,5,8}
donde cada número representa el número de puntos posibles que aparecen enci-
mas

Ejemplo 5.2 Si lanzamos una moneda al aire, el experimento consiste en


lanzar la moneda. Un espacio muestral asociado a este ex-
perimento será
n = {Cara, Sello) = (C, s)
Ejemplo 5.3 Se selecciona una persona aleatoriamente de un grupo de
trabajadores fabriles. El experimento es la selección del
obrero del grupo de trabajadores fabriles. ra espacio muestra', será el con
junto de todos los trabajadores fabriles que pueden ser seleccionados, es de
cir,11 es simplemente.el listado de todos los obreros fabriles.
Ejemplo 5.4 Supongamos que el experimento consiste en lanzar 2 dados,
uno rojo y otro azul. Un espacio muestral para el experi
mento será la colección de todos los posibles pares ordenados (i,j) donde i
indica el número de puntos del dado rojo y j el número de puntos del dado a-
zul. Entonces el espacio muestra]. es
11= {(i,j) : i = 1,2, ..., 6; j = 1,2,... 6}
de manera que el número de elementos mueatrales son 36.
Ejemplo 5.5 Juan, Pedro y José juegan a la moneda. El experimento
consiste en que cada uno de ellos lanza una sola vez la
moneda. Un espacio muestral razonable para este experimento es el conjunto
de 3-tuplos, tal que cada uno de sus elementos pueda ser C (cara) 6 S (se -
no) en cada posición. La primera posición corresponde al resultado que ob-
tuvo Juan, la segunda posición al resultado que obtuvo Pedro y la tercera po
sici6n al resultado obtenido por José. Este espacio muestra]. puede escribir
se
{(xl, x2, x3) : xl = C 6 S, x2 = C 6 S, x3 = C 6 S}
o lo que es lo mismo
ri- Rece), (ces), (csc), (set), (css), (scs), (su), (sss))
Fácilmente se pueden formular experimentos para casos más generales
que impliquen resultados con vectores de n elementos.
Por otro lado, así como es importante considerar cuáles son los elemen
tos (6 puntos) del espacio muestra' (que son sucesos simples), también pode-
mos estudiar sucesos que pueden constar de más de un elemento muestra].; así
por ejemplo, en el experimento que consiste en lanzar un dado, un resultado
puede ser, que aparezca un número de puntos mayor que 3.
DEFiNICIOE 5.16 Un 4SUCCAO ( o evento) es un subconjunto del espacio
muestral. Cada subconjunto de 11 es un suceso.
Un suceso es también un acontecimiento particular deseado; así, en el
experimento que consistía en lanzar un dado, vimos que el espacio muestra].
era
11= {i, 2, 3, 4, 5, 6}
entonces cada uno de los conjuntos
A = {l}, B = f1,3,5}, C = (2,4,6), D = f4,5,6), E = (5)
es un suceso (pero no son los únicos sucesos posibles de este experimento).
Vemos que todos estos sucesos son diszintos, sin embargo dos o más sucesos
pueden servir para un mismo fin. Por ejemplo, si consideramos únicamente
los sucesos A, 3, C y D, y apostamos que al lanzar un aedo ganaremos si apa-
-,-. recen 5 puntos, entonces si ocurren los sucesos B y D ganamos, puesto que
-90-

ambos contienen al elemento 5; por otro lado si ocurren les sucesos A y C,


perderemos, ya que no aparece el 5; es decir, 5 A, 5 4 C. Ahora, si se
ganara cuando no aparecen 4 puntos, entonces los sucesos A, 13 y E, son igual
mente favorables.
En general, un suceso se enuncia en palabras y se simboliza con alguna
letra mayúscula (al igual que es la teoría de conjuntos). De esta manera,
si para el ejemplo 5.1 definimos los sucesos:

A : aparece un número par de puntos


B : aparece un número mayor que 2 puntos
C : aparece un número no mayor ni menor que 3 puntos
D : aparece a lo mis 5 puntos.
Entonces, ya que acontece un suceso si cualquiera de sus elementos ocu-
rre, tenemos

A = {2,4, 6)
D = {3,4, 5, 6)
C = 13}
D = {1, 2, 3, 4, 5)
En el ejemplo 5.4 cuyo espacio muestral era

C1=-1(i,j) : i = 1,2,..., 6; j =

los sucesos:

A = la suma de los puntos de los dos dados es 11


Al = la suma de los puntos de los dos dados es 7
2 los puntos de los dos dados es 6
A = el producto de
A3 = la suma de los puntos de los dos dados es menor que 4
4
equivalen a los sucesos (subconjuntos)

Al = {(5,6) , (6,5))
A2 = «1,6),(2,5),(3,4),(4,3),(5,2),(6,1))
A = {(1,6),(2,3),(3,2),(6,1))
A = {(1,1),(1,2),(2,1)}
4
Una pregunta casi inmediata, es: ¿cuántos sucesos hay en relación a un
experimento dado? La respuesta es inmediata: hay tantos sucesos como subcon
juntos sean posibles de formar a partir del espacio muestral. Así, en el ex
perimento del Ejemplo 5.1, hay 64 eventos o sucesos, incluyendo el caso en
que no ocurra uno de todos ellos. A este Último suceso se lo llama 4UCC40
iMp0441/e d. De la teoría de conjuntos, sabemos que el conjunto vacío í no
contiene elementos, entonces un conjunto que contenga al menos un elemento
del espacio muestral es un auceao pouIte, mientras que el conjunto que no
contiene ningún elemento de(1, se dice que es un suceso imposible, razón
por la que se lo simboliza por
- 91 -

Hay otros sucesos importantes que pueden apreciarse a primera vista:


así, un suceso que tiene un sólo elemento de se llama 4ucs40 4.(mpte,mien
tras que el suceso que contiene a todos los elementos de fl (que es el mismo
si ) se denomina 4UCCASO zegmo. Efectivamente, el suceso que ocurra 1, 6 2,
3, ó 4, ó 5, ó 6 puntos al lanzar un dado, es seguro. Si un suceso A, de-
finido en un espacio muestral correspondiente a un experimento particular,
no ocurre, entonces ocurre el zumo wat/unía de A, que se simboliza con Ac
(que significa que no ocurre el suceso A).

Dado un espacio muestral asociado a un experimento, al conjunto forma-


do por todos los subconjuntos posibles a partir de los elementos de') , se
denomina cale f o 6amaial de 4UCC406, y se denota por En otras pala-
bras, una clase de sucesos, es el conjunto de todos los sucesos posibles de
un experimento.

El alumno ha podido apreciar hasta esta parte la analogía entre los


conceptos de conjuntos y sucesos. Puesto que un suceso es un conjunto, en-
tonces es posible aplicar un álgebra de sucesos, y de esta manera formar nue
vos sucesos y ver la relación entre sucesos. Así por ejemplo, dados los su-
cesos A y E,

A U B es el suceso que ocurre A o B (o ambos)


A () B es el suceso que ocurre A y

Si se tiene el caso particular de que At1B = 1, entonces A y B se di-


ce que son 4UCe404 íncompatíbte4 o sea que no pueden ocurrir ambos a la vez.
Por ejemplo, en el lanzamiento de un dado, no puede ocurrir el suceso de que
el :lanero de puntos sea mayor que 5 y que a la vez aparezca un flamero impar
de puntos.

5.6

Axiomas de Probabilidad

El cálculo de probabilidades se auxi-


lia de la teoría de conjuntos y su desarrollo parte de tres axiomas (o poste
lados) básicos respecto de la medida aplicada a sucesos. Daremos más énfa-
sis a los espacios muestrales finitos. Antes de entrar a definir el concep-
to de probabilidad y ver sus propiedades, vale la pena mencionar los axiomas
de un arillo-44m de sucesos. Denotando con a a la colección de todos los
sucesos, se tiene:

1)Para todo suceso A e a , también el suceso contrario Ae es elemen-


to de a . 0 sea, que si AE Ac É .
2)Si Al, A2, ..., AA, es una sucesión numerable de sucesos en Cl, tam
bién L) A4 E a , y
i=1
-92-

3) I E a.
Veamos ahora la definición de probabilidad.
DEFINICION 5.17 La probabilidad P es una Sanción que asigna a cada su
ceso A en aun número P(A), llamado p4obabítidad del
huce40 A, tal que cumple los siguientes axiomas:

1) Si Acez P(A) O (condición de no negatividad)

2) Si A.Ea i=1,2,..
1 =* P(I)Ai) = c :P(Ai), y
i : (5.1) -
y A n A. = é Vi. 1 5 i=1
i
3) P ( II ) = 1
La probabilidad es entonces una medida aplicada a los sucesos que pue-
den ocurrir cuando se realiza un experimento. En otras palabras, la función
probabilidad es una función de conjunto real-valorada definida sobre la cla-
se de todos los subconjuntos del espacio muestral c).
Para cualquier experimento, el espacio muestrall)5 uega el papel del
conjunto universal; entonces cualquier suceso complemento (o suceso contra -
río), debe tomarse con respecto a O.
La función probabilidad que cumple los tres axiomas anteriores, se supo
ne válido para cualquier juego o experimento, tanto si los sucesos elemen-
tales son igualmente posibles o n6. Partiendo de esos axiomas, deduciremos
las siguientes propiedades importantes.
TEOREMA 5.6.1 P(é) = O para cualquier Q. (5.2)

Esto indica que la medía del suceso imposible es cero.

Demostración: Para un suceso cualquiera A, se tiene A Lié = A. Aplicando


la medida P, se tiene:

P(A L/é) = P(A), y como A nd = I, entonces por el Axioma 2,

P(A) + P(ó) = P(A)


de donde P(é) = O
TEOREMA 5.6.2 Parados sucesos cualesquiera Al y A2,
P(A1iiA2) = P(A1) P(A2) - P(AinA2) (5.3)

Demostración: Sí tenemos el diagrama (página siguiente)


- 93 -

rl

Ac
1n A2

Figura 5.6.1

vemos que Al U A2 = Al U (A? n A2).

Por el Axioma 2
P(A1 U A2) = P [A1 U (Al (1 A2 )) = P(A1) + P(A? n A2) (a)
(ya que los sucesos Al y Ac n A2, son incompatibles).
1
Por otro lado, (ver Figura 5.6.1),.
A2 = (A l fl A2 ) U (Ac (1 A2)
1 2
y por el Axioma 2,

P(A2) P(Al n A2) 1- "Al (1 A2) (b)


Luego, de (a) y (b)
P(A3 U A2) = P(A1) + P(A2 ) - P(A1 fi A2)

Para tres sucesos A l' A2, y A cualesquiera, se tiene:


3
P(A1 U A2 U A3) = P(A,) + P(A2) + P(A3) - P(A, (I A2) - P(A1 /1 A3) - P(A2 n A3) +
P(A1 n A 2 n A3)
TEOREMA 5.6.3 (Desigualdad de Boole). Para dos sucesos cualesquiera
Al y A2 ,
P(Al U A2) .4. P(A1) + P(A2) (5.4)
Demostración: Es una consecuencia inmediata del Teorema 5.6.2, puesto que

P(Al n A2) ?

COROLARIO P( U A.) C P(A.) (5.5)


í=1 1 i=1
La demostración es inmediata aplicando el método metemático
de inducción compteta.
- 94 -
TEOREMA 5.6.4 Si AlC:A2, entonces P(A1) 1 P(A2) (5.6)

Demostración: Del siguiente diagrama


n

2nAc
1

Figura 5.6.2

vemos que A2 = A-, 1.) (A2nAl)


Por el Axioma 2,
P(A2) = P(A1) + P(A2()A1)

pero P(A2((.111) 1 O
En consecuencia P(A2) P(Al) O
COROLARIO Para cualquier suceso A se tiene
P(A) 1 1 ( 5 .7)
Demostración: Como A<IS1 , entonces por el Teorema 5.6.4

P(A) 1 E(n )
Por el Axioma 3
p( n ) = 1, luego P(A) á 1
De este corolario y por el Axioma 1, concluimos que para cualquier su
ceso A, se tiene
O P(A) 1
De manera que la medida de un suceso está acotada entre O y 1.
TEOREMA 5.6.5 Para cualquier suceso peca , se tiene
P(Ac) = 1-P(A) y P(A) = 1-P(Ac) (5>13)

Demostración: Sabemos que Ae U A =n y que At n A = 1, luego


P(Ac UA) = ID( n ) = 1
y por los Axiomas 2 y 3
P(Ac) = 1-P(A)
P(Ac) + P(A) = 1 ===> .11
Il P(A) = 1-P(Ac)

Frecuentemente a P(A). y P(AC) se llaman pkobabítidades, compeementax(ao.

TEOREMA 5.6.6 Para dos sucesos cualesquiera Al y A2,


P(A NA ) = P(A ) - P(A (1 A ) (5.9)
1 2 1 1 2
Demostración: Por el siguiente diagrama

Vemos que

Al = (Av) A2) u (Al n

Aplicando la medida P, se tiene


P(A1) = p(Ai (1 A2) + P(AI NA2)

Luego,
A \ A = A (1 A
l 2 1 2 P(A \A ) = P(A1) - P(A
1 2 1
n A2) og
Figura 5.6.3

5.7

Sucesos simples y el caso de


igual Probabilidad

Es importante fijar bien el concepto de


suceso simple (o suceso elemental), cuando se realiza un experimento que tie-
ne un número finito de resultados posibles. Como veremos los valores de la
función de probabilidad P para sucesos simples están completamente especifica
dos, igualmente para todos los eventos que admite un experimento.

Mencionamos anteriormente que un.suceso simple era aquél que solamente


contenía un elemento del espacio muestral. Por ejemplo, si el espacio mues-
tral es fC, S} , los sucesos simples son {C),IS).Para un espacio muestral
f2 = (1,2,3,4,5,6) , los sucesos simples son (1}, (2) , 13) , (4) , jSj , y
(6) . Para el espacio muestral XI. f(0,0),(0,1),(1,0)} , los sucesos elemen-
tales son t(01 0)) , {(0,1)} y ((1,0)). Luego, sio tiene n elementos, en-
tonces hay exactamente n sucesos simples. Veamos la siguiente propiedad rela
cionada con las probabilidades de sucesos simples.
- 96 -

TEOEMA 5.7.1 Dado un espacio ruestral£1 y un suceso.A ( • n ,

P(A) = P(A1) + P(A2) +...+ P(An)


Al, A2,...An son sucesos simples tal que
A = Aly A2 4./ ufAn.

Demostración: Si Al, A2,..., An son sucesos simples distintos, entonces


= 0 para todo i 0 j, y por el Axioma 2,

P(A111A2U •..UAn)= E pus )


• n inl
y como A = t) Ai, se'tiane
1=1.
P(A) =E:P(Ai)
Ejemplo 5.6 Supongamos que lanzamos un dado. Si se trata de un suce-
so A: número impar de puntos al lanzar un dado, equivale
a A = (1, 3, 5) = (1) U( 3) 1./(5), luego la probabilidad del suceso"número
impar", por el teorema anterior, será
P( (1,3,5)) = P((11) + P(13)) + P(15)) •

•En muchos experimentos es razonable suponer que cada suceso simple pue
de ocurrir igualmente que cualquier otro. Por ejemplo, si nuestro experimen
to consiste en jugar a cara o sello con pna moneda bien equilibrada, eviden-
temente los sucesos simples de £1= (C, S) tienen la misma posibilidad de ocu
rrir. Si nuestro experimento consiste en elegir un estudiante de un curso
de Proyectos, es razonable pensar que cada uno de ellos puede ser elegido cors
la misma posibilidad. Si tomamos el supuesto de que todos los sucesos sím -
ples den son igualmente posibles hay una manera muy simple de asignar medi-
das de probabilidad a todos los subconjuntos de £1, que serán consistentes
con los tres axiomas de probabilidad (Definición 5.17).
Supongamos que se tiene un experimento con 1.posibles resultados, y
que cada uno de estos resultados de cuerdo a la descripción del experimento,
tienen la misma posibilidad de ocurrir. Entonces, ya que la probabilidad to
tal de todo el espacio muestral es 1, el valor común de la probabilidad para
cada suceso simple será 1/k. Además, ya que cualquier suceso es la unión de
sucesos simples (tal como lo muestra el Teorema 5.7.1), entonces la probabi- e,"

lidad de cualquier suceso ACfl estará dada por la razón del número de ele -
mentos de A (el número de sucesos simples, cuya unión es A) y el nómero.de e
lamentos de £1 . Esto es,
P(A) = para todo ACC1
nua.f '

" Para simplificar la notación, algunas veces prescindiremos del corchete de


conjunto. Por ejemplo, en lugar de P( 15) ), escribiremos P(5).
-97 -
(donde n(A) indica el número de elementos en A y n(n) el número de elemen -
tos en fl ). Este método de cálculo, bajo los supuestos de igual posibilidad,
satisface los tres axiomas fundamentales de probabilidades.
Ejemplo 5.7 Si nuestro experimento consistiera en lanzar un dado una
vez, cuál será la probabilidad de obtener un número impar?
y cuál la probabilidad de que aparezca un número mayor que 47.
Sea A el suceso número impar y B el suceso número mayor que 4, enton-
ces:
A = {1,3,5] , = (5, 6)

Luego n(A) = 3 n(B) = 2

Por tanto, P(A) = 1 .L P(B) =


6 2 b 3

Ejemplo 5,8 Sea el experimento que consiste en lanzar dos dados una
vez. Cuál es la probabilidad de que la suma de los puntos
que aparecen sea 12? Cuál es la probabilidad de que sea 17 y cuál la probabi
lidad de que la suma no sea mayor que 3?
Por el ejemplo 5.4, sabemos que hay 36 sucesos simples, ya quefl tiene
36 resultados posibles, o sea = 36. Por otro lado, sean los sucesos

A : la suma de los puntos es 12 =fl = {(6, 6)}


: la suma de los puntos es 7 =*73 = 1(1,6),(2,5),(3,4),(4,3),
(5,2),(6,l)}
C : la suma de los puntos es crp,C W 11,1)(1,2)(2,1)j
menor que 4
sed que n(A) . 1, n(B) = 6 y n(C) = 3
Luego, bajo el supuesto de que los dos dados son correctos e idénticos,
tenemos
6 1 3 1
= Y P(C) m 12
36 P(B' -. 36 n 6
Ejemplo 5.9 Se tiene un grupo de 20 profesionales. El grupo está con
puesto de 7 ingenieros varones, 2 ingenieros mujeres, 8
economistas varones y 3 economistas mujeres. Seleccionamos aleatoriamente
un profesional: ¿Cuál es la probabilidad de que el profesional seleccionado
sea una mujer?, ¿Cuál la Pr de que sea ingeniero?, /Cuál la Pr de que sea
economista varón? Si a cada profesional del grupo le asignamos un itero o>-
=elativo de 1 a 20, el espacio muestral será
(1 = { 1,2 , ,20}
♦ Algunas veces usaremos Pr y otras solamente P, para indicar la medida de
probabilidad.

- 98 -
La ocurrencia de un Suceso simple, es equivalente a que seaseleccionado un
profesional cualquiera. Supuesto que cada uno de ellos tiene la misma posi-
bilidad de ser elegido, tendremos los sucesos:

A : el profesional seleccionado es mujer


B : el profesional seleccionado es ingeniero
C : el profesional seleccionado es economista (hombre)

Entonces

n(A) = 5 P(A) =
20
= 1
4
n(B) = 9 =# P(B) =
20
n(C) = 8 p(c) = = 2
20 5
Son muchos los problemas que tienen sucesos simples igualmente posi -
bles. Como se ha visto en este caso, el procedimiento de cálculo se reduce
a contar el número de elementos de n y el número de elementos del suceso de
interés; y la probabilidad está dada por la razón de esas cantidades.

5.8

Probabilidad Condicionada

La probabilidad condicionada, llamada


también probabilidad condicional, ligada o relativa; es un modelo de probabi
lidad de bastante aplicación práctica. Lo que se trata de determinar con
una probabilidad condicional, es la medida de un suceso dado que ha ocurrido
otro suceso. En otras palabras, si se dispone de cierta información, se pre
tende averiguar, tomando como base esa información, cuál es la probabilidad
de algún suceso. Por ejemplo, si sabemos que una carta extraída, de un jue-
go corriente de 52 cartas, fué roja, entonces podemos estar interesados en
conocer la probabilidad de que sea "as" de corazones. O también, cuando ee
desea saber la probabilidad de que un estudiante selec0.onado es varón, si
es uno de los reprobados en un examen. Después de la siguiente definición,
veremos algunos ejemplos que nos aclararán estas ideas.

DEFINICION 5.18 La plobabiadad condíaonal de que ocurra A, dado que


ha ocurrido E, que se escribe P(A(B), está dada por
p(A13) .P(B) si P(8) > 0 (5.10)

En el caso particular de que


P(B) = O, definimos P(AlB) = O
- 99 -
dIC

P(A1B) se lee: probabilidad de A dado B.

Gráficamente se tiene

P(AIB) 1103)

Figura 5 8.1

Ejemplo 5.10 En un lanzamiento de dos dados, se di6 el Caso de que no


aparecieron puntos iguales a la vez. Calcular la proba-
bilidad de que la suma sea 7, que la suma sea 2, que la suma sea 8.

Sean los sucesos:

A : los dos números que ocurren son diferentes.


•: la suma es 7
C : la suma es 2
D: la suma es 8

Por el enunciado, sabemos que ha ocurrido el suceso A.

Entonces, asumiendo que los sucesos simples son igualmente posibles,


hallamos que:
30 5 6 1 1
P(A) = = w ; P(B) = 96
= ; P(C) =

P(D) = 63 ; P(All B) = ; P(Ael C) = 0; P(AAD) -

Luego:
] O 1
1/4.. 1- 1 ! V 2
P(BIA) = 5 = 5 ; P(CIA) = 6 = O ; P(DiA) = = —
5 15
W W

Ejemplo 5.11 En un cierto colegio, el 20% de los estudiantes reproba-


ron en estadística, el 10% reprobaron en economía, y el
5% se aplazaron en estadística y economía. Sean los sucesos

A = (estudiantes reprobados en estadística) y

B e {estudiantes reprobados en economía) ,

entonces P(A) = 0,20, P(B) = 0,10 y P(Ar1B) = 0,5


100 -
Si se selecciona aleatoriamente un alumno, tendremos:

La probabilidad que el estudiante falló en estadística, dado que él re


probó en economía, es

P(AlB) = P03) 121


0,10 1
2
La probabilidad que el estudiante reprob6 en economía, dado que tam -
bién fallé en estadística, es
P(AAB) 0,03 1
P(BIA) P(A) m 0,20
La probabilidad de que el estudiante reprob6 en estadística, en econo-
mía o en ambas materias, es

P(AUB) = P(A) + P(B) - P(AAB) = 0,20 + 0,10 - 0,05 = 0,25


De la definía:6n de probabilidad condicional, se puede obtenervfacil -
mente el concepto de probabilidad conjunta de sucesos, ya que

P(A(B) P(AAB)
rí p (ACIB) P(B) P(AIB) (5.11)
Y P AAB) P(AAB) = P(A) P(BIA)
P(BIA)
PA

Bato se conoce también como la propiedad de Probabilidad para xmltipli


caci6n de sucesos. En general para g sucesos, se tiene

n
P(/1 Ai) ?(A') P(AglAi) P(A31A1(1A2)...P(An IA1AA2(1...(1An_i)
i=1
Ejemplo 5.12
Se seleccionan 2 bolillas aleatoriamente sin restitución
de una urna que contiene 5 bolillas blancas y 3 negras.
Calcular la probabilidad de que ambas sean blancas. Definamos loe sucesos

A : la primera bolilla es blanca


: la segunda bolilla es blanca
C : ambas bolinas son blancas.

Entonces

An a * C P(C) P(AnB) = P(A) P(BIA)


o sea
° f•
Si por otro lado, estamos interesados en calcular la probabilidad de
que la segunda bolilla sea blanca, tendremos:
- 101. -
Del álgebra de sucesos,

B (A(1B) U (Oil B) y (Af1B) n (Ae na) • qs

entonces
P(B) = p(An e) p(Ac nB)

P(A) P(BiA) + P(AC)


I 4. 3. 4
8 • 7 8 • 7 5b
Ejemplo 5.13 Una caja I, contiene 5 focos con defectos y 15 focos sin
defectos. La caja II, contiene 2 focos defectivos y 2
sin defectos. Lanzamos un dado correcto una vez. Si obtenemos 1 o 2, selec
cionamos un foco de la caja I; en otro caso, seleccionamos un foco de la ca
ja li ¿Cuál es la probabilidad que el foco seleccionado sea defectuoso?

Definamos los sucesos

A : seleccionamos un foco de la caja I


: el foco seleccionado tiene defecto.

Entonces P(A) • 1 PIO) • 2 , P(BIA) •• -1 y P(BlAc) • 1


• 20 - "

4. ya que 11 = (Bn A) U (13nAc ) y (BnA) n (BilAc ) =

tenemos P(3) • P(BRA.) + :(BnAc )

a p(A) p(SIA) + P(Ae ) P(1310)

• 1 1 4, 2 1
3• E 3 2 12

5.9

TeoremA de Be:y.1s

Uno de los teorwaas en probabilidades


muy 'nado es el propuesto y demostrado originalmente por Tomas Bayes. Ac-
tualmente juega un rol imponente en muchas pares de la estadística *plica
de. Antes de enunciar el teorema o.:1 Bayes, veamos la probablidad de un su-
ceso alzas una partición del espacio muestra]..

Sean los sucesos A1, A2,...An que forman una partición de un espacio
zuestral ; esto es, los sucesos Ai son mutuamente e:..cluyentes y su uni6n
es n. Sea además otro suceso cualquiera B. Todo ésto en términos de un
diagrama, equivale a (ver página siguiente).
- 102-

A
l

A
n
Figura 5.9.1

Vemos que

B =aro - (Ai u A2 u... U An) n B

c,(Rin B) U (A2n B) U... (An(1 B)

y como los A. n) son mutuamente .xcluyentes, ea decir


in B (i-1,2
(Air)s) fl (Ai nB) • d para todo i # j, entonces

P(B) = P(A n5) + P(A n B) +...+ P (Ann 3)


1 2
Por otro lado,

P (Ai B) P(Ai) P (BlAi) (por 5.11)


Luego
n
P(B) = a P(Ai) P(BIAL) (5.12)
i=1

TEOREMA 5.9.1 (de BATES) Supongamos que tenemos n sucesos que


forman una partición de fl, entonces para cualquier suceso
B C 11 ,
se tiene
P(A.) P(BIA.)
P(A5IB) = 1 para j = 1,2 n (5.13)
P(A.) P(BlAi)
i=1

Demostración: Por definición de probabilidad condicionada,


P(AMB)
P(A.IB) P(B)
3

luego por (5.11) y (5.12)


P(A.) P(BIA.)
P(A.18) = n1 j = 1,2
3
P(BlAi)
i=1
-103-
Un ejemplo clásico de .a aplicación del teorema de Bayes, es como el
que presentamos a continuación.
Ejemplo 5.14 Una f¿brica manufacturera produce bombillas eléctricas en
tres plantas con volúmenes de producción diaria de 200,
350 y 400 unidades respectivamente. De la experiencia pasada se sabe que la
proporción de productos defectuosos producidos por las tres plantas, son res
pectivamente 0,03; 0;02 y 0,06.Si al seleccionar aleatoriamente una bombi -
11a de la producción total de un cierto día, comprobamos que es defectuosa,
de cuál de las plantas proviene esta bombilla eléctrica?
c En este caso es aplicable el teorema de Bayes, de manera que nosotros
tenemos del problema los siguientes sucesos:
Al : volumen de producción de la lra. planta (200 por día)
A2 : volumen de producción de la 2da. planta (350 por día)
A3 : volumen de producción de la 3ra. planta (400 por día)
B : la ampolleta tiene detecto.

De aquí, P(AilB) es la probabilidad que el artículo corresponda a la


producción de la i-ésima planta, dado que el artículo es defectuoso. Por o-
tro lado, P(Aif1B) es la probabilidad que los artículos son producidos por
la i-ésima planta y que además son defectivos.

Calculemos ahora las probabilidades en conexión con la selección aleato


ria de una ampolleta eléctrica; del total producido en un día.
1) Probabilidades de que el artículo elegido pertenezca a la i-ésima planta
2
200 4
P(A1)200+350+ 00 19
P(A2) =
• 19
4
P(A3)= 5515 8
00 • 9
1
2) Probabilidades conjuntas
4
P(Al()B) • P(A1) P(BIA1) • 5 - (0,03) 017
12
9—

P(A2i1B) • P(A2) P(BIA2) • 17(0,02) li.


a1
0 48
P(A3r1E) • P(A3) P(BIA3) • 8 )
7 (0,06) • 19

P(B) • 2:5(Ai) P(BlAi) = 0 74


i•1 19
donde P(BlAi) es la probabilidad de que el artículo seleccionado sea der.o -
Lucio sabiendo que pertenece a la i-ésiza planta.
- 10 4-

3) Probabilidades finales
)3) . (0,12)/19 = 6
P(A115) = P(Al(1
171r (0,74)/19 37

P(A2Ig) - P(A?t1B). (0,14)/19 7


P(B) 37

P(A3(1B) (3,L8)/19 = 24
P(A3IE) = 77 7W.51 37
En consecuencia, es más probable que la ampolleta seleccionada perte -
nezca a la tercera planta, sabiendo que es defectuosa. Una manera fácil de
verificar que los cálculos fueron bien hechos, es que debe cumplir
= 1
El anterior ejemplo, nos ilustra una de las principales aplicaciones
del Teorema de Bayes, en toma de decisiones.

5.10

Sucesos Independientes

No siempre se da el caso de que un suce-


so está ligado a la ocurrencia de otro suceso, como cuando para dos sucesos
A y 8 se cumple la relación ACB. Es posible también que dos o más sucesos
acontezcan independientemente. Por ejemplo, al lanzar un dado dos veces, el
resultado del segundo lanzamiento no está condicionado al resultado del rri -
raer lanzamiento. Este tipo de sucesos tienen muchísima importancia en el en&
Tisis estadístico. La definición formal para sucesos independientes es como
sigue:
DEFINICION 5.19 Dos sucesos A y 8, son .01dApeadheNte4 si y sólo si

P(A(1B) = P(A) P(B)


Se ve inmediatamente que si los sucesos A y la son independientes- enton-
ces
P(A 1 B1 = P(A !18)
P(A) P(5) = P(A)
MY P(B)
Entonces, la probabilidad condicional de que ocurra A dado que ha ocurrido B,
es simplemente la probabilidad incondicionada de A.
-105-
Elemnio 5.15 Supongamos que los números que se dan en la siguiente ta-
bla, den lee probabilidades de que un individuo seleccio-
nado aleatoriamente sea enfermo.

Tabla 5
Adquiere No adquiere
Cáncer Cáncer
Fumador 0,50 0,20
No fumador 0,10 0,20

Esto es, si decimos que A es el suceso de que el individuo seleccionado es


un fumador y que B es el suceso que el individuo seleccionado adquiere Cán
cer, entonces

P(A(1B) = 0,5, P(A/lBc) = 0,2, P(Acf1B) = 0,1 y


P(Aen Be) = 0,2
y como
P(A) = P(ArIB) + P(AnBc) = 0,7

P(B) = P(AllB) + P(Ac(IB) ='0,6


vemos que
P(A/1B) = 0,5 1 (0,7) (0,6), luego, A y B no son independientes.

Ejemtio 5.16 Si se lanzan 2 dados una vez, veremos que los dos sucesos

A : la suma de los puntos que aparecen arriba son 7, y


: los dos dados tienen el mismo número
no son independientes.

Como vimos antes, P(A) = P(B) = 1/6; por otro lado At1B = P(A(111)=0,
de manera que P(AEIB) = 0 # (1/6)(1/6) = P(A) P(B). Entonces los dos suce
scs no son independientes.

La definición anterior se hace extensiva fácilmente a más de dos sucesos.


Por ejemplo, si los sucesos A, B y C son independientes, entonces
1. P(AnB) = P(A) P(3)
2.P(A1C) = P(A) P(C)
3. ?Ca(ie) = P(B) p(c;
4.P(11BAC) = P(A) ?(B) P(C)
Hay casos en que las primeras tres condiciones no implican la cuarta y
viceversa.
- 106 -
Terminaremos este capítulo dando las dos definiciones siguientes:

DEFINICION 5.2C Un espacio muestral díbeacto es aquél que tiene un nú-


mero de elementos finito o infinito contable.

Prácticamente todos los espacios muestrales que hemos visto en los ejem
plos del presente capítulo, corresponden a espacios muestrales discretos.

DEFINIC/ON 5.21 Un espacio muestral continuo (unidimencional) es aquél


que tiene como elementos todos los puntos sobre algún
intervalo de la línea real.
Entonces, los conjuntos
(x: 0<x <1) , {x: -3 lx4 3} , (x: x> 0)
son ejemplos de espacios muestrales continuos.

Ejercicios 5.2

1.Especificar un espacio muestral para el experimento que consiste en ex -


traer una bola de una urna que contiene 10 bolas de las cuales 4 son bleu
cas y 6 rojas. (Asuma que las bolas están numeradas del 1 al 10).

2.Especificar un espacio muestral para el experimento que consiste en ex -


traer 2 bolas con reposición de una urna que contiene 10 bolas (ésto es,
la primera bola extraída es restituida en la urna antes de la segunda ex
tracción). Otra vez asuma que estén numeradas.

3.Especificar un espacio muestral para el ejercicio anterior, si el experi


mento se realiza sin reposición.

4.?ara el espacio muestral dado en el Ejercicio 1., defina los sucesos (co
mo Subconjuntos):
A: una bola blanca es extraída
3: una bola roja es extraída

5.Para el espacio muestral dado en el ejercicio 2, defina los sucesos (como


subconjuntos):
C:la primera bola es blanca
D:la segunda bola es blanca
E:ambas bolas son blancas.
Es C11D = E?
6.Supongamos que :ocios los residentes de una cierta ciudad son calvos o
tienen cabello pardo o tienen cabello negro. Además, cada residente tie
ne ojos pardos o azules. Si se seleccionaaleatoriamente un residente,
dar un espacio muestral para este experimento y defina, como subconjun
- 107-

tos, los sucesos:


A: el residente seleccionado es calvo
8: el residente seleccionado tiene ojos azules
C: el residente seleccionado tiene cabello castaño
y ojos pardos.

7. Dados cl = 11,2,3) ; A • 1.1} ; B (3) ; C = (2) ; P(A) • 1/3 y P(B) • 1/3

hallar:
7.1 P(C) 7.3 P(Ac) 7.5 P(Ac U Bc)
7.2 P(AUB) 7.4 P(Ac ("1 Be) 7.6 P(BUC)

8. Dado un experimento tal que P(A) = 1/2, P(B) = 1/2 y P(A U 15) = 2/3,
calcular:
8.1 P(Ac) 8.4 P(Ac (1 9c) 8.7 P(Ac(111)
8.2 P(Bc) 8.5 P(Ac U Bc) 8.8 P(AcUB)
8.3 P(A(18) 8.6 P(A Bc) 8.9 P(A U Bc)

9. Es posible tener una asignación de probabilidades tal que P(A) = 1/2,


P(A B) =1/3 y P(B) • 1/4?

10. Si extraemos una carta aleatoriamente de un juego estándar de 52 cartas,


cuál es la probabilidad de que sea roja? Que sea un diamante? Que sea
un as? Que sea as de diamante?

11. Una urna contiene 4 bolas numeradas con 1,2,3 y 4, respectivamente. Se


extraen dos bolas sin reposicién. Sea el suceso A tal que la suma es 5
y sea Bi el suceso que la primera bola extraída tiene el número i, i=1,
2,3,4. Calcular P(A1150, i • 1,2,3,4, y P(BilA), i = 1,2,3,4.

12. Si el experimento del ejercicio anterior, se realiza con reposición, cal


cular las mismas probabilidades que piden en el ejercicio 11.

13. Una urna A contiene 2 bolas blancas y 4 azules, otra urna B contien3 10
bolas blancas y 2 azules. Si una urna es elegida aleatoriamente y se ex
trae una bola de ésta, cuál es la probabilidad de que la bola selecciona
da sea azul? Cuál que sea blanca?

14. Un lote de 15 radio-grabadoras es recibido por un almacén de ventas. En


el pasado, se sabe que el 70% de tales lotes no contienen defectivos, 152
contienen un defectivo, 10% contienen 2 defectivos, y 52 contienen 3 de-
fectivos. Cuatro grabadoras son seleccionadas a la vez aleatoriamente
para su observación, y se halla que 2 son defectivos.

14.1 Antes de seleccionar la muestra, cuál es la probabilidad de rzcibir


un lote que contenga 3 defectivos?
14.2 Con la evidencia muestra', cal es la probabilidad que la caja justa
mente recibida contenga tres defectivos?
-108-

CAPITU10 6

VARIABLES ALEATORIAS Y
FUNCIONES DE DISTRIBUCION

Ahora estudiaremos una de las ideas ten


trales de las probabilidades y la estadística, que es el concepto de varia -
ble aleatoria, y sobre todo las funciones de distribución de ésta. Puede de-
cirse que en la actualidad, el concepto de variable aleatoria y sus funcio -
nes de distribución de probabilidades, son el nexo entre la teoría de proba-
bilidades y la estadística inferencial.

En el capítulo anterior se han considerado una serie de experimentos ,


tales como lanzar una moneda, rodar un dado, seleccionar un artículo de la
producción en serie de cierto día, la extracción de una bolilla de una urna
o una carta de un juego de cartas, etc. A estos experimentos los hemoi lla-
mado egnsimentoa a/eatoxias, porque ellos pueden admitir diferentes resulta
dos en pruebas repetidas bajo las mismas condiciones. Por otro lado, vimos
también varias propiedades para calcular probabilidades de sucesos asociados
a un espacio muestralfl. En la aplicación de la teoría de probabilidades ,
es frecuente el interés de conocer además cómo se distribuyen las probabili-
dades relacionadas con alguna característica de los posibles resultados de
un experimento. Todos estos antecedentes nos facilitarán captar con facili-
dad el concepto de variable aleatoria y sobre todo las funciones de distribu
ción relacionadas con ella.

DEFINICION 6.1 Una variable ateatnnia X es una función cuyo dominio


es el espacio muestralfly cuyo recorrido es un conjun
to de números reales, de manera que para cualquier número real x, el
conjunto de sucesos elementales w para los cuales %MI x es un suceso,
ésto es, un elemento de la clase de suceso de fl.

Esta última condición puede escribirse {w e fl I X(w) 4 x} e a.


En otras palabras, la variable aleatoria es una función que asigna un
número real e cada suceso simple de un espacio muestral (o sea a cada elemen
to de fl). Así por ejemplo, si consideramos el juego más sencillo que con-
siste en lanzar una moneda, sabemos que puede resultar cara o sello, es decir
que CP. (C,S}, y si definimos la variable aleatoria X como el "número de ve
ces que aparece cara", entonces X es una función sobre(); de manera que
X(C) a 1 y X(S) a O. Ahora, si el experimento consiste en lanzar un dado co
mem, puede definirse una variable aleatoria que indique el número de puntos
que aparecen; en tal caso, X puede tomar los valores 1,2,3,4,5 ó 6.
-109-

Ejemplo 6.1 Sea el experimento que consiste en lanzar tres monedas al


aire, y sea la variable aleatoria X: número de caras.
El espacio muestral asociado a este experimento, está dado por
{(CCC),(CCS),(CSC),(SCC),(CSS),(SCS),(SSC),(SSSU
Entonces X(CCC) = 3; X(CCS) = 2; X(CSC) = 2,...,etc. La Tabla 6.1 nos mues-
tra todo el recorrido de la variable aleatoria X: número de caras, o sea,
0,1,2 y 3.

TABLA 6.1

Puntos
Muestrales (ccc) (ces) (CSC) (SCC) (css) (SCS) (SSC) (SSS)

Número de
caras X 3. 2 2 2' 1 1 1 0

De acuerdo a cuál sea el espacio muestral desde el punto de vista del


número de sus elementos, una variable aleatoria puede ser discreta o conti -
nua. Antes de considerar otros ejemplos, veamos la siguiente definición.

DEFINICION 6.2 1) Una variable aleatoria X es díbotatd si su recorri-


do pertenece a un conjunto discreto de números rea-
les.

2) Una variable aleatoria X es continua si su recorrido pertenece a un


conjunto continuo de números reales, y la probabilidad de que X tome
un sólo valor de su recorrido, es cero.

Ejemplo 6.2 Si el experimento consistiera ahora en lanzar al aire cua


tro monedas una vez (es equivalente, lanzar una moneda 4
veces), y definimos la misma variable aleatoria X: número de caras, enton -
ces
(1 I(CCCO),(CCCS),(CCSC),...,(SSSS)},
11 = {(i,j,k,1): i = C,S; j = C,S; k = C,S; 1 = C,S}
donde O = cara y S = sello. Luego el recorrido de X es el conjunto (0,1,2,
3,41, de manera que X es una variable aleatoria discreta.

Ejemplo 6.3 Supongamos que la hora de llegada de un avión al aeilopuer


to está indicada entre las 6:00 y 6115 de la tarde. El
espacio muestral para la hora (en minutos) de llegada del avión será

n= (x: 4x115}
.Ahora, si X es el momento de llegada, entonces el recorrido de X es el con -
junto {x: O 4x413}; de esta mañera X es una variable aleatoria continua.
Ejemplo 6.4 Si se trata de conocer los ingresos individuales de 50
trabajadores, el espacio muestral puede ser el conjunto
,,, cuyos elementos son el listado de los 50 trabajadores; y si Y indica el
ingreso, entonces el recorrido de r serán los ingresos de los 50 trabajado -
res, de manera que Y es una variable aleatoria discreta.

Antes de considerar el estudio de las funciones de distribución de una


variable aleatoria, conviene recalcar algunos conceptos que se vienen utili-
zando. Por lo expuesto, vemos que una variable aleatoria es una Punción ele
mentó cuyo dominio es el espacio muestral para un experimento (Capítulo 5,
definición 5.12). La letra w se está utilizando para representar un elemen-
to genérico del espacio muestral, y X(w) para indicar la representación fun-
cional de la variable aleatoria X. Nosatros, en general, denotaremos una va
riable aleatoria simbolizándola por una letra mayúscula, tal como X,Y,Z,U,V,
W, etc., y a los valores que éstas toman, con las letras minúsculas x,y,z,u,
vy.etc., respectivamente. En particular, si X es una variable aleatoria
que toma diez valores en su recorrido, estos valores los simbolizaremos por
xl, x2,...x10; 6 xi: i = 1,2...,10. (Puede apreciarse que esta parte es and
loga a la estudiada en el capítulo 1, en lo que concierne a las variables).
Otra característica importante que se nota, es que cualquier valor que toma
una variable aleatoria es equivalente a un suceso, ya que hay siempre algún
suceso ele:rental o un suceso con más dé un resultado posible, asociado a ese
valor. Así por ejemplo, si observapos la Tabla 6.1, al valor x - 3 le co -
rresponde el suceso {(CCC)}; al valor x = 2, el suceso {(CCS),(CEC),(SCC)},
etc. En vista de esto y por la definición 6.1, ya que un valor de una varia
ble aleatoria es un suceso, entonces es posible aplicar la medida de probabi
lidad a dicho valor. De esta manera si tenemos las probabilidades de todos
los valores que puede asumir una variable aleatoria, entonces es posible es-
tudiar la distribución de probabilidades de tal variable aleatoria; luego,
podremos obtener la llamada función de probabilidades, o distribución de pro
babilidades, o simplemente distribución de una variable aleatoria.

6.2

Funciones de Probabilidades y
Distribuciones para Variables
Aleatorias Discretas

Si X es una variable aleatoria discre•


ta, podemos usar medidas de probabilidad definidas sobre loe subconjuntos de
S) para deifinir la función de probabilidad de X.
DEFIRICION 6.3 La lunean de pm/balita d para la variable aleatoria
X, es una función de una variable real x (denotada por
p1(x)) que está definida por

p1(x) = P(X(w) = x), para todo x real. (6.1)

Esta función recibe también el nombre de &nein.: de cuentea.


Si nosotros tenemos un espacio muestralil asociado a un experimento a-
leatorio y se tiene una variable aleatoria discreta X definida sobre los ele
mentos de fl, entonces podemos hallar px(x) como sigue.
Sea el suceso
A(x) = X(w) = xj
Entonces px(x) = P(A(x)) para todo x real. Vemos inmediatamente
que A(x)
puede ser un suceso imposible (45) para muchos x, entonces px(x) = O para ta-
les x.

Ejemplo 6.5 Consideremos el experimento que consiste en rodar un par


de dados una vez. Recordemos que el espacio muestral pa-
ra aste caso esta dado por

fl= {(i,j): i = 1,2,..., 6; j = 1,2,...,6}

..onde i indica el número de puntos del primer dado y, j los puntos del segun
do. La figura 6.1 nos muestra este espacio muestral donde cada punto rere-
p
senta un (i,j)cn. .
n
6
I in
5
a 11—
4
aun
3
a En
2
1 anua
a nn
o
1 2 3 U 5 6
Figura 6.1 Espacio muestral correspondiente
al lanzamiento de dos dados una
vez.

Bajo el supuesto de que el experimento se realiza en condiciones norma


les y con dados equitativos, podemos pensar q ue cada (i,j) tiene la misma po
sibilidad de ocurrir, es decir que PUi,j)] = 1/36. Recordemos
que el Ami;
ro total de sucesos posibles en este caso es muy grande *, ya que el número
de sucesos simples son 36.

Asociado a este experimento y para el mismo espacio muestral, pued en


definirse muchas variables aleatorias, por ejemplo, que X sea la suma de los
puntos que aparecen, la diferencia del primero y el segundo, el producto de

cono n(11) = 36, entonces n(5) = 236, 0 sea que el número ae sucesos se
aproxima a los 69 mil millones.
- 112 -

elles, la suma de sus cuadrados, etc. En general se tendrán distintos reco-


rridos para distintas variables aleatorias asociadas a un mismo espacio mues
tral. Para seguir con nuestro ejemplo, consideremos el caso clásico, es de-
cir, que X sea la suma de los ptntos que aparecen en los dos dados. Entonces
el recorrido de X(i,j) = i+j, es el conjunto (2, 3, 4, 5, 6, 7, 8, 9, 10, 11,
12) f (Ver figura 6.2),

(6,6)
\:11

• • • ,L •
• •
X(i,j ) i+j
• • •

• • \*.\\

O ;•\

\ON

l 2
Figura 6.2 Representación gráfica de la
función X(i,j) =
De la figura 6.2, se desprende que bajo la aplicación de la función X,
hay valores de X que corresponden a varios puntos del espacio muestral; así
por ejemplo, el 3 ea originado por los sucesos elementales ((1,2)1 y 1(2,1))
para el 7 hay seis sucesos simples, etc. Es decir, que hay valores del re-
corrido que se repiten más veces que otros. (En el Capítulo 2, a este hecho
se denominó: Frecuencias Absolutas). De manera que podemos hablar de la
existencia de una distribución de valores absolutos de la variable aleato -
ria X asociada a un experimento, y por tanto se puede hallar fácilmente la
distribución de sus probabilidades. Así por ejemplo, P(x = 2) = 1/36,
P(x = 3) = 2/36 = 1/18, F(X = 7) = 6/36 = 1/6, etc.
La Tabla 6.2 nos muestra el detalle completo de la distribución de la
función de probabilidades tara la variable aleatoria X(i,j) «7: (Se 8,10n
seja al estudiante, comparar la analogía que existe entre la Tabla 6.2 y
la que se estudió en el Capítulo 2.).
- 113 -

TABLA 6.2 Distribución de probabilidades y probabilidades acu-


muladas de la variable. aleatoria X(i,j) = i+j para
el experimento que consiste en rodar dos dados una vez.

Suma de los Número de P(X=x)1=px(x) P(X 4x)


puntos veces que Probabilidad de Probabilidad de
X = x aparece x que X tome el que X tome un
valor x valor menor o
igual Que x

2 1 1/36 1/36
3 2 2/36 3/36
3 3/36 6/36
5 4 4/36 10/36
6 5 5/36 15/36
6 6/36 21/36
8 5 5/36 26/36
9 4 4/36 30/36
10 3 3/36 33/36
11 2 2/36 35/36
12 1 1/36 1

E 36 1
Jr-

Si comparamos la Tabla 6.2 con la Tabla 2.3 del Capítulo 2, vemos que
son completamente análogas; de manera que es aplicable todo cuanto estudia-
mos en estadística descriptiva respecto de las distribúciones de frecuen -
CiaB y las medidas que se podrían obtener,- tanto de tendencia central como
de variación. A diferencia de entonces, en nuestro caso, se trata de estu-
diar el comportamiento de una vaithabte á/cato/tia; o mejor dicho, las distri
buciones de las probabilidades de una variable aleatoria. También es inpor
tante representar gráficanente, las distribuciones de probabilidades, a fin
de tener una idea de la forma en que éstas están distribuidas. Naturalmen-
te que la forte de la distribución dependerá de cuál sea el experimento y
cuál la variable aleatoria definida sobre su espacio- muestral. La forma
que toma la distribución de una variable aleatoria, es de gran importancia
I- para el análisis estadístico, por lo que debemos prestarle la mayor aten -
ci6n posible.
Como mencionamos anteriormente, podemos hallar cualquier tipo -de medi-
da relacionada con la distribución de probabilidades de una variable aleato .
ría asociada a algún experimento. Así por ejemplo, para la informaci6n de
la Tabla 6.2, podemos calcular la media aritmética de los valores de X, uti
Usando la fórmula (3.3) o la (3.4). Para ésta última tendríamos
12
xPx(x) = 2 . 1/36 + 3 . 2/36 +....+ 12 . 1/36 4 7

Esta medida, tal como veremos más adelante, recibe el nombre denvelor cene-
E142"0"~eranza. matemática."
-114-
En lo que sigue, veremos todo lo relacionado con estas ideas incluyendo
algunas propiedades importantes para nuestro estudio de la inferencia estadía
tica. Nuestro deseo es muy grande por presentar los aspectos teóricos en de-
talle, sin embargo, creemos que se pasaría del nivel y objetivo del presente
trabajo; por ello, nos limitaremos estrictamente a lo necesario para compren-
der los temas de los capítulos posteriores.

Se tendrá una función 41 probabilidades para una variable aleatoria dis-


creta, si satisface las siguientes condiciones:

px(x) = 1 , para cualquier variable aleatoria X. (6.2)


RX
donde RX nos simboliza el recorrido de X.

Además, px(x) 0 para todo x (6.3)

Obsérvese que la función de probabilidades definida para el Ejemplo 6.5,


cumple las dos condiciones anteriores (Ver Tabla 6.2).

Con toda variable aleatoria, tal como vimos, está asociada otra función
que se llama su función de distribución. En estadística las probabilidades
de las funciones (variables aleatorias) se tratan por medio de sus correspon
dientes funciones de distribución.

DEFINICIOR 6.4 Si X es una variable aleatoria, la dame:can de datAibu-


dan, es una función Fx, definida por

Fx(x) P(Xlx) I

para todo número real x.

Notemos que Fx(x) dá la acumulación de probabilidades para X que toma


cualquier valor menor o igual que x. Por esta razón, recibe también el nom-
bre de Sanción de dizttabaUdn aeumutativa. (observe la cuarta columna de la
Tabla 6.2).
Si se conoce la función de probabilidades de una variable aleatoria dis
creta X, podemos ver fácilmente que

Fx(x) 5::: 'X(xi) (6.4)


xi"
donde la suma se realiza para todos los valores dei tales que x/4 x.

Ejemplo 6.6 Tomemos la información del Ejemplo 6.1. Si los ocho suce-
sos simples son igualmente posibles de ocurrir, entonces
la Tabla 6.3 nos muestra la distribución de probabilidades para la variable
aleatoria X: número de caras.
-115-

TABLA 6.3

Número de
Cara Px(X) Fx(X) ?(X<X)
X

o 1/8 1/8
1 3/8 4/8
2 3/8 7/8
3 1/8 1

E 1

Supongamos ahora que x4CO, por ejemplo x = - 1,5, entonces (X4-1,5)= 1


luego P(X4-1,5) = O
Si x 0,3, entonces (E5 0,3) = l(SSS)1, luego PCX 40,3) = P(SSS) = 1/8
Si x = 1,8, entonces (X1x) = {(CSS),(SCS),(SSC),(SSS)}, luego

P (X 1 x) = PR(CSS),(SCS) ,(SSC),ISSS Ir t

Si x 1. 3, entonces (X 4 x) = n, luego P(X44) = 1

Una forma adecuada de presentar las funciones de probabilidad y de dis-


tribución, es:
Para nuestro ejemplo,
px(x) = 1/8 si x = 0 6 3
=3/8 si x = 1 6 2
= O en otro caso
Por otro lado
PX(x) = O si x<0
= 1/8 si Clx(1
= 4/8 si 1 4 x 2
= 7/8 si 2 1x <3
= 1 si x )3
El gráfico 6.3 nos muestra éstas dos funciones.
- 116 -
F X(x\
'
1

3/8

2/8 0,5

1/8
X
x
0 1 2 3 -1 0 1 2 3 4
Figura 6.3 Representación gráfica de las
funciones px(x) y Fx(x).
Las propiedades más importantes de una función de distribución, son las
siguientes: -

1) 06Fx (x)( 1 puesto que Fx(x) es una probabilidad


para todo x. (6.5)

2) Si xiGx2 entonces Fx(xl) < Fx(x2), lo que nos


indica que Fx(x) es una función no decreciente (6.6)

3) lim Fx(x) = 1 y lira FX(x) = 0 (6 .7)


x 00 x

P(X>x) = 1 - F(Xlx) (6.8)

6.3

Funciones de Densidad y
Distribuciones para
Variables Aleatorias Continuas

En lo que dice relación a variables a-


leatorias contínues, se tienen las siguientes características.
DEFINICION 6.5 Una variable aleatoria X tiene una distribución absolu-
tamente contínua si existe una función fx(x), tal que
Fx(x) = j/x(t)dt:

para todo número real x.


La función f,(x) se llama One.e6n de devuudad de la variable aleatoria
contínua X, o de función de distribución absolutamente contínua Fx(x), y
- 117 -
es tal que
f X (x) = Fx(x)

Las condiciones que deben cumplir la función de densidad y la función


de distribución de una variable aleatoria continua, son anflogas qué para
una variable aleatoria discreta, salvo el caso de que fx(x) = O para un va-
lor particular x cuando X es continua.
1) Si xj.< x2, entonces
x2
P(x2.1:Xlx2)1-S fx(x) dx (6.9 )
xl
También P(a<X<b) = Fx(b) - Fx(a)

2) 1 fx(x) dx = 1
(6.10)
fx(x) O -o* < x oco

Ejemplo 6.7 La siguiente Punción, satisface las condiciones de fun -


ción de distribución continua
Fx(x) = 0 si x<0
= 1 - e-2x si x1:0
Veamos cuél seré su función de densidad.

---F
dx X (x) = O si x<0
= 2e-2x si x> 0
Luego 'X(x) = 2e-2x si x>0
=O en otro caso
La función fX(x) = 2e-2x (Figura 6.4) nos permite hallar probabilida-
des como las siguientes:
0,4 0,4
F(x10,4) 2e-2x dx _e-2x] . l - e- 0,8 . 0,5507 „.„.,
O O

Vemos que es equivalente a haber usado la funoión de distribución, o sea


- 118 -
Fx(0,L) = '— e -2(0,4) = nxi0,41
00
P(X >1) = .1" 2e-2x dx = e-2 = 0,1353
1
2
P(l< X <2) =1« 2e-2x dx = e-2 - ea = 0,117
1

x
8,4
Figura 6.4 Representación gráfica de fx(x) = 2e-2x
Ejemplo 6.8 Consideremos la función de densidad
f X (x) = 1 x si O<x< 2
= O en otro caso.
2 ix
Entonces Fx(x) =
rx
24. t dt _ x2 si 01, x ‘2
2 4 4
o o
Luego Fx(x) = O si x<0
x2
— 4.0 Lx .41 2
4
=1 si :0, 2

0,5

0 1 2 0 1 2
Figure 6.5 Representación sitiea de les funciones de densi-
dad y distribución de la variable X dada en el
Ejemplo 6.8
-119-

Veamos algunas probabilidades


cli,501x . t2 1.1,5 11 )2

J o2
P(X1 1,5) = 4 --9— - 0,5625
o 2
P(X >1,6) 1: 1 - P(X4 1,6 = 1 -lita
- - 0,19

V(0,7 0(41) = Fx(1) - Vx(0,7) • - ( 2E12 0,1215

P(x<1 o x >1,5) = P(x<i) + P(x >45) = 0,25+0,4375 = 0,6875

6.4

Operaciones con
Variables Aleatorias

En esta sección, nos limitaremos a enun


ciar algunas operaciones entre variables aleatorias, cw/os resultados también
son variables aleatorias.

TOEREMA 6.1 Sí X e Y non variables aleatorias, también lo son las siguientes


expresiones:
1) XSY
2) X Y
3) X2
4) K X (para cualquier X constante)
5) XIX si Y(w) O O

También vale la pena mencionar, que si X e I con variables aleatorias y


está definida la función máx {X,Y} como la función que a cada w e Q hace co -
?responder el mayor de los dos ndmeros X(w), Y(w); entonces, máx {X,Y} es tam
bién una variable aleatoria.

Si H es una función real definida sobre (- ce, os) y X es una variable


aleatoria, definida la función H(X), seré a su vez una variable aleatoria.
- 120 -

6.5

Valores Esperados

En los capítulos 3 y 4 vimos cómo se de


terminan tanto medidas de tendencia central COMp de variabilidad y sus res-
pectivas aplicaciones, para distribuciones de frecuencias de una variable
cualquiera. En forma análoga, en el caso de tener la distribución de proba-
bilidades de una variable aleatoria, es de mucha importancia obtener medidas
que nos indiquen el comportamiento de dicha variable, para la teoría estadía
tica y sus aplicaciones.

Antes de estudiar tales medidas, hagamos algunas consideraciones pre -


vias. Hemos visto que si X es una variable aleatoria discreta, para calcu -
lar probabilidades respecto de X, se puede usar su función de distribución
Ex(x) 6 su función de probabilidades px(x); de igual manera, si X es conti -
nua, se puede usar la función de distribución Fx(x) ó la función de densidad
fx(x), para determinar probabilidades acerca de X. Además de saber el inter
valo del recorrido de una variable aleatoria X, es muy frecuente la necesi-
dad de conocer el promedio de los valores que ella toma o el valor que se es
pera que tome. Así por ejemplo, si apostamos 10$ a la ocurrencia de un cier
to resultado en un juego de azar equitativo, estaremos interesados en saber
cuánto en promedio, se espera recuperar. Si realizamos una inversión anual -
de 10.000$ desearenos saber, cuánto de utilidad en promedio, se espera obte-
ner: Si se aplica un sistema de alimentación especial a 1.000 bovinos, cuán
tos esperamos que aumenten de peso al cabo de un cierto tiempo? Así como es
tos tres casos, podemos estar frente a un sin número de problemas, relaciona
dos con el valor promedio de una variable aleatoria.

Nosotros, en general nos refernemos al valor promedio de una función


de una variable aleatoria H(X), la que incluye el caso particular de que
H(X) = X.

DEFINICION 6.6 1) Si X es una variable aleatoria discreta con función


de probabilidades p (x), el vatox upehacto de X (que se
x
escribe E(X)), es

E(X) x px(x) (6.12)


Ex

siempre y cuando la serie (suma) sea absolutamente convergente.

2) Si X es una variable aleatoria continua con función de densidad


fx(x), el vatot Weitado de X, es

E(X) r
jp
xf (x) dx
X
(6.13)
^"X

si la integral es absolutamente convergente.


- 121 -
Si la suma o la integral no es absolutamente convergente, entonces el
valor esperado no existe.
Si B(X) es una función de la variable aleatoria X, entonces, el valpr
esperado es
E LH(X)1= 5:: Hlx) px(x) (6.14)
Ri

si X es discreta, y
E EH(X)1 =1 11(x) fx(x) dx (6.15)
Rx
si X es contínua.
El valor esperado recibe también otros nombres, tales como cápártanza ma
teridtíca, mem pxomedio, o simplemente media, de una variable aleatoria.
Usualmente a E(X) se la denota también por Ax, o seaE(X)=Atx.

Ejemplo 6.2 Si tenemos el experimento que consiste en lanzar al aire


tres monedás, cuál es el número de caras que se espera que
ocurran? Recordemos que para este caso pX(x) = 1/8 para x = 0,1,2,3, si X
es la variable aleatoria que indica el número de caras. La Tabla 6.4 nos
muestra el cálculo del número esperado de caras.
TABLA 6.4 Cálculo de la esperanza matemática
del número de caras al lanzar tres
monedas.

xi Px(xi ) xiPx(xi)
0 1/8 0
1 3/8 3/8
2 3/8 6/8
3 1/8 3/8

E 12/8

Luego E(X)= iUx = 12/8 = 3/2


Antes de seguir, hagamos una aclaración muy importante. El valor espe-
rado se trata de una medida teórica o ideal, no es que se espere que efecti-
vamente X tome el valor 3/2 en un lanzamiento de tres monedas; lo que cabe
esperar razonablemente es que el valor medio de X en un gran número de expe-
rimentos se acerque al valor esperado de X.

Ejemplo 6.10 Sucongamos que se tiene un dado cargado, tal que la proba
bilidad de que aparezca un número es proporcional a cada
número. Si se realiza el experimento de rodar el dado, qué número se espera
que aparezca?
- 122-
La Tabla 6.5 nos muestra el recorrido y sus probabilidades de la varia-
ble aleatoria X asociada a este experimento.

TABLA 6.5

x. 1 2 3 4 5 6

1/21 2/21 3/21. 4121 5/21 6/21


Px(xi.)
6
Luego E (X)= 5 x. p (x) = 1.(1/21) + 2(2/21) +...+6(6/21) =
i=1 X 1

91/21 = 4,33

Ejemplo 6.11 Supongamos que un médico recomienda a su paciente seguir


una dieta especial durante medio año. Considerando su
estructira y formación ósea, él estima que es igualmente posible que dismi-
nuya de peso entre 7 y 13 kilos. Cuántos kilos en promedio se espera que
pierda siguiendo dicha dieta? Si hacemos que X sea el número de kilos que
perderá, entonces

f (x) = 1 si 7< x < 13


X
= O en otro caso.

Luego el peso promedi.., que perderá, es


3 2 13
Ax= E(X) ° Si x . e dx = t.c-1 = 10 kilos.
7 7
Ejemplo 6.12 La utilidad que se obtiene por la utilización de una plan
ta particular de energía eléctrica, durante el mes de
febrero es una función de la cantidad de lluvia que cae durante ese mes.
La utilidad es aproximadamente 3(1 - e x) cien miles de 5, donde x represen
ta el número milímetros de lluvia-ixlda
ca durante dicho mes. Suponiendo que
la distribución de X es fX(x) = e (O <x < oo), cuál es la utilidad espe-
rada por la compañia de luz durante el mes de febrero?

Entonces
oo
30_8 x) e-2x dx
E [11(X2= E [3(1-e x)] = o
oo
-3x 1 1
= 3(e 2x -e ) dx = 3( - 3) = 0,5 cien miles de $.
So
De manera que se espera tener una utilidad de 50.000 $.

Examinaremos ahora las propiedades de la esperanza matemática.


- 123-

TEOREMA 6.1 Si X e Y son variables aleatorias continuas o discretas cuyas


distribuciones de probabilidades se conocen, entonces:

1)E(K) = k donde K es una constante


2)E(J.X) = KE(X) (6.16)
3)E(X+Y) = E(X) E(Y)
si existen las esperanzas. Estas proposiciones se demuestran fácilmente a-
plicarlo la definición de esperanza.

Otra medida esencial para muchas aplicaciones, es el promedio de los


cuadrados de los desvíos de los valores de una variable aleatoria, respec-
to de su media /X. Esta medida recibe el nombre de varianza de una varia-
ble aleatoria.

Es importante reiterar que las interpretaciones de las medidas de ten-


dencia central como de las de variación, son completamente idénticas a las
estudiadas en los capítulos 3 y 4, solo que ahora se está tratando con dis-
tribuciones de probabilidades de variables aleatorias.

DEFINICION 6.7 Si X es una variable aleatoria discreta o continua con


espera..za E(X) =/"x, la vailianza de X (expresado por
V(X) a4, está definida por
V(X) =0-2 = E [(X -44 )21 (6.17)
x
La raiz cuadrada positiva de la varianza, denotada por gg, se llama
dm/A:tan eetandah de X. Es decir

O- = V(X) = O-
X 1-7X
Una propiedad para la varianza de una variable aleatoria,
que se usa frecuentemente para cálculos, es la siguiente

TEOREMA 6.2 Si X es una variable aleatoria que2tiene distribución discreta


o absolutamente continua, y si E(X ) existe, entonces
2 2 (6.18)
V(X) = E(X ) - 7:`'X

Demostración:
V(X) = E ( x -AA )2 j = E[X2 -
[ 2.1? +px]
2
= E (X ) — 2,4x E(X) +,52c
2
= E (X ) - a
Ejemplo 6.13 Calculemos la varianza de X dada la información del ejem-
plo 6.9.
- 124-

En primer lugar,

( ) = 02.0/8) + 12.(3/8) + 22.(3/8) + 32.(1/8) = 3


E(X2) = Ex2Pxxi
i
2
y como E(X) = 3/22==›/Uk = 9/4

Luego V(X) = 3 - 9/4 = 0,75 /

y la desviación estándar será = 17,


-517 1 0,866

Ejemplo 6.14 Calculemos ahora la varianza y desviación estándar para los


datos del ejemplo 6.11.

Sabemos que " = 10 kilos, entonces


13
la 1 3
V(X) = E [(X - 10)2] = ‘
i (x-10)2 • —6 dx = 1- (x-10) =. 3
18
7 7
Y
CX = 17 = 1,732

Veamos algunas propiedades relacionadas con la varianza de una variable alea-


toria.

TEOREMA 6.2 Si X es una variable aleatoria discreta o continua.

1)V(X) )0
2)V(K) = O (donde K es una constante)
3)V(KX) = K2 V(X) (6.19)
4)V(-X) V(X) 2
'5) V(aX + b) = a V(X) (donde a y b son constantes)

Las demostraciones de estas proposicibnes se deja como ejercicio para los es-
,
tudiantes.

6.6

Variables Aleatorias Estándar

Una función lineal importante de una va-


riable aleatoria X, es la que se denomina forma estándar de X.

DEFINICION 6.8 Si X es una variable aleatoria con media j9 y desviación


estándar Crk, entonces la 40Jund e&tándax de X, es la va-
riable aleatoria.
,:e,i'' "wke,

/.1 e --- --- ., le•A


17
IQ.- vnall"

1-

o .
•• %D.'

'''''''''''
y\
-S \
Oh

• •
15 2_
\\

(6.2o)
En capítulos posteriores veremos la utilidad de una variable aleatoria
en su forma estándar. La propiedad relevante de una variable estandarizada
es que tiene como media cero y su varianza es la unidad, es decir
E(Z) , g1:2L1.21r. ) , E(X) - E(X) O
cx CX
Y 2
V(Z) = E(Z2) - [E(Z)] 2 = E CE2
ok 11) 2 E(
oi
X)2,
le -1
02
que también nos indica que Tz • 1.

Cabe destacar otras propiedades de una variable aleatoria estandarizada. La


transformación Z no cambia la función de probabilidades original de X. La
probabilidad de cualquier valor de 2 es la misma que corresponde al valor
de X. La transformación Z cambia la escala la variable original.

6.7

Distribución Conjunta
de Variables Aleatorias

La importancia del estudio de la con -


teta conjunta de varías variables aleatorias, se justifica ampliamente, ya
que los fenómenos de la naturaleza están caracterizados, en general, por la
.coexistencia de diversos atributot y medidas. A menudo se nos presenta la
necesidad de considerar distribuciones multiariantes, puesto que la resclu
el& de muchos problemas prácticos por su naturaleza lo exigen; así por
ejemplo, de un grupo de obreros elegidos aleatorisiente puede interesarnos

al mismo tiempo la relación entre su edad, peso, estatura, su ingreso mone-
tario, etc.; de una pieza metálica fabricada con un cierto proceso, elegida
aleatoriamente, podemos desear conocer su dureza y resistencia al calor,
etc.

En esta sección, después de presentar un ejemplo ilustrativo , veremos


definiciones de conceptos nuevos de mayor importancia, relacionados con die
tribuciones bivariantes.

Ejemplo 6.15 Se tiene conocimiento que las compañías A y E controlan


respectivamente el 50% y 20% de la demanda en el mercado
de un cierto producto. Se trata de obtener una distribución bivariante del
numero de clientes que fomentan cada compañía tomando muestras de dos consu
midores de dicho artículo. Representaremos con el símbolo (x,y) el evento
en que x de los dos compradores son clientes de A y, que z de los dos consu
- 126 -
midores son clientes de B. Por otro lado, representaremos por

PX (x,y) a la probabilidad conjunta de estos eventos. Dado que


las dos compaásas juntas tienen solamente una demanda del 70%, supondremos
que el 30% restante de los que consumen dicho producto, prefieren otras com-
pañías; denotaremos con N cuando uno de los clientes lo previera así. La Ta
bla 6.6, nos muestra los posibles casos para dos compradores elegidos aleato
riamente.

TABLA 6.6

Consu- Consu- Probabilidad Suceso Probabilidad


midor midor compuesta biva - total del suceso
1 2 riente bivariante
íxJ)

A A (0,5)(0,5) = 0,25 (2,0) px,y(2,0) = 0,25


A B (0,5)(0,2) = 0,10 (1,1) (1,1)
px,y = 0,20
B A (0,2)(0,5) = 0,10 (1,1)
A N (0,5)(0,3) = 0,15 (1,0) px,y(1,0) a 0,30
E A (0,3)(0,5) = 0,15 (1,0)
B 3 (0,2)(0,2) = 0,04 (0,2) px,y(0,2) = 0,04
B N (0,2)(0,3) = 0,06 (0,1)
N B (0,3)(0,2) = 0,06 (0,1) pxx(0,1) = 0,12
N N (0,3)(0,3) = 0,09 (0,0) px,x(0,0) = 0,09

La distribuoidn bivaria/te de la Tabla 6.6, puede presentarse en forma


más compacta (Tabla 6.7)

TABLA 6.7 Distribución bivariante


de clientes.

0 1. 2
- PY(YY
>k,
0 0,09 0,30 0,25 0,61+
1 0,12 J,20 0 0,32
2 0,04 o o 0,04
px(x) 0,25 0,50 0,25 1

En los márgenes de la Tabla 6.7, se tienen las sumas de las filas y co-
lumnas de las py y(x,y). Los totales de las columnas indican las probabili-
dades px(x) de qle x de los doe compradores son clientes de la compañía A;
y los totales de las filas, las probabilidades px(y) de que y.de los dos
-127-

compradores son clientes de B. A estas probabilidades se las denolinan dfA-


t&tibucLoneb wang2nale4, que no son otra cosa qua simplemente distribuciones
univariantes (de una sola variable). Los valores de la tabla indican las
probabilidades de las distintas alternativas de preferencia de ambos consumí
dores; así por ejemplo, p. y(1,1) 0,20, índice la probabilidad de que uno
de los compradores sea cliente de A y el otro B. La figura 6.6 nos mues-
tra la representación gráfica de la distribución de probabilidades conjunta
para nuestro ejemplo.
Px,Y(x y)
0,3

0,2

0,1

Y
Figura 6.6 Representación gráfica de la dis-
tribución conjunta para el ejem-
plo 6.15

DEFINICION 6.9 Dado un experimento aleatorio E, el par (X,Y) se llama


variable aleatoria bidimencional si X e Y son dos lacio
nes que tienen como dominio el espacio muestralIl asociado al ea-perinola
to E, y por recorrido el cqnjtatto de números reales.

Es decir, X e Y son dos funciones que asignan un número real a cada re-
sultado del experimento E, o sea a cada ven (a cada elemento del espacio
muestral).

Ejemplo 6.16 Supongamos que se lanza un dado dos veces. Si X ea el


mero que ocurre en el primer lanzamiento e Y el número que
ocurre en el segundo lanzamiento, entonces (X,Y) es una variable aleatoria
bivariante.

Ejemplo 6.17 Se selecciona aleatoriamente un estudiante de evaluac'6n


de Proyectos. Si CI es un coeficiente intelectual y
el minero de años que estudfo, entonces (CI,N) es una variable aleatoria vi •
variante.

Ejemplo 6.18 De una urna que contiene 3 bolillas numeradas con 1.2 y 3
extraemos 2 con reemplazo. Si X es el número de le p.:ime
ra bolilla extrp1)
ída e Y es el numero de la acerada, entonces el espacio alia3
tral será 11 t (1 ' 3(132)3(133) (2 5 1) (Z72)
5 (2,3),(3,1),(3,2),(3.3)}
- 128-

La Tabla 6.8 ncs muestra la distribución de probabilidades para este ex


perimento.

TABLA 6.8

N
YcN
1 2 3

"1 1/9 1/9 1/9


Asf que:
2 1/9 1/9 1/9
3 1/9 1/9 1/9 P (x,y) 1/9

Ejemplo 6.19 Supongamos que el experimento propuesto en el ejemplo an


terior, la extracción de las dos bolillas se realiza sin
reposición. Para este caso la distribución de probabilidades, está resumi-
da en la Tabla 6.9

TABLA 6.9

1 2 3

1 0 1/6 1/6
2 1/6 0 1/6
3 1/6 1/6 0

Si se tienen dos variables aleatorias, ambas pueden ser discretas, am-


bas continuas, 6 una discreta y la otra continua.

DEFINICION 6.10 La función de probabilidad para una variable aleatoria


discreta bivariante, esa definida por

PX,Y (x,Y) c F(X = x, Y c y) para todo par real (x,y)

y que debe satisfacer las siguientes condiciones:

1) (x,y) O para todo (x,y) (b.21)


pX Y
2) p (x,y) 1
Rx Rx 'Y
(donde Rx y 'simbolizan los recorridos de X e Y, respectivamente).
Ry

Enionces, si una función satisface estas dos condiciones, se dice que


existe una función de probabilidades para una variable aleatoria discreta
(E,Y).
- 129 -
DEFINICZON 6.11 La función de densidad para una variable aleatoria con
tínua bivariante, está definida por
fX,Y (x. y) = P(X = x, Y = y) = O para todo par real (x,y)
tal que debe satisfacer las condiciones
1) fxy(x,y) ?. O para todo (x,y) (6.22)

f (x y) dx dy =.1
2) I I/ i X,Y '
DEFINICION 1.12 La SuncZón de dC4ttilueZón conjunta de una variable
aleatoria bivariante (X,Y), asta definida por
Fx,y(x,y) = P(Xlx, Y1 y) para todo par real (x,y) (6.23)
Esta función tiene propiedades similares a las de una función de die -
tribuel& univariante.

Existen dos conceptos muy importantes relacionados con distribuciones


multivariantes, que son las distnibuníaneó m'animales y las
eondicionates. dabtaurioned

DEFINICION 6.13 Si (X,Y) es una variable aleatoria discreta bidimew.


siona/, la ISaneWn de pnobabilidad nang.inaL de X es-
tá definida por

px(x) ' 2:: Px y(xJ) para todo x


Ry '
y la marginal de Y, por
(6.24)
Py(Y) = EPx,y(xJ) para todo y
Ex

DEFINICION 6.14 Si (X,Y) es una variable aleatoria continua bidimen-


% sional, la éundan de densidad manginat de X se defi
ne

fX(x) = ly para todo x


fX,Y(x'Y) dy
y la marginal de Y,
(6.25;
fy(y) = S il f ( x y ) dx para todo y
X,Y '
X
Como puede. apreciarse en el fondo resultan funciones de probabilida-
des de variables unidimensionales.. Entonces son aplicables todas las pro-
piedades estudiadas al respecto. La Tabla 6.7 nos muestra las funciones
de probabilidad marginales.

e
- 130 -

Ejemplo 6.20 Las distribuciones marginales para el ejemplo 6.19 serrín

TA3LA 6.10

1 2 3 pf (y)
;\\\
1 0 1/6 1/6 1/3
2 1/6 o 1/6 1/3
3 1/6 1/6 0 1/3

nx(m) 1/3 1/3 1/3 1

O sea .
si x = 1,2,3
PX(x) = 1/3
= O en otro caso

Y Py(y) = 1/3 si y = 1,2,3

= 0 en otro caso.

También en el caso de estar trabajando con distribuciones dé va;iébles


aleatoriasbivariantes, es importante conocer algunas medidaa relacionadas
con dichas distribuciones, así 'por ejemplo. los promedios.
DEPINICION 6.15 Si (X,Y) es una variable aleatoria bivariante y H(X,Y)
es una función de X e Y, entonces el valox upe-nado de
H(X,Y) se define:
1) Si X e Y son conjuntamente discretas,
(6.26)
E[H(X,Y)] "11 E H(x,y) px,f(x,y)
Rx Ry
Si la serie el absolutamente convergente, y
2) Si X e Y son conjuntamente continuas,

11 H(x,y) i X,(x )dx ay (6.27)


H[H(X,Y)1 = Y yr"
./
'X Y
Si la integral es absolutamente convergente.

Entonces, si se conoce la ley de probabilidades de (X,Y), podemos fácil


mente calcular la esperanza de funciones tales como XtY,X-Y, XY, etc.
Ejemplo 6.21 Si consideremos una vez más el experimento que consiste
en lanzar dos dados distinguibles una vez, y hacemos que
X sea el número del primer dado .e Y el número del segundo dado, entonces
-131 -

px,y(x.y) si x • 1,2 6• y • 1,2,...,6

o en otro caso.
Ahora si queremos saber el valor esperado de la suma de sos dos números
tendremos:
6 6 6
E(X+Y) • I:: 1:: (x+y) 1 = 1 n (6~1) • 7
xel yvl 36 36 x•1
(compare este resultado con el que obtuvimos al principio de este Capítulo).

Ejemplo 6.22 Juan y Pedro son hermanos cuya actividad consiste en colo
car pólizas de seguros en. general. Sea X el ingreso por
comisiones de Juan e Y el ingreso de Pedro, durante un mes. Por la experien
cia pasada, ellos saben que la función de densidad conjunta (en cientos de
$b.), está dada por

fx ,Y ( x,Y) si 6Cx<15 8<y<111


• O en otro caso.
El ingreso conjunto esperado por coadsiones•de los dos hermanos será:
11- 15
E(X+Y) (x+y) 5 dx dy
8 6
14,0
- (-LS t 9y) dy • 21,5
514 2
8
Luego, el ingreso esperado de los dos, es 2.150 $b.
Otras medidas también importantes que nos miden la variación conjunta
de dos variables, son la covarianza y el coeficiente de correlación. En el
Capítulo 11, estudiaremos sus aplicaciones.
DEFINICION 6.16 La covczcanza de X e Y está definida por

Cov (X,Y)• Crxy • E [(X - 114x)(Y - ily)] (6.28)


En general Cky nos mide la covariabilidad de X e Y.
TEOREMA 6.3 Si está definida la covarianza de X e Y, entonces

cr = 3(U) - 3 (X) 3 (Y) (6.29)


Esta propiedad es particularmente útil para fines de c¿lculos.
e. e
- 132-
DEFINICION 6.17 El co€64:c.t:ente de covietacZón entre las variables alea-
torias X e Y, está definida por

Cxy (6.30)
eXY - co—y

donde oí y crX son las desviaciones estándar de las distribuciones


univariantes de X e Y respectivamente.

Esta medida nos indica el grado de dependencia que existe entre las va-
riables X e Y.

Es importante notar que po11 1. Si /0 = 1, se dice que hay una per-


fecta relación lineal entre X e Y. Otro concepto importante para aplicacio-
nes estadísticas de la teoría de probabilidades es la independencia de varia
bles aleatorias.

DEFIN/CIOY 6.18 1) Se dice que las variables aleatorias discretas X e


Y son írtdeperedantea si y sólo si

pm (x,y) e p (x) PY (Y) para todo x,y


X
2) X e Y son variables aleatorias continuas 4gdoggdígnted si y sólo si

fXY(x,y) ° £X(x)fY (y) para todo x,y

TEOREMA 6.4 Si X e Y son variables aleatorias independientes, entonces

E(XY) = E(X) E(Y)

En general E(XY) ¢ E(X) E(Y)

TEOREMA 6.5 Si X e Y son variables aleatorias independientes, entonces

O-XY = f0NY =

Debe tomarse en cuenta, que si Gil- = exy = O, X e Y no necesariamente


son independientes; de manera que la proposición anterior no indica que sea
condición necesaria y suficiente.

La distribución condicional de una variable aleatoria dado que otra se-


gunda variable aleatoria ha tomado un valor particular, también de interés
en muchas aplicaciones. Esta idea es análoga a la que estudiamos al tratar
las probabilidades condicionales en el Capítulo anterior.

DEFINICION 6.19 1) Si X e Y son variables aleatorias discretas conjun-


tas, la ítineídn de whabítídad condZeíanat para Y, da
do que X = x, está definida por

PXY(x'Y)
Pxix(Ylx) si px( x) > o (6.31)
p x
x
=0 si px(x) • O
- 133-

2) Si X e Y son continuas, la Suneíóft de denaidxd condZeZonat para Y,


dado que X = x, está definida por
fXY(x'y)
fY1X(Ylx) para f (x), O
fX(x) X
(6.32)
= 0 sí / (x)=0
X
pX1Y(xly) y f (x1y) se definen en forma análoga.
XIX
El estudiante fácilmente puede verificar que estas funciones condiciona
les, cumplen con todas las propiedades de las funciones de probabilidades de
una sola variable.

Antes de finalizar este capitulo, definiremos un concepto central para


el análisis de regresión que se estudiará en el Capítulo 11. Se trata del
valor esperado de una función de densidad condicional.

DEFINICION 6.20 Si X e Y son variables aleatorias distribuidas conjun-


tamente, el valor esperado de Y, dado que X = x, se
llama negneaión de Y sobre X, cuya expresión es:

E(YIX = x) = y . EXY(xd)
f(x) dY (6.33)
RY

6.8

Ejercicios

1 Una urna contiene 4 bolas numeradas con L,2,3,4 respectivamente. Se ex-


traen aleatoriamente dos bolas de una urna, sin remplazamiento. Si X es
la suma de los dos números que ocurren, determinar la función de probabi
lídad para X.

2. Sí el experimento se realiza con restitución en el ejercicio anterior y Y


es la suma de los dos números que aparecen, determinar la función de pro-
babilidad para Y.

3. La variable aleatoria X tiene como función de probabilidad


1
PX(x) = para x = 0,1,2

= O en otro caso

Cuál es la'función de distribución para X?

4. Verificar que
17 (t) = 0 t < -2
X = 1/2 -2 t < O
=1 t)0
- 134 -

es un función dedittribuición y determinar la función de densidad para X.


Computar P( IX 11 1).

5. Si X es una variable aleatoria, tal que

fx(x) - 2(1-x) ()Cm('

0 en otro caso.
Determinar F (t).
X
6. Lá variable aleatoria continua Y tiene función de densidad

f (y) = 1U e-1° Y y)0


Y
= O en otro caso
Determinar F (t).
Y
7. El número de horas de operación satisfactoria (sin reparación) de una
cierta marca de televisores, ea una variable aleatoria cuya función de
densidad es
-600x
f (x)
x
600 e si x)0

0 sí x10
Calcular /tic Y
X
8. De un lote de 12 radios que contiene 5 defectivos, se toma una muestra de
3 radios sin sustitución. Hallar las funciones de probabilidades y de
distribuci5n del número con defectos en la muestra.

9. Determinar Al valor esperado para cada uno de los primeros 6 ejercicios,


propuestos anteriormente.

10.Si se venden 20.000 billetes de una rifa, a 5 $ cada uno, pata el sorteo
de un automóvil de 85.000 8, cuál es la ganancia esperada de una persona
que compre un billete?

11.Sea X el número de caras en el lanzamiento de cuatro monedas . Calcular


/4.411 Y c.
12.Una moneda equilibrada tiene pintado 1 en un lado y 2 en el otro lado. Se
lanza tres veces la moneda. Sea X la suma de los dos primeros números y
sea Y la suma de los dos últimos números. Determinar la función de proba
bilídades conjunta y las funciones de probabilidad marginales.
- 135 -

CAPITULO 7

MODELOS DE DISTRIBUCIONES
DE PROBABILIDADES

Hemos visto que podrían existir un nú-


mero muy grande de distribuciones de probabilidades, tantas como experimen-
tos pueden presentarse en la naturaleza; y es más, a cada experimento sabe-
mos que es posible asociarle varias variables aleatorias, de acuerdo al ti-
po de investigación que se desee realizar, las que a su vez originan distin
tas funciones de distribución. Estudiar individualnente cadadistribución sería
realmente cosa de titanes. Felizmente muchas distribuciones guardan cier - ,
tas características análogas, de manera que casi siempre es posible adecuar
los a algunos modelos estándar. La búsqueda de un modelo de probabilidades
que sea capaz de describir la distribución de los datos que se tengan dispo
nibles, es una de las tareas básicas para un investigador científico.

Un modelo de dist/canea de pubabítiddde4, es una expresión matemáti


ca que se obtiene a partir de un conjunto de supuestos, que sirve para estu
diar los resultados de un experimento y para predecir resultados futurcis
del experimento cuando éste se efectúa repetidamente.

El propósito de este capítulo, es introducir algunos modelos especia -


les, los que nos servirán, también, para hacer inferencias estadísticas res
pacto de conjuntos poblacionales grandes. De acuerdo al objetivo que persi
gue nuestro texto, únicamente daremos las ideas centrales de los modelos y
sus aplicaciones, sin entrar a demostraciones cuya rigurosidad matemática
podría distraer nuestra atención del tema principal. Por otro lado procura
remos que se tenga fluidez en el manejo de las Tablas de probabilidades que
se dan en el apéndice, con el fin de reducir cómputos numéricos prolongados
cuando no se cuenta con una computadora. Se recomienda al estudiante que
e.) tenga cuidado en la identificación del problema con el modelo correcto, an-
tes que memorizar el detalle de la expresión matemática de los modelos.

Iniciaremos por ver el modelo de Bernoulli, por tratarse de uno de los


más simples, pero que tiene muchas aplicaciones y sobre todo porque sirve
de base para la deducción de los modelos binomial y Poissoniano, de probebi
lidades.
- 136-

7.1

Modelo de Bernoulli

Bernoulli, uno de los pioneros del cál-


culo de probabilidades, formuló un modelo que se aplica a variables aleato -
ries las cuales pueden tomar sólo dos valores. Usaremos las siguientes ex -
presiones como equivalentes: "Modelo Bernoulli", "Prueba Bernoulli". "Varia-
ble Bernoulli" ó "Distribución Bernoulli"; al referirnos a este tipo de dis-
tribución.

DEFINICION 7.1 Una phueba Belmouttí es un experimento que tiene dos re-
sultados posibles, generalmente llamados éxito (E) y
fracaso (P).

Entonces, el espacio muestral para una prueba Bernoulli, será c1={E,P)


Son muchos los experimentos que corresponden a este modelo, así por ejemplo,
el resultado de lanzar una moneda puede ser, cara o sello; un artículo produ-
cido en ciertas condiciones, puede resultar con defecto o sin defecto; una
persona puede tener un ingreso menor o mayor de una cantidad pre-determina -
da; un obrero puede estar de acuerdo o nó de realizar algún trabajo; etc. O
sea que el modelo Bernoulli es apropiado pasicualquier situación donde sólo
nos interesa que ocurra el suceso deseadc(éxito), o el suceso contrario
(fracaso); de aquí, se observa que los dos sucesos son excluyentes. Por esto,
también puede decirse que el modelo Bernoulli, está relacionado con fenómenos
de la naturaleza que pueden ser clasificados cualitativamente.

Si a los dos valores únicos que toma una variable aleatoria, dada una
prueba Bernoulli, los deslnamos por 1 y O, tal que p y 1-p q sean sus res
pectivas probabilidades, entonces la función de probabilidad de una variable
Bernoulli estará dada por

=p si x = 1
-oX(x) = q si x= O
p(x) pxql-I si x = 0 6. 1 (7.1)
- O en otro caso - O en otro caso

Se observa inmediatamente que cumple con las propiedades de una función


de probabilidades, o sea

p%(x) O
(x) ■
p+,4.1
Y *--X

Veamos cuál es la media y cuál la valianza de esta distribución:

En primer lugar tenemos que

E(%) = 2::xlyx(xi) = 1 • p + P

E(%2) 1.151x1px(xi) = 12. p + 02.4 • p


- 137 -
Entonces el valor esperado de la variable aleatoria X Bernoulli, es
E(X) '#x = P (7.2)
y la varianza
V(X) =UI = E(X2) - = p - p2 p(1-p) = pq (7.3)
Ejemplo 7.1
Supongamos que de un conjunto de amas de casa, el 70% está
de acuerdo con utilizar un nuevo aceite comestible fabrica
do a base de "palma africana". Si seleccionamos aleatoriamente una ama de
casa del conjunto, y designamos X = 1 si está en favor del nuevo aceite y
X = O si prefiere aceite comestible de otras plantas oleaginosas, entonces X
es una variable aleatoria Bernoulli,' luego su esperanza matemática es simple
` mente

P 4 0,7
y la varianza.

GX PC (0,70)(0,30) = 0,21

Como acabamos de ver, el modelo Bernoulli implica realizar una sola vez el
experimento; si se realizara una y otra vez el mismo experimento bajo las
mismas condiciones y cuyos resultados son independientes, entonces se dirá
que estamos en presencia de una 4UCC4i64 de pruebas Bernoulli. Esto Ultimo
da origen a la formulación de un nuevo modelo, que es el binomial.

7.2

Modelo Binomial
Ip•••••••■■
•••••■

Supongamos que realizamos un experimen


to que consiste de n repeticiones independientes de .pruebas Bernoulli en las
mismas condiciones, es decir que si tenemos una sucesión Bernoulli, entonces
el espacio muestral para este experimento es el producto Cartesiano de los
^ espacios muestrales de las pruebas indíviduelee. O sea

fl = fklx £12x...x fln,

donde fl i = {E,P}, 1 = Bit{E}} = p para todo i.

De aquí, podemos entonces formular el modelo binomial.

DEFINICION 7.2 Si X ea una variable aleatoria que indica el número de


éxitos (E) en n pruebas independientes Bernoulli con
probabilidad P(8) m p c.:instante en cada prueba, entonces ae dice que X
es una variable aleatoria Imola/ con patánketros n y p..
-138-

El modelo binomial es aplicable a un número grande de casos; por ejem -


plo: si lanzamos al aire 20 veces una moneda y definimos la ocurrencia en
termines del número de caras que aparecen arriba; cualquier selección alea-
toria con sustitución de artículos de un lote, si definimos como éxito al nó
mero de artículos no defectivos; etc. De manera que con este modelo es posi
.ble dar respuesta a preguntas como la siguiente: Si realizamos un experimen
to n veces bajo las mismas condiciones, cura es la probabilidad de obtener
exactamente x éxitos2, al menos x éxitos?, a lo más x éxitos?.

El siguiente ejemplo nos ilustrará la secuencia de la obtención de la


función de probabilidades para el Modelo binomial.

Ejemplo ?'.2
Veamos cuál es la probabilidad de obtener trica de "ases"
si rodamos cine veces un dado, Vemos que en este experi-
mento el resultado de cada prueba puede ser "as" o cualquier otro número de
los cinco restantes. Entonces el experimento satisface las premisas de un
modelo binomial. En cada prueba, p = 1/6 y q = 5/6, y como son cinco prue-
bas, n = 5. •El orden en que vayan apareciendo los "ases", no tiene importan
cía en este caso. Así, si llamamos E toda vez que aparece "as" y F si no a-
parece, un resultado del.experimento puede ser EEFEF, cuya probabilidad es

(116)(1/6) (5/6)(1/6)(5/6) = (1/6)3(5/6)2


Otro resultado del experimento puede ser la sucesión FFEEE, y su probabili-
dad es
3 2
(516)(5/6)(1/6)(1/6)(1/6) (115) (5/6)
Otra sucesión distinta a estas dos, en.la que aparezcan tres "ases", también
tendrá la misma probabilidad. Cuál es entonces la probabilidad de obtener
trica de ases? Como todos los posibles sucesos simples son mutuamente exclu-
yentes y tienen la misma posibilidad de ocurrencia, entonces la probabilidad
de éxito, por la propiedad de adición (Sección 5.6), es la suma de las proba
bilidades individuales, es decir
3 2 3 2 +
(1,6) (5/6) + (1/6) (5/6)
1,1
tantas veces como es posible seleccionar 3 elementos de 5, o sea (.1 . En
consecuencia, la probabilidad de obtener trica de ases, es

3}
(1/6)3(5/6)2 1 0,032

Como dijimos, ésta es la secuencia lógica para la obtención de la función de


probabilidades para una distribución binomial.

* (5\1= 10 indica el número de selecciones posibles de 5 elementos


1„3/ 3152!
• tomados tres a tres.
-139-

TEOREMA 7.1 Si X es una variable aleatoria binomial con parámetros n y


la Sunciln de mobabitidad 645tomía2 está dada por

n x n-x
PX(x) m (,x)P q para x 0,1,2,...,n
(7.4)
= en otro caso

Es fácil comprobar que esta función cumple con todas las propiedades de una
función de probabilidades. Aplicando el teorema del binomio de Newton, que
establece la fámula

(a + b)n r bn-r
r=0 ri a
Por analog£a, tenemos

Lx=o(X) p. (p.„) n
de manera que n PX(s) - 1
RX
y es obvio que p (x) O
X
Algunas veces se suele utilizar la expresión b(x;n,p) para indicar la fun
.1ign de probabilidad binomial, con parámetros n y p.

En vista de que la variable aleatoria binomial es discreta, la sanción


de diatrtíómeión bhtonuAt. de X estará dada por

F (x) = P(X x) ' 51( r.) Pt(I-P)n-t (7.5)


X
coi()

que también puede simbolizarse como Fx(x;n,p).

Para el caculo de la función de distribución binomial, es recomendable


recurrir a las tablas hechas para este fin.

Ejemplo 7.3 Una moneda se lanza 12 veces, cuí' es la probabilidad de


obtener al menos 6 caras?, exactamente 5 caras?, no más de
3 caras? Este problema corresponde al modelo binomial donde n- 12 y p = 1/2
Si X nos indica el número de caras, entonces
a (x) .(12)(1/2)x (1/2)12-x
x para x - 0,1,2,...,12
= 0 en otro ces).
5
Luego P(x 1.6) - 1 - P(X <6) = 1 - J b(x; 12, 1/2)
x=0
1 - 0,3872 = 0,6128
- 140-

P(X = 5) = P(X15) - P(X1 4)

= 0,3872 - 0,1938 = 0,1934

P(X1 = 0,073

Para el cálculo de estas probabilidades, se utilizó la Tabla de distri-


bución de probabilidades binomial que se da en.el apéndice.

En el caso en que p>0,5, se pliede calcular la probabilidad del suceso


contrario, a fin de poder utilizar las tablas (que solamente dan valores has
ta p= 0,5). Por otro lado, si el número de pruebas es muy grande o si la
probabilidad de éxito es muy pequeña, de manera que no sea posible utilizar
las tablas habrá que recurrir a una computadora o en su caso aproximar la
distribución binomial a otro modelo que facilite el cálculo. Esto , veremos
más adelante.

Ejemplo 7.4 Se sabe que en un }ote de 20 transistores, 4 tienen algún


defecto. Si se toma una muestra aleatoria de 5 transisto
res del lote con reemplazo, cuál es la probabilidad que uno de ellos sea de-
fectuoso? Cuál la probabilidad de que a lo más uno sea defectuoso?

Si X indica el número de transistores defectuosos, entonces por la con-


dición del problema, corresponde a una distribución binomial con parámetros
4
= 0,2 y n.8, es decir
II a 20
px(x) = b(x; 5; 0,2) =( 5) (0,2)x (0,8)5-x si x • 0,1,2,3,4,5

Luego

P(x-1) = px(1) = b(1; 5; 0,2) = (I) (0,2)(0,8)4 • 0,4096

Y
P(X 11) = px(0) + Px(I) • 0,73728

(Para los cálculos, ver la tabla en el apéndice.)

El gráfico 7.1 nos muestra la distribución binomial para algunos valores


de E y n
Ahora veamos cuáles son las medidas del valor esperado y la varíenme pa-
ra una distribución binomial.

X E (X) 1:: x p (x)


X
.5-- x(n) pxqn-x • np (7.6)
Rx Rx

2
02 E(X ) - (M )2 = npq (7.7)
X • V(X) /X
- 141 -

0,4

2 4 6 8 0 2 4 6 8
n = 8, p a 0,2 n = 8, p = 0,5 n = 8, p e 0,9

,2

0,1

0 1 2 3 0 2 4 6 0 2 4 6 8 10 12
n = 3, p = 0,2 n = 6, p = 0,2 n 15, p 0,2
Figura 7.1 Distribuciones de probabilidades bino-
mieles para n constante y p constante,
respectivamente.

Ejemplo 7.5 Un agricultor ha determinado a partir de numerosos ensayos,


que de un cierto tipo de semillas, el 5% no germina. Cuán -
tas semillas se espera que germinen, si se siembran 200 de ellas? Cuál es su
variación?. En 'éste caso, p=0,95 , q=0,05 y n=200.
Entonces,
- E(X) a 200.(0,95) = 190

con una desviación estandar

Cr =j 200.(0,95)(0,05) = 3,08
- 142-

7.3

Modelo Hipergeométrico

Veremos ahora la distribución de una va


riable aleatoria con características similares a la binomial, que recibe el
nombre de distribución Wipergeométrica. Esta nueva distribución se aplica a
poblaciones finitas, cuyos elementos pueden también clasificarse en dos cate
gorías, sólo que en este caso las n pruebas se realizan sin reposición, de
manera que de prueba a pruebalds sucesos son dependientes.

Si se tienen una población de N artículos,•r de los cuales poseen una de


dos características, entonces habrán N-r que poseen la otra característica. Si
seleccionamos n artículos aleatoriamente sin restitución de los N artículos,
cada selección subsiguiente es dependiente de manera que la probabilidad de
que se obtengan éxitos cambia en cada prueba simple. Entonces, puede intere-
sarnos conocer la probabilidad de obtener exactamente x artículos de los r
(éxitos), en uns muestra aleatoria de tamaño n. Bajo estas condiciones, el
número de éxitos en n pruebas dependientes, corresponde a la vahíabie hipen- '
geontanica.
1
TEOREMA 7.2 Si X es una variable aleatoria hipergeométrica, entonces, la
Sanción de pnobab.(.Pidadea de X, está dada por

(I) ' c)
(ti
P X(N) (
N
) si x = 0,1 2 n (7.8)

donde N es el número total de artículos; r el número de elemento que ti


una de las dos :aracterísticas, n el tamaño de la muestra (número de prue-
bas).

Ilustremos la deducción de esta función. En primer lugar ,N acordemos


que el número total de maneras de extraer n objetos de N, es (n). En se-
gundo lugar, estraer x artículos con cierta característica, es idénticamen-
te igual a extraer n-x artículos de un total de N-r artículos disponibles
(con otra característica). Entonces el número total de maneras de extraer
x con característica r, y n-x con la otra característica, es (x) (N-r Por
n_x).
último, si el merimento es aleatorio y asignamos igual probabilidad a ca-
da uno de los n) puntos del espacio muestral, entonces la función de proba
bilidad para una variable hipergeométrica, que puede simbolizarse h(x; N,n.r),
resulta
r N -r
x n-x
h(x; N,n,r)
N
- 143-

La luneWN de diaticameZdn de X hipergeométrica, estará dada por

t
F (t) = P(X‘, t) h(X;N,n,r) (7.9)
X x = mía [0,n-(N-r)]

También para este modelo existen tablas que facilitan el cálculo de las
probabilidades de una variable aleatoria hipergeométrica X.

Ejemplo 7.6 Una caja contiene 12 latas de leche, 9 de las cuales son
frescas (recién envasadas). Seleccionamos aleatoriamente
2 latas de la caja sin devolución. Sea X el número de latas de leche no
frescas que se seleccionan, entonces X es una variable aleatoria hipergeo-
métrica, con
( ) (!)(29 -x)
Prx- • /12\ si x 0,1,2
121
en otro caso

De aquí, la probabilidad de obtener las dos latas de leche fresca, será

(1) (1) 1x36 6


p (0) =
X /12\ 66 11
21
La probabilidad de obtener al menos una lata fresca

5
P(X)1) = 1-P(X < 1) = 1 - 11
(12\ "1 - 6II
2
La probabilidad de obtener a lo mgs una lata no fresca

, (:) (1)(1) 6„. 3 9 7


P(2:41) PX(°) PX(1' /121 /12\ 11 + 11 " 11 -

Eja lo 7.7 En un lote de ampollas de suero glucosado (todas del mismo


tamaño y color), 10 ampollas quedaron sin marcar. Se sabe
que 6 de ellas provienen de una envasadora A y 4 de una envasadora B. Si se
eligen aleatoriamente 4 de las diez sin marcar, cuál es la probabilidad de
que todas las elegidas fueron envasadas por B? Cuál es la probabilidad de que
dos o más de las seleccionadas fueron envasadas por B?

Sea X el número de ampollas llenadas por la envasadora 13, entonces

F(X=4) - pX (4) = (1)( 0)


210
1
0,004762
0,0
(T )
- 144-

'10 Y I-(41)10
P(X12) = 1 - P(X I I) = 1 í(01(64) (1 1 19
42
( )

w 1 - 0,412381 • 0,5476 19
Estos valores se hallan también directamente de las tablas de probabi-
lidades acumuladas para una variable aleatoria hipergeométrica.

El valor espeAddo de una variable aleatoria hípergeométrica, esté da-


da por

" =•E(X) = 1:: x (r)(N-r)


x nx n.r (7.10)
x=0 N
(I)
y la ~Unza,

2 v(x) .n (1)(111 (11)


ax (7.11)

• Ejemplo 7.8 Para la información del ejemplo 7.7, tenemos


4
X • 4.7 1,6
"
Y 2 Aí 4)(10-4 \ (10-4) _ 22±. - 0,64
lo lo I 9 900
Es decir que se espera que 1,6 ampollas correspondan a la envasadora B al
extraer aleatoriamente 4 ampollas, con una desviación estandar de 0,8.

7.4

Modelo Poisson

Ahora estudiaremos otra de las distri-


buciones de probabilidades que también tiene múltiples aplicaciones, que fuá
formulada por Poisson. En un principio se la utilizaba sólo como una aproxi-
mación a la binomial cuando p era pequeño y cuando se tenía un número grande
de observaciones. En la actualidad su importancia es muy superior, ya que
además trata el comportamiento aleatorio de eventos distribuidos al azar en
el tiempo y en el espacio. Así por ejemplo, estudia casos de: distribueio -
nes del número de muertes por cualquier tipo de accidentes, tiempos de falla
en un proceso de producción, número de llamadas sobre una línea telefónica
en una hora indicada, número de bacterias en un cultivo dado, momentos de
-145-

llegada a un servicio determinado (que pueden ser aeropuertos, puestos de


peaje, oficinas de recaudación de impuestos, surtidores de gas, y muchos o-
tros servicios), glóbulos rojos en una muestra de sangre, etc. En esta cla
se de sucesos y en muchos otros más, nuestro interes puede ser el conoci-
miento únicamente del número de éxitos del suceso, y no así el suceso con-
trario Por ejemplo, para nosotros es más importante conocer el número de
personas que llegan a pagar impuestos a una oficina de recaudaciones duran-
te cierta hora; que investigar el número de personas que no acuden a pagar
impuestos en esa hora.

La función de probabilidades Poisson, puede deducirse a partir de la


distribución binomial.

TEOREMA 7.3 Si X es una variable aleatoria Poisson con parámetro X, enton


ces la Sanción de pitobahaídade4 poízeon, está dada por

>x e-X para x = 0,1,2, (7.12)


PX(x) - x!

= O en otro caso

donde X>0 es el promedio de éxitos en u pruebas con probabilidad p ; y


e = 2,71828... , es la base de los logaritmos naturales.

Esta distribución puede obtenerse como caso límite, en cierto sentido,


de la distribución binomial. Considerando una sucesión Bernoulli de n ensa
yos con una probabilidad de éxito p en cada prueba, llamando X = np , y su- .
poniendo que X es el número de éxitos que se obtiene en la prueba, entonces
la función de probabilidades Poiasson se obtiene calculando el siguiente lí
mite:

líes 1
( n px (1-p) -x

o sea

líes
n) (A) (1 - )
n-x
e-)1/4
n
x n x.

' Es interesante observar la aproximación que tienen la distribución binomial


con la distribución Poisson con parámetro 71/4= np , cuando el número de prue
bas es muy grande y la probabilidad p de que ocurra un suceso es muy peque-
ña. Por ejemplo, si X indica el número de éxitos en 1.000 pruebas de una
sucesión Bernoulli con p=0,0015 , entonces este proceso que es binomial po
demos aproximarla mediante el modelo Poisson con parámetro =1.000x0,001I =
= 1,5. Ahora, si se deseara conocer la probabilidad de que ocurran exacta-
mente 5 éxitos, o sea P(X=5), tendremos

(1000) (0,0015)5(0,9985)995
p (5) ■ para la binomial.
x 5
-146-
5
y (1,5)5 e-1' por la Poisson
PX(5) 5!
resultados que serán prácticamente iguales, de manera que puede utilizarse
Poissson para aproximar a la binomial. Algo más puede observarse, y es que
el cálculo de la probabilidad, para este tipo de casos, es más facíl la de
Poisson que la binomial.
Otro aspecto interesante que vale la pena observar, es que la distri-
bución de Poisson nos permite calcular probabilidades cuando se conoce la
media A del proceso que se esté estudiando (o es posible aproximar la me-
dia), sin necesidad de saber n ni 11, con tal que la población sea grande.

la 6uncíón de di4tAilueídn para una variable aleatoria Poisson X, con


parámetro í1, está dada por

(rX) = 3 si x <O
FX ' (7.13)
si x
= PX(t)
x=0
además

F (x • X) = P (X S, x)
X
en una
Ejemplo 7.9 Supongamos que el número de muertes por accidente
,= 3 por mes.
ciudad es un proceso Poisson con parámetro 2
Sea X el número de muertes por accidente que ocurren entre el lro. de ene-
ro y el 31 de marzo inclusive, de 1984. Entonces X es una variable aleato
ría Poisson con parámetro -1
nm 3x3 = 9

luego x -9
9 e para x = 0,1,2 ......
PX(x) x!

=0 en otro caso.

La probabilidad de que hayan al menos 10 muertos por accidente en los tres


meses, es entonces
P(X >,10) = 1 - P(X (.9) = 1 - 0,587 1 0,413

Ahora, si deseamos conocer la probabilidad de que mueran exactamente 8 ,


tendremos
. 8) -
P(X = 8) = P(X‘. 7) = 0,456 - 0,324 = 0,132

(Los cálculos fueron hechos aplicando la tabla de la función de distribu


Poisson, que se da en el apéndice).
La distribución de Poisson, puede ser usada como una distribución inde
pendiente cuando solamente se conoce la media ñ como nos indica el ejemplo
- 147 -

anterior. Ademas puede utilizarse para mostrar la estrecha relación que


existe con la curva normal cuanto p es muy pequeño, pero X
sea si >1 15, tal como puede observarse en la figura 7.2. es grande, o
pX(x)
0,6

A. 5

4 6 8 10 12 14 16 18 20 22
Figura 7.2 Distribuciones de probabilidades de
Poisson para distintos valores de A.

Ejemplo 7.10 Supongamos que el número de llamadas a una central tele-


fónica es un proceso Poisson con un promedio de
madas por hora. Si X es el número de 180 lla-
minuto, entonces X es llamadas que llega en el lapso de un
una variable aleatoria Poisson con parámetro
A r. 180
luego
x -3 60 = 3
PX(x) = 3 e si x = 0,1,2,
xl
= O en otro caso
De esta manera, la probabilidad de que no llegue ninguna llamada a la ceo -
tral, en ese minuto es

PX(0) = e 3 1 0,05

y la probabilidad de que lleguen de 2 a 5 llamadas, inclusive, es

P(2 1X1 6) = P(X 16) - P(X 4 1) = 0,996 - 0,199 = 0,797


(Ver tabla del Apéndice)

Para la distribución Poisson, es interesante observar que tanto


el va-
20A upe/gado, como la vanianza son iguales, es decir, JUIL 2
= , o sea
- 148 -

AX E(X) - (7.13)
Y 6-2 V(X) - X (7.14)
X
Ejemplo 7.11 La media y la varianza para el experimento palnteado en
el ejemplo 7.10, son
/Ok = 3 y G1 = 3

Hasta aquí, hemos estudiado los tres principales modelos de diatribu -


ción de probabilidades para variables aleatorias discretas. En lo que sigue
de este capítulo, veremos modelos relacionados can variables aleatorias con-
tinuas, entre las que está la distribución normal, de singular importancia.

7.5

Modelo Exponencial

En esta sección y en la que sigue, es-


tudiaremos los dos modelos más importantes que están relacionados con varia-
bles aleatorias continuas. La primera, es el modelo exponencidde que es apli
cable a varias situaciones reales, entre ellos está el económico. En la ma-
yoría de los casos en que existe la necesidad de determinar un tiempo razona
ble para la ocurrencia de un suceso, aparece una variable con distribuciÓJ
exponencial.

Por ejemplo, cuando se trata de estimar el tiempo de duración sin falla


de cualquier articulo que sufre desgaste a medida pue pasa el tiempo.

En cierto nodo, el modelo exponencial se deriva del proceso Poisson.


También puede considerarse como un caso particular de la llamada disittLhu-
can gamma. Trataremos de ilustrar la primera de estas dos formas, ya que
ayuda a comprender mejor las aplicaciones del modelo exponencial.

TEOREMA 7.4 Supuesto que X es una variable aleatoria exponencial con paré -
metro A, entonces la función de densidad de X, está dada por

11(x) = >te- x si x > O (7.15)


= O en otro caso
y la función de distribución por

F (x) = O si x <O
X (7.16 )
= 1 - e-ikx si x“)
- 149 -
donde X>0 y e= 2,71828... es la base de los logaritmos naturales.

Es fácil verificar que


r(x) > o
Y os
cif (x) dx = Xe-Ax dx 1

Por otro lado,


jr x

ñx
f (X) = (x) cL (1 - e- Ax)= Xe-
x dx FX dx

Remos visto en la sección anterior que el número de acontecimientos de


un evento en un tiempo determinado, siguen el modelo de Poisson; ahora, la dis-
tribución de los periodos de tiempo entre los acontecimientos, es una varia -
ble exponencial. El modelo exponencial puede surgir como respuesta a la pre-
gunta: Si una sucesión de sucesos ocurren en el tiempo (6 espacio) de acuer-
do al proceso de Poisson, conociendo el promedio de sucesos por unidad de
tiempo, en qué tiempo se espera que ocurra el primer evento*?
La respuesta a la anterior pregunta, nos lleva a un método para construir
el modelo exponencial a partir del modelo Poisson. Veamos en lineas generales
,auál es este procedimiento. Sea la variable T que indica el tiempo entre aten-
tos. Si consideramos un intervalo de tiempo especificado t , entonces el su-
ceso T> t , implica que este suceso aún no ha ocurrido en el intervalo de
tiempo (0,t). La probabilidad de que esto ocurra, por la ley de Poisson ep
, ( !) t ° - Xt Xt
P(T>t) P(que no ocurra en (0,t)) = -- e e
De s'Id, fácilmente podemos obtener la función de distribución para una va -
riable aleatoria exponencial X, utilizando la propiedad
PX(x) = P(Xtx) - i - p(x>x)
o sea
F (x) = 1 - P(X> x) = l'- e- Xx
X
donde X ea el número promedio de ocurrencias por unidad de tiempo (o espacio)
en la distribución Poisson.

Ejemplo 7.12 Se ha observado que las paradas repentinas de una máquina


en una planta industrial, siguen aproximadamente un proce-
so Poisson con parámetro X= 2/3 por hora (o sea 2 cada 3 horas, en promedio)
Si X representa el tiempo de falla de la máquina a partir de un momento dado,
entonces X tiene una función de densidad

2
2 x
f (x) = —
3 e 5 si x > O
X

=0 si x < 0
-150-

De esta manera, la probabilidad de que no transcurran más de 3 horas sin que


ocurra la primera falla de la máquina, es
3 2
y(x4 3) ti a e 3 x gx = - e-2 t 1 = 0,8647
3

La probabilidad de que pase al menos una hora antes de que talle la máquina
es
" - g- x _P
p(x >1) zi i e 3 dx e 3 0,5134
I 3
La probabilidad de que la primera falla ocurra entre la cuarta y quinta ho -
ras, es:
5
P(4 < X 4 5) 25 g e -
t
xdx a
3
r #e
10
'1) 0,0225
4 3
La representación gráfica para esta función de densidad, puedo apreoiaL
se en la figura '.3.
-(2/3)x
fx(x) 2 (2/3) e
),•2/3

0,5

área • 0,8647

ea 2 0,0225

0 1 2 3 4 5 6
Figura 7.3 Distribución exponencial con X. 2/3

El valor esperado de la distribución exponencial será

1:4 (7.17)
A E(X) si XXe... s
X
0

y la varianza
(7.18)
1 • V(X) E(X2 )
2) " 242
x . 1

Observe que en esta distribución, )1 • g.


- 151 -
Ejemplo 7.13 En relación al ejemplo anterior, el tiempo promedio de la
primera falla es /x • . • 1,5 horas, con una desviación
estándar dí • x • 1,5 horas.

7.6

Modelo Normal General


y Estándar

La 444.tsibuch5n de mobaba.Ulade4 roa -


mat, está considerada como el tipo más importante entre las diferentes die -
tribuciones de probabilidad. No tan sólo porque aparece en una gran varíe -
dad de casos, sino también porque muchas otras distribuciones pueden aproxi-
marse a la normal, coro podrá apreciarse en los capítulos posteriores.

También es notable olmo el modelo normal se puede aplicar a casi todos


los campos de la ciencia, as`- por ejemplo a la biología, física, econonfa,
etc. La importancia de la distribución normal en la teoría estadística es
profunda e indiscutible, razón por la que le prestaremos algo más de aten -
ci6n que a otras distribuciones.

Muchas variables aleatorias continuas, tales como los pesos de loe es-
tudiantes de economía, coeficientes de inteligencia de nitos que estudian,
diámetros de tubos de acero producidos mediante un cierto proceso, etc.,
tienen distribución normal.

Esta distribución sirve como una buena aproximación de muchas distribu


ojones discretas, tales como la binomial o el modelo Poiason. Por otro la-
do, muchos problemas pueden ser resueltos bajo la suposición de estar traba
j'ando con una población normal. Hay algo más importante 802, tal como se
verá, y es que las distribuciones de muchos estadísticos muestrales calcula
dos de muestras grandes, se aproximan a la distribución normal como un lími
te. En la inferencia estadística, este hecho es muy importante.

DEFINICION 7.3 Se dice que una variable aleatoria X tiene itabeatt -


can miura, si sn función de densidad está dada por
2 2
1 -(X-I") /2cr para -00 ¿CCP, (7.19)
f(x)
x •
✓ 2 71 de e

o sea, para todo real x.

Donde ve 3,14159 , e = 2,818281 Les paránetrosiky O•, son tales


que - oo Cf44 (oey 0-.> 0.
- 152 -
Como puede apreciarse, la función de densidad (7.19) es exponencial, de
manera que es fácil comprobar que

fX
(x)> 0 y que -X(x)dx = 1
Para indicar que X tiene distribución normal con parámetros Ay é, al-
gunas veces utilizaremos la notación
N(/, cr2)
La razón para utilizar los símbolos/Uy o-2 (en 7.19), se debe al hecho
de que precisamente/ces la media de la distribución normal, y 0- su desvia-
ción estándar; es decir que

=
(7.20)
2 2
Y °-7( =
En la figura 7.4, puede apreciarse la distribución normal para distin-
tos valores de los parámetros/4y Q. Es interesante observar además que
la simetría de la curva normal se mantiene en cualquier caso. Algo más, su
media, mediana y moda, coinciden.

(a) (b)

Figura 7.4 a) Distribución normal con la misma desviación estándar


y diferentes medias, y
b) Distribución normal con la misma media y diferentes
desviaciones estándar.
- 153-

La 6anciln de datnibueíón para una variable aleatoria normal X, es

rt
F (t) j 1 e - (x-9)2/2 al dx (7.211
Z
-oo A 71 Cr 2
Como puede verse, para el cálculo del área de probabilidad deuda fun -
ojón de densidad normal, la anterior expresión resulta bastante molesta. Pe
ro esta dificultad se salva fácilmente estandarizando la variable aleatoria
normal X, y luego recurriendo a las tablas de la normal estándar.

Es importante notar, por lo mencionado en el Capítulo anterior, que si


X es una variable aleatoria normal con media/uy desviación estándar C, en-
tonces Z = (X -,44)/C es también una variable aleatoria normal, con /¿4= O y
Cr= 1. En este caso, algunas veces abreviaremos la notación con N(0,1).

DEFINICION 7.4 Si z es una variable aleatoria normal conim= O ya2 =1


entonces Z es una variable aleatoria noltmat tátándák,
cuya función de densidad es

2
1
f (z) = e-z /2 (7. 2 2)
Z ITY
y su función de distribución

F (t) = P(21 t) = 1 e
2
-z /2
dz (7.23)
z
Stoo 127
La representación gráfica de estas dos funciones puede apreciarse en
la figura 7.5

F (z)
f (z)

-3 -2 -1 1 2 -3 -2 -1 0 1 2 3

Figura 7.5 Funciones de densidad y distribución normal


estándar.
-154-
En el Apéndice, la tabla de la distribución de rrobabilidadse normal,
nos dé valores para P(Z1z).

Edemplo 7.14 Si Z ea una variable aleatoria normal estándar, calculamos


las siguientes probabilidades, amando directamente la ta -
bla del apéncide:

P(Z 4 -2) = 0,0227

P(Z 41,24) • 0,8925

P(14242) • P(X 4 2) - P(X 41) • 0,9773 0,8413 • 0,136


P(2 > 0,4) /4 - 0,4) 1 - 0,6554 • 0,3446
niZI 4 04) 9 P(.-0,54 6 0,5) • P(2 40,5) - P(24-0,5)
•0,6915 - 0,3005 • 0,383
Ejemplo 7.15 Supongamos que el ingreso mensual promedio de 1.200 obre-
ros en una ciudad es $ 750 con une desviación estándar de
$ 100. Si X representa el ingreso y tiene distribución normal, hallar el nd
mero de obreros que tienen un ingreso mensual inferior a $ 750i el número de
obreros oon ingreso superior a $ 750 pero inferior a $ 900; número de obre -
ros con ingreso mayor a $ 900.
En este caso, es suficiente determinar la parto porcentual de obreros
con un ingreso determinado. Entonces.

P(X<750) P(21Z2 -4- 4. M0-150) P(Z <0) • 0,5


O" 00
Luego
1.200 (0,5) • 600 -

es el número de obreros que tienen un ingreso mensual inferior e. $ 750.

Para el segundo caso,


(7.50-750 I=4±1 c yo)
ozz
P(75° x (9°°) P 100 ( Cr 100
=1P (04241,5)

•P(Z < 1,5) - P(2 O)


•0,9332 - 0,5 a 0,4332
Luego,
1,200 (0,4332) 519,84 obreros. .
- 155-

Finalmente, 900-750)
p(x,900) - 1 - POI< 900) = 1 -P
cr z loo
- 1 - P(Z< 1,5) - 1 - 0,9332 = 0,0668 /

Luego
1.200 (0,0668) = 80,16 obreros.

Como la probabilidad total es 1 o sea el 100%, entonces el número total


de obreros, obtenidos anteriormente son 1.200, que representa el 100% de la
distribución (ver figura 7.6). 0 sea,

Total de obreros = 600 + 519,84 + 80,16 = 1.200

-3 -2 -1 0 1 2 3
450 550 650 750 853 950 1.050
/M-3T /m-2T /u-17 ./4 /Ut1T ith12ria+30-

Figura 7.6 Areas bajo la curva normal para los


valores del ejemplo 7.15

Ejemplo 7.16 Supongamos que el peso de los paquetes de mantequilla empa


quetados automáticamente por una máquina de cierta fábrica
de productos a base de leche, es una variable aleatoria normal X, con un peso
promedio de 1,03 libras y una desviación Or= 0,01 de libra. En la envoltura
de los paquetes lleva impreso "Peso neto 1 libra". Si se elige aleator:amen-
te uno de estos paquetes, cuál es la probabilidad de que pese menos de uía li
bra7, que pese más de 1,02 libras?. Entonces, la probabilidad de que pese me
nos de una libra, es
X-1 < 1-1
0,03)
P(X < 1) = P (Z <-3) = 0,0013 /
K 0, 0013 01

y la probabilidad de que pese más'de 1,02 libras, será


. ni.
P(X >1,02) es X-1 03 > 1-1
P E—S--
03
-'--1----) a P (2 > -1) = 1 -P (z 4 -1)
0, 01 0 ,01
= 1 - 0,1587 • 0,8413 //
-156-
Tal como dijimos antes, en loe capítulos que siguen podremos «preciar la
verdadera importancia de la distribución normal. Pero antes de finalizar es-
te capítulo, veamos el siguiente gráfico que nos muestra los porcentajes de
áreas de probabilidades de la curva normal.

99,73%
95.45%
e-
68,27%;

-3 -2 -1 0 1 2 3
4-347 .44-2c 11-1C ,44 fin"
" ta+30-

Figura 7.T Porcentaje de áreas de la curva normal estándar

1. 7
Ejercicios

1.Se lanzan cinco dados una vez. Si X es el número de unos que ocurren, cal
tullir 114x. Cric, 2(3.1.X< 4) y P(X) 2)

2. Be ¡Babe que el 2% de cierto tipo de artículos heohos por una máquina, son
defectivo.. Si seleccionamos 10 de estos artículos, cuál es la probabili-
dad que ninguno sea defectivo? Cuántos se espera que sean defectivos?.

3. Una caja contiene 10 ampolletas de luz, 8 de las cuales son buenas. Si ue


seleceionan aleatoriamente 5 ampolletas, cuál es la función de probabilida
des para el número de ampolletas buenas?

h. In una cierta planta manufacturera, ocurren accidentes a razón de 1 cada 2


meses. Asumiendo que los accidentes ocurren independientemente, cuál es
el albero esperado de accidentes por ato? Cuál es la desviación estándar
del :libero de accidentes por ato?. Cuál es la probabilidad de que no ocu-
rra ningún accidente en un mes dado?
- 157-

5. A un tablero de registro llegan llamadas de acuerdo a un proceso de Poi-


sson con parámetro Am 5 por hora. A'partir de una última llamada, cuál
es la probabilidad de que pase al menos 15 minutos antes de la siguiente
llamada? Que no pase más de 10 minutos? Que la llamada ocurra exactamen
te a los 5 minutos?

6. Supuesto que una variable binomial tiene por media 12 y per varianza 8,
hallar p y n.

7./ Supongamos que la estatura de los varones adultos tiene una distribución
normal, con 169 y Cr= 7, centímetros. Cuál es la probabilidad de que
un individuo elegido elatoriamente, tenga más de 170 cros.? Cuál de que
mida a lo más 168 cros?.

8.' Cuál es la mediana de E, si fx(x) = 2(1-x), 0 Cx 1?

9.//E1 promedio C.I. (coeficiente de inteligencia) de cierta juventud se esti


ma en 100, con un desviación estándar de 10 unidades. Cuál es la proba -
bilidad de que una persona seleccionada aleatoriamente tenga un C.I. de
más de 110? Al menos 105? Qué valores de C.I. serían considerados como
un buen promedio, si se estima normal el porcentaje medio de 68?

10./ El peso promedio de una piña es de 50 onzas, con una desviación estándar
de 5 onzas , según informes de un comerciante local. Supuesto que los pe
sos se distribuyen normalmente, que porcentaje de piñas pesa más de 54 on
zas? Que porcentaje pesa menos de 40 onzas? Por encima de qué peso cae
como máximo un 10% de las piñas?

11./La longitud de cierto tipo de clavos se encuentran distribuidos normalmen


te. La media de la distribución es de 2,5 pulgadas y la desviación estáTt.
dar 0,006 pulgadas. Entre qué valores centrados cae el 50% de loa clavos?
Determinar la probabilidad de que la longitud de un clavo iguale o exceda
2,509 pulgadas. Determinar la probabilidad de que un clavo mida entre
2,499 y 2,510.

12. Un proceso con distribución normal está centrado en 20,6 cc. y mantiene
una desviación estándar constante de 0,5 cc. Qué tanto por ciento de los
artículos de esta línea de producción vendrán conformes con los siguientes
límites de especificaciones:

12.1)20,6 + 1,0 cc
12.2)21,0 :a: 1,0 cc
12.3)20,5 -T 0,5 cc
- 158-

CAPITULOO

MUESTREO Y DISTRIBUCONES
EN EL MUESTREO

8.1

Introducción

Prácticamente desde el Capítulo 2 hemos


venido utilizando el vocablo ~me, y es más, casi todo el tratamiento, tan
to conceptual como computacional, se ha hecho como si se tratara de una mues-
tra de tamaño n. También se llegó a la idea intuitiva de que una muestra es
un subconjunto de la población. Se ha dicho insistentemente que la estadísti-
ca moderna es netamente inferencial, etc., etc. Lo cierto es que tenemos ,
por los conceptos vertidos hasta donde llevamos estudiado , la idea intuiti-
va de muestra, cono una parte del todo. Así, cuando se dice: "para muestra
basta un botón", ea con el pensamiento de que, conociendo tan sólo algunos
elementos de un conjunto de objetos, se puede inferir cómo son todos loe que
reatan. Por ejemplo, suele ocurrir que una ama de casa, antes de comprar, di
gamos frutillas, prueba una o dos para luego tomar una decisión posible: coma
prar, si saben bien a su paladar o no comprar en caso contrario, porque infe-
rirá que todas las demás son como las que probó.

El presente capitulo, no tiene la finalidad de presentar las técnicas


del muestreo ni la teoría del muestreo, aunque nuestro deseo es grande, pe-
ro ello ímplicarfa mucho tiempo y espacio por la magnitud de estos temas.
Lo que perseguimos en realidad, es dar una idea de lo que consiste el mues
treo y sobre todo ver los conceptos básicos relacionados con las distribu-
ciones del muestreo aleatorio, que son les herramientas básicas para la a
6eaeneia tetad:Laica.
La importancia de este tema, como una antesala de la inferencia esta-
dística, es relevante sobre todo para aquellos que están interesados en la
preparación de proyectos. La teoría del muestreo, en la actualidad va a-
corde al progreso cient5fico, la misma que requiere de constantes experi-
mentaciones, para poder inferir resultados generales a partir de pequeñas
observaciones. Es aquí, que el concurso de la teoría de probabilidades
juntamente con el muestreo, brindan el instrumento estadístico más impor-
tante para toda investigación. El modelo del muestreo aleatorio es apli-
cable en mayor o menor medida, a todos los campos de la investigación cien
tffica.
- 159 -

La aplicación del muestreo en el campo de los fenómenos económicos ea


tal que, en la actualidad no es posible prescindir de esta técnica estadísti
ca. Así por ejemplo, en lo que respecta al e4hidkd de mexedd04, el muestreo
es un auxiliar importante, cuando se trata de estimar valores medios y tota-
les de ingresos en una población, demanda de diferentes artículos y grupos
de artículos, porcentajes de gasto o ingreso familiar de ciertos grupos so-
ciales, la capacidad de disponibilidad monetaria para recreaciones o turismo,
etc. los tres campos principales donde se aplica el muestreo en el estudio
de mercado, son: 1) estructura del mercado, Z) preferencias del consumidor,
y 3) técnicas de venta. En el primer caso, se trata de conocer la campos/ -
ción de la población según el sexo, edades, clases socio-económicas, etc. En
el segundo caso, se trata de conocer los hábitos, necesidades, experiencias
y conocimientos sobre los productos considerados por parte de los consumido-
res efectivos o potenciales, teniendo en cuenta el tamaño de los diferentes
grupos poblacionales. Por último, en el tercer caso, se trata de aprove -
cher las experiencias pasadas para lanzar al mercado ciertos productos en
condiciones óptimas, tomando en cuenta aspectos publicitarios, así como la
interacción de los vendedores hacia los clientes. Todo esto, con el fin de
aumentaro iniciar utilidades asegurando los riesgos implícitos, tomando en
cuenta los movimientos de costes, suministros de materias primas, etc. Tam-
bién habré que estudiar la influencia de variables exógenas, por ejemplo fe
nómenos meteorológicos (tales como sequías, inundaciones, plagas, pérdidas
de cosechas, etc.), y la política económica y social de los gobiernos o enti
dades influyentes.

El muestreo también puede utilizarse para la estimación del ingreso na-


cional, estimación de inventarios, obtención de números índices, conocer pre
supuestos familiares, escalas de consumo, niveles y costo de vida, etc.

Por ahora, dejaremos otras consideraciones acerca de la importancia y


aplicaciones del muestreo, para abocarnos a la construcción de distribucio -
nes de probabilidades para estadísticos muestrales y sus propiedades. Pero
antes de todo ésto, estudiaremos algunos conceptos relacionados con n varia-
bles aleatorias, que es una generalización a las distribuciones bivariantes
que mencionamos en el Capítulo 6.

8.2

Funciones de Varias
Variables Aleatorias

A menudo se presenta la necesidad de co-


nocer el comportamiento de variables aleatorias que son a su vez funciones
de varias otras, sobre todo en el muestreo aleatorio. En primer término, de
finiremos un concepto que ya se utilizó para describir una medida provenien-
te de una muestra.
-160-

DEPINICION 8.1 Una función de los elementos de una muestra aleatoria.


que no depende de un parámetro desconocido, se llama
un e4tadatico.
Esto es, si X1, X2, Xn es una muestra aleatoria de una misma varia-
ble aleatoria X, las cantidades
Xn
XI + X2 , leí , • (X.-3)2 ,
X1 • isl i=1
son estadísticos.

Si X es una variable aleatoria con medle"y varianza d2, entonces las


cantidades tales como
2 XI X2 .1 3.
X3 -/u ;::: ati-/A)
i-1 202

son estadísticos si.„44 y G2 son conocidos; pero, si/4y 02 se desconocen, en-


tonces no son estadísticos. 1

Ya que un estadístico es una función de los elementos de una muestra a-


leatoria de una variable aleatoria, entonces un estadístico es a su vez una
variable aleatoria.

De una muestra a otra, el valor de un estadístico puede variar , porque


los valores particulares de la variable aleatoria pueden variar. De esta ma-
nera, la función de probabilidad o función de densidad de un estadístico pue-
de deducirse de la función de probabilidad o función de densidad de la mues -
tra; entonces, el estadístico puede usarse para hacer inferencias relativas a
parámetros desconocidos en la distribución de probabilidades de X.

Anteriormente hemos indicado que trataremos el caso particular de varia-


bles aleatorias independientes. Recordemos que si tenemos X1, X2 Rn va-
riables aleatorias independientes, cada una de ellas con media y varianza fi-
nitas, entonces

E(X + X2 +....+X ) E(X )


1 n i
i-1
Y
V(X/ + X2 +...+ Xn) s fl V(X.)
isl 1

Podemos deducir facilmente varias propiedades para la suma de variables


aleatorias independientes idénticamente distribuidas.

TEOREMA 8.1 Si X1, X2, Xn son variables aleatorias independientes Ber-


noulli, cada una de ellas con parámetro p, entonces

Y a > X. es una variable aleatoria binomio/ con parámetros


i-1 n Y P.
- 161 -

TEOREMA 8.2' Si X1, X,,...,X son variables aleatorias independientes norman


les idénticamenYe distribuidas, cada cual con perímetros/uy01

entonces Y= r X. es una variable aleatoria normal con parámetros ne y


i=1
2
n C

En símb2los, si X,A,N(u, C2) para todo i=1,2 , n entonces


YryN(nia, n ). (el símbolo tv, se lee "esté distribuido").

Ejemplo 8.1 Tomemos la informacién del Ejemplo 7.16 Supongamos ahora


que la Fábrica envía a sus distribuidores mantequilla en
cajas de 100 paquetes. Sean XI, X2,...,X 100 los pesos individuales de los
paquetes que son puestos en una misma caja. Entonces el peso total de cada
caja con 100 paquetes de mantequilla, es y 100 a. Si asumimos que los
i=1
pesos individuales de cada paquete son independientes, el peso total de la
caja, Y, es también una variable aleatoria normal, pero con#f mi= 100(1,03)
2
= 103 y 0 = n02 - 100(0,01) - 0,01. Luego, GY - 0,1
Y
De esta manera, la probabilidad de que una caja sel eccionada aleatoria-
mente, pese al menos 100 librases

P(Y > 100) = 1 P 100-103) 1


0,1 - P(2 1-303 = 1-0 1
( Y
Y -"AY
TEOREMA 8.3 ¡Supuesto que X son variables aleatorias independien-
2
tes idénticamente distribuidas, cada cual con mediaiXy varianza
rj . Si 31 es el promedio aritmético de las n variables aleatorias, es decir

rt .1. t X. = -1
1 X.
=1 i

entonces, A1- -/U-


X
2 2
Y Cr C
I " n
0 sea que, el valor esperado de X es igual a la media comen de las X., y la
varianza de X es l/n veces la varianza común 072 i

Se aconseja al alumno tomar muy en cuenta este hecho, puesto que juega
le papel importante en la teoría estadística, y en forma particular en la in
ferencia estadística.

Antes de seguir considerando el comportamiento de varias variables alee


torias, hagamos un paréntesis para presentar una de las desigualdades más imm-
portantes en estadística, que fué propuesta por CHEBYCHEV.
- 162-

8.3

Desigualdad de Chebychev

La desigualdad de Chebychev, muestra la


relación notable que existe entre el valor esperado, la desviación estándar
y la distribución de probabilidades de una variable aleatoria, discreta o
continua.

TEOREMA 8.14 Si X es una variable aleatoria con mediaAty desviación están


dar c', entonces

P( IX-AA I < k(r )11- I2-


o el complementa de ésta

P( I ) k Cr )<Ir
k
Lo notable de esta desigualdad es que sin importar cuál sea la distribu
ción de probabilidades de X, indica que la probabilidad de tener valores fue
ra del intervalo (AZ- k G ) ,‹44- kcr) está limitada, ya que es un valor menor
o igual a 1/kc.

EJEMPLO 8.2 Cualquiera que sea la variable aleatoria X, si k = 2


(1/k • 0,25), la probabilidad de que un valor de X quede
fuera del intervalo ()U- 2cr,,ct+ 20-) ea menor que 0,25, si se conoce la
media y la desviación estándar de X.

La desigualdad de Chebychev, debido a su generalidad, tiene gran utili-


dad en la teoría moderna de probabilidades. Por ejemplo en el control de cali
dad industrial moderno, es de mucho interés conocer la proporción de la produc
ción que queda por fuera del intervalo 94- kCr mas- k , conociendo la cali-
dad media p.

Esta desigualdad es también útil desde el punto de vista teórico; por ejem
plo, en la discusión de la ley de los grandes números.

8. 4

Ley de los grandes números

Hay un hecho que es muy importante en


la estadística aplicada. Se trata de que cualquiera sea una distribución
poblacional (con tal que tenga varianza finita), la distribución de la me-
dia muestra' se concentra más y más alrededor de la media poblacional a me
dida que aumenta el tamaño de la muestra. Como veremos, se deduce que cuan
- 163-
to mayor es una muestra, la media obtenida de la muestra es mucho mejor esti
orador de la media de toda la población en estudio.

TEOREMA 8.5 (Ley de los Grandes Números) Sean XI, X2,..., Xn una sucesión
de variables aleatorias independientes idénticamente distribui-
das, cada cual con media.fry variante 6'2, comunes. En tal caso la sucesión
de medias aritméticas

Xn - n x. n = 1, 2, 3, ....
i=1
XI + X2 +
XI X2 , R3
3 3
(° °es: 11 4'X1 ' 2 2
converge en probabilidad hacia , a medida que n crece. Es decir,

lím P(
'TI"71
-/a 1>t) = o para todo (>0
n-. w
O sea que la probabilidad de tienda afr, es prIcticamente 1, si n
que'11
crece indefinidamente.

8.4

Teorema Central del Limite

Ahora enunciaremos un teorema de enorme


importancia, porque permite el uso de las propiedades de la distribución nor
mal, aunque se tengan variables aleatorias distintas de la normal. El tecla
ma central del limite, también es una de las proposiciones más notables de
toda la matemática.

TEOREMA 8.6 Sea XI, X2 ..... Xn una sucesión de variables aleatorias indepen
dientes idénticamente distribuidas, cada cual con mediaiu. y va-
riante 62 (es decir, du y 6-2 comunes y finitas). Si se define la sucesión de
variables aleatorias
-
II
Z n - 1, 2, 3,
n

donde 1n 7-- X.
n 3i=1
- 164-

Entonces
2
1 -z /2
lim F, (t) dt
II --I x
an 7inf e
00

es decir que 2,
4v N(0,1) si n-->oo

El punto importante que debemos retener de este teorema, es el hecho de


que en el límite, la distribución de 2 no depende --de cuál sea la distribu -
clon común de las X u
n
Resumiendo, la importancia de este teorema en lo_que respecta a las apli
cationes prácticas, se debe al hecho de que la media Xn de una muestra alqato
ría proveniente de cualquier distribución con mediaiuy varianza finita O ,
se distribuye aproximadamente como una variable normal con media/L y varianza
cr-ln. Por otro lado, el teorema central del límite se aplica tanto a distri
buciones discretas, como a distribuciones continuas.

Antes de ver algunas distribuciones importantes en el muestreo, defina -


mos los estadísticos más comunes que serán usados en problemas de inferencia.

En todo el contexto de lo que sigue, trabajaremos con muestras aleato -


rias de tamaño n, X„ X2,...X , provenientes de una variable aleatoria X. En
tonces, es posible también obVener algunas medidas de ellas, a las que hemos
llamado estadísticos.

DEFINICION 8.2 Si XI, X2 X es una muestra aleatoria de X, el k-é-


n
sipo momento muutnal está dado por:
1I- _1(
por k 1,2,3,...
14k ;
iffil 1
- C--
En el caso particular en que k e 1, entonces tenemos MI a X = 1

que es la media aritmética muestral.

DEFINICION 8.3 Si XI, X2,...,Xn es una muestra aleatoria de X, la va-


níanza mutothat se define por
S2 1 f i-
a — (X. - 5)2
n 1 i
ial
donde X es la media muestral
La razón del por qué se divide este promedio, por n-1, lo veremos más
adelante. De la definición se obtiene fácilmente la de4viación utdndat MUC4
ttat, s
- 165 -

TEOREMA 8.7 Si S2 es la varianza muestral, entonces

S2 = -n- (m2 - R2)


n-1
El
—1
donde n es el tamaño de la muestra y M2 n
Se demuestra fácilmente,en forma análoga, como se vid en el Capítulo D.
Veamos ahora algunas distribuciones en el muestreo que serán de uso co-
rriente en problemas de inferencia estadística.

8.5

Distribución Muestral
de una Proporción

En el Capítulo 1 (1.3) definimos la


proporción poblacional por P a h. , donde A es el número de unidades elemento.
lea con cierta característica ynN el número total de unidades elementales de
la población de tamaño H. De la misma manera podemos definir la pupouídn
wuutita por p = , donde x es el número de unidades que poseen cierta pro-
piedad y n es el tamaño de la nuestra.

Si se obtiene una muestra aleatoria de tamaño n con remplazamiento, en-


tonces la distribución muestral de p obedece a la ley de probabilidades bino
miel estudiada en el capítulo anterior, luego

a Elp) E (-11)m In 11- = P (8.1)

C2 n V(P) a Laril (8.2)


n' n

de donde la desviación estándar (error estándar) denotado por Gin es:


111=11) (8.3)
En el caso de que la muestra se. realizara sin restitución, entonces la
distribución muestral de p obedece a la ley de probabilidades hipergeomátri-
ca. Entonces

A aP
crp . Bp
= 21:1) (8.)
n N-1
- 266 -

donde (8-n)/(21-1) es el 6am104 de co4Pteeean pmblde4ondi &mito.


Si consideramos la variable Z 2 , entonces 2-Za se aprsxima
os
N(0,1) (Teorema Central del Límite).

8.6

Distribución Múestral
de la Media

La distribución en el muestreo de la me
dia, o sea la distribución de las medias obtenidas de todas las muestras po-
sibles del mismo tamaño extraídas de la poblada, proporciona el aspecto más
relevante dela inferencia estadística.
Si le toma una muestra aleatoria X1, X2,..., Xn de X con media" y va -
rianza474, eptoncee las xs. (i=1,2,...,n) son variables aleatorias idénticamen
te distribuidas con los mismos parámetros. Además, la media muestral

37 = 1n- i.1 Xi

es también una variable aleatoria; luego, el valor esperado y su varianza son

E(X) . 019 = I E:rxi 95( (8. 5)

n Cr2
Y 01- = V(r) = Va EX±) = '
22 VOli) = = (8.6 ;

Todo ésto baje el supuesto de que las Xi son independientes. Además

es decir,CI es el error estándar de la media. Puede observarse que


y también que cuando n--io2 gst...-.0
También puede utilizarse el factor de corrección poblacional finito, pa
ra el cómputo de la desviación estándar de la media, o sea

0r- 47 (8.8)
X' Is-2
-167-
En el caso de que la población sea normal, no hay ninguna dificultad de
trabajar, ya que la distribución muestra). de 1 es también normal. Sin embar
go, si la población tiene cualquier otra distribución, entonces la variable-
= (E9M)/Cry se aproxima a la normal con media 0 y variante 1, cuando n
se hace suficientemente grande.

Ejemplo 8.3 Supongamos que tenemos una población que consiste de cua -
tro fiches numeradas, 1,2,3, y 4, respectivamente. Si to-
ma:son muestras aleatorias de tatuado 2, tendremos • 4
)
( <
Posibles valores Probabilidades`
f2 0(5 )
de X Pi
1,5 1/6
2 1/6
2,5 2/6
3 1/6
3,5 1/6
/2,5 1

Luego
14157= z(i) = (1,5)(1/6) 2(1/6) + (2,5)(2/6) + 3(1/6) + (3,5)(1/6) = 12=2,5/
6
Que coincide con At= 1+2 ---. 2,5 a'
+4341
Por otro lado, 52 m N(X2) - ("4)2 = 7,5 - 6,25 = 1,25 /
Luego, (r
417E1 1/113711r---6
:717 0 6455 /
A n N-1 2 4-1 '

8.7

Distribución Muestral de la
diferencia de dos Proporciones

Cuando se extraen dos muestras aieato -


ries de dos variables binomiales, pueden compararse las proporciones. Veamos
cual sería la distribución muestra: para este caso. Supongamos que se extraen
dos muestras aleatorias independientes, la primera de tamaño nl de una pobla-
ción binomisl con proporción PI y, la segunda de tamaño n2 de una población
binonlial con P2. Entonces la diferencia de las dos proporciones muestrales,
e p = P1-P2, es también unsvariable aleatoria cuya distribución tiene como va
lor esperado
- 168 -
E( d ) = cl = Pl - PE (8.9)
y coro desviación estándar muestra.1

i/P1(1-P1) P2(2-P2)
(8.10)
O n1 n2
Por otro lado, si ni y n2 son suficientemente grandes, entonces

Z= -lene aproximadamente distribución N(0,1)


G-dP

8.8

Distribución Maestral de la ////


Diferencia de dos Medias

Muchas veces se hace necesario comparar


las medias de dos variables aleatorias. Este hecho se presenta a menudo en
el campo de la investigación científica, por ejemplo si se trata de ver el
resultado de dos procesos de producción diferentes, etc. En este caso Latir -
bién se trata de comparar dos muestras aleatorias independientes. Si una
muestra de tamaño ni se extrae de una población con media,MI; y una muestra
de tamaño n2, de otra población con mediaiM2, y si 11 y 7. son las medias
rmestrales ottenilas, entonces podemos calcular la posible diferencia
et,a. A- ifs2 a partir de las medias mueatrales, o sea con dr = ri - 12.
Entonces, la distribución =astral de N3r, tendrá como valor esperado

./10i = E( di) = d/Ot


(8.11 )
y como desviación estándar

nrbr 1
0.2
-2
n2
(8.12)
nl
Igualmente si nI y n2 son suficientemente grandes, entoncesirse puede a-
proximar a la distribución normal mediante la estandarización

Z (8.13)
aR
donde Z r1/4/N(0.1)
-169-

8.9

Distribución Nuestra'
de la Varianza-'

Cuando se toma una muestra aleatoria de


tamaño n de una población, la varianza de la muestra está dada por

2 1 r oc. _ 1)2
s —
n
i=1
Pero ocurre que al determinar la esperanza matemática, da
2 n 1 2
E(s ) 0-
n
En cambio si se toma la varianza tal como se definió (Definición 8.3), goza
de la propiedad de que

E(s2) = E -)2) =
(La
\, n-1 i.1

En este último caso, se dice que la varianza muestra' es un -estimador inses-


gado de la varianza poblacional, tal como veremos In el capítulo siguiente.
Naturalmente que sin es suficinetemente grande, s y 52 son prácticamente
iguales, ya que n — se aproximará a 1.
2
Entonces para la distribución muestral de S ,tendremos
E(52) .0_2
(8.14)

Y S2 2 T-
- 1cf

de la misma manera que en los casos anteriores, es posible estandarizar esta


distribución, y así aproximarla a la distribución N(0,1), gracias al teorema
central del limite.

No hemos puesto ejemplos para las distribuciones muestrales por dos ra-
zones: Primero porque se reduce a hacer cálculos como en los Capítulos 3 y4
y para determinar probabilidades, se hace igual que en el Capítulo 7, e. la
sección correspondiente a la distribución normal; y segundo, porque en los
dos capítulos siguientes tendremos oportunidad de practicar con estas distr
buciones muestrales, y además ver sus aplicaciones. Ahora enunciaremos las
tres distribuciones que se cuentan entre las más importantes para las aplica
ciones prácticas de la Estadística.
-170-.

8.10

Distribuciones: Chi-Cuadrado,
F y t-Student

Para comparar la varianza de una mues -


tre con la varianza hipotética de la población, se utiliza la distribución
%2 (se lee "chi-cuadrado"). Esta distribución es de mucha utilidad para
pruebas de significación de varianzas, es decir en los casos en que se quie-
re comprobar si .a varianza de una muestra encaja o no en la distribución
prevista para e: estadístico, en los casos en que se tenga que formular la
hipótesis de un valor específico de Ir.

TEOREMA 8.8 Sean n variables aleatorias independientes XI, X2,...Xn todas


ellas con distribución normal estándar ( XindR(0,1) para i = 1,2,...n), en -
tonces el estadístico
2 t-- Xi2

es una variable aleatoria chi..-Cudditado con n grados de libertad.

'astil. aleatoria de una variable aleatoria non


Si X1, X2,...,X1 es una ml
mal X con distribucion N(iAA,Qc), entonces

%2 E xi )2 con n grados de libertad.


¡si 6.

La función de densidad de la distribución %2 para n grados de libertad,


llega a ser

° (x) - x (n/2)-1 e -x/2 para x >O


Z- 7
2 171-(7
1/2)
-
0 en otro cano.

(rI, es la función gamma).

Podemos observar que para el caso particular en que n = 2 tenemos la dis


tribución exponencial fx(x) = 21 e-x/2.
2
El gráfico 8.1 nos• muestra la función de densidad de% para distintos
valores de n .
- 171-

0,3

0,2

0,1

0 2 4 6 8 10 12 14 16 18 20
2
Figura 8.1 Distribución de 1 para distintos valo-
res de n.
e

2 Como se puede ver, a medida que es mayor el valor de n, la distribución


X. tiende a aproximarse a la distribución normal.
En cuanto,a le media y varianza, de unal2 con n grados de libertad, se
A tiene/l= n y Cr =2n, respectivamente. Entonces, la variable
Xn
Z - — se aproxima a la N(0,1) a medida qua n crece. En tal caso, el pro-
blema s
e reduciría a utilizar las tablas de la distribución normal, sín em -
basgo, se puede trabajar directamente con las tablas de probabilidades para

Ejemplo 8.5 Supongamos que X tiene distribución 12 con 10 grados da li
bertad, entonces utilizando la tabla del apéndice, podemos
calcular probailidades como:

P(X> 12,51) - 1-P(X1 12,51) = 1-0,75 = 0,25


P(X > 4,9) - 1-P(X1 4,9) - 1-0,1 - 0,9
TEOREMA 8.9 Si X, X, ...,X es una muestra aleatoria de una variable alea-
'
toriánolMal X /on mediaay varianza02 , entonces
2
(X. - 3)
Z = u
i-1 02

es una variable aleatoria%2 con (n-1) grados de libertad,y2yi son varia


bles aleatorias independientes.

Podemos modificar el numeradordelsexpresión anterior, teniendo en


- 172 -
- 2
cuenta que S2 = E(112
-X o sea (n-1)S2 ="1:(X-X) .
n-1
luego z (n-1)82
s
Seta prcpiedad es de bastante aplicación en4iroblemas de inferencia.
Veamos el siguiente ejemplo.
-■
Ziemnlo 8.6 Supongamos que tenemos una muestra aleatoria de 12 observa
ojones de una variable aleatonia normal con media/ay va -
rianza(72, depoonocidos. Entonces Z - 11 S2/0•` es una variable aleatoria
Z2 con 11 grados de libertad. De las tablas, podemos ver que
P(4,57 1 2C 3,7) = P(2 (13,7)-P(204,57) = 0,75 - 0,05 = 0,7.
o también
P(0,42(12( 52( 1,25 02) 0,7,
lo cual nos indica cuán probable es que la varianza muestra) esté cerca de
Cr 2 para una muestra de 12 observaciones.
Veamos ahora la distribución F.
THOREUA 8.10 (Distribuci6n ?) Sean las dos variables aleatorias independien-
tes X e Y, tal que X tiene distribución chi-cuadrado con m gra- ,
dos de libertad, y tal que Y tiene distribución chi-cuadrado con n grados de
libertad. Entonces el estadístico
q. ss
)
Y/n
es una variable aleatoria F con (m,n) grados de libertad.
La distribución tiene casi la misma forma de la 0(Ver Figura 8.2).

Figura 8.2 Distribuciones de F para varios taoaaca(m,n)


- 173 -

No creemos necesario describir la función de densidad de F.

Rey situaciones en las cuales se desea comparar la variabilidad de una


población con otra. Mediante el uso de .a distribución F podemos comprobar
si una observación determinada de una relación de variantes de muestras indi
ca o no que dos muestras proceden de una población única o de dos poblacio -
nes que tienen variantes iguales. La prueba F se emplea también en el análi
sis de datos de un experimento en el cual se trata de descubrir cuál entre
varios factores afecta a un proceso. Este tipo de análisis de datos corres-
, ponde al ~gaje de vahíania. Como al realizar pruebas F nos referimos a
dos muestras, tendremos dos valores diferentes de m y n, si las muestras tie
nen el mismo tamaño. De esta manera, existen muchas distribuciones F dite -
rentes (Figura 8.2).

Las tablas de la distribución F, presentan tabulaciones para el par de


números enteros (m,n) y la probabilidad p, para el valor x, es decir

P(X tx) = p

si X tiene distribución F con (m,n) grados de libertad. El siguiente ejem -


plo nos muestra el uso de la tabla del apéndice.

Ejemplo 8.7 Si X tiene distribución F con (m,n) = (5,7) y p mi 0,90, se


lee x = 2,88. Ahora si (m,n) * (7,5) y p = 0,975, obtene-
mos x mi 6,85

Se habrá observado que en la tabla sólo figuran valores grandes de la


probabilidad p; sin embargo, no es difícil utilizar la tabla para valores pe
quedos de p. Para ésto, se aprovecha la propiedad siguiente: Si X tiene
distribución F con (m,n) grados de libertad, entonces

P(X tx) = 1-P(Y 41/x)

donde Y es una variable aleatoria que tiene distribución F con(n,m) grados


de libertad.

Ejemplo 8.8 SiX ea una variable aleatoria con distribución F con(8,6)


grados de libertad, se desea hallar el valor de x tal que
F(Xtx) = 0,05. En este caso, se verá en las tablas el valor de 1/x pera el
que sea P(Y tl/x) = 0,95, donde Y tiene distribución F con (6,8) grados. de
libertad. Se encuentra que 1/x = 3,58, luego x = 1/3,58 = 0,28
La tercera distribución, de considerable importancia práctica, es '1
distribución "t" de Student. En muchos trabajos de investigación estad rd.-
ce., la media y la desviación estándar se calculan sobre la base de muewizas
relativamente pequeñas, usando como estimadores r y S. En tal caso, la dis-
tribución t de Student para muestras de alrededor de 30, se aproxima bastan-
te a la distribución normal. En general, cuando se conoce dr, debe emo?ear-
se la distribución normal para hacer inferencias relativas a los prcaethos
de una población; y cuando se desconoce dr, se debe emplear la distribución
t apropiada al tamaño de la muestra por la cual se calcula S.
174-
TEOREMA 8.11 Sean X e Y dos variables aleatorias independientes, tal que
X tiene distribución normal estándar, e Y una distribución chi-
cuadrado con n grados de libertad.
Entonces T a X/vr77717
es una variable aleatoria con d'ha/u:lacten t con n grados de libertad, cuya
función de densidad ea

r
ri(n+1 /2) 1 + t2 ) - (n +1) /2 om
fT(t) (n12) n Para - cc.< tc
ATI
En la figura 8.3 se muestra esta función para distintos t'Amabas de n.

Densidad N(0,1)

Densidad de t; n o 3

Densidad t; n o 10

Figura 8.3 Curvas de la distribución t con n=3 y no 10


comparadas con la distribución normal están-
dar.
También existen tablea con tabulaciones para la función de distribución
t con n grados de libertad, o sea que nos da el valor de x que cumple la con
dición

P(X1x) sil /St) dt p


os '
dado el valor de la probabilidad p.
Dialing° 8.5 Si n o 14 y p a 0,99 se lee x s 2,624, es decir P(X42,624)
o 0,99. Esto mismo suele simbolizarse t0,99(14) 2,624.
De esta manera, t0,95(6) ' 1,943 es equivalente a P(X41,943) o 0,95.
Si la probabilidad p es pequeña, también resulta posible utilizar la ta
bla, teniendo presente que para la distribución t se verifica la siguiente
identidad:
P (X1.x) (x -x)
- 175 -

Ejemplo 8.10 Si n = 15 y p = 0,01, entonces


P(X 62,602) = 0,99, luego P(X A-2,602) = 0,01. Esto se
debe al carácter simétrico de la distribución t.

TEOREMA 8.12 Supuesto que X es una variable aleatoria normal con zediajAy
varianza Q2, y que X1, X2 XII es una muestra aleatoria de n
observaciones de X, entonces

t -I -
S
MOTT
tiene distribución t-Student con (n-1)grados de libertad.

Ejercicios

1.Supongamos que Ire ison las medias de dos muestras, cada una de tamaño n,
tomadas de una población normal con varianza G 2. Determinar n de modo
que la probabilidad de.que las dos medias muestrales se diferencien en menos
de ósea aproximadamente 0,99.

2.Si X se distribuye normalmente, con media 20 y Cr= 5, calcular la pro


babilida de que: 1) X> 21, 2) 5:>21, si x se basa en una muestra aleato-
ria de t o 25.
3.Hallar el nivel de probabilidad del 0,95 para la distribución F con dos
y cuatro grados de libertad.
4.Explicar la diferencia entre: 1) estadístico y parámetro y 2) error están
dar y error muestral.

5.Para muestras de tamaño dos de una población con varianza G2, demuéstrese
que el valor esperado de la varianza muestral es 02/2.

6../Utilícese la desigualdad de Chebychev para hallar cuántas veces debe lan-


zarse una moneda para que la probabilidad de que 1esté entre 0,4 y 0,6
sea, almenos 0,9 (suponiendo que la moneda esté bien construida).
7.Un. instituto de opinión pública quiere obtener una muestra de votantes de
una.cierta ciudad, suficientemente grande para que la probabilidad de que
la proporción obtenida a favor de un cierto candidato resulte infer:or al
50%, siendo verdadera del 52%, sea sólo 0,01: Qué tamaño de muestra debe-
rá adoptar?.

8.Una compañía de trigo híbrido para cultivo, afirma que su producto dará,
por término medio, 14 quintales por hectárea sembrada de trigo. 25 ectá-
reas dan un promedio de 13,5 quintales por hectárea. Si suponemos que la
desviación estándar ores 2 quintales por hectárea, cuál es la probatili -
- 176 -

dad de obtener una media =teatral de 12,5 o menos? Qué conclusión Po-
dría deducirse?.
probabilidad de que ric este
9. Si se lanza 130 veces un dado, aproximase la
comprendido entre 3 y 4.

10. Supuesto que se sabe que en una población, los coeficientes de inteli-
gencia (CI) se distribuyen normalmente con/V= 100 y cr= 10. Cuál es
la probabilidad de que un individuo seleccionado aleatoriamente tenga
un CI comprendido entre 95 y 115?

11. Es conocido que un cierto proceso hace focos de alumbradode


cuya duración
200 horas y
está normalmente distribuido con un promedio de duración
desviación estándar de 20 horas. Si seleccionamos aleatoriamente 3 fo-
cos de este proceso, cuál es la probabilidad que todas las tres duracio
nes exceden 195 horas?

12. Asumamos que el peso de los estudiantes de un Colegio están distribui-


dos normalmente. Si tomamos una m.a. de 20 estudiantes y registramos
los pesos de cada uno, cuál es la función de densidad conjunta para la
muestra de los pesos? Como una función deiü y 6, cuál es la probabi-
lidad de que el total de los pesos excedan4.000 libras?
-1777

CAPITULO 9

ESTIMACICN DE PP.RAMETROS

Mitre los problemas más importantes de


la estadística, están sin lugar a duda, los modelos de estimación puntual y
por intervalos, de los parámetros de una población.

Son innumerables los casos en que estamos interesados por conocer una
medida de un conjunto de elementos pertenecientes a la población en estudio;
por ejemplo: la media, la mediana, la desviación estándar, alguna proporción
etc. Como estudiamos en capítulos anteriores, existen una serie de factores
que impiden conocer estas medidas si se quiere tomar en cuenta a todos los
elementos de una población; sea porque el numero de commonentes es muy gran-
de, lo que incide en los costos de obtención y elaboración de datos; sea por
que'se requiere de mayor tiempo para conseguir los resultados; sea porque mu
chas veces no es realmente posible conseguir toda la información; etc. Sin
embargo, todo ésto no constituye un obstáculo para poder obtener de una mues
tra tomada aleatoriamente de la población, una medida que sea un buen estima
dor del valor de la medida poblacional correspondiente. Sabemos que no siem
pre es necesario tomar en cuenta a todos los elementos de la población, ya
que admitiendo un pequeño margen de error se pueden obtener estimaciones ca-
si exactas. Obviamente, es muy difícil cue la medida calculada de una mues-
tra coincida con su correspondiente poblacional, pero, desde el punto de vis
ta de la aplicación práctica, sea en el campo económico o en otros campos,no
tiene mayor importancia el que exista una diferencia pequeña. Por ejemplo,
si la media de los ingresos de 100.000 artesanos es 1.200 $b. mensuales, y
si el ingreso medio mensual de 800. artesanos (tomados aleatoriamente de los
-^ 100.000) da 1.235 $b. la diferencia es muy pequeña, para ser significativa
desde el punto de vista de un análisis general sobre el ingreso promedio men
sual de los artesanos. Es más, decir que el íMBAC40 la/comed:Lo &timado es
1.985 $ 6 1.235 $, 6 1.220 $, no tiene mayor importancia, puesto que todos
ellos son igualmente buenos estimadores del ingreso promedio de toda la ro -
blación de obreros, que es 12= 1.209 $. Si se conociera la medida cue aos
interesa de una población, el problema terminaría en ese momento. Pero, en
general no se conocen los valores de los parámetros de la distribución dl la
población. Eh la práctica se obtiene una muestra aleatoria, y en base a és-
ta, se pretende estimar los valores exactos de los parámetros desconocidos.

En términos mas generales, supongamos que nos interesa conocer la media


(fi) de una población, para lo cual tomamos una muestra aleatoria y calcula-
mos la media maestral Ir; nos preguntamos, si podemos tomar éste valor como
-178-
una estimación de la media poblacional, y de ser así, en qué medida nademos
confiar que no diferirá mucho de ,
,(t, ya que si se toman otras muestres del
mismo tanaho, es seguro que darán medias distintas al de la primera muestra.
Entonces, hasta qué punto rodemos estar seguros de cue 7 es un buen estima-
dor de la ?. Se ve claramente que un valor único de la media de una muestra
no es suficiente parayermitirnos especificar el verdadero valor de la me -
dia poblacional, por esto es más adecuado encontrar une•:regibn de valores
razonables dentro del cual caiga efectivamente el verdadero valor del pará-
metro, con un cierto grado de confian7a.

En el presente capítulo, toda vez que generalicemos algún aspecto rela


tivo a estimaciones, utilizaremos simbólicamente la letra griega E. (theta)
para indicar el parámetro desconocido de la población, y a para designar al
estimador de G. Por ejemplo, si 6 es la varianza poblacional, entonces t
(que se obtiene generalmente de una muestra) será el estimador de la variar
za poblacional.

Por otro lado, para problemas de estimación paramétrica, es importante


saber cuál es la distribución de probabilidades de la v.a. asociada a la po
blación que se desea estudiar. Por ejemplo, si se trata de medir el peso
de las naranjas de una población 11 que consiste en las naranjas producidas
en cierta granja, la v.a. X puede representarnos los pesos de las naranjas;
que de la experiencia se sabe que los pesos tienden a distribuirse normal -
mente. Esto es nuy importante,*ya que, si deseamos estimar el peso prome -
dio de las naranjas de dicha granja, tomaremos una muestra aleatoria y el
análisis se hará sobre la base de que los pesos de las naranjas tienen dis-
tribución normal.

Este proceso descrito en forma simple, es generalizable a una serie de


casos prácticos de estimación; además, las distribuciones pueden ser otras ,i--
y no solamente la normal. En lo que sigue, veremos la estimación puntual
(o de punto) y la estimación por intervalos.

9.1
Estimación Puntual

La utimacíón puntual (o de punto);


es un modelo estadístico que nos proporciona un valor único para estimar un
parámetro desconocido de la población. Por ejemplo, si se trata de estimar
el salario promedio de los artesanos de una ciudad, un valor como $ 1.195
obtenido de una nuestra, representa una estimación puntual. Existen tres
• métodos que son los más conocidos para la estimación puntual de parámetros,
ellos son: Método de los momentos, Método de la máxima verosimilitud y Mé-
todo Bayesiano. Per ahora nos abocaremos a estudiar el segundo método, que
es el más usado en aplicaciones prácticas.
- 179 -
9.2

Máxima Verosimilitud JK/

El método de la máxima verosimilitud


para generar estimadores de parámetros desconocidos, se basa sobre una mues
tra de una variable aleatoria. Pub introducida por primera vez por R. A.
Fisher. Este método proporciona generalmente buenos estimadores, razón por
la cual es preferido al método de los momentos.

Este método puede describirse cono sigue: Sea X una variable aleato -
ria definida sobre una población II. Supongamos que la densidad de.la dis-
tribución puede indicarse en la forma f(x; 19), ésto es, que la densidad sea
una cierta función de x, pero que depende de un parámetro desconocido 8. El
problema consiste en estimar el valor de 9. El principio de máxima verosi-
militud (o, como también se dice, de máxima probabilidad), establece que el
valor de 9 debe ser tal, que la 'probabilidad de observar lo que realmente
se está observando sea máxima". Es decir que se trata de hallar una estima
cf.& de 9 con la máxima probabilidad de que se obtenga el valor de O como u.
na función de los elementos de una muestra aleatoria.

Antes de seguir veamos algunas definiciones necesarias para el desarro


llo de este método de estimación.
DEFINICION 9.1
1)Sea X una v.a. discreta cuya función de probabilidad
px(x,9) depende de un parámetro desconocido 9. Sea X1,... X2, ...Xn
una muestra aleatoria de X y sean x1, x loa valores muestrales
observados. La 56uncínt de ve.weiún(X.GtUd de la muestra está definida
por
L(e) = px(xbe) px(x2,e) ...px (xn;G) (9.1)
2)Sea X una v.a. continua con función de densidad fy(x,9)
que depende del parámetro desconocido 9. Tomando una muestra aleato -
función de vexceimaítad está defini-
ria como en el anterior caso, la '
da por
L(9) fx(x1,9) fx(x2,9) fx(xn,9) (9.2)

DEFINICION 9.2 Dada la función de verosimilitud L(9) de una muestra, sea


= g(x1,x2, xn;9) el valor que hace máxima L(6); es decir,
L(4) - máx L (G)
e
El eatImadox WhUnio veno.s.ail de O es entonces

99:= 8(X1s X2..., Xn; 9)


-18o-
Si la v.a. X tiene más de un parámetro desconocido, entonces la función
de verosimilitud, dependerá de todos los parámetros desconocidos.

Muchas funciones de verosimilitud son funciones que admiten derivadas,


de manera que el estimador máximo verisímil es una solución de la ecuación

d L(9) o ( 9.3)
de
Además, de la matemática pura, sabemos que una función o el logaritmo
de dicha función, tienen máximo o mínimo relativos, para un mismo valor. A-
sí, en nuestro caso, alcunas veces resultará más fácil hallar el máximo de
la función logarítmica de la función de verosimilitud, o sea

in (L(9)) = K(G)

Veamos algunos ejemplos que nos aclararán estas ideas.

o Ejemplo 9.1 Supongamos que X es una v.a. Normal con variante unitaria
y mediaie desconocida. Se trata de estimar el parámetro
a partir de una muestra por el método de máxima verosimilitud. Si X1,X2,..
Xn es una muestra aleatoria de X, entonces la función de verosimilitud
de la muestra es:

(xi -/a)2
2
L(µ) = fx(xs) = II 1 e
i=1

_ 2 i.=1 e)2
-µ )2

Tomando logaritmos, se tiene

)2
ln LcO) = K (fi) = n la 21(xi

derivando respecto de/a,dá

= - =5:xi - nµ = 3 (a)
dµ 2
2= Exi = x (media muestral)
de donde 2
- 181 -
Hasta aqui,hemos considerado la condición necesaria para la existencia
de un punto máximo, en este caso parajc= 3E. Sin embargo, falta la condi -
ojón suficiente, que consiste en que la segunda derivada debe ser negativa,
o sea
d2K(9) <O
de2

De (a), volviendo a derivar respecto de /, se tiene

d2K
An2 = - n<C

Luego, el estimador máximo verisímil de/aes la media muestral.

e Ejemplo 9.2 Sea X una v.a. con distribución exponencial cuya función
de densidad es fx(x) =Xe-AX para todo x>0. Se trata de
estimar el parámetro X que suponemos desconocido. Si tomamos una muestra
aleatoria XI, X2,...,Xn de X, entonces.la función de verosimilitud será

n - xi e Exi
,n—
L OO = TT fx(xi, A ) e = A
i.1 i=1
Aplicando logaritmos, se tiene

lnL(4) = n lnX-X E)
ci
derivando respecto de A e igualando a cero, tenemos
dInL(A) n n--x = o
dA A z-
_ 1 . 1
de donde xi r
n
de manera que el estimador máximo verosímil de )1/4 es el inverso de la media
muestral.

Los dos ejemplos anteriores, pueden servir de modelo para determinar es


timadores máximo verosímiles de parámetros desconocidos de variables aleato-
rias con otros tipos de distribuciones. A continuación presentamos una ta -
bla de estimadores de máxima verosimilitud para algunas distribuciones más
comunes.
-182-
Tabla 9.1

Estimador máximo ve
Distribución Parámetro rósímil (o de máxi-
ma probabilidad)
n
p = r
Bernoulli p

Paisson )1(=/2) #1.7.,= y


Expotencia.1 X N',44) A.s
1s1
x
Normal )
17- 7
6
a2 12 E (x - 7)2
n

Antes de estudiar las propiedades de.los estimadores, veamos algunos


ejemplos de aplicación práctica.
Ejemplo 9.3 Supongamos que se compra una docena de naranjas de cierta
granja frutícola y se toman sus pesos en onzas. Si la
v.a. X indica el peso de cada naranja de toda la producción, entonces pode-
' mos considerar a X1 , X2, ... X12 como una muestra aleatoria donde cada
X•(i=1,...,12) nos indica el peso de la i-ésima naranja. Efectuados los
caculos, se obtuvieron los siguientes resultados: 12
Peso Total = xi =66
12 2 i=1
onzas, y n x = 385 onzas cuadradas. Con toda esta información se trata
í=1
de estimar el peso promedio y la desviación estándar de la producción total,
asumiendo que los pesos tienen distribución normal.

Para ésto, calcularemos los estimador" m o verosímiles de/íZy 92.


De la tabla 9.1, sabemos que fi ry que 3" = (x - 502

EXi . 66 s 5,5 Onzas 7 4 `..)


Entonces ir4= 5E= 12_ .
_2
E(x. - 7)2 E34 aExi + nx
Y

_ 385 - 2(5.5)(66) + 12 (5,5)2 = 1,83


12

luego d = 757;13 = 1,35


De manera que el peso promedio estimado de todas las naranjas es de 5,5 onzas
con una desviación estándar estimada de aproximadamente 1,35 onzas.
••■
-183-
Ejemplo 9.4 Se trata de hallar el estimador máximo verosímil del tiem-
po medio de duración sin falla de tubos eléctricos de un
producido por una fábrica de artículos de alumbrado. Sabemos oue el
tiempo de duración en funcionamiento sin falla de este tipo de artículos,
tiene distribución exponencial. Sea la v.a. X: tiempo de duración de los tu
bos eléctricos. Para estimas el tiempo medio de duración sin falla, se to -
man aleatoriamente 30 tubos y se ponen en funcionamiento. Asumamos que se
registraron todos los tiempos que duraron sin falla, y que se obtuvo un to -
tal conjunto de 32,916 horas, es decir,
30
xi Ir- 32,916 horas.
1.41

Por el ejemplo 9.2, sabemos que el estimador máximo verosímil de la me-


dia poblacional es '1,1
Z
Luego

5■
= 32,910
1--,.= 0,
'911
30
Es decir,que el estimador del tiempo medio de duración sin falla de los tu -
boa eléctricos, es aproximadamente de 0,911 de hora.

9.3

Propiedades de los Estimadores

Hemos definido a un estimador como al-


guna función de los valores de la muestra, que proporciona una estimación de
cierto parámetro desconocido. Además, vimos que si se toman dos muestras de
igual tamaño de la misma población, sus medidas generalmente serán diferen -
tes. Se trata entonces de saber cuál es mejor y qué tan bueno es un estima-.
dor. Debemos recordar también, que el estimador de un parámetro desconocido
es un estadístico, que a su vez es una variable aleatoria cuyo valor puede•
observarse sobre la base de una muestra, es decir que un estimador es a su
vez una variable aleatoria, ya que los valores particulares que toma, verían
de una muestra a otra. A continuación estableceremos las propiedades desea-
bles de un buen estimador, las que a su vez, pueden usarse como criterio pa-
ra distinguir entre buenos y malos estimadores. Veremos únicamente los más
importantes desde el punto de vista de su uso pránt3co.

Consideremos una población f1 con una variable aleatoria X definida so -


bre ella, y sea 9 un parámetro* asociado a11 . Además, tomaremos una mues -
., * Es equivalente decir: e es una constante (que se trata de valorar) asocia-
da a la población A.
- 184 -

tra de tamaño n, y consideraremos una variable aleatorial definida sobre el


espacio de sucesos de fi .

DEP/NICION 9.3 Una variable aleatoria 'a es un estimador Anegada de 9 si


• el valor esperado de 'a es igual a 9; es decir, si E (9) = 9 para todos
los valores de 9 en 11 .
En otras palabras, se dice que un estimador es insesgado, si el valor
esperado del estimador es igual a la cantidad estimadas esto es, si nosotros
tomamos todas las muestras posibles de tamaño n, y para cada una de ellas
calculamos el valor 'a, entonces el promedio de esos valores observados debe
ser igual al parámetro 9 que deseamos estimar.

Para una mayor comprensión de esta propiedad, ilustraremos con un ejem


plo muy sencillo, en el que supondremos una población de sólo 4 elementos y
que es toman muestras de tamaño 2.

Ejemplo 9.5 Supongamos que las edades de cuatro hermanos son: 2, 5, 8


y 13 años respectivamente. Tomemos todas las muestras po
sibles de tamaño 2, que son ( 2) = 6* , de manera que la probabilidad de ele
gir una muestra cualquiera es p=116 para todos los casos. Si estamos inte-
resados en medir la edad media, entonces las medias muestrales posibles son:
= 3,5 5+8
2 =
-111 = 6 ,5
2
72 2+ 8 _ 5 _ 9
2 5 2

373 a- 2 + 13 = 7,5 6 = 8 +2 13 - 10,5


2
6
Luego E (E ic E xi Di

= (3,5). 1 + 5. 1 + (7,5). 1 + (6,5). 1 + 9. 1 + (10,5).1


6 6 6
= 1 (42) = 7
6
Por otro lado 2 + 5 + 8 + 13 = 7

De manera que ; es un estimador insesgado de /M, puesto que E (1)=7 =in


No todos los estiraadorés son insesgados. Si bien la media muestra/ es
un estimador insesgado porque E (x)= /te , en cambio el estimador
s2 = Cr
^2
- ag. -n 1)2

* Combinaciones de 4 elementos tomados de dos en dos.


- 185 -

no es insesgado *, puesto que E (62)O Gr2• Sin embargo SI,E(mg - 51)2


n-1
sí es un estimador insesgado de .2, puesto que E(S2) =cr2. Conviene recor
dar que la proporción muestral p es un estimador insesgado de la proporción
pcblacional P, ya que E (p) = P.

Algunas veces suelen tomarse dos o más estimadores insesgados para cual
quier muestra dada. Si el y 92 son dos estimadores insesgados distintos de
9, ¿cuál de ellos se debe tomar, como mejor estimador que el otro? Una for-
ma de salir del apuro, es comparar les varianzas de los estimadores y elegir
el de varianza mínima, en tal caso, el que tiene varianza más pequeña se di-
ce que es más eficiente.

DEPINICION 9.4 Si 'Eh y112 son estimadores insesgados de 9 para la misma


muestra, entonces 111 es NO:d eiSiaiente que 112, si

V (I1) < V (52)


(donde V($1) indica la varianza de 61).

a Ejemplo 9.6 Supongamos que X es v.a. con distribución Poisson con partí
metro X y que X1, X2,...Xn es una muestra aleatoria de X.
n 4
Si 2:: X. 2:: xi
L 1=1 1 i=1 , entonces ambos son estimadores insesga -
ñ1 n Y A 2 =4---- dos de X.
\
Por Otro lado,

V ()9) = -1 Y (12)
7
1 i
Luego, si n 4, t es un estimador más eficiente que ilk2 puesto que -1-.<
X X—
n 4
Parece que un buen estimador seria aquél para el cual el error disminuye
cuando crece el tamaño de la muestra. Es decir, el estimador es mejor cuando
_se basa por ejemplo en una muestra de 20 observaciones, que si el estimador
se basa en sólo 4 observaciones.

* Evidentemente E(IP) = n-1 or2 = Cr2 -0-2


de manera que el sesgo es

. El sesgo tiende a una cantidad muy pequeña a medida que el tamaño de


la muestra es cada vez más grande.
- 186 -
DEFINICION 9.5 Un estimadoribeaesconMazate si lim Pr CIZ - Ql> g] =
n«-.0t
para todo e> o
dada una muestra de tamaño n.
Notemos que un estimador tes consistente si una sucesión de probabili-
dades (evaluados de la función de probabilidad o densidad de t)converge a ce
ro mientras que el tamaño de la muestra crece. En otras palabras, la condi-
ción de consistencia establece que para muestras grandes en tiende a aproxi-
marse a cero.
Para aplicaciones prácticas, la propiedad siguiente, nos permite verifi
car fácilmente si un estimador particular es consistente.

TEOREMA 9.1 Si
lim E (9) =
Y n-Ivo
(9.5)
lim V (41) = O
n--• 00
entonces G es un estimador consistente de 9 (donde n es el tamaño ae la mues
tra)
Ejemplo 9.7 Supongamos que X es una v.a. con media/ y varianza or 2, y
que X1, X2, es una muestra aleatoria de X.

Sabemos que
E (Y) =71-4 y V (3) cr2
2
Luego, lim E (Y) =yez y lim - = o
n-sam. 211:1:.(5) = n-,00 n

de manera que Yes un estimador consistente de ya

9 .4

Estimación de Intervalos
de Jonfianza

La estimación puntual de un parámetro,


si bien es muy útil, no resulta de mucho valor si no se tiene alguna medida
del posible error cometido en la estimación. Toda estimación 9 de un paráme
tro desconocido 9 debería acompañarse de un cierto intervalo que incluyera a ,
9, por ejemplo de la forma (1 - k; 9 + k), junto con alguna medida de segurf'.:
- 187-

dad de que el verdadero valor del parámetro 9 estuviera comprendido-dentro


de dicho intervalo . Así, se puede estimar el número de desocupados en
momento dado en 25.400 + 3.700, teniendo bastante seguridad de que el nume-
n, verdadero de desocupados está comnrend5do entre 21.700 y 29.100. Se pue
de también estimar que la vida media de un condesador bajo condiciones es-
tablecidas, es de 300 + 50 horas, con una probabilidad alta de que el prono
dio correcto sea mayor que 250 y menos que 350 horas.
De manera que es mucho más satisfactoria y eficaz la determinación de
un "intervalo aleatorio" en el cual esté•compréndido el verdadero valor del
parámetro desconocido con una probabilidad próxima a uno. Un intervalo tal,
recibe el nombre de intekvalo de conlianza (o íntekvato conlideneíat), en
tanto que a los valores extremos del intervalo, se los designa antitek nen-
lidencate4 (o laite4 de conitanza).
DEFINICION 9.6 Sea X una v.a. cuya ley de probabilidad depende de un pará-
metro desconocido G. Dada una muestra aleatoria l' X X2 ..
Xn de X. los dos estadísticos L y (Límite inferior y Límite superior)
fo rma un /Ate/tonto nenlidennig/Ide (I-.0 100% para O si
P(L 1-0( (9,6)
I O S)'
no importa cuál sea el valor desconocido de O

Vemos que el intervalo (L1, L5) puede denominarse un intervalo aleato-


rio, pues ambos puntos extremos son variables aleatorias ya que variarán de
una muestra a otra. Una vez que se toma la muestra, podemos calcular los
valores para LI y IR y luego decir que confiamos en un (1- c)100% que el
intervalo contenga al valor desconocido G. Al valor 1-d- se denomina decli-
nante conlidendiat o neeliníente de conlianza (que nos indica el grado de
confianza). A fin de precisar estas ideas, veamos los siguientes ejemplos:

Ejemplo 9,8 Supongamos que el número de onzas de mermelada que una má


quina pone en un frasco de vidrio es una v.a. normal-con
mediafidesconocida y cuja desviación estándar es 0,5 de onza. Si seleccio-
namos aleatoriamente n frascos llenados por dicha máquina y si X1 , ,
n
son los números de onzas que contienen, respectivamente cada uno de Ios n
frascos; entonces, X es una v.a. normal con mediafty desviación estándar
0,5/117. De una Tabla de Distribución de Probabilidades Normal, sabemos que

Pr (-1,964241,96) = 0,95

donde Z es una v.a. normal estándar. Pero, para nuestra muestra

-h
0,51,11
es una v.a. normal estándar. De este modo
-ti, 1,96) = 0,95
Pr (-1.961 0,5/Th-
- 188 -
o también Pr I7 - (1,96) 51< p. + (1,96) 22A] = 0,95

Luego L1 = 7 - (1,96) 1=1


-Av
Y Ls = 7 + (1,96) 225-

forman un intervalo confidencial del 95% para /u. Si se observan los pesos
de 75 frascos y se halla 17= 12,1 los valores de L1 y Is serán
LI = 12,1 - (1,96) III.= 11,99
Y75

18=12,11-(1,96) 124=12.21

Entonces podemos decir que estos limites 11,99 y 12,21, contienen el va


lor del parámetro verdadero, o sea que el verdadero promedio de contenido en
onzas de mermelada en los frascos llenados por dicha máquina, está comprendido
en el intervalo (11,99 y 12,21) con una seguridad del 95%.
Debe examinarse con mucho cuidado los significados
P (7 - 0,11 <,04(< i+ 0,11) = 0,95

P (11,99 </a< 12,21) = 0,95


que significan la probabilidad de que el intervalo aleatorio 71- 0,11 a z + 0,11
contenga a la media verdadera /, es 0,95. Esto es, si se extraen repetida-
mente muestras de tamaño 75, y si se calcula para cada muestra el intervalo
aleatorio 5: - 0,1187 + 0,11, es de esperar que el 95% de estos intervalos
contengan la media verdadera,. Tenemos pues, una gran confianza de que el
intervalo 11,99 a 12,21 cubra la media verdadera.
Es posible obtener intervalos con cualquier grado de confianza. En
nuestro ejemplo, si se desea obtener un intervalo confidencial del 99%, en -
tonces

P (-2,58 Z 4 2,58) = 0,99


y siguiendo el mismo procedimiento de cálculo que hicimos en el ejemplo, ten
dremos

Pr (- 2,58 < 12,1 -A` 1. 2,58) = 0,99


0,5/ ,T75
o sea Pr (12,1 - (2,58) 9-22 <74 12,1 + (2,58) 212- ) = 0,99
55
-"
- 189-

.de donde Pr(11,95 1./4..5.12,25) = 0,99

El grado de confianza dependerá del problema en particular que se esté


tratando.

Cono toda estimación implica la existencia de un error, una oregunta


que surgirá siempre, es: /con qué grado de confianza debemos trabajar?,es
decir, cuál es la probabilidad de seguridad que debemos utilizar, para que
el valor estimado esté contenido en cierto intervalo? La asignación del
coeficiente de confianza, se hará de acuerdo a la delicadeza del problema
que se esté tratando. En este momento es importante el concurso de las per
sonas encargadas de tomar decisiones en cualquier campo de investigación,
ellos nos darán una idea de la magnitud del problema según sea la política
de decisión que utilizarán. Obviamente la idea es de que el grado de con
fianza sea lo más grande posible (si es posible del 100%). En la práctica,
generalmente se usan coeficientes confidenciales entre 95% y 99%, según se
trate de obtener una medida más fina de seguridad. Sin embargo, se observa
que si se pretende tomar un nivel de confianza próximo a uno, el intervalo
será muy granda, lo que no significa que necesariamente se tenga una buena
estimación; lo contrario tampoco es muy significativo. Por ejemplo, decir
que el peso promedio de los estudiantes de un colegio de enseñanza media ,
está comprendido entre 20 y 80 Kgs., con una seguridad del 99,99%; no tie-
ne mucho significado, puesto que prácticamente es imposible que ésto no
ocurra. Si tomáramos un 20% de nivel de confianza, qué ocurre con el in-
tervalo?. Analice y obtenga conclusiones sobre la relación del carnea° de
▪ muestra, coeficiente de confianza y longitud del intervalo.

En lo que sigue presentaremos una serie de teoremas (dejando por aho-


ra de lado las demostraciones que podrían distraer nuestra atención*), que
nos proporcionarán los límites de confianza, para algunos parámetros de ma
yor utilidad.

TEOREMA 9.2 Si X
1, X2'..'Xn es una muestra aleatoria de una v.a. normal
cuya media ase desconoce y si tiene variante conocida ,
r2, en
tonces los estadísticos

L - - z o'
LI 1-01V2siF
(9.7)
L ■
X or
+ z 1-dna

donde
P(Z
1-MV2) 1 - --
2 constituyen los limites para un i•ter
velo confidencial (1-4Q 100% para im.

• Los estudiantes que deseen profundizar el tema, pueden recurrir a la bi-


bliografía citada, pero conviene hezerlo después de terminado este capí-
tulo.
- 190-

(2 es una v.a. normal estándar).

Ejemplo 9.9 El encargado del control de salida y llegada de una Cia.


de autobuses que presta servicio de transporte de pasaje-
ros entre dos localidades rurales, sabe que el tiempo empleado en el recorri
do de un punto a otro, es una variable aleatoria normal con una desvia-
ción estándar de 2 minutos. Cierto día, registro los tiempos utilizados en
los latimos 22 viajes y halló que el promedio de egos tiempos fué 28,5 minu
tos. De una tabla de probabilidades de la distribución normal estándar, 1-J
liamos que z0 90 = 1,28 y z = 1,64
095
Con esta información, se trata de determinar los intervalos confiden-
ciales que contendrán al tiempo medio utilizado generalmente por los autobu
ses en recorrer de una localidad a otra, con un 80% y 90% de seguridad.

El intervalo confidencial con un 80% de seguridad será

(28,5 - (1,28) 724.- ; 28,5 + (1,28).427) ■


(27,95; 29,05)

y para un 90% de seguridad, tendremos

(28,5 -(1,64). 727


2 ; 28,5 + (1,64)• -—) (27,80; 29,20)

Nótese que el intervalo es mayor para una seguridad del 90%.

Nota: Negamos una acotación para el cálculo de 2, ,u, Para ésto, debe to
marse en cuenta la definición 9.5, donde eralficiente de confianza
es 1-d. Entonces, cuando por ejemplo, decimos una seguridad del 90%, es-
to implica que 1-0(= 0.90 de donde dr.= 0,10; luego Z1_0 10 //2 = n .
como Z tiene distribución normal estándar, basta ver lal Unas dé Probabis
lidades para esta distribución.

s Ejemplo 9.10 En relación al ejemplo anterior, supongamos que Goleasen


te estamos interesados en determinar el recorrido del in
tervalo confidencial. Restando las igualdades del teorema 9.2, obtendremos:

L - L1 = 2z (9.8)
S 1-W2 lir .A=
que es una constante (independiente del valor de la media muestral). Enton
ces el recorrido del intervalo confidencial que contenga a/A con un 95% de
confianza será
2 (1,96) .(2/11-) = 7,84/11E
para un n cualquiera. Si n = 22, la longitud del intervalo confidencial
que contendrá a/A, con una probabilidad 0,95 de seguridad, es 7,84 -
1,6/
22
minutos.

En este caso, saber cuál es el recorrido del intervalo confidencial,


antes de tomar la muestra para determinar el estimador de la media , es
de bastante utilidad en muchos casos, pues podemos conocer apriori en cuán- -'
to variará el intervalo. Así, en nuestro ejemplo, podemos interpretar di-
ciendo que con una seguridad del 95%, habrá una diferencia de 1,67 minutos
- 191 -
en promedio entre los autobuses que llegan adelantados y los que llegan con
retrazo.

El método que acabamos de usar de acuerdo a la propiedad que indica el


r. teorema anterior, no suele ser de posible utilización para estimar la media
de unlk población normal, pues lo corriente es que se desconoce la varian -
za Orc.

Como z -

para una muestra dada, se conoce ly n, pero no así o, de manera que no se


rg, posible calcular límites de confianza para/(. Claro que puede sustituir
se orpor su estimador a-, pero la afirmación de la probabilidad de certeza
ya no será exacta, y mucho menos para muestras pequeZas. A continuación ve-
remos un método que salva esta dificultad, para lo cual se usa la distribu -
ojón t-Student.
TEOREMA 9.3 Si X es una v.a. normal con media/ay verianza 0.2
, ambos deseo
nocidos, y si X1, X2, ... XII es una muestra aleatoria de X; en-
tonces

L1 = - ti_ 04 •
2 Y n

La = X + tl_o c
2
S (9.8)

constituye un intervalo confidencial de (1- .4 ) 100% para,. Donde tl_


2
es el (1- —2) 100 porcentil de la distribución t con n-1 grados de liber -
tad.

La ventaja de este teorema es que la determinación de los límites confi


denciales no dependen del parámetro Or. El valor de S (desviación estandar
de Cocinan) se calcula fácilmente de la muestra obtenida, ya que

= x.n:1Z g
11J
/- 1(x2) - 002 (9.10)

E emulo 9.11 Se trata de establecer un intervalo de confianza para la


cantidad media de aceite que se puede extraer de caía ra-
cimo de "motacén (fruto de una palmera del mismo nombre), producida en una
zona tropical con algunas características particulares. Para ésto, se regís
traron las cantidades de aceite extraídas de 5 racimos elegidos aleatoriamen
te, las que fueron 58, 65, 55, 64, 69 y 62 cm . De esta información, obtene
nos
6 ," 6
= 373, 5:: xl = 23.315
i=1 i=1
-192-

de manera que
S, 62,2 cms2A s - (62,2)2 = 5,04
5N 5

Ahora, si deseamos determinar un intervalo del 90% de seguridad, entonces


ti_0,1= 0,95 = 2,015 con 5 grados de libertad (este dato se obtiene de las
2
tablas de probabilidades de la distribución t-Student).

Luego,

'- (2,015) (5.04) = 58,1 cm3


LI = 62,2
'kg
La = 62,2 + (2,015)(2,057) = 66,3 cm3
Por tanto, el intervalo confidencial (58,1 cm3; 66,3 cm3) contendrá la
verdadera cantidad promedio que se puede extraer de los racimos de motacú,
con una certeza del 90%.
También es frecuente la necesidad de obtener un intervaló confidencial
para la varianza Cr2 áe una variable aleatoria normal. El próximo teorema
nos indica cómo hacerlo.
TEOREMA 9.4 Si El, X2,...Xn es una muestra aleatoria de una v.a. normal
con parámetros desconocidos ley or2, entonces

LI DX. - 1)2
2
x1-
-.112
(9.11) -y
Y

formen un intervalo confidencial de (1-.0 100% para gr2. Donde t2 mv2 y

4( 100 y (1 44 100 porcentiles, de la distribución


41- «(/2 son el2 2
12 (Ji-cuadrado) con n-1 grados de libertad.
La técnica cara estimar el intervalo de confianza para la varianza, es
similar a la que venimos utilizando.
O Ejemplo 9.12 Las resistencias a la rotura, expresada en libras, de
cinco ejemplares de cuerda con diámetro 1/16 de pulgada,
son: 59, 52, 54, 58 y 55 libras. Se trata de estimar la variación mediante
un intervalo confidencial del 90%, suponiendo que la resistencia a la rotu-
ra es una distribución normal. En este caso, como puede apreciarse, los
cálculos para hallar los límites confidenciales, no ofrecen dificultad algu-
-193-
na. Así, obtenemos que

Lxi = 278 , Ex2 = 15.490

21,95= 9,49 Y ti5.


05 = 0,711
(Ver tabla de distribución de probabilidades 12 con 4 grados de libertad)
Luego 33 2
In' a, Et 3,5 /

3E4_ 46,69 11
LJg - 1,711

Ejemplo 9.13 Sea una máquina que se usa para cortar barras de metal en
pedazos pequeños, que sirven para fabricar pernos, y su -
puesto que las longitudes de losapedazos cortados es una variable aleatoria
normal con mediai4ty varianza 0-', ambos parámetros descónocidos. Se trata
de estimar la variación de los tamaños, a fin de chequear si la máquina nace
sita algún ajuste. Para esto, se toman 25 piezas cortadas por dicha máquina
y se halla que

wi
= 101,1 cros , Exf = 412,75 , 210q - SiD2 = 3,9
Si consideramos un intervalo confidencial del 90% para estimar 0r2, entonces
/1_ 0,2 /8,95 = 36,4 Y /8,05 = 13,8 para 24 grados de libertad. Enton-
ces, por el teorema 94, se tiene

L1 = 36,4 = 0,11 Y=
-0 13,8
-0,28

Si la longitud Ls - Irl = 0,17 cros, indica que la variación es excesiva-


mente grande, según los técnicos especialistas en este tipo de trabajo, debe
pararse la máquina para ser ajustada.

Una de las distribuciones que aparecen a menudo, en aplicaciones econó-


micas, ea la exponencial. Frecuentemente ocurre que el tiempo de duraciin
de todos los objetos que sufren desgaste, tienen distribución exponencia-
con parámetro X. Recordemos que el valor esperado de una variable alee= -
ria exponencial es 2-„- (en este caso el tiempo de falla esperado). Si ne:esi
A
tamos estar seguros que el tiempo esperado de falla de una v.a. exponencial
es al menos algar número de horas, nosotros necesitaríamos saber que X es no
mayor que cierto número. Por ésto es que en problemas prácticos es usual
que se determine un sólo lado, o sea el límite superior del intervalo confi-
dencial para X (lo cual implicará un extremo inferior del intervalo confiden
sial para 1. ).
- 194 -

TEOREMA 9.5 Si X1, X2, ...Xn es una muestra aleatoria de una v.a. X con dis
tribución exponencial con parámetro entonces
11-.1
Lis _ 2u r

es un intervalo confidencial de (1- d. ) 100% del límite superior, para X,


donde es (1 -c4) 100 porcentil de la distribución 12 con 2n grados de li
11-0C
bertad.
o Ejemplo 9.14 Supongamos que el tiempo de falla de un cierto tipo de ar
tefacto eléctrico os una variable aleatoria exponencial
con parámetro A. Seleccionamos aleatoriamente 10 artefactos de ese tipo,
y los ponemos a funcionar en forma continuada hasta que fallen todos (las fa
lías no son dependientes). Se registran todos los tiempos, y se observa que
la suma de esos tiempos de falla resulta ser

10
xi = 211,5 horas
i=1
Por otro lado, para un intervalo confidencial del 90%, /8.90 = 28,4 para 20
grados de libertad; de manera que

2111 - 0,067
Ls = 2(211,5)

Luego el intervalo para el parámetro )A , es de 0,067 para abajo, con un


90% de seguridad.
Alternativamente, el valor observado de un intervalo confidencial con
1211a seguridad del 90%, para el tiempo esperado de falla -a- es de '
0,067
= 14,92, para arriba, es decir que el intervalo para el promedio de duración
es mayor que 14,92 horas.
Para otros tipos de distribución que no sean la normal o exponencial ,
¿cómo se determinará un intervalo de la estimación de una media poblacional?
Esta pregunta era de esperarse. Felizmente, son muy pocos los cases en que
una distribución no se aproxima a la normal, sobre todo si no se trazan de
casos extremos como cuerdo la distribución es muy diferente y el temelo de
la muestra es extremadamente pequeño. Además, cualquiera sea la distribución
para muestras razonablemente grandes, por el Teorema Central del Límite, la
distribución de las medias de las muestras se aproximará bastante a la nor -
mal, de manera que admitiendo un pequeño error, siempre es posible aplicar la
teoría normal.
Finalizaremos este capítulo estudiando otro caso' que también es muy fre
cuente en una serie de investigaciones, y es lo concerniente a la estimación
- 195-

puntual y por intervalos de la popo/Leían pob/ae/onal P. El procedimiento


es análogo al de estimar una media poblacional, utilizando en este caso la
phopc2cak mueatAdt p. Recordemos que el valor esperado y la varianza de
la distribución de p, están dados por

E (p) = P
y
r
(9.13)
V (p) P (1-1")

de manera que la duo/ación eadndalt de /a popo/Leían * r , es

/777-17-
p - n

Cuando se tienen poblaciones finitas pequeñas, y se toman muestras re-


lativamente grandes, se utiliza el 4actok de coa/Luc/6n líníta ,w/(N-n)/(N-1),
para la determinación del error estándar p, o sea

P(1 -P) 111717


Cp n N-1 (9.14)
donde N es el tamaño de la población.

Si la razón de tamaño de la muestra n respecto del tamaño de la pobla-


ción N (o sea lb no excede el 5%, generalmente el factor de corrección pue-
de desecharse.

Como puede apreciarse, el estimador puntual de P no es más que p; es de


cír, que la proporción muestral es un estimador de la proporción poblacional.
Este estimador os bueno, puesto que goza de las proniedades de insesgamiento,
eficiencia y consistencia. Así por ejemplo, para una encuesta sobre la pre-
ferencia al consumo de mantequilla o margarina, se tomó una muestra aleato -
ria de 120 amas de casa de una zona resilencial, y de las respuestas obteni-
das, se determinó que el 75% (o sea p a i) de ellas preferían mantequilla.
3
Entonces, p = i nos estima la verdadera proporción poblacional P. En otras
palabras, según este resultado obtenido de la muestra, se estima que el 75%
de todas las amas de casa de la zona mencionada, preferirán mantequilla, o
sólo el 25% de ellas preferirán margarina.

También en este caso será de mayor utilidad estimar un intervalo de con


fianza que contenga a P con algún grado de seguridad. Como lógicamente el
parámetro P es desconocido, para calcular (.-.- habrá que utilizar su estimador

muestral, o sea S = 2-q— ' y si la muestra es suficientemente grande una bue
P /r---
n-1

* cr' se denomina también eanoa estante de p.


- 196 -

naestimación es simplemente Sp =J Entonces los límites de confianza pa


ra estimar la proporción poblacionalnson
Li= p - Z1 _42 J-2y.
(9.15)
p + 71 -ot/2Y3
LIS=
donde Z tiene distribución normal estandar. (q = 1-p)
Ejemplo 9.15 De 400 agricultores, elegidos al azar, se encontró que
260 eran propietarios, en tanto que 140 sólo eran
r arrenda
tarios. Con esta información, se trata de hallar un intervalo del 95% de
confianza para el porcentaje verdadero de propietarios de granjas en la po- -
blación muestreada de agricultores.
Para 1 = o,95, tenemos que 20,975 = 1.96
/ 260 140
400 40(5 1 0,603
luego 260 - (1,96)
LI= 400 400

Ls = 0,65 + (1.96)(0,0238) I 0,6966


De manera que podemos concluir que con un 95% de suguridad, de entre to
dos los agricultores, el porcentaje de agricultores propietarios de granjas,
está entre 60,3% y 69,66%.
-.197-

9.5

•• Ejercicios
r

• 1.Si deseamos estimar la media de una población normal cuya variante es 10.
Cuál deberá ser el tamaño de la muestra a tomar, de forma que sea 0,80 la
probabilidad de que la estimación no tenga un error mayor de 0,4 unidades?

2.Supuesto que Az= $ 100, z - t 2,58 y 01 = 10


Encontrar:
2.1 El intervalo de confianza
2.2 Los límites de confianza
2.3 El coeficiente de confianza

3.En relación al ejercicio anterior, suponga quemes desconocida y R=105 S.


Encontrar:
3.1 La estimación puntual
3.2 La estimación del intervalo
3.3 Interpretar los resultados de las dos estimaciones anteriores. SiM es
conocida e igual a 100 S, ¿está la verdadera media poblacional dentro
del intervalo de estimación?

4.DI las razones y las condiciones, si existen, para sostener los siguientes
enunciados:

4.1 p es una estimación insesgada de P.


4.2 p(1-p) es una estimación insesgada de P(1-P)
4.3 fra(n-1)] pq es una estimación insesgada de P(1-P)

5.Suponga que les ha preguntado a 350 trabajadores seleccionados aleatoria-


mente de 20.000 en relación a sus salarios semanales. Los resultados es -
tán tabulados más abajo. Estime la media de la ploblación de los salarios
ganados por todos los trabajadores mediante un intervalo de confianza del
95 2.
Salarios Semanales Numero de
S Trabajadores

50 a menos de 70 50
70 a menos de 90 70
90 a menos de 110 125
110 a menos de 130 75
130 a menos de 150 30

6.La división de investigación de un departamento estatal de carreteras de-


sea conocer el número promedio de kilómetros recorridos durante una sema-
na por camiones. El jefe de la división dice que: 1) el error muestral
máximo no deberá ser mayor que 15 kilómetros por encima o debajo debilita.-
- 198 -

dadera media, 2) el nivel de confianza deberá ser 95,45 X, y 3) la des-


viación estándar de la población, basada en estudios muestrales previos,
es 120 kilómetros. Cuál es el tamaño de muestra adecuado a fin de lle -
nar estos requerimientos?.

7.El gerente de una estación de radio quiere conocer la proporción de la


gente que le gusta un programa particular. El especifica que: 1) el e-
rror muestral máximo no deberá ser más del 2 % de la verdadera proporción,
2) el nivel del intervalo de confianza deberá ser 95 %, y 3) la propor-
ción de la gente a quienes gusta el programa es cerca de 60 X.
7.1 Cuál es el tamaño de muestra adecuado?
7.2 Cuál es el tamaño máximo de muestra si él no especifica el punto 3)?
• •
8.Qué tamaño de mmeltre habrá que extraer de una población normal para ob-
tener una probabilidad de 0,95 de que un intervalo confidencial del 90 %
(basado en la distribución t) para la media, tenga longitud inferior a
675. ?.

9.Pruebe aue la longitud del intervalo confidencial para C (de una pobla -
ci6n normal) tiende a cero al aumentar el tamaño de la muestra.

10.Supuesto que usted compra una docena de naranjas de una propiedad A, las
pesa y halla que
12 12 ,
EX. a 66 onzas, EX: a 385
ial 1 1=1 1
Calcular el estimador mlimo verosímil de/Ayo-2, asumiendo que las 12
naranjas que compró son una muestra aleatoria de todas las de la pro-
piedad A (considere que los pesos se distribuyen normalmente).

11.Asuma que el número de automóviles nuevos vendidos por día, realizado


por un comerciante particular es una variable aleatoria Poisson con pa
rámetro A. Dado que en 20 días el número total de ventas que él hizo
eran 30 automóviles, cuál. es el estimador máximo verosímil de X?.
- 199 -

CAPITULO 10

PRUEBA DE HIPOTESIS ESTADISTICA

10.1

Análisis General

En este capítulo estudiaremos uno de


los problemas principales de la inferencia estadística, que es la teoría
llamada "Prueba de Hipótesis Estadística". Se trata de un instrtmento esta
dístico de gran utilidad para aquellos cuya tarea fundamental es tomar deci
sione's, cualesquiera que sean los niveles y naturaleza de los problemas en
estudio.

Sabemos que una hipótesis, no es más que una proposición de un supuesto


relacionado con cualquier cosa posible. Así por ejemplo, podemos suponer
que hay vida animal en el planeta Marte; que hay yacimientos auríferos de-
bajo del mar; que dentro de 50 años se agotarán las reservas de estaño en
Bolivia; que los televidentes asíduos tienden a ser personas menos socia -
bles; que el ingreso per cápita aumentará sise crean más fuentes de traba-
jo; que desaparecerá el contrabando si no hay control de precios; etc. ,
etc. Como se trata simplemente de supuestos posibles, es lógico pensar que
serán o nó ciertas las proposiciones, de manera que se puede tentar una
prueba, para rechazar o aceptar tales supuestos.

Pero no toda hipótesis es una hipótesis estadística. Para nuestro pro-


pósito solamente consideraremos como hipótesis estadística a las proposiciones
relativas a la distribución de una o varias variables aleatorias, o sea res-
pecto de sus leyes o funciones de probabilidad (es decir, las funciones de
densidad o cuantía, según se traten de variables continuas o discretas, res-
pectivamente).

De entre las distintas clases posibles de formular hipótesis respecto


de la distribución de una variable aleatoria, nos abocaremos solamente a a-
quellas proposiciones relacionadas con sus parámetros, suponiendo conocida
la forma en que está distribuida la variable aleatoria. Así por ejemplo ,
sí asumimos que una variable aleatoria tiene distribuición exponencial, la
- 200 -

hipótesis puede ser una proposición respecto del valor de su parámetro X.

Diremos que la puteba utaastíca, se trata de una decisión estadística


de aceptar o rechazar la hioótesis formulada, sobre la base de los resulta-
dos obtenidos de una muestra aleatoria.

En general, sí al tomar una muestra de la población se obtuvieran resul


tados consistentes (respecto de algún parámetro 9 de la población), aceptare
mos la hipótesis ?ronuesta; en cambio, si los resultados de la muestra no son
consistentes, obviamente, rechazaremos la hipótesis. En la actualidad exis-
ten muchas maneras de llegar a tomar la decisión de aceptar o rechazar la hilo!
tesis sobre la base de una muestra.

En lo que sigue, examinaremos una metodología simple y práctica pero


sin quitarle el rigor de la teoría estadística imprescindible en este caso,
que alcance a cubrir las necesidades primarias para que un estudiante o una
persona dedicada a las técnicas de Evaluación de Proyectos, pueda tomar deci-
siones a partir de pruebas estadísticas. Por otro lado, laicamente nos refe-
riremos a algunos aspectos de la docimasia de hipótesis que particularmente
sean de nuestro interés, ya que especular en detalle todo lo concerniente al
tema, como sería nuestro deseo, demandaría mucho tiempo. Así, dado un expe-
rimento cualquiera, asumiremos en general que la distribución de probabílida
des de la variable aleatoria asociada al experimento, es Normal.
Además, como trabajaremos con muestras provenientes de una población en
estudio, nos interesará sobre todo conocer las distribuciones muestrales. Es
este el momento adecuado para recordar el enunciado del Teorema Central del
Límite:*"... Cualquiera que sea la forma de una función de densidad, con
tal que tenga varianza fíníta, la media muestral tendrá, para muestras gran-
des, distribución aproximadamente Normal... "**

De acuerdo al valor o valores hipotéticos que pueden tomar los paráme-


tros desconocidos, existen hipótesis simples y compuestas: Si el valor su -
puesto para una variable es (mico, se trata de una hipóted44 aimpte; en cam-
bio, sí se supone que el parámetro puede tomar más de un valor, entonces se
dice que es una hipatehía commeeta. Por ejemplo, si suponemos que la media
poblacional toma los valores

* Se trata de una de las proposiciones más importantes de la estadística, y


es también uno de los teoremas más notables de toda la matemática.

**Más rigurosamente: Sea una•v.a. X con distribución cualquiera, tal que


tiene media,AU y varianza C*2 . Si xn es la media mues-
tra' de X, entonces xn tendrá distribución aproximada a N (m.
,
ae )

Además, la variable aleatoria 2 • xn -AA N (0,1)


Or
- 201 -

im- 5 o fi= 4 6 AA - 8.753,

cada una de ellas representa una hipótesis simple; en cambio, si suponemos


que

ALI4 ó,14# 0,5 6 15759.4.01.756,

se tendrán hipótesis compuestas.

Inmediatamente de haber formulado una hipótesis, aparece para lelamente


en forma intuitiva otra hipótesis contraria a la propuesta. Por esta razón
algunos autores llaman "contraste de hipótesis", puesto que se trata de for
mutar además otra hipótesis que contraste a la primera. La proposición ori
ginal recibe el nombre de 1146te6/4 Nula y se la simboliza con Ro, en tanto
que la que sirve de contraste, recibe el nombre de HípóteAAA Attemativa y
se la designa con 11,. Asá por ejemplo, si suponemos que la hipótesis nula
es Ah= 60 de una población, se puede considerar como hipótesis alternativa
indicando queiü<60, .
6 que 60, etc. Simbólicamente para el primer caso
se tiene:

: i/.4= 60
o
ti 1: <60
Por lo anterior, pueden presentarse pruebas de una hipótesis simple
contra una hipótesis alternativa simple, una simple contra una compuesta ó
una compuesta contra otra compuesta. En la práctica la mayor parte de los
problemas implican hipótesis compuestas, Pos ésto, le dedicaremos más aten-
ción al caso particular de tener una hipótesis simple contra una hipótesis
compuesta.

Vemos también en efecto, que dado un experimento aleatorio, estamos se


parando todo los resultados posibles en dos conjuntos disjuntos, los resul
tados para los cuales decidimos aceptar la hipótesis y aquellos que harán
que tomemos la decisión de rechazar la hipótesis; en otras palabras, se tra
ta de una partición del espacio muestral* . Entonces, el recorrido de la
variable aleatoria se dividirá en dos regiones, la neoL6n de aceptación (RA)
- o y la Región de Rechazo 6 «luir caí-Uta (RC) de la hipótesis.

Al tomar una decisión concerniente a una hipótesis basada en una mues-


tra aleatoria, es fácil darse cuenta q ue pueden cometerse dos tipos de erro
res; asf, podemos rechazar la hipótesis cundo ésta es verdadera 6 aceptar
la hipótesis cuando ésta es falsa.

* Conjunto de resultados posibles de un experimento.


- 202-
Definición 10.1 Si se rechaza la hipótesis cuando ésta es verdadera, se co-
mete un error que recibe el nombre de Enno4 Upo 1. Si se
acepta la hipótesis siendo falsa, se comete un Ethan Upe II.
En los problemas de testde hipótesis, es importante conocer el tatuado
del tipo de error que se comete en términos de probabilidades.

Definición 10.2 La probabilidad de cometer un Error Tipo I, recibe el nom-


he de nLvet de dígnifiíedexón (00; o sea,
Ot= Pr (de rechazar la hipótesis cuando es verdadera).

La probabilidad de cometer un Error Tipo II, no recibe un nombre en par


titular, designándola por /03 ; o sea,

/9 = Pr (de aceptar la hipótesis cuando es falsa).


Debe tenerse presente que en general 04 +/31 1.
Más adelante, en los ejemplos que se presentarán con cierto detalle si-
guiendo el esquema general para probar hipótesis, se verá el papel relevante
que juega el nivel de significación, que en la práctica frecuentemente toma
loa valores 5% y 1% (o sea, 04= 0,05 y °i= 0,01).
La especificación del nivel de significación dependerá de las caracte - 7
rfsticas partictilares de cada problema, y del objetivo que se persiga para „:
tomar las decisiones. No es cuestión de asignarle sin criterio alguno el va
lor 0,05 ó 0,01, puesto que ello a menudo dará lugar a sacar malas conclusio
nes. Además es importante asignar el valor de o( , antes de realizar el pues
treo.
Hn la etapa de formulación de las hipótesis, que es la primera, en un
principio casi siempre surge la pregunta de cuáles son las proposiciones más
apropiadas para 39 y H1. En este caso, como Para la especificación del ni -
vel de significación, dependerá también de las características propias del
problema en manos. Se tiene que estudiar cuidadosamente lo que se trata de
probar. Creemos que una vez finalizada la lectura de este capítulo, el estu
diente habrá obtenido la respuesta satisfactoria a esta interrogante.
Ahora pasaremos a estudiar con cierto detalle una metodología del proce "
dimiento general para pruebas de hipótesis estadísticas. que básicamente
consta de las siguientes seis etapas: 1) Formulación de las hipótesis nula y
alternativa, 2) Especificación del nivel de significación; 3) Selección del
estadístico de prueba, 4) Establecimiento del criterio de decisión, 5) Reali
nación de los cómputos, y 6) Toma de decisiones.
Analizando paso a paso estas seis etapas, quedarán más claras las ideas
mencionadas anteriormente. No se trata de redundar sobre lo dicho, sólo de-
seamos se fijen bien los conceptos puesto que de ello dependerá el que las
decisiones sean correctas una vez realizada la prueba. Es de imaginarse las
consecuencias graves que traería consigo una mala decisión.
- 203 -
Probar hipótesis o construir criterios de decisión implican métodos muy
complicados. Tomando un nivel elemental del análisis estadístico nos concre
taremos a aquellos problemas de docimasia en la cual hay sólo dos alternati-
vas de tomar la decisión; así por ejemplo, comprar o no comprar un artículo,
aceptar o rechazar un lote de mercaderías, cambiar o mantener un sistema de
producción, admitir o rechazar la preferencia de ciertos alimentos, etc.

1. FORUULACION DE LAS HIPCTESIS

La primera etapa de una prueba estadística, es la formulación de las hi


p6tesis. Una hipótesis estadística, en términos formales, es un supuesto so
bre la distribución de una variable aleatoria, de manera que las hipótesis
se referirán a algún parámetro O asociado con la distribución de la pobla -
ci6n. • Por Alto, es importante conocer en alguna medida la distribución
de probabilidades de la variable aleatoria asociada al experimento.

Al probar una hipótesis, qué es lo que realmente se espera?.. Esta pre-


gunta es interesante ya que estamos frente a una especie de juego bipersonai
donde el primer jugador está empeñado en demostrar que su hipótesis es verde
dera; mientras que el segundo jugador trata de mostrar lo contrario. La res
puesta a la incógnita está dada por la teoría clásica de docimasia de hipóte
sis, que siguiendo cierta analogía, toma la posición del segundo jugador. En
otras palabras, antes de obtener los resultados de la muestra aleatoria para
una dócima, en realidad lo que debe esperarse es que haya inconsistencia en-
tre los resultados de la muestra frente a la hipótesis formulada; puesto que
sería ilógico emplear datos muestrales, para probar hipótesis, las cuales es
tán sugeridas por los mismos datos. Entonces, como una regla general, se
tratará de rechazar la hipótesis nula Ho cuando ésta puede ser verdadera con
un alto grado de confianza, esto es, tomando un nivel de significación •C muy
pequeño.

Como anteriormente se dijo, de momento dedicaremos nuestra atención a


los modelos en que se tienen pruebas de hipótesis simples frente a hipótesis
compuestas. Si G es un parámetro cualquiera de la población, y Go un valor
particular asignado por la hipótesis nula, los tres casos más frecuentes en
la formulación de las hipótesis, simbólicamente son:

1. Ho: G = Go 2. Ho: 0 = Go 3. Ho: O • Go

Hl: Q G Go Hl: 6 > go G O Go

las dos primeras formas se tratan de pusebas de un extuffe (más concretamen-


te, prueba de extremo izquierdo y prueba de extremo derecho, para el primero
y segundo casos respectivamente). A la tercera forma, se la llama pillaba de
doble extreme.

Para los tres casos anteriores, podemos graficar a título ilustrativo


las regiones críticas y de aceptación, supuesto que se conoce el punto fron-

. • Así por ejemplo, O puede ser: el promedio, la desviación media, la va -


rianza, etc., de la variable aleatoria X: estatura de un grupo de estu
dientes.
- 204 -
tira k que recibe el namore de 'tazón UtZtZca.

2. 3.

RC RC RA RC
RC RA RA
. k1 k
2

Figura 10.1

Las proposiciones anteriores se acomodan a la mayoría de los problemas


en que se tienen que tomar decisiones estadísticas. Naturalmente ,hay pro
biazas muy complejos, sin embargo no es difícil resolverlos acomodándolos -a
alguno de los modelos anteriores.

2. ESPECIFICACION DEL NIVEL DE SIGNIFICACION


Como segunda etapa tenemos la determinación del nivel de significación
04. Generalmente el valor dectes fijado de acuerdo a la delicadezadel
problema que se está estudiando, y además tomando en cuenta el tamaño de la
muestra. Corrientemented.toma los valores 0.01 y 0.05
En la vida real ocurre que, cuanto menos es la posibilidad de alcanzar
una meta perseguida, tanto más es la satisfacción si se la alcanza. En es
tadístíca ocurre algo análogo; así, tanto más grande sea el riesgo que se
corre en una prueba, tanto más significativo será el resultado del esperi-
mento si coincide con lo esperado. Por ejemplo, si cone& 0,05 se llega
a rechazar N , diremos que los resultados muestrales son significativamente
diferntes de°H . Por ésto, cuando la hipótesis nula se rechaza con un ni-
vel de signifdación del 5 por ciento, se dice que el resultado de la prue-
ba es dígnilicatívo; y es más, si se rechaza II cono. 0,01, se dice que
mível de
el resultado de la prueba es andmente 4.14n4aatívo. El concepto
hignhUeación, se usa sólo para indicar que una prueba estadística evalúa
la "significación" de la diferencia entre el valor hipotético de un pará-
metro comparado con el resultado de la muestra.
En este momento puede surgir otra pregunta, como ser: Cuál es el valor
del riesgo que debe usarse en una prueba dada?. La posición clásica sobre
este punto no es concreta. Generalmente se evade la responsabilidad dicien
do que la determinación del nivelotestá en manos de los encargados de tomar
decisiones, y no así del técnico estadígrafo. Sin embargo, el estadígrafo
puede estar en condiciones, si acaso obtiene la información necesaria de
aconsejar y formular una política adecuada para el tamaño de PC .
Las más de las veces, tomar uno u otro valor para al, dará lugar a caz
bios en loa criterios de decisión, puesto que cambiarán los límites de las
regiones de aceptación y rechazo. Por tanto, habrá que seleccionar cuidado
estante el tamño del riesgo a tomar. Después de ver los ejemplos que se
presentan más adelante, se apreciará que no hay dificultad en asignar el d.
apropiado.
Nótese que solamente hicimos referencia a la medida del Error Tipo I,
y no así a la probabilidad de cometer el Error Tipo II, >3. Esto se debe
-205-

a que por ahora dejaremos de lado el análisis de.este tipo de error, lo mls-
mo que el concepto de "función de potencia" que está relacionado con /3.
3. SELECCION DEL ESTADISTICO DE PRUEBA

Una vez formuladas la hipótesis y determinado el nivel de significación,


la tercera etapa del proceso general de test, consiste en seleccionar un eó-
tadatice de prueba, que será una nueva variable aleatoria cuya distribución
muestral es conocida bajo el supuesto de que la hipótesis nula es verdadera.,

El estadístico de prueba dependerá del parámetro el que están referidas


las proposiciones Ho y H1. Así por ejemplo, si Ho y H1 son supuestos relati-
vos a la media poblacional, entonces la media muestral servirá de estadístico
de prueba.

Si se trata de probar una hipótesis concerniente a 9, y se obtiene me -


:liante una muestra el estimador de 0, nosotros podemos usar directamente 9
para probar Ho contra H1, o en su caso hacer la transformación equivalente.

donde Go es el valor supuesto por la hipótesis nula. La ventaja de utilizar


la v.a. Z, es que ésta tiene distribución Normal estándar, o sea Zoha(0,1).

El estadístico Z, es uno de los más usados para pruebas de hipótesis,


pero no es el único. Existen otros que pueden estar en función del tamal>
de la muestra o del parámetro en estudio. Así por ejemplo, para probar hipó
tesis relativas al coeficiente de correlación poblacional, dada una distribu
ción bivariante, se usa el estadístico

t =

que tiene distribución t-Student con (n-2) grados de libertad; donde r es el


coeficiente de correlación muestral y n el tamaño de la muestra.

U. ESTABLECIMIENTO DEL CRITERIO DE DECISION

Siguiendo nuestro proceso general de test de hipótesis, habrá que estu-


diar un criterio de decisión, o establecer una regla, con el propósito ds
aceptar o rechazar Ho. Esto implica, como se ha mencionado antes, la div-
sión del estadístico de prueba en dos partes: la hegídil de heehazo 6 hegin
enttica, y la Acatan de acotación.• El criterio de decisión dependerá ds có
mo se hayan establecido los primeros tres aspectos básicos; es decir, las hi
pótesis nula y alternativa, el nivel de significación y, la distribución mis
tral del estadístico de prueba. Supondremos que modo ésto fuá realizado ade
cuadamente.
- 206-
Como establecimos anteriormente, en el presente capítulo, asumiremos que
la población en estudie es Normal o que la muestra es bastante grande, que
la distribución muestra? del estadístico de prueba es Normal. Entonces, la
tarea radica en hallar un valok del estadístico de prueba, el cual separe la
región crítica de la región de aceptación, dado un nivel de significación y
para una particular hipótesis alternativa. Este valor frontera recibe el
nombre de vale& cRítico.

A continuación, veremos en forma simple cómo se halla el valor crítico


para cada une de las tres formas más frecuentes de formular la hipótesis al-
ternativa.

a) Primero consideremos la prueba Eo: G = Go frente a H1: G < Go.

Esto si/Miles que estamos interesados en una prueba de extremo izquier


do, donde Hl está apoyado sólo en valores pequeftos de G. Si se usa Z como
estadístico de prueba, entonces la regla de decisión llega a ser: Rechazar
No si y solamente si

00
Crt < Z4L

donde el valor crítico es Z4, que es un valor de la variable aleatoria Z con


distribución Normal estándar. Así por ejemplo, si el= 0,01, entonces Z

33
26t= 0,01 11 -2'

Gráficamente se tiene

-2,33

Figura 10.2

• Ver la tabla de distribución de probabilidades de la Normal estándar pa-


ra .(= 0,01
- 207 -
- Go
els decir, que se rechaza Ro si sólo si < 2,33*, si el nivel de

significación es 0,01.

b) Segundo, si nosotros probamos Ho: 0 • Go contra Hl: 0)0 , entonces esta


nos interesados en una prueba de extremo derecho. Tomanao nuevamente la
variable Z con distribución Normal estándar, la regla de decisión se estable
cerá como sigue: Rechazar Ho si y sólo si

- 00
Zi_

Por ejmpio, si tomamos uno(* 0,05, entonces 20,95 - 1,65.

Gráficamente, tenemos

2
1,65

Figura 10.3
0 - 0
Mí que se rechaza Ro si y sólamente si 07, e ) 1,65 cono(= 0,05
0

c) Finalmente, si se trata de probar R0:19•00 frente a E,: O # 0, tenemos


una prueba de dos extremos. En este caso se tienen dos valores críticos,
de manera que las regiones críticas se encuentran en los extremos. Entonces
la regla de decisión en términos de 2 será: Rechazar Ho si y sólo si

- 0 -e
< 2.
4/2 6 . 21_,v2
9
En este caso, si tomamos 01= 0,05, entonces 20,025 - -1,96 y 7.6975
, n 1,96

• Ver Tabla de sitribución de probabilidades de la normal estándar en el


apéndice.
- 208 -

Gráficamente

-1,96 1,96

Figura 10.4

Que se interpreta análogamente a los casos anteriores.

En la Tabla No. 1 se presentan las regiones críticas 6 de rechazo co-


rrespondientes al estadístico de prueba 1 - 0 , para los niveles de
Z
significaciónc<= 3,01 ya= 0,05

TABLA 10.1: Reglas para probar H0: 0 = 00 frente


a H en términos de Z.
11

o¿lo 0,01 c<4 0,05


H
1
Rechazar H si y sólo si:
o

< -2,33 < -1,65

Z ) 2,33 Z 1,65

44 00 Z < -2,58 Z < -1,95


o 6
Z 2,58 Z 1,95

5. REALIZACION DE CONFUTOS

Habiendo realizado loe primeros 4 pasos, se tiene completamente diseña


da la prueba de hipótesis estadística. La quinta etapa es puramente computa
cional. Así, tomando la infonacián de la muestra, se cllcula el estimador
del parámetro 0 y la desviación estándar del estimador 0. El valor crítico
se encuentra fácilmente de una tabla de ditribución de probabilidades de la
- 209 -

Normal estándar. Se puede usar la Tabla No. 1 para el caso particular de te


ner niveles de significación del 1% y 5%.

6. TOMA DE DECISIONES

Por ultimo, queda delinear conclusiones estadísticas que nos permitan


tomar la acción de decisión más apropiada. Sobre la base de los cálculos
previos, el técnico estadígrafo decidirá rechazar Ho si el valor del estadía
tico de prueba cayó en la región crítica y aceptar la hipótesis nula si cejó"
en la región de aceptación.

La decisión estadística se hará además tomando en cuenta la estructura


del criterio de decisión previamente establecido (o sea, en las tres prime -
ras etapas). Si el estadístico de prueba dá un valor que pertenece a la re-
gión de rechazo, se considera significativa la diferencia entre el valor
muestral y el valor hipotético del parámetro. En otras palabras, se dirá
que el resultado muestral realmente es diferente de E0, y no podemos pensar
que la diferencia se debe solamente a un hecho accidental; entonces, podemos
afirmar que la hipótesis nula es falsa o que las observaciones muestrales
no con consistentes con la hipótesis nula. Debe tenerse presente que el re-
chazo de Ho implica en efecto la aceptación de H1. Por otra parte, si el es
tadfstico de prueba cae en le región de aceptación, la diferencia que se a-
preciará entre el resultado muestra' y el valor hipotético del parámetro en
estudio, puede deberse a un resultado casual, y por lo tanto no es significa
tiva estadísticamente; en consecuencia, nuestra decisión será no rechazar aj,
estableciendo que el resultado muestral no es inconsistente con la hipótesis
nula propuesta. Si la diferencia entre el valor observado y el valor hipoté
tico es muy grande, podemos rechazar Ho con un elevado nivel de significa -
alón.

En general, cuando rechazamos una hipótesis, suponemos que existe una


razón suficiente para ésto; mientras que si se acepta, solamente decimos que
los datos muestrales no son lo suficientemente significativos para llegar a
dudar la verdad de la hipótesis. Hata diferencia de actitudes, surge del he
cho de que lógicamente, es siempre más fácil probar que algo es falso, a pro
bar que algo es verdadero. Por ejemplo, para probar la falsedad de una pro-
posición matemática, es suficiente un contraejemplo; mientras que para pro -
Lar que es evidente, no son suficientes ni un millón de ejemplos. Puede jus
tificar este hecho, la razón del por qué de momento sólo nos estamos preocu-
pando del Error Tipo I; además, la determinación de los valores del Error Ti
po II son más dificultosos por la forma en que se ha diseñado la hipótesis
alternativa.

Mayormente a una prueba no se la considera positiva cuando confirma la


verdad de la hipótesis propuesta. La gracia de una prueba está en mostrar
la consistencia estadística cuando se desaprueba la hipótesis; de ser aai,
generalmente estaremos más satisfechas con la prueba. Pero, no debe olvidar
se nunca que existe unsprcbabilidad, así sea muy pequeña, de que la decisión
sea equivocada al rechazar la hipótesis.

• Generalmente una conclusión estadística es la base sobre la cual un eje


cutivo selecciona la acción apropiada a seguir. Sin embargo, es importante
- 210 -

notar que si una prueba es altamente significativa desde el punto de vista


estadístico, ésto no implica necesariamente que tenga una aplicación prácti-
ca óptima. Dependerá obviamente de la política de decisión que tienen deli-
neada los encargados de tomar decisiones según sea el caso particular que se
esté tratando.

A continuación presentamos algunos modelos para pruebas de hipótesis,


acompaflades de una serie de ejemplos, cuyas soluciones siguen las seis eta -
pes del proceso general para probar una hipótesis estadística.

10.2

Prueba de Hipótesis •
Para j4.
2 /10

Frecuentemente deseamos conocer si una


media poblacional ()a) ha aumentado o disminuido, o permanece sin cambio; o-
tras veces podemos estar interesados en determinar si una media poblacional
es significativamente mayor o menor que algún valor asumido. Por ejemplo,
podemos estar frente a las siguientes incógnitas: Aumentó el ingreso real
per chita en 3olivia desde la última estabilización monetaria? Puede un
nuevo procedimiento de producción reducir el costo medio en un proceso de
producción? La introducción de la Teoría de Conjuntos como eneefianza en el
Nivel Básico, podrá aumentar el rendimiento medio de loa alumnos en matemáti
ces?. Estas y muchas preguntas más, podemos contestar probando „M="0 con-
tra alguna hipótesis alternativa apropiada.

Si los resultados de una muestra aleatoria son razonables, entonces se


puede usar la media mulutul (i) para probar una hipótesis relativa a la me-
dia poblacionalt. Como Si tendrá distribución aproximadamente Normal, en -
tonces el estadístico de prueba adecuado, como ya vimos, será:

zt fio .1. 2 All1(0,1)

(10.1)
donde Cc - 47
--
r
a

Ahora bien, tal cono prometimos, veremos paso a peso algunos problemas
clásicos de prueba de hipótesis.
- 211 -

Ejemplo 10.1 (Prueba de Extremo Derecho) Se conoce que un cierto pro-


ceso de manufactura utiliza-
do en una fábrica, rinde una producción promedio de 155 unidades por hora
con una desviación estándar de 8 unidades. Aparece en el mercado un nuevo
tipo de máquina que realiza el mismo producto. El gerente de la fábrica es-
tima que si el rendimiento de producción de las nuevas ráquinas es en prome-
dio mayor que 155 unidades por hora, éstas deberían comprarse no obstante de
se más caras. Se experimenta con 35 máquinas del nuevo tipo, con miras a
utilizarlas en el proceso de manufactura, en lugar de las antiguas. La deci
'alón final se hará de acuerdo al siguiente procedimiento:

1. Formulación de las hipótesis: Asumamos que el gerente está inclinado a


creer que el promedio de producción por
hora de las nuevas máquinas es mayor que 155 y que quiere evitar la posi
bilidad de cometer el error de comprarlas cuando en realidad no sería con
veniente hacerlo; entonces la formulación de las hipótesis apropiadas se-
rán:

Ho: ,M= 155 unidades

H1: 155 unidades

2. Especificación del nivel de significación:- En este caso rechazar la hipó


tesis nula si es verdadera con
duciría e serias consecuencias, puesto que tomaría la acción equivocada
de comprar máquinas más costosas siendo así que la producción promedio no
diferirá mayormente de las que actualmente se están usando. A fin de pre
veer una decisión errada como ésta, el gerente decide utilizar un nivel
de significación c(s 0,01, o sea una probabilidad pequeña de rechazar H
siendo verdadera. o

3. Selección del estadístico de prueba: Para este caso hemos visto que el ea
tadístico de prueba más adecuado es
x -AAo
E
x
donde Z tiene distribución Normal estándar.

4. Establecimiento del criterio de decisión: Parad: 0,01 y para una prueba


de extremo derecho, como la que
estamos viendo, la regla de decisión es: Rechazar H siempre y cuando
> 2,33, en otro caso, aceptar H . (Ver en el Apén2ice la Tabla da dis-
tribución de probabilidades de la°Normal estándar).

5. Cómputos: Supongamos que las 35 máquinas del nuevo tipo, .constituyen una
muestra aleatoria, y que se ha obtenido una producción redia de
x = 160 unidades por hora. Por otro lado, asumamos que la desviación es -
tándar de producción para las nuevas máquinas, es idéntica al de las má -
quinas antiguas (ésto es, Or- 8 unidades por hora), entonces con n = 35,
-212-

tenemos
o- = 8 - 1,35
x 471.

z - Ao 160 - 155.1 3,7.
Luego, 1,35
x

6.Toma de decisiones: Como Z = 3,7 y 2,33, entonces Z cae dentro la región


crítica, por tanto se rechaza Ha, lo que implica a-
ceptar H1. Es decir, que de acuerdo al criterio prIdesignado por el ge-
rente, es recomendable comprar las nuevas máquinas para utilizarlas en
lugar de las del tipo antiguo.

Ejemplo 10.2 (Prueba de extremo izquierdo) La distancia promedio nece-


saria para detener un auto-
móvil con un icerto tipo de frenos, cuando está viajando a 60 Kms. por hora,
es de 20 metros. El departamento de ingeniería de la Compañía ha disertado
un nuevo sistema de frenos para que sea más efectivo que el actualmente usa-
do. Para probar este invento, el nuevo sistema de frenos se instaló en 64
coches, y la prueba mostró que la distancia nromedio para detener un carro a
una velocidad de 60 Kms. por hora, es de 19 metros, comuna desviación están
dar de 1,5 metros. Prueba la diferencia de un metro, que el nuevo sistema
de frenos es mis efectivo que el actual? Ahora bien, como el gerente desea
evitar el error de seguir utilizando el mismo sistema de frenos, si el nuevo
sistema es más efectivo, la pregunta anterior se nuede responder mediante la
siguiente prueba:

1.fflipótesis: :M= 20 metros


o
H :JU < 20 metros
1
2.Nivel de significación: 01 = 0,05

3.Estadístico de prueba:
- Ato

4. Regla de decisión: Rechazar Ho si y sólo si 2 <- 1,65

5.Cómputos: La media muestral con 1.1'1164, dió 19 metros. La desviación están-


dar de la población se desconoce en este caso, pero como la
muestra es suficientemente grande, podemos estimarla por medio de la des-
viación estándar muestral, o sea S = 1,5 metros. De este modo

3x = =
121 =
64 -
121
8
= 0.1875

19 - 20 5,33
luego =
0.1875
- 213 -

6.Decisión: Puesto que Z = - 5,33 < - 1,65 se rechaza Ho. Por tanto, el ge
rente deberá considerar seriamente la adopción del nuevo siste-
ma de frenos, por ser más efectivo que el que se está utilizando actual -
mente.
Veamos ahora un ejemplo para la tercera forma habitual de formular hip6te
sis.
Ejemplo 10.3 (Prueba de doble extremo) El vendedor de una fábrica de
cera para lustrar pisos gana
una comisión media de 980 $b. por mes, con una desviación estándar de 235 $b.
Aparecen en el mercado nuevas marcas de cera para pisos producidas por otras
fábricas. Este hecho hará reducir el volumen de ventas por vendedor, y ob-
viamente a disminuir sus entradas. Mientras tanto, los costos de producción
de la firma han aumentado paralelamente, con la inflaci6n general, lo que im
plica un precio de venta mayor; este factor tiende entonces a incrementar la
comisión del vendedor por cada venta. El gerente de la firma está ansioso
por descubrir el efecto neto de estos dos factores sobre las comisiones de
su vendedor. Para lograr ésto, se adopta el siguiente procedimiento de deci
sión:
1.Hipótesis: Ro ya= 980 $b.

B1:110 980 $b.


2.Nivel de significación: .( = 0,05

3. Estadístico de prueba: Z - o

4.Regla de decisión: Con 01-= 0,05 para un test de doble extremo (6 bilate-
ral), la regla de decisión llega a ser: Rechazar Ho
si y s6lamente si 12 1)1.96, o lo que es lo mismo, se rechaza Ho siempre
y cuando Z (-1,96 6 Z 1,96.
5.Cómputos) Supongamos que de entre todas las cuentas actuales del vendedor
se toma una muestra aleatoria de 100, y se encuentra un prome -
dio de comisiones de 940 $b.
Entonces
crr --.11.5.= 23,5
ral
Y
Z = 940-980 _ 1,7
23,5
6. Decisión: Como Z = - 1,7 cae dentro de la región de aceptación, Ho no se
rechaza. Este resultado indica que la diferencia de ho $b. pue
de atribuirse al carácter aleatorio de la selección de los elementos que
intervinieron en la muestra y que no es significativa con un riesgo del
5%. El gerente debe dejar de lado esta preocupación, puesto que el resul
- 214 -

cado de la muestra nos conduce a sacar la conclusión de que el ingreso me


dio mensual del vendedor no ha variado significativamente.

Tal vez sería más apropiado para este problema tomar como hipótesis al-
ternativa iu <980 $b., ya que para la gerencia no será problema si la comi
sión media del vendedor fuera igual y mayor que 980 $b. Veamos entonces qué
ocurre si formulamos la prueba de hipótesis H : da= 980 y Hi ytt<980 para el
mismo nivel significación 0:
1 a 0,05. La regid de rechazo sérá para cual -
quier valor de 2 < -1.65. Como el estadístico de prueba da un valor 2 =-1,7
la cual es menor que -1,65, habrá que rechazar H . Así, puede observarse
que la misma diferencia que no es significativa para una prueba bilatera:,
puede llegar a ser significativa para una prueba de extremo simple, como ocu-
rre en este caso. Todo ésto nos indica que si nosotros hubiéramos optado
por realizar una prueba del extremo izquierdo, la decisión de la gerencia ha
bría sido completamente diferente para los mismos resultados de la muestra.
Entonces, en lugar de no hacer nada(cono cuando se aceptó H ) el gerente po
dría, debido a la aceptación de Hl, actuar tomando una política distinta a
fin de obtener una solución al problema. Así por ejemplo: dar lugar a una
campaña de anuncios a fin de aumentar sus ventas, aumentar el porcentaje de
las comisiones que se pagan, mejorar la calidad de su producción a fin de e-
vitar competencia, o hacer mucho más que todas estas acciones con el propósi
to de mantener o incrementar el volumen de sus ventas, con el objeto de man-
tener al menos el monto de las comisiones de su vendedor.

Estas observaciones nos indican la importancia de formular las hipóte-


sis y especificar el nivel de significación adecuadamente, y además estable-
cer la regla de decisión antes de recolectar y obtener Los resultados de la
muestra.

10.3

Prueba de Hipótesis
Para P = P
o

Apareceaa menudo situaciones en las


que estamos interesados en determinar algún atributo de una población, en
tal caso, las observaciones de la variable serán cualitativas; así por ejemplo
cuando se desea conocer si los trabajadores en la recolección de capu-
llos de algodón de preferencia son hombres o mujeres; si los productos con
un cierto proceso tienen o n6 defectos; .l ue un artículo tiene o n6 demanda,
etc. Esto no significa que no puedan haber más de dos atributos mutuamente
excluyentes en una poblacion, sin embargo siempre es posible agruparlos tan -
sólo en dos clases. Por ejemplo, en una población de consumidores de carne,
- 215 -

pueden haber unos que consumen carne de res, otros carne de pescado, otros
carne de pollo y los que consumen otro tipo de carne; sin embargo, todos es-
tos pueden ser clasificados en aquellos que prefieren o no prefieren un tipo
de carne particular.

Cuando analizamos los datos cualitativos de una población, en general


estamos interesados en determinar la proporción poblacional (P) que existe
respecto de un atributo en particular. De esta manera, se deseará probar la
hipótesis P = P contra una alternativa apropiada, utilizando la proporción
muestral (p) para la prueba estadística. En este caso el estadístico de
prueba será
p - Po
0" (10.2)

que tiene distribución N(0,1), si se puede supone que R es verdadera, donde


o
P (1-P )
0"P - o o

Ejemplo 10.4 (prueba de doble extremo) Un fabricante de ladrillos de ar


cilla anuncia que produce un nue
vo tipo de ladrillos (con un tiempo y temperatura de cocimiento adecuados a
los insumos especiales que utiliza), sosteniendo que su producto es resisten-
te a roturas en un 90Z debido a efectos de presión. La Asociación de Cona -
tructores tuvo interés en verificar esta afirmación para lo cual organiza un
grupo de especialistas a fin de avaluar la resistencia anunciada. Algunos
miembros del grupo dudaron de la bondad de este nuevo tipo de ladrillo (basa
dos en su experiencia en el pasado con productos similares), pero dado que
los otros confiaban que podía ser cierto, convienen en que pueden ser consi-
deradas ambas alternativas. Luego de haber aunado criterios deciden tomar
un ot= 0,05 y comprobar con 200 de estos ladrillos. En otras palabras, el
procedimiento de prueba está diseñado cono sigue:
1. Hipótesis:
o P = 0.90
H : P ¢ 0,90
1
2 Nivel de significación: o(= 0,05
3. Estadístico de prueba: 2 -

La cual es una variable con distribución normal estándar si H es verdade


ra. Donde p es la proporción muestral. Además debemos recodar qua

OP = Pi. tal que Q = 1-P


4. Regla de decisión: Rechazar H
o si y sólamente se Z < -1,96 ó 2)1,96
- 216 -
5. Cómputos: Supongamos que de entre los 200 ladrillos probados con cierta
presión, 170 no sufrieron ningún dono, entonces p = 0,85

Por otro lado 130(1-P0) 10,90)(0,10) -


0.0212
°I n 200

Luego Z = 0,85 - 0,90 - 2,358


0.0212

6. Decisión: Puesto que Z = -2.358 < -1,96, se debe rechazar Ho. Entonces
la comisión informará a la Asociación de Constructores que el
nuevo tipo de ladrillo no tiene la resistencia anunciada.
Es interesante notar, que si la comisión de especialistas hubiera tomado
un oí.= 0,01, la decisión cambiaría. Por qué?
Ejemplo 10.5 (Prueba de extremo izquierdo) Supongamos que una de las
embotelladoras de bebidas
gaseosas de una ciudad ha anunciado en un períodico lo que sigue: "Hay más
de 15 embotelladoras de bebidas gaseosas en la ciudad, pero el 30% de las
familias que toman refrescos, son nuestros clientes. BEBIDAS ILLIMANI". El
efecto de esta propaganda como puede esperarse en la realidad perjudicaría
a las otras compañías embotelladoras, quienes como reacción lógica elevan
una queja, la OCC piensa que debe hacer una investigación previa para tomar
decisiones. Seleccionan una muestra aleatoria de 250 familias quienes nor-
malmente se sirven debidas gaseosas, y hallan 65 familias consumidoras de
"Bebidas Illimani" . Se preguntan si es significativo estadísticamente, cc
te resultado, y para responderse, la OCC dísela el siguiente procedimiento
de decisión:

1.Hipótesis; Ho: P = 0,30

Hl: P < 0,30


La hipótesis alternativa es apropiada puesto que habrá que pensar que el
reclamo de las otras embotelladoras estará inclinada a que el porcentaje
de clientes es inferior a la del anuncio.

2.Nivel de significación: Es interesante notar que la probabilidad de re -


chatar incorrectamente la hipótesis nula en este
caso, estará sujeto a dos criterios: El criterio del fabricante de "Be-
bidas Illimani" será naturalmente que la OCC utilizará un ch mínimo, sien
tras que las otras Compañías embotelladoras pedirán obviamente un 44.gran
de. Luego de estudiar cuidadosamente el caso a fin de evitar problemas
futuros la OCC decide utilizar un 5% de nivel de significación, o sea
04= 0,05.
3.Estadístico de prueba: Z = P -crPo

4. Regla de decisión: Con ot= 0,05, deberá rechazarse lahdpótesis nula cuan
do y solamente cuando
Z C - 1,65
-217-

n
5.Cómputos: 65= 0
V ,26
LV
P = 250 '

44/ (0,3)(0,7)
250 0.029
Luego Z = 0 26 - 0 30 -0 04
—2--- 1,38
0.029 0.029

6. Decisión: El valor de Z cae en la región de aceptación. Sin embargo el


reclamo hecho por las otras compañías embotelladoras no es infun
dado en términos de la muestra observada; no obstante, tampoco existe una
base para censurar el anuncio hecho por "Bebidas Illimani".

10.4

Prueba de Hipótesis
Para 0 = 0
1 2

También existen en la naturaleza otros


problemas frente a los cuales se tiene necesidad de tomar decisiones, como
ser: Es significativa la diferencia entre el ingreso medio de los trabajado
res mineros y el ingreso medio de los trabajadores fabriles?; los ingresos
reales de los profesores normalistas de Bolivia han cambiado desde 1971? Hay
una diferencia apreciable entre la demanda de aceite vegetal comestible y la
manteca de cerdo? El uso de material sintético en lugardebotellas de vi -
drio para el envasado de leche fresca, da lugar a una diferencia en la deman
da de leche entre los que prefieren uno u otro tipo de envase? Es significa
tiva la diferencia del rendimiento de estudiantes de un 2o. nivel universita-
rio, entre aquellos que en cursos básicos pre-universitarios siguieron dis-
tintos métodos de enseñanza? Estas y muchas otras preguntas pueden contes -
tarse comparando resultados de dos poblaciones; pudiendo ser éstas una misma
bajo distintos experimentos, o distintas poblaciones bajo un mismo experimento.

En el fondo, se trata de hacer una comparación entre algunos indícalo -


res o parámetros de interés de la población observada, asf por ejemplo, ver
la diferencia entre dos medias ,dos proporciones, dos desviaciones medias ,
etc., y probar hipótesis relativas a la existencia de alguna diferncia. Así,
es aceptable suponer apriori que no existe diferncia y contrastar con
otra hipótesis proponiendo lo contrario. Esto es, si 01 y 02 son dos valo-
res del parámetro 0 y deseamos probar la existencia de una diferencia linar-
tante entre ellas, la formulación aconsejable de las hipótesis, será: R0:01=02
contra Hl: 01 Y 02.
- 218-

Ilustraremos este tipo de prueba para el caso de comparar dos medias yo


blacionalee.

10.5

Comparación de Dos Medias


Poblacionales

Supongamos que se tienen dos medias po


pbacionales y
v /M2, pudiendo existir o n6 una diferncia significativa en
tre ellas. La 1formulación de la hipótesis nula será que no hay diferencia
entre ellas, o sea, H : /V = idu2.
o 1
Para probar una hipótesis de este tipo, se siguen los mismos criterios
del proceao general que hemos estudiado. Debiendo tenerse únicamente cuida
do con el estadístico a usarse para la prueba, que es la diferencia de dos
medias muestrales calculadas Ce dos muestras aleatorias independientemente
diseñadas. Llamemos = IW - /0 (diferencia entre medias poblacionales)
1 (2
y c& = ;e, - x (diferencia entre medias muestrales). Como de costumbre,
bajo el Supuesto de que la hipótesis nula es verdadera, el estadístico de
prueba que nos dará el valor crítico es:
- ) -
ert - 1
- 1 -iv2 1 (10.3)
U"- 0- -
dx dx Cd-
x

0-12 012 •.
donde Gdx w sil nn son los tamaños de las muestras
n n 2
1 2
1 y 2, respectivamente.

La variable 2 tiene distribución N(0,1).. Notemos que en (10.3), como


estamos considerando que la hipótesis nula verdadera, entonces /v1= /V2' o
sea distail% - /112 a O
Ejemplo 10.6 Se trata de probar una nueva técnica de producción de
cierto artículo hecho a mano. Se tomai80 trabajadores
con la misma habilidad para este trabajo y se enseña a 40 de ellos la nueva
técnica. El número medio de artículos producidos por los trabajadores que
aprendieron la nueva técnica, fué de 30 artículos por día con una varianza
de 15; mientras que los otros 40 que trabajaron como de costumbre, en praze
dio hicieron por día 32 artículos con una varianza de 18. Con estos resul-
tados preguntamos si conviene enseñar a todos los trabajadores esta nueva
técnica de trabajo, con un nivel de significación de 1%. Para contestar es
ta pregunta, podemos plantear la siguiente prueba de hipótesis:
- 219 -

1. 1.11.1.1.11211: Ho: =,A2

R1: C /2
donHeithi es el promedio de producclon diaria del grupo de trabajadores
que no utilizaron el nuevo método de trabajo, y donde/42 es el número me
dio de artículos producidos por aquellos que utilizaron la nueva técnica.

2. Nivel de significación: ¿Ca 0101


xi x2
3. Estadístico de prueba: 2
dx
4. Regla de decisión: Rechazar Ho si y sólo si Z C -2,33

5. Cómputos: Dado que n e 40 y n = 40 son nuestras bastante grandes, se


1 .2
pueden usar las varianzas muestrales como estimadores de la va
riente poblacional. Esto nos serviré para estimar la desviación estándar
de dx, es decir
2
s
Gdí = 15 , 18
n1 + n 0.908
-1/ 40 ' 40 m
J 1 2 2
7 - R
Luego 1 2 30 - 32
Z = 0--- 2,2026
0.908
dx
6. Decisión: Como Z dentro de la región de aceptación, Ho no puede rechazar-
se, es decir la aceptamód con uncí.= 0,01. De manera que no hay
una diferencia significativa entre el número de artículos producidos entre
la nueva técnica y la técnica corriente con una seguridad del 992

Comente qué ocurriría si al- 0,05

Ejemplo 10.7 Una fábrica de productos a base de leche, distribuye cante


quilla en paquetes pequeños, cuya tapa lleva una impresión
litográfica que dice: "Contenido neto 1 libra". Se ha observado que hay una
- desviación estándar de 0,5 de onza en el empaquetado por una maquinaria recien-
"temente adquirida. Se hicieron constantes ajustes a la maquinaria, chequeando
los pesos netos del contenido de los paquetes. Dos muestras tomadas en dos
diferentes fechas arrojaron la siguiente información:

la. Muestra 2a. Muestra


n o 30 n2 _ 35
1
x o 15,8 onzas x 16,2 onzas
1 2
El jefe de producción de la fábrica, desea saber si hubo cambio en el a-
juste de la maquinaria entre las dos fechas.
- 220 -

Podemos suponer que no hubo cambio de importancia en los ajustes reali-


zados, entonces la prueba apropiada será:

1. Hipótesis:
Hol µ1 = 1142

11 1: /U1 # 1/,t2
2. Nivel de significación: Usemos un riesgo.L= 0,01

3.Estadístico de prueba: -
Z
6---
dx
4. Regla de decisión: Rechazar Ho si y sólo si Z < -1,96, 6

Z > 1,96
5. Cómputos:
15 8 - 16,2
Z = 3.215
(0,5)2s (0,5)2
j 30 - 35 .

6.Decisión: Z cae. en la región critica, por tanto se rechaza H . Es decir,


que realmente hubo un cambio significativo en los ajustes rea-
lizados en la máquina.

Suponiendo que la segunda muestra hubiese dado un promedio de 15,9 onzas,


cuál será su decisión y por qué?

10.6

Ejercicios

1.Explique les siguientes conceptos: 1) nivel(de significación, 2) valor crí-


tico, 3) región dé rechazo, 4) región de aceptación.

2.Indique la diferencia entre: 1) una prueba dé dos extremos y una prueba de


un extremo, y 2) una prueba de extremo izquiedo y una prueba de extremo
derecho.

3.Una compañia que vende productos de carne envasados imprime en la etiqueta


"Peso neto 12 onzas". Una muestra de 25 envases da una media de 11.83 on-
zas. De la'experiencias anteriores se conoce que la población de los pe -
sos de los envases tiene una desviación estándar de 0,5 onzas. Utilizando
gd:= 0,05, qué conclusión se sacaría acerca de la producción que la compa -
ala intenta obtener?

4.Una compañia sostiene que la duración media de todos los acumuladores para
automóviles, producidos por la compañia, es 40 meses, Sin embargo, se ha
- 221 -

encontrado que la duración media de una muestra de 100 acumuladores produ


cidos por la compañia es solamente 38,5 meses con una desviacié estándar
de 5 meses. Determínese si la afirmación de la compañia está o nó sobre-
estimada a un nivel de significación de: 1) 0,01 y 2) 0,05.
5.Un hombre tiene dos granjas. El peso medio de 10 pavos en una
granja fué
de 14,35 libras con una desviación estándar de 2,5 libras; mientras que
el peso medio de 20 pavos de la otra granja fue de 12,19 libras con una
desviación estándar de 2 libras. Las varianzas de los pesos de todos los
pavos de.las dos granjas se cree que es la misma. Desea saber si el pe-
so medio de los pavos en una granja difiere significativamente del de la
otra granja. Basado en un nivel de significación de: 1) 0,01 y 2) 0,05,
encontrar la respuesta adecuada.
6.Un manufacturero de drogas sostiene que su producto TP, fué 95% efectivo
en mitigar los sufrimientos del dolor de muelas en un período de 5 minu-
tos. Una muestra de 150 personas que usaron el producto arrojo que pro-
dujo alivio para 138 personas. Cree que la afirmación hecha por el manu
facturero es válida al nivel de significación de 0,10?
7.La vida media de una muestra de 25 bombillas eléctricas producidas por
una compañia, se encuentra que es de 1535 horas, conrconocida de 100
horas. El promedio de este tipo de bombillas ha sido anteriormente
.1.4= 1.500 horas. Si la desviación estándar no ha cambiado, compréebese
la hipótesis de que las nuevas bombillas duran más que las antiguas,
7.1 Utilizar un riego 01 de 0,05
7.2 Usar un riesgo de d=0,10
8.Se hicieron idénticos exámenes a 20 estudiantes de cada uno de dos cole-
gios. El promedio para el colegio A fue 63 y para el colegio E, 72.
Se sabe que la desviación estándar para los examinados es 10. Comprobar la
hipótesis de que no existe ninguna diferencia entre las medias con un
riesgo oCm0,05.
- 222-

CAPITULO li

MODELOS DE RSGRESIOR

Asociación entre Variables

Se ha estudiado cómo podemos obtener irsdi


cadores relacionas con distribuciones de una sola variable, llamadas temblé;
dlaisibscAenee traivaitíantte. Esto es, nuestro interés radicaba en tomar una so
la característica de cada unidad elemental de la muestra. For otro lado, los
estadísticos muestreles, eran usados para obtener inferencias sobre los paráme-
tros correspondientes.a una pottación univailínnte. *

Los fen6menos en la naturaleza están caracterizados por *le coexistencia de


muchos atributos y dimensiones, por lo que frecuentemente se hace necesario con
siderar distribuciones de más de una variable, con el fin de dar solución a im-
portantes problemas de decisi6n. Estudiaremos entonces distribuciones de pobta
OídHed rnattívaitionaW4, término que puede ser usado conceptualmente para desig
nar una población con un número arbitrario de variables. Así, una pobtación
=
VdAialtte es la que contiene dos dimensiones en cada elemento; por ejemplo, pedí'
mos observar: la estatura y el peso de cada persona en una población de hom -
bree mayores de 40 años, el coeficiente intelectual (CI) y el ingreso por comi-
siones de cada persona que trabaja como agente de seguro, los salarios ganados
y cantidades gastadas en recreaciones por trabajadores individuales de una po-
blación cualquiera, etc. La observación de un elemento de una población que ad
mite tres c más medidas, cada cual referida a una característica especifica, s'o-
ré un dato multivariante; por ejemplo, si se toma el peso, la estatura, el con-
sumo de leche y el coeficiente de inteligencia de un individuo de una población
de personas con SO nem de edad, dé lugar a una observación con cuatro varia -
bles.

El principal problema en el estudio de datos biverientes o multivariantes,


es hallar y medir el grado de relaci6n o asociaci6n que existe entre las varia-
bles, o sea, determinar cómo varían éstos conjuntamente. Así, podemos observar
que los trabajadores que ganan mayores salarios gastan más en recreaciones, o
que los hombres altos generalmente son pesados, etc. Pero ésto es verdadero so
lamente en promedio, puesto que hay excepciones tal como trabajadores que ganan
salarios reducidos y gastan más en recreación que otros con salarios mayores, o..
" Conjunto total de elementos en estudio, de los cuales se observa una sola ca-
racterística.
- 223-
que hay hombres pequeños pesados. Se trata entonces de analizar la relací3n
promedio que existe entre dos o más variables. Si esta relación promedio se
puede establecer mediante alguna forma funcional matemática, estaríamos en
condiciones de determinar-en cierto modo- el grado de dependencia entre varias
variables.
Para el estudio relativo a la relación o asociación de dos o más variables,
veremos los mátodos llamados andaba de xegnezion y andtAzÁZ de come/alían.
El primero intenta establecer la relación funcional entre.variables de manera
que seamos capaces de predecir el valor de 'una variable sobre la base de otra
u otras. Llamaremos convencionalmente van2cbleó índependientez o simplemente
A uatiebtez a las que servirán de base para la predicción, y vonabtez dependiera
tez a las variables que se predicen.
Por otro lado, el análisis de correlación se refiere a la determinación
del"grado de relación" que existe entre las variables. En el análisis de co -
rrelación no tiene ninguna significación práctica cuál es la variable.índepen-
diente o dependiente.

De acuerdo a que se trate de variables bivariantes o multivaríantes, el a-


nálisis de asociación será simple o múltiple, respectivamente. También se dife
ranciará entre asociación línea/ y no linea& de acuerdo al tipo de relación
que tengallas variables.

Antes de entrar a las técnicas propiamente del análisis de relación entre


las variables que se desean estudiar, es aconsejable tener una idea de cómo es
tán distribuidos los puntos (o unidades elementales observadas) en el espacio
euclideano n-dimensional. Es de lamentar que las más de las veces, ni siquie
ra es posible tener una buena representación gráfica con tres variables; de ma-
nera que,solamente a.título de ilustración, veamos algunos diagramas del upan-
etmiento o nave de puntos para datos bivariantes.

Y Y Y

2 2 3
Y =I a + bx Y = a + bx + cx Y = a + bx + cx + dx

Ir • t

1X
- 224 -

1
Y = a + b x
0 1
a+ óx

X' X
• N.

d e
Figura 11.1
Las líneas entre los puntos (x1, yi) nos describen la Ionma de id ubican
pumedío entre las variables X e Y. estas líneas y sus funciones se denomina -
rán líneas de regresión y funciones de regresión, respectivamente.

Nótese que en el diagrama d, no hay una línea adecuada para describir la


relación promedio entre las dos variables, lo que nos índica que no'hay rela-
ción entre ellas. Se dice también que en este caso, la correlación es nula.

11.2

Modelo de Regresión Lineal Simple


Bivariante

En el análisis de regresión., como en o-


tros tipos de estudios estadísticos, nosotros procederemos corrientemente a ob-. -
servar datos muestrales, cuyos resultados nos servirán para estimar la relación
que existe entre las variables de la población. De entre todos los modelos po-
sibles que pueden construirse para describir la variación conjunta de dos varia .
bles, estudiaremos con bastante detalle el mode/o de negnes.ión Uneat siMpte.

En general usaremos la letra mayúscula X para designar a la variable inde-


pendiente, e Y para la variable dependiente. Por otro lado, x e y representarán
sus valores particulares (es decir, xcX e y «Y). En la teoría 4e regresión,
sobas pueden ser variables aleatorias, pudiendo asignarse a cualesquiera de e-
llas el carácter de dependiente o independiente. No obstante asumiremos que
lns valores independientes de X son otnocidas o fijos.

Para comprender bien nuestro trabajz, debemos aclarar previamente lo que


entenderemos por "relación entre una variable aleatoria Y y una variable X".
- 225 -

Asumiremos que para cualquier valor dado x de una variable "independiente", e-


xiste una distribución o población de valores asociados 21; esta distribución
de valores asociados I., perenne x dada, vendrá descrita por una función de den
sidad fy(y1x) si la población toma valores continuos, y una función de probabi
lidades py(y1x), si la población tiene un número discreto de casos posible.

Una interpretación más simple es que, para un valor dado de X hay muchos
valores asociados z los que supondremos están distribuidos normalmente*. La
distribución de los valores de Y para cada x, se considera una subpoblación;
por tanto, la población consistirá de tantas subpoblaciones como valores x ha-
yan. Así, en cualquier evento, la distribución de cada subpoblación está con
dicionada a cada valor de X.

Entonces, podemos hallar la media de cada subpoblación Y para un x dado,


o lo que es lo mismo, el valor esperado de Y para un valor x dado; o sea ,
E(YIx) =" . La forma funcional E(Y1x) varia de acuerdo al tipo de aplica -
ojón partinlar de que se trate. En esta sección estudiaremos el caso espe-
cial de una función lineal simple; esto es, todos los valores de itt , deben
caer en la línea recta, yx
E(YIx) ■ a+ bx (11.1)
que es la ecaacZón de xegne4/.6n poblacLonat para nuestro modelo lineal biva-
riante. Los momentos superiores al de primer orden de Y no dependen de x. Las
dos constantes a y b, que reciben el nombre de coe6.LeLente4 de xegneziln pobta
eionat, son desconocidos y serán estimados mediante una muestra de valores de
Y.

Lo dicho anteriormente, gráficamente se tiene:


: 1
*
A \E(YIX) a /44
= a + bx
Yx

Figura 11.2

Ahora podemos definir la variable

6= Y -t
yx

* Se interpreta igual si decimos que para cada x hay un Y con distribución nor-
mal.
- 226 -

que es la desviación de ?os valores de cada subpobiación Y con respecto a sus


medias. E recite también el nombre de error residual. E es una variable alea
toria independiente con valor esperado nulo, es decir E ( E ) = O. Además, si
las Y-es son variables Normales, podemos asumir que también la variable aleato
ria E está distribuida normalmente.

Para un valor particular en cada subpoblacién Y, podemos expresar

y = E (Y1x) +e
donde e 6 e

Gráficamente tendremos:

E(Ylx)

= a + bx

Figura 11.3

Finalmente, como cada súbpoblación de valores de Y para un x dado tiene una va


rianza cr2 y una desviación estándar c , asumiremos que todas las desviacio -
nes estándar son idénticas, esto es,
2 •
ci ca ..,..,.. = oí =7 =JE [Y-E (Y1x).1 (11.3)
Yx
que también reciben el nombre de deavíaeLón eadndak de AegAuían.
Bajo todos los supuestos anteriores, gráficamente nuestro modelo será

o también2 2
G-
Yx = IDY -/aYx) /e
- 227 -

Densidad

Y (Variable
dependiente)
x
2
./lx a + nx
n (línea de regre-
sión poblacional)
X
(Variable in-
dependiente)
Figura 11.4

Nótese que los supuestos del modelo poblacional anterior puede que no se
ajusten perfectamente a la mayoría de los datos bivariantes económicos. Sin
embargo, el modelo dará un resultado satisfactorio si la relación entre los
valores de X e Y es aproximadamente lineal.

11.3

Estimaciones para el Modelo da


Regresión Lineal Simple

Recordemos que la estimación de un parámetro poblacional pueda tratarse


de una estimación puntual, o, de la estimación de un intervalo confidencial.
Así, la estimación puntual de un parámetro poblacional es un estadístico musa
tral correspondiente, mientras que la estimación del intervalo viene especifi
cado por los límites de confianza superior e inferior, las que se calculan a
partir del estadístico muestral y el error estándar * del estadístico.

* El error estándar, como ya se v16, es la desviación estándar de la muestra.


- 228 -

11.4

Método de los Mínimos Cuadrados

En primer término veamos una forma para


estimar a y b de la línea de regresión poblacional E (YIx) = = Y = a+ bx
El método de los mínímoó cuadhado4 para estimar a y b, especifia que nosotros
tomaríamos como estimadores, aquellos valores de a y b que minimicen la suma
de los cuadrados de los errores residuales, o sea, minimizar una cantidad Q
tal que

(11.5)
1)
Qa i=1

donde las y. son lcs valores de Y observados de la muestra y las x. son los va
lores asociados de la variable independi$nte 1. A los estimadoressde a y b
por este método los simbolizaremos por a y b , respectivamente. *

Si tomamos una muestra aleatoria de n pares, (x1, y 1)(X 2, y 2)...(xn1Yn )


gráficamente tendremos
Y (xn,3r n)

Figura 11.5

donde Y será nuestro estimador de E (11x) = „.“ = Y = a + bx


c Yx
Entonces, el método de los mínimos cuadrados nos dice que debemos coneide
rar todas las posibles líneas y rectas que podamos trazar en el plano y elegir
aquella que minimice la suma de los cuadrados de las desviaciones e entre los

+
* Así por ejemplo, se dirá que el estadístico a obteniendo de la muestra, serát•
el estimador mínimo cuadrático del parámetro poblacional a.
- 229 -
puntos observados yi y la recta que nosotros delineamos. La linea que minimi
za ésto, se llama Z2nea de 2egke4i6n mZnAno wad/ab:w. Y se denota por
Ye = a+ + b+x. Esta linea se llama también regresión de Y sobre X. Si noso-
tros elegimos otra línea distinta de Ye - a* + b+x, por ejemplo:

- a' b'x,
la suma de los cuadrados de los desvíos de las y! sobre esta segunda línea se
rá necesariamente mayor; es decir,Ele!2 r-- 21

Teorema 11.4.1 Sean (xl, y1), (x2, y2) ..... (xn, yn),,los valores observados
de una variable aleatoria Y, asociados a sus valores x, donde
E (YIx) = a + bx. Entonces la línea de regresión mínimo cuadrática está dada
por Y = a+ + b+x, donde
c
+ +
a =y-bx
51(xi - (Yi -
b (11.6)
E(x. - TO 2
Demostración: Se trata de hallar los valores de a y b que hagan mínima la ex-
presión (11.5)
esto es,
Minimizar, Q = min. (yi - a - b xi)2
(para a y b) a,b isl
El método que seguiremos para este fin, es el comunmente usado en el cál-
culo infinitesimal, es decir: se hallan las derivadas parciales de Q con res -
pecto a a y b, las que deben ser nulas como condición necesaria. La condición
suficiente es que
2Q
tal ) O y que el determinante de las derivadas parciales
segundas debe ser también mayor que cero, o sea,
Q
' 2Q
DP.2 DECD11
> o
1)2 Q .212
"0-sibb 'VbZQ
Entonces, a* y b* harán mínima la expresión Q.

Veamos el desarrollo para esta demostración:

Otra expresión equivalente para b+, que suele ser útil para cálculos, es
Exi yi - y2__ x. (11.7)
2::x2 2::x.
-230-

Aplicando derivadas parciales a Q con respecto a a y b, se tiene

YI a - b sí)
i=1
(1.a)

-2 21(Y1
. -a- b x,) x.
i=1
Para la condición necesaria, tendremos
-2
z

,
t.
]. 1
Sistema que comunnente se escribe
na + bEx. = y.
. =2::x.y.z
aEx. + bEx2 (11.8)

y reciben el nombre de ecuacioneh nomatu de regresión lineal mínimo cuadráti


ces. La solución de este sistema nos dará los valores de a+ y b+.
De la primera ecuación se obtiene
a = y - b
sustituyendo en la segunda
2
- b 701:1x. z y.
1 + bx. = >--- x. z
;Ex. + bE:x. 0511xi Tyi.
. - 11::x.) =I::x.z yz
b (rx2 . -
de donde Yi PiEixi 1::(xi (Yi Y)
x.
2 - xe— x. 3 - (xi - -
7)2

Luego
a+ = - b.1
Por ultimo, veamos si estos valores hacen mínima la función Q.Tomando deriva-
das parciales segundas en (la) tenemos:
-1)25
- 2n, .t)21 2 ni, 1.22 2 Exf
1Pa "Dapb 1>b
Esto es,

2Q -
-aa2
2r. > 0 ',ya que n )0, por ser el tazafic de la muestra)

Por otro lado,

2n 2 Exi
z - 4 ( Exi)2 = 4n E(xi - ic-)2
2 Exi 2E4
la cual es positiva si tenemos al menos dos valores xi distintos.
En consecuencia, los valores a+ y b+ hacen mínima la expresión Q, luego
la línea de regresión mínima cuadrática es Ye = b+ x
Ejemplo 11.1 Supongamos que los gastos de consumo, desde el punto de
vista económico en promedio, es una función lineal de los
ingresos de las familias con un estándar de vida bajo. Pensemos que pa-
ra los ingresos X hay una distribución de gastos Y, de tal manera que pa
ra cualquier x la media de la distribución de gastos está dada por
E (YJx) = a bx, donde a y b son constantes (parámetros) desconocidos.
Se tomó la información correspondiente al ingreso anual disponible y de-
sembolsos por consumo de diez familias seleccionadas aleatoriamente de
una zona fabril de cierta ciudad, tal información fue:

Tabla 11.1
y

Ingreso Gastos
Consuma.:
$b. $b.
20.000 18.000
15.000 12.000
8,000 7.000
13.000 11.000
7.000 8.000
6.000 6.000
12.000 10.000
20.000 12.000
10.000 8.000
17.000 14.000
- 232-

Se trata de estimar a y b sobre la base de estos valores observados, usan


do el criterio de mínimos cuadrados, tal que podamos ver la relación existente
entre los ingresos y gastos de consumo. Para facilitar la parte computacional
podemos tomar X en "miles de $b.", puesto que esto no cambiará en absoluto el
análisis de la regresión. Entonces el cuadro de operaciones será:

Tabla 11.2

Ingreso Consumo
en miles en miles
2 2
xi Yi x. yi
xi Yi

18 360 400 324


20
12 180 225 144
15 49
8 7 56 64
11 143 169 ;21
13 64
7 8 56 49
6 36 36 36
6
10 120 144 100
12
14 280 400 196
20 64
10 8 80 100
14 238 289 196
17

V-- 108 1.549 1.876 1.294


128

0sea:2_,c. =128C Yi- °108; Em. iy. = 1.549;


37-. 2 • 1.876;
2
2_ y/ = 1.294; x = 12,8; Y e 10,8; E(c. X) e 237,6

1.549 - (10,8) 128


+ Yi Y 2— xi 10,7
de donde b •
1.876 - (12,8) 128

+ - + -
y a ey-b x e 10,8 - (0,7) (12,8) 4 1.84

Luego el estimador de Y = X(Yix) = a +bx será Y (Ver


= 1,84 + 0,7x (o sea, la lí-
figura 11.6)
nea de regresión mínimo cuadrática estimada). c
Los puntos representan los pares de datos originales de la muestra.

De manera que podemos estimar cuánto gastan anualmente en promedio, por


ejemplo, las familias con un ingreso de 9.000 $b.; para ésto, es suficiente
sustituir el valor particular x = 9 en Y ( puesto que convencionalmente esta
tos trabajando en miles de $b.) , o sea,c •

Y = 1,84 + (0,7)(9) = 8,14


c
- 233 -

Para la interpretación de este resultado debemos partir de la siguiente


premisa: Hay muchas familias con un ingreso de $b. 9.000 pero las cantida -
des que gastan para consumo, no necesariamente son iguales, siendo en gene -
ral distintas. *

Entonces la interpretación adecuada es la siguiente: Las familias que


viven en la zona fabril mencionada y que tienen un ingreso de $b. 9.000 gas
tan en pnomed¿o 8.140 $b.anualmente en consumo. Se estima también que el
gasto promedio por consumo es de 13.740 $b., para familias con un ingreso a
nual de 17.000 $b.

Y (Consumo en
20 miles de $)


10
• • = 1,84 + 0,7x

X (Ingreso en
10 20 miles de $)

Figura 11.6

Veremasa continuación sin entrar a demostraciones rigurosas (Ver Apéndice),


algunas propiedades relativas a los estimadores Yc = + a+ y b+.
Por los estudiado en muestreo, los estimadores mínimos cuadráticos de a
y b, también resultan ser funciones de los valores muestrales. Siguiendo el
criterio de los mínimos cuadrados, los estimadores tendrán distribución idén
tica al de la variable de donde proviene la muestra. Una primera propiedad
deseable, es que un estimador sea insesgado; es decir, que el valor medio es
perado del estimador sea igual al valor del parámetro estimado.

Teorema 11.4.2 Sea Y una variable aleatoria con media a + bx, para un valor
dado x. Se toma una muestra aleaoria de tamaño n de Y (con
sus valores asociados x).

B = 51:(xi - X)(Yi - +
- Si y +
A ='Y - x, (11.9)
21(x. - 1)2

* Esto es lo que se quería decir al introducir este tema, con:"...para cada va


Ior dado x, existen muchos valores de Y, que pueden estar distribuidos
de alguna manera. Asumiremos que la v.a. Y está distribuida normalmente...".
- 234 -
+ son los es amadores insesgados de a y b, respectivamente.
entonces A y

Corolario: Y e es un estimador insesgado de Y = a + bx; esto es,


+ +,
E (á + B x) = a + bx
Teorema 11.4.3 Sea Y una variable aleatoria con media a + bx, para un va -
lor dado x, y C2 la variante de 1 para cualquier x (esto es.
cada distribución de los valores de Y para diferentes valores de x, tienen
la misma variante). Sea (x., Y I), (a2, (xilY ), una muestra alea -
coria de Y con sus valores ásocZados x. Entonces, n
2 ^-- 2
Gr yx L__x.
i
+
V(A ) - 2
n 21(xi n)

CYX
v(B') \-m..4)2
,
- cYx2
cov (A,)
E(xi-X)2

. + +
donoe A y B son los estimadores mínimos cuadráticos.
2 entonces
Teorema 11.4.4 Suponiendo que E(Y1x) = a + bx y que V Cylx) czpx,

(5.1)2 1 y- (Y t + 2
- A - xi)
n - 2
i=1

1 (g+)2 5:: (xi 1,21 (11,,11)


))
n - 2 [ /1.:"1
'v. - 1)2

es un estimador insesgado de (variante poblacional de la regresión)


2x
Y
+)2
La raiz cuadrada del estimador (S recibe el nombre de estimador de la
desviación estándar poblaeiunal de regresión 6 deaviaeLon est/Inda/t muestaat
de xegamaién. Algunas veces se llama también ekno)t. eatandak de eattisacion.

• Para fines de cálculg,se supla usar la expresión idéntica


c- 2
2L_Y I -
tc 7-x.
A 4.....Y s - 6-1 --- Y. .1-c- :s
...I 2 1 c 2 + 1E7v .-b i_x.yi
'fr-2 .1 i ( [_. Y - a -' i 3..
G. 2 (,:: ) ^ n - 2 T' n-2 A
yx
.(11,12) C'„,
-235-

Teorema 11.4.5 Supuesto que E (Y!x) ■ a + bx, para valores dados de x, y que
la varianza de Y es c‘ para todo x. Entonces, si (x., Y1) ,
(x2, Y2),...,
) (xn Yn ) es una muestra aleatoria de Y con sus valores ¿socia -
dos x, los estimadores minino cuadráticos A+ y B+ son los mejores estimadores
lineales insesgados de a y b.

Teorema 11.4.6 Sí Y es una variable aleatoria normal con media a + bx, para
un valor especificado x, y con varianza cr2 para cualquier x;
entonces, dada una muestra aleatoria, los estimadores máximo verosímiles de
a, b y cr2, son
A-
A = Y - Bx

^E(x-i) a (Y - b
B -
5--(xi-x )2 2
y
E = nI (Yi - I - 2
Bmi)

Se aprecia inmediatamente que los estimadores máximo verosímiles de a y


b son idénticos a los estimadores mínimo cuadráticos de esos mismos paráme-
tros. De manera que también son insesgados, exento el rtImador máximo veto
símil F,2 que es sesgado de .2, puesto que E ( E • r i -- 0-"`
n yx
Es muy importante tener presente todas estas propiedades, pues de ello
dependerá una mala o buena aplicación e interpretación de los resultados de
un problema dado. Por otro lado, el hecho de que se hayan usado varios símbo-
los para indicar estimadores de un mismo parámetro (por ejemplo, a+, A y I,
para estimar a), se debe Gnicamente a nuestro interés por diferenciarlos de
acuerdo a sus propiedades particulares. Además cuando se esté resolviendo un
problema práctico, se apreciará que desde el punto de vista computacional, no
hay ninguna diferencia.

Ejemplo 11.2 En relación al ejemplo 11.1, estimemos la desviación están-


dar poblacional de la relación entre los gastos de consumo
respecto de los ingresos de dichal familias. Para esto, usaremos la ex
presión simple para calcular (S+) , o sea
ir- 2 +
+ 2 2. 2.
(5 )
n-2

Tomando los resultados obtenidos a partir de la tabla 11.2, tendremos

+ 2 2 254 - (1,24)(108) - (0,7) (1.549) 16 98


(S ) S
19 - 7 8
-236-
+
Luego Yx= S 1;17

Esto nos indica que en promedio existe una desviación estándar estimada
de 1.170 $b., en relación al gasto promedio por concepto de consumo.

11.5

Inferencias Relativas a la Regresión


y Correlación Bivariante

Una vez obtenida la ecuación de regre-


sión muestral, la cual indica la existencia de una cierta relación funcional
entre dos variables, cabe preguntarse si ésta es idéntica a la ecuación de
regresión verdadera /•5,x (que se obtiene de la población). La respuesta es
inmediata en el sentido de qua necesariamente habrá diferencia, salvo el ca-
so particular de que la población tenga una relación lineal bivariante, per-
fecta. El tamaño de este error se mide mediante la desviación estándar po-
blacional de regresión, pero en general no hay manera de evaluarlo porque
los coeficientes de regresión poblacional y sus desvíos son desconocidos. Un
segundo error se debe al muestreo propiamente dicho, debido al carácter alee
torio de la muestra obtenida. Los errores muestrales de los estimadores se
evaluaría en términos de sus respectivas distribuciones muestrales.

COMO CotAECS interesados en obtener algunos indicadores que nos persa/ -


tan inferir la relación y grado de dependencia entre les variables de una PC
blación a partir de una muestra aleatoria, en lo que sigue, estudiaremos las
distribuciones muestrales de los estimadores, siempre bajo el supuesto dR
que Y tiene distribución normal con media a + bx y varienza constante dr'.
Bajo este supuesto, podremos construir fácilmente intervalos confidenciales
para a, b, a + bx = iMyx, y además probar hipótesis acerca de estas cantida
des.

11. 6

Distribuciones Muestrales de y bl"

La distribución de al' para muestras


de tamaño g), tiene las siguientes medidas:
-237-
E (a+) a a
r 2
+ - c4x xi (21.14)
V(a
a z)1::(xi-17)2

Lasdistribuciones de b+, tienen las medidas:

E (b4.) a b

2
+ 2 cryx
V(b )= cm .= 2 (11.15)
b 2_(xi-Sp

Le dedicaremos más atención al estimador b+, dado que para tomar decisio-
nes relativas al comportamiento de una población bivariante, es más importante
que a+. Así, si b+ es positivo o negativo, nos indica una relación positiva o
negativa. Como estamos suponiendo que Y es normal, entonces la distribución
de es normal si el tamaño de la muestra es mayor que 30. Cuando n C 30, lo+
tiene distribución más o menos como una t de Student con (n-2) grados de libes
tad. Además, en ambos casos, el estimador insesgado de V (be) es

"2 " 2
"2 cr Cryx
=
(11.16)
b r.(x-s)2 Exl - (5:xi)2
n
El estimador insesgado del error estándar de b+ es simplemente la raíz
cuadrada de
b*

intervalo Confidencial para b*

Recordemos que la estimación puntu.l de


un parámetro no resulta de mucho vainr si nc se tiene alguna medida del ,Josi -
ble error cometido en la estimación. En este como en muchos otros casos, lo+
debería estar comprendido dentro de cierto intervalo con alguna medida de segu
ridad de que b también esté dentro de dicha intervalo. Así por ejemp:4, un er
valuador de Prcyecru que esté :cupado en estudiar el comportamiento entre el
consumo y producción de un artículo, deseará estimar que la relación entre so-
' bas variables sea 1,05. 0,35 para b*, o sea que el coeficiente de regres:6n b,
- 238 -

esté comprendido entre 0,70 y 1,40 con un cierto porcentaje de seguridad.


Entonces se trata de determinar el límite superior (Ls) y el límite inferior
(LO entre los cuales queda comprendido con bastante seguridad el verdadero
valor del parámetro.

Para nuestro caso, los límites confidenciales estarán dados por los ea -
tadísticos.
1
L + t
s i-01/2 S/ 2
211(x - x)
Y
L •8 - t 1
1-0/2

donde t ee el 100 (1- c< percentil de la distribución t con (n - 2)


1-‘1C/2 2
grados de libertad.

Ejemplo 11.3 En el ejemplo 11.1 vimos que la estimación puntual del coe-
ficiente de regresión b, era 0,7. Se trata ahora de esta -
blecer su intervalo de confianza, tal que b se encuentre comprendido
dentro de dicho intervalo, con una probabilidad de seguridad del 95%.
Para calcular los límites, podemos usar los resultados obtenidos en los
ejemplos 11.1 y 11.2 faltándonos únicamente el cálculo de tII
,.- 2) con n-2

grados de libertad; comoo(- 0,05, entonces bastará ver la tabla de proba-


bilidades de con (10-2) • 8 grados de libertal, es decir:
tZ0,975)
t
(0,975)(8) = 2,306.
Entonces, L oe 0,7 + (2,306)(1,17) - 0,8748
S I237,6
1

L • 0 7 - (2,306)(1,17)
I ' 1 0,5252

o sea 0,5252<b<0,8748

Este resultado nos indica que el parámetro b (coeficiente de regresión


poblacional), estará comprendido entre 0,5252 y 0,8748, con un 95% de segur/
dad. También puede asegurarse que b # O con un nivel de confianza del 95
por ciento y que es evidente que b será una relación positiva, entre los in-
gresos y gastos de consume: es decir que a medida que aumenteilos ingresos,
aumentará la tendencia a gastar más en consumo. De acuerdo a la relación es
r tablecida conviene ver ahora mismo una aplicación de la prueba de hip6tesis,
estudiada en el capítulo' anterior, en relación al parámetro b, antes de estu-
diar lo relacionado con las estimaciones defi .
yx
-239-

11.8

Prueba de Hipótesis para b e bo

Una pregunta casi inmediata, una vez


que se está frente a un problema donde se tiene que tomar alguna decisión
respecto del comportamiento conjunto de dos variables, es, si existe o n6
alguna relación entre dichas variables. Así por ejemplo: Hay alguna reía
ción entre la estatura y el peso de un grupo de alumnos universitarios?; la
demanda de viviendas está influenciada por el crecimiento de la población
de personas en una ciudad?; hay un mayor número de artículos fallados de acuer
do al número de horas de funcionamiento de una máquina?: hay alguna relación
entre los ingresos de personas mayores de 40 años, con el número de años dedi-
cados al estudio antes de cumplir los 40 años?, etc. Muchas más preguntas
que éstas podrían contestarse, realizando una prueba de hipótesis respecto
del parámetro b.

Siguiendo los mismos pasos del procedimiento general de prueba, podemos


formular que existe hipotéticamente un valor b o de relación entre dos varia
bles, o sea probar Ho: b = bo contra una alternativa Hl: b # bo
. En la mayo
ría de los casos, se puede partir de entrada del supuesto de que no existe
ninguna relación entre las variables, tomando como hipótesis nula Ro: b = O
, y contrastar con la alternativa H 1: b # 0, es decir que existe una relación
en el comportamiento conjunto de la población bivariante.

Los estadísticos de prueba según el tamaño de la muestra serán:

Para muestras grandes


+
b - b
2 donde Z tiene distribución normal
estándar
Para muestras pequeñas b
+- b
o
que tiene distribución t-Student con
n-2 grados de libertad.

Ejemplo 11.4 Supongamos que existe una relación nula, con un nivel de
significacióno(= 0.05, entre los ingresos y gastos de
consumo, dados en el ejemplo 11.1 ; entonces el proceso de prueba será:
Hipótesis H : b = O
o
H : b O O
l
Nivel de significación: oCa 0,05
- 240-

Estadístico de Prueba: Como nuestra muestra es pequeña, tomaremos el eatadís


tico

donde + = Si
6. 1
E:(x- - 1)
2

Regla de Decisión: Rechazar H si y sólo si t > 2,306


o
El valor critico 2,306 se halla como en el ejemplo 11.3 (ver la Tabla
t-Student, para 0,975 y 8 grados de libertad)
S 1 17 76
ad:.-+ - -, -7437 = 0,0

luego t 9,21
0,076
Decisión: Como 9,21 > 2,306 rechazamos Ho. Era de esperarse, puesto
que b cae dentro del intervalo (0,5252; 0,8748) con una seguridad
probable del 95%.

1.1.9

Distribución Muestral de Yc

Ahora veamos los estadísticos corres-


pondientes a la distribución muestral del estimador Ye, de 15yx• Por las
propiedades estudiadas y bajo el supuesto siempre de que pyx tiene distri.
bución normal con media a + bx, y varianza com(h1(72; puede demostrarse
que la distribución muestral de Ye es una distribución t con n-2 grados de
libertad.
+ + + +
La medía Y , es E(Y) = E(a + b x) = E(a ) + E(b ) x = a+bx /aya
c
es decir que Ye es un estimador insesgado de "c.

La varianza de Yc estará dada por


-2
1 (x - x)
V (Y ) = =
c Y yx n
c
- 241 -
El estimador insesgado de V (Ye) es

/1
2 2 í 1 (x ;)2
CrY (5-yx n JI
E(x.-Z2
de donde r es el estimador insesgado del error estándar de Y c.
Ye

11.10

Intervalo Confidencial para Ye

Veamos ahora cuál es el intervalo con-


fidencial, que contenga a P.m
. Bajo los supuestos y distribuciones muestra
les estudiadas anteriormente, tendremos

...■ 1 + (x - x)2
L (x) =Y + t S —
S 1-042 n c-- 2 (11.20)
2...._(x.-x)

2
LI ()
(x) = - t1-a12 S
n _;,2
L-A

las cuales forman un intervalo confidencial de (1 -al) 100% para a + bx


para cualquier valor dado x. Los valores observados de esos estadísticos
pueden delinearse como funciones de x, a lo largo de la línea de regresión
observada Y , y es obvio que elle; formarán una banda alrededor de dicha
línea de regresión; por esto se dice también que se trata de bandas confi-
denciales
Y
L (X)
S

Y Y (x) = a+ +
Figura 11.7 c x

o X
X

Nótese ahora que los límites son funciones de x.


-242 -

Ejemplo 11.5 Para la regresión de los gastos desconsumo respecto de


sus ingresos obtenida en el Ejemplo 11.1 bajo el supues
to de que para un ingreso dado, el consumo se distribuye normalmente, deter
minaremos el intervalo confidencial para iMvx. Las bandas que contendrán ,
a una familia con x miles de ingreso anual, son

(x - 12,8)2
Ls (x) = 1,84 + 0,7x + (2,306)0.17) 7 vi 237,6
2
1 (x - 12 8)
L (x) = 1,64 + 0,7x - (2,306)(1,17) TU 237,6

Si se toma un ingreso de 6.000 $b. anual, se tendrá un gasto promedio


estimado de 60,40 $b. Este es un buen indicador, pero no va muy lejos; en
cambio, podemos decir con un 95% de seguridad, que las familias con un in-
greso anual de 6.000 $b., tienen un gasto de consumo promedio comprendido
entre 4.576 y 7.504 $b.
Si utilizamos la línea de regresión puede estimarse lo que gastarían
en promedio para consumo por ejemplo, las familias con un ingreso anual de
21.000 $b. Pero obviamente será mucho mejor si se estima un intervalo en
el cual esté comprendido el gasto promedio con un cierto porcentaje de cer-
teza. Supongamos que en nuestro ejemplo se desea conocer los límites de
confianza para familias con 21.000 $b. de ingreso anual, con una probabili-
dad del 95% de que el gasto promedio esté comprendido entre dichos límites.
Es análogo decir que el nivel de significación sea o..
/ = 0,05. Entonces,

(21-12,6)2 L 18,21
L (21) = 1,84 + (0,7)(21) + (2,306)(1,17)j
21 10 + 37,6
S

LI (21) = 16,54 - 1,67 4 14,07

Por tanto, se espera que con un ingreso de 21.000 $b., los gastes por
consumo promedio estén comprendidos entre 14.870 y 18.210 $b. con una pro-
babilidad de certeza del 95%.
- 243 -

Correlación

Coe6Leíente de Con/tetar-14n

Hasta ahora hemos visto, en el análisis de regresión, el problema de la


relación entre dos variables. Se hall& una expresión matemática que relacio
naba dos variables linealmente con todas sus implicaciones, la misma que ad;
más nos servia para predecir en promedio la varitión de una variable en fun-
ción de otra. Ahora examinaremos el grado de dependencia que hay entre dos
variables. La medida de este grado de dependencia se denomina coelicante
de correlación (fi )

Definición 11.11.1 El coeficiente de correlación poblacional en términos de


la covarianza entre las variables aleatorias X e Y, se
define como

I, _cov (X, Y) _ E C(X -,1) (Y -AST))


Or 67
C y E (X -A)2 2 )2
(Y -"

Esta definición, para un modelo de correlación lineal bivariante, se ba


sa en los siguientes supuestos:

Las variables aleatorias X e Y, pueden tomar el carácter de independen-


te o dependiente, indistintamente. La distribución bivariante (X, Y) es por
mal por tanto X e Y también tienen distribución normal. La relación de X e
Y es lineal, de la forma AA = a + bx, y AA = a' + b'y.
yx xy
Muchas veces, se puede obtener un buen indicador del grado de dependecía
de dos variables,calculando directamente la covarianza. Sin embargo,
el coeficiente de correlación se trata de una medida más fina, que inclusive
permite interpretar la correlación en términos de porcentajes. Para esto se
usa la medida p2 que indica aproximadamente el porcentaje de la variabilidad
.total de los latos, debida a alguna relación entre las variables. Así por
ejemplo, sip = 0,52, se puede decir que sólo un 52% aproximadamente de la
variación en los datos es atribuible a una relación entre las variables. A
esta medida /02, que es el cuadrado del coeficiente de correlación, algunos
autores le llaman coelie¿ente de detuunínac,(6n.

Recordemos que en general estamos trabajando con muestras aleatorias pa


ra tomar decisiones, bajo los supuestos de la imposibilidad de contar con to
dos los datos de la población, o que en muchos casos una muestra es suficiente
para obtener estimaciones muy buenas. Entonces se hace necesario nuevamente
contar con un estimador de /0 , Si bien cada observación aleatoria de las
variables X e Y por sí solas son independientes, las dos conjuntamente
no necesariamente son independientes. Bajo el supues to de que la población
- 244 -

bivariante tiene distribución normal, y se toma una muestra aleatoria de e-


lla, el ezamadoit máximo vemamíl de ip, es

- 1)(Yi - ;) (11.22)
02 E(y -
Eoci - ;

El coeficiente de correlación es una medid} acotada entre los valores


-1 y 1, es decir, -1 1/91 1. Por otro lado ,p toma valores comprendidos
entre O y 1, o sea O 1/0'1 1.

Ejemplo 11.6 Aplicando este concepto, a la información del ejemplo 11.1


tendremos

1.549 - 10 (12,8)(10,8) 0,959


p-r=
*/[1.876 - 10 (12,8)2 3 [1.294 - 10 (10,8)21
2
De donde r = 0,919 puede interpretarse, diciendo que existe aproxima-
damente en promedio una dependencia del 92 por ciento entre los ingresos y
gastos de consumo.

Inferencia Acerca de O

El estimador la del coeficiente de co-


rrelación poblacíonal, de la misma manera que otros estadísticos, es tam -
bián una varialbe aleatoria, cuya distribución muestral dependerá de la dis
tribución de 1O y el tamaño de la muestra. Como estamos suponiendo que la
población bivaríante es normal, entonces la distribución de p tenderá a nor
malizarse a medida que se aproxime a O y aumente el tamaño de la muestra.

En esta parte, nos limitaremos únicamente a examinar lo relativo a la


prueba de hipótesis para el coeficiente de correlación, por ser de utilidad
su aplicación práctica en la toma de decisiones, respecto del grado de de-
pendencia entre dos variables de una población bivariante.

* Para fines de cálculo, es conveniente utilizar los siguientes expresiones


equivalente: •
Ex. y. -nxy 9E:xi Yi -/lx± 51:375.
3=
- n 12)(Ily1 - n 12) ( Exi)2 I InEy1-(/_}'i)2]
(11.23)
- 245-

11.13

Prueba de Hipótesis
para fi =/

Eh este caso, se tratará de probar una


.A
proposición relativa a algún valor particular del parámetro poblacional fi.
Es usual partir de la hipótesis de que no hay dependencia entre el comporta-
miento de las variables en estudio, de manera que puede formularse una hipó-
tesis nula Ho:/4= O contra una alternativa H1: /o O 0. Si el tamado de la
muestra es grande, en este caso para /9= 0, el coeficiente de correlación
nuestral tendrá una distribución aproximadamente normal, de manera que el es
tadístico de prueba, será z = r - /2 que tiene distribución normal estandar
11
Pero en lapráctica, casi siempre se trabaja con muestras pequeñas, en este
caso, si n 1 30, el estadístico para probar la hipótesis es
51777--
t = r (11.24)
1 - r2

s. la que está distribuida como una t-Student con (n-2) grados de libertad, si
Ho es verdadera.

Ejemplo 11.7 (Prueba para = Tomemos en cuenta nuevamente la in


formación correspondiente al eem-
plo 11.1. Supongamos que no se hizo absolutamente ninguna inferencia sobre
esta información, es decir que no sabemos nada respecto del comportamiento
conjunto entre lo que ganaron ni gastaron en consumo anualmente dichas
1.1.as. Pensemos hipotéticamente que tal vez no hay ninguna dependencia en -
tre las variables. Entonces, siguiendo el proceso general de prueba tendre
mes:

Hipótesis:

Hl : /0 * O

Nivel de significación: Tomaremos un nivel de significación del 5%, o


sea o( = 0,05
Estadístico de Prueba:

t = r 1_12

que tiene distribución t-Student ccil n-2 grados de libertad, y r es el esti


xador máximo verosímil de /9.
- 246-

Criterio de Decisión: Rechazar 11o, si y sólo si 1 t 1 > 2,306

Cálculos: 8
t 0,959 j 1-0,919 9,53

Decisión: Se rechaza la hipótesis de que no existe ningun grado de dependen


cia. Esto tenía que ser así, puesto que en el ejemplo 11.6 vimos
que la correlación era 91,9%,
Para finalizar este capítulo, veamos algo más que puede sernos de utili
dad práctica. Con la prueba anterior únicamente aseguramos que existe depen
dencia entre dos variables de una población bivariante, al rechazar la hipó-
tesis nula. Perc, no alcanzamos a conocer en qué grado están correlaciona -
das dos variables. Entonces habrá que formular otras hipótesis, en que jo
tome otro valor que puede estar próximo a uno de los dos extremos, por ej2mr
plo,P0 = 0,9,71 = 1, /00 = -0,8, etc. y contrastar con alguna hipótesis al
ternativa apropiada.

Para valores de p distintos de cero y para muestras pequeñas, la distri


bución de r es bastante asimétrica; por esto, R.A. Fisher utilizó la trans-
formación
1 1 + r 1 2,3026 . logio 1 + r * (11.25)
Z = — ln 1 - r - 1 - r
r 2
que tiene distribución aproximadamente normal, excepto para muestras muy pe-
queñas. Además Fisher mostró que
1
E (Zr} = Z y 6--z 77175
Por tanto, el estadístico de prueba será
Z -
r P
(11.26)
r
que tiene distribución aproximada a la Normal estándar.

Ejemplo 11.8 (Prueba para /1 # 0) Tomand)los supuestos de los Proble


mas 11.1 y 11.7, formulemos la hipó.
tesis H : /D= 0,90, es decir que estaríamos suponiendo la existencia de una
dependencia grande entre ingresos y gastos de consumo. Entonces, las hipóte
sís serán
H : = 0,90
o
H : p # 0,90
1
Se trata de probar que E es verdadero con un nivel de significación
del 5%. Como el estadístico 3e prueba se distribuye como una normal estan-
dar, entonces para o(= 0,05, la regla de decisión será: Rechazar Ho si y sólo

El símbolo ln, indica logaritmo natural o Neperiano, cuya base es


e = 2,71828...
,A•

-247-
si Z < -1,96 6 Z ) 1,96

Realizando cálculos tenemos

1
Zr = 0,959 - 7 + 0,959
0,959
(2,3026) log 1,93332

210 = 0,90 1

2 (2,3026) log
,
1 + 0
1 - 90 - 1,47216

Luego: Z = 1,93332 - 1,47216 - 1,22


1
N/I0-3
Entonces como Z a 1,22(1,96, aceptamos la hipótesis. De manera que
podemos concluir diciendo que el coeficiente de correlación es tan grande co
.mo 0,90. En otras palabras, la diferencia entre a y r no es significativa.
ro

11.14

Ejercicios

1. La siguiente tabla contiene las estaturas y los pesos de una muestra de


hombres adultos.

Estatura Peso Estatura Peso


cms. Kg. cros. Kg.

155 61,5 157 61,5


152 50,0 165 72,0
152 54,5 162 66,0
155 57,5 178 72,0
157 63,5 183 84,0
152 59,0 178 82,0

1.1 Dibuje un diagrama de dispersión 4. 4.


1.2 Obtenga la regresión estimada Ye =a +bx
1.3 Calcule e interprete un intervalo de 90% de confianza para b.
1.4 Calcule e interprete un intervalo de 95% de confianzaiLA =65
1.5 Pruebe la hipótesis Ho: b = O f ylx
1.6 Pruebe la hipótesis Ro: b = 6
1.7 Prediga el peso de un individuo que tiene una latura de 168 centí-
metros. Dé un intervalo de predicción.
- 248 -
1.8 Estime la altura de un hombre cuyo peso registrado es de 77,5 Kgs.
- Qué proporción de la variación de Y está "explicada" por la regle
sien del peso en la altura?
2. En un estudio de regresión se hicieron los siguientes cálculos prelímina
res: x = 20; Y = 22; 2::(x+X)2 225; 571(y-02 s 414; 57 ..(x-1)(y-1')=180•
n = 32
2.1 Cuál es la estimación pata el coeficiente de regresión de la pobla -
ejem?
2.2 Cómo interpreta usted el coeficiente de regresión b de la población?
2.3 Obtenga la ecuación de regresión de la forma Ye = A+ +
2.4 Pruebe la hipótesis Ho: b = 1

3. Verificar la hipótesis de que /9 = 0,7, si una muestra de tamaño 50 día.


r = 0,6.

4. De una muestra de 10 elementos, se calcularon las siguientes sumas de


un problema de correlación:

71;EY = 70; 2::x2 = 555;51y2 = 526,Exy = 527


4.1 Hallar el valor de r.
4.2 Existen evidencias de una correlación estadísticamente significativa?
4.3 Determinar los límites de confianza para el valor del? •••

4.4 Es posible trazar el diagrama a base de la información dada sobre es-


ta situación? Por qué?

5. Una compañia deseaba conocer si el ingreso personal neto es un indicador


confiable paca predecir las ventas de la compañia. Se tomó la serie de
datos de los filtimos 11 años.

Año Ingreso Personal Ventas de la Compañía


neto ($) (en miles de $)

1963 1890 402


1964 1900 404
1965 2080 412
1966 2270 425
1967 2390 426
1968 2520 436
1969 2570 440
1970 2740 447
1971 2930 458
19 72 3080 469
1973 3160 469

5.1 Trace un gráfico de puntos con estos datos. Qué variable trazaría en
el eje de las X? Por qué?
5.2 Estime la ecuación de regresión lineal usando el método de los mínimo/.
cuadrados.
- 249 -
5.3 Qué relación describe la ecuación de regresión?
5.4 En promedio, cuales serian las ventas de la compañia cuando el ingre-
so neto personal fuera 2.500 $? Use un intervalo estimado con un coe-
ficiente de confianza de 95%.
5.5 En la pregunta 5.4 trabaje con un ingreso neto de 3.000$.
5.6 Por qué los intervalos en 5.4 y 5.5 no son de la misma amplitud, a pe
sar de que se ha usado en ambos casos el mismo coeficiente
za? Explique. de confian
5.7 El ingreso personal neto en 1974 se espera que sea 3250 $ Cuál es la
predicción para las ventas de la compañia para 1974? Es el intervalo
de predicción lo suficientemente preciso para ser útil? La adminis -
tración desea tener un intervalo de predicción con una amplitud de
4- 2% y un coeficiente de confianza de 95%.
5.8 Estime b con un intervalo de confianza de 98%.
5.9 Proporciona su intervalo de confianza alguna indicación sobre si exis
te o no una relación entre el ingreso neto personal y las ventas de
la compañia?
5.10 Calcule loe coeficientes estimados de determinación y correlación.
Cuál es el significado del coeficiente de determinación?
- 250 -

11.15

Modelos de Regresión Múltiple


y no Lineales

Lo que vimos en el capítulo anterior


fué la relación promedio entre dos variables, mediante una función lineal
simple. Es evidente que las más de las veces se utiliza el modelo lineal
estudiado, para estimar la interrelación de dos variables, pero no siempre
es adecuado para otros casos, como aquellos en que el esparcimiento de los
datos no siguen una tendencia lineal. Así, en muchas actividades económi-
cas, se puede describir mejor la relación con una función no lineal, o sea
con una curva (como en los casos b,c,e y f, del Gráfico 11.1). Por otro la
do, toda variable en alguna medida depende de más de una variable indepen-
diente.
Así por ejemplo, el peso de los niños comprendidos entre 5 y 12 años,
dependerá de la edad y estatura; la producción anual de maíz por hectárea
dependerá de la cantidad de lluvia, cantidad de fertilizante y temperatura
ambiental promedio; el ingreso, dependerá de los años de experiencia, del'
coeficiente intelectual, años de estudio, etc. •

11.16

Regresión Lineal Múltiple

En economía como en los demás campos


de investigación, generalmente existe interrelación entre varias variables,
tal que la variación de una de ellas está relacionada con el comportamiento
conjunto de las otras. Cuando la variable dependiente está relacionada a
dos o más variables independientes, se puede obtener un resultado más real
analizando todas las variables conjuntamente.
En vista de que la experiencia enseña que muchos conjuntos de varia -
bles tienen una relación aproximadamente lineal y además que las funciones
lineales son de fácil manejo, en esta sección intentaremos estimar la varia
ble que interesa mediante una función lineal. Este método de análisis se
llama xegte.sión linea/ matípte.
Hay muchas maneras de representar simbólicamente al conjunto de varia-
bles, sus relaciones y sus medidas, las que cambian de acuerdo al criterio
de cada autor, nosotros trataremos de seguir en lo posible una nomenclatura
simple, encuadrada al contexto que se viene presentando.
Asumamos que la variable dependiente Y está relacionada con k varia -
bles independientes XL, X2 Xk, mediante una función lineal que será la
media de cada subpoblación Y para valores x. dados de las X. (iel,...jk), o
- E(Ylxx2 xn) a 1 b 1 x1 + b2 x2k x x. (11.27)
sea /4,5'x1x2
- 251 -

que ea la ecuación de regresión lineal multivariante, donde a y las b.


(i=1,..., k), son los coeficientes de regresión poblacional. Gráficaménte es
ta relación es un hiperplano k+1 dimensional.

Vemos que un valor individual de Y está definido por

y = E (Ylx,,x2,...,xk) + e (11.28)
que nos indica la relación de una observación de Y en el plano de regresión
multidimensional, donde la variable aleatoria e es la diferencia (error o
desviación) entre un valor observado y su hiperplano medio poblacional (va-
lor medio de Y asociado con un conjunto de valores x. fijos de los Y.
(i=1 ..... k).)
Como en el caso de la regresión lineal simple, se tratará de estimar
los coeficientes de regresión poblacional, mediante una función que haga mí
nima la suma de los errores. Siguiendo el método de los mínimos cuadrados,
tendremos que hallar los valores de a y b. (i=1,...,k), que minimicen la ex
presión

Q = e2 =E EY - E (Ylxi,x2,...,mk)] 2
(11.29)
= 2:: (y - a - bixi - b2x2...- bkxk)2
.lo desarrollarers detalladamente la forma de hallar los estimadores mí-
nimos cuadráticos a y los b.+, puesto que se trata prácticamente de una ge-
neralización del teorema 11.k.1 particularmente en lo concerniente a la de -
mostración. De manera que es cuestión de hallar derivadas parciales en
(11.29) respecto de los coeficientes, igualarlos a cero, y luego obtener las
ecuaciones normales, o sea

- 221(y - a - b1x1 - b2x2-...- bkxk) (-1) = 0


"Da
-
bQ 2E(y - a - b lxi - b2x2-...- bkxk) (-x1) = O
1Db 1

1)(1
"Db 2E(y-a-b 1 x1-b x--b
... x.) (-C=0
k 22 kThe
de donde

5::y = na + b
l 2::x l
b2 11:x2 +'" bk
Ex1Y • a EX + b1 23(2 + b21 x + bicExixk
1 2+
Ex2y = a Ex2 + b 2::x x' + b
1 1 2 2 x2
2 + + b
k x2>tk

ExkY a Exk + b i Eximk 11112xk bk2--xl


- 252 -
Sistema que recibe el nombre de Acuacioma4 noltmale4.
Indudablemente que si el número ecuación es grande, habrá que recurrir
a algún método matricial para encontrar los valores de a y las b., que serán
los estimadores mínimo cuadráticos de los coeficientes de regresión.

A continuación veremos el caso particular de tener dos variables inde -


pendientes. Porejemplo, Y puede representar la cantidad de ventas de cada
vendedor en una compañia, X los años de experiencia en ventas, y X2 el coe
ficiente de inteligencia. Él estudiante fácilmente podrá generalizar sobre
esta base, a casos de tener tres o más variables independientes.

Supongamos que tenemos asociadas tres variables, una dependiente Y y


dos independientes, X, y X * y que la relación de Y es lineal respecto de
3
X2 y X,, entonces tendremos el modelo de regresión lineal trivariante para
la población, expresado por

E (Y1x2, x3) • 11'5,x2x3 = a + b2x2 + b3x3 (11.30)

De esta manera, un valor observado de Y, será

= /Myx x + e
yi 23 l
Los valores de a, b2 y b3 que hagan mínima la función
)2
9 = 2:lei =;::(Yi 1-1( x2x3
pan estimadores mínimo cuadráticos, que podemos designarlos por a+,
b y b Las ecuaciones normales para hallar estos valores, se obtienen fa
2 3.
ci lmente siguiendo el proceso de las derivadas parciales, etc.; y se tendj

Ely = na + b2Ex2 + b 5:1x


3 3
ryx2 = aEx +
2 + b2Ex2 b3Fx2x3
(11.31)

ryx3 = arx3 + b2Ex2x3 + b3Ex3


Algunos autores suelen hacer transformaciones en las variables, para fa
cilitar la solución del sistema anterior, pero en la actualidad pierde un po
co el uso de métodos simplificados de cálculo, por la facilidad de contar
con máquinas electrónicas. Por esto, se recomienda sustituir los valores de
las sumatorias y resolver el sistema matrieialmente.

Luego la función de regresión mínimo cuadrática estimada será


+
= a + b
Y
c 2 x 2 + b 3 x3 (11.32)

la que gráficamente representa un plano promedio entre las observaciones de

* Tal vez habría sido más lógico poner XI ea lugar de Y.


- 253 -

Y sobre los valores X2 y X3. (figura 11,8)

t Y
E I
' x2' x

+ +
Y ■a + b2 x + b x
c 2 3 3
e.

x31

X2 Figura 11.8

El coeficiente á es la intersección entre el plano y el eje Y. %sea


que la elevación obtenida es el estimador de a. Las cónstantes 14 y b3 se
llaman cogicientea de negeeeídn pakeiat;b el estimador de b, que mide la
le- cantidad por el cual un cambio unitario en211:, es esperado para Y cuando X,
permanece constante, y b-1-
3 es el estimador de-b3, que mide la cantidad de Jara
bios en Y por unidad de cambio en X cuando X2 permanece constante.
3
Algunos autores usan la siguiente eirabologla

X
1(23)c = a1.23 b12.32:2 b13.2X3
en lugar de la que estamos utilizando. Donde X1(23)c nos indica que es la
primera variable (dependiente) y que existen dos variables independientes X2 y
X,; al 23 ea el coeficiente de regresión independiente, cuyo subíndice irsdi
ci que a variable dependiente es X1 y que hay dos variables independientes
X2 y X ; b12 , representa el coeficiente de la variable independiente X2 cuan
12
.-do la variaoló dependiente es X. y la otra variable independiente es X,. Ge
neralizando, b 4235 representaría el coeficiente de regresión de la able
vari
independiente Aí siendo X la variable dependiente y que además existen las
variables independientes A2, X3 y X5, etc., etc.

Creemos que es más simple la notación que venimos presentando, ya que en


cada problema están completamente definidas cuántas variables independientes
existen y cuál es la variable dependiente, En todo caso, el estudiante es li
bre de elegir segGn su criterio, inclusive una notación propia.

Es importante revisar los conceptos respecto de la distribución de La va


riable Y cuando estudiamos el modelo de regresión lineal simple de doe varia
bles, puesto que dichos supuestos son también aplicables en este caso.
-254-

Problema : El gerente de una Cía. de Seguros desea estimar el monto total de


préstamos que hará durante el año 1974, sobre las pólizas emiti-
das por su compañía. Para esto, los consejeros de inversiones de la Cia. de
ciden hacer un estudio al respecto en base a resultados obtenidos durante
los primeros 10 años de existencia de la Cia. , tomando en cuenta además
otras variables como ser el Ingreso Nacional y la población estimada, que en
juicio de ellos, tienen influencia sobre los préstamos.

TABLA 11.3

Préstamos hechos
sobre pólizas
Año por la Cia. de Ingreso Nacio - ?oblación esti-
nal (en millo - mada
Seguros (en mi-
nes de $) (en miles)
les de $) Y
X2 x3
1964 3,6 5 127
1965 3,5 128
1966 3,.4 6 129
1967 3,3 6 130
1968 3,3 7 131
1969 3,2 8 133
1970 3,0 10 134
1971 13 136
1972 2,6 16 138
ti
1973 2,3 18 140

Total 31,1 96 1.326

El estudiante fácilmente puede obtener la función de regresión, reali-


zando los cálculos necesarios para aplicar el sistema de ecuaciones normales
(11.31).

Puede surgir una pregunta en relación a la correlación mGltíple. Es de-


cir, cuál es el coeficiente de correlación simultáneo para un modelo multiva
riente? Generalmente en los casos en que existen más de una variable inde -
pendiente, se trabaja con los ~tantea de eatketaeLon parcial, El cual
consiste simplemente en determinar la correlación entre la variable depen -
diente y una sola variable independiente, considerando a las otras variables
como constantes. De manera que se reduce al cálculo simple que estudiamos en
la sección 11.11.

11.17

Regresión no Lineal

Si la dispersión de los datos observados


no siguen una tendencia lineal, tal como dijimos, habrá que intentar una fun
tia no lineal, que estime en promedio, el comportamiento de las variables.
- 255 -

Si por ejemplo la tendencia de las observaciones sigue una línea parabó-


lica podemos utilizar la función
2
Y = a + bx + cx

que aplicando el mismo criterio del procedimiento de los mínimos cuadrados,


tendríamos que hallar los valores de a, b y -C, tal que minimicen la expre -
e/6n
22
Q=E(Y. - a-bx.-cx )

Los pasos que se siguen son idénticos al que vimos en el Teorema 11.11.1
De ésta manera se obtendrá el siguiente sistema de ecuaciones normales.

Ey = na + bEx + crx2

Exy = arx + bZIx2 + cEx3 (11.33)


511x2Y = allx2 + bEx3 + c 2:: x4

de donde, resolviendo el sistema, se obtienen los estimadores mínimo cuadrá-


ticos a+, b+ y c+ de a, b y c respectivamente.

La generalización a un polinomio de k-Isimo grado de la forma


Y = a + a x + a x2 + + a xk
o l 2 k
es inmediata.

Un caso particular de la función polinomial, es.

Y=axb
Si la función
b c
Y = a x x
2 3
se ajusta mejor a una distribución de datos, podemos seguir el artificio de
aplicar logaritmos a la identidad, es decir

log Y = log a + b log x2 + c log x3

ahora, si hacemos los siguiente cambios: log Y - Z, log a = k, log x2 = r


y log x3 = s, entonces

Z k + br + cs

no es otra cosa que una función lineal múltiple, con variables independientes
r y s.

Otro tipo de función de bastante aplicación en el análisis de asociación


de variables, es la función expoen cial que puede estar dada por la expresión

Y = a bx
- 256 -

En casos como éste, se sigue el procedimiento de aplicar logaritmos, c


sea
log Y = log a + x log b

Ahora si log Y = Y', log a = a' y log b = b',

tendremos
Y' = a' + b'x

que no es otra cosa que una función lineal bivariante. De manera que podemos
aplicar todo cuanto estudiamos en relación a este tipo de función. Del mismo
modo, es posible linealizar otras funciones. Por ejemplo, si en
1
Y =
a+bx 1
tomamos el reciproco de Y, z w 7 , entonces
= a + bx
que también es una función lineal simple.

Finalmente, mencionamos otras funciones que también son linealizables:

1= a + bcx (Logística)
Y
ln Y = ln a + (log b) . cx (Gompert)

Y = aebx

Y = a + 15-
x

El único cuidado que debe tenerse al realizar casibios de variable, como


los anteriores, es que al finalizar el orocedimiento debe volverse a las va-
riables originales cuando es necesario

11.18

Ejercicios

1.Deducir las ecuaciones normales y determinar los estimadores mínimo cus -


dráticos para todos los modelos no lineales que se indicaron en la última
sección de este capítulo.

2.Hallar la función de regresión mínimo cuadrática, dada la información de


la tabla 11.3.

3.Cómo puede determinar si la relación entre dos variables es lineal o no li


neall.
- 257 -
4.Deducir las ecuaciones mínimo cuadrgticas para el ajuste de una curva del
tipo y = ax + b/x a un conjunto de n observaciones.
5.Los datos que se citan a continuación corresponden a las 3 variables: pul
donor (Y), puntuación sobre la inteligencia (X2) y horas de estudio (R3).
Hallar la ecuación del plano de regresión de y con respecto a x2 y x3, da
do que

5:1-x = 250,11x x = 33,x3 = 3611x2y = 106, ¿x3y


2 2 3 = 22
6.En el díselo de un modelo de simulación es necesario conocer la función
consumo de productos agropecuarios. Se dispone de la siguiente informa-
clon.

Consumo de Ingreso Importaciones


AÑOS productos agro- disponible de productos
pecuarios agrícolas
$ $

1967 39 48
1968 9
40 54 10
1969 45 55
1970 12
43 58 11
1971 50 62
1972 14
53 64 18
1973 62 69 20

6.1 Ajustar una función de la forma

C = a + b Y + cM

donde C = consumo de productos agropecuarios


Y = ingreso disponible
M = importaciones de productos agrícolas
a,b,c parámetros de regresión
- r
6.2 Calcular los coeficientes de correlación parciales.
- 258 -

CAPITULO /2

MIMOS INDICES

En el presente Capítulo, veremos tan só


lo los lineamientos generales y básicos, tanto de los conceptos como de los
métodos de construcción de los números índices. Dado que es posible obtener
un número extenso de variantes según sea el caso específico de aplicación in
cluso dentro de un mismo campo, ver todo en detalle implicaría un trabajo in
terminable. Las variables que se estudiarán en lo que sigue, bien pueden
ser variables aleatorias, y es más, pueden considerarse como provenientes de
muestras aleatorias, De manera que es aplicable a los números índices todo
lo relacionado con las distribuciones de probabilidades que vimos en los ca-
pítulos precedentes.

12.1

Introducción

Anteriormente hemos estudiado una serie


de indicadores o medidas que servil:1n para diferentes fines. Ahora veremos
un nuevo tipo de indicador que se utiliza para medir, en cierto modo, el com
portamiento de una o más variables a través de sus recorridos, que recibe el
nombre de n1imen0 índíces Si bien se trata de un indicador importante en es-
tudios económicos y también en otras disciplinas, no es una medida muy preci
ea.
Los números índices constituyen una medida útil mediante la cual pueden
ser resumidos los cambios de datos estadísticos, de informaciones pasadas,
de precios, cantidades u otros. Se usan como herramienta en el análisis de
muchos problemas relacionados con la comercialización, producción, distribu-
ción, etc. A medida que vayamos estudiando, se podrá apreciar la ductilidad
de los números índices respecto de sus aplicaciones.
Uno de los problemas importantes en estudios económicos se trata de la
medición de agregados de variables heterogéneas. El agregado puede ser una
cantidad física, tal como stocks en inventarios, los flujos de ingresos, lis
tes de precios de varios tipos de insumos, precios de Vett65 de proveedores
de artículos de consumo, etc. Los posibles cambios que se presentan, pueden
ser medidos mediante los números índices. Estos cambios se realizan tomando
en cuenta un período llamado nen-Codo &ama. Cuando se trata de medir los cam
-,
bios de una sola variable sirle, recibe el nombre de adite 4impte; en tan
to que si se trata de un índice construido en base a un grupo de variables,
-259-

se denomina ZW44ce. umpauto. A continuación veremos en qué consisten estos


conceptos nuevos,

12.2

Números Indices Simples

Se trata del case mis sencillo de entre


todos los índices, ya que se construye generalmente a partir de una serie de
tiempo concerniente a una sola variable. Un Indice simple no es más que la
razón de dos números, la comparación relativa entre un valor observado compa
rade con otro, éste último es el que sirve de hese para la comparación. En
términos de una serie de tiempo, el cálculo de índices simples puede apre
ciarse en la tabla 12.1

TABLA.12.1 Indice simple (Base te0)

Números Indices
Año Variable Simples
t X
o x., (xclima).100e 100
1 xl
-1-
x .100
ro
2 x2 11 ..
no 100

k xk xk
.100
xt

donde las xl representan los valotes de <a .ariable, la que puede ser precio,
canTidad, etc. El período base pude ser cualquier ano t. Por simple inspec
ción, se ve que el índice para el período base es siempre igual a 100,

Eiemp...o 12.1 Eh la Tabla 12.2 se ilustra la construcción de númerta ín-


dices simples para una colección de datos hipotético: res-
pect; de las ventas de una compelía de tabacos.
- 260 -

TABLA 124 Indices de ventas simples.

Ventas Indice A Indice B


/Lao
(miles $) (1970=100) (1968-1969=100)

1966 75 60 79
1967 115 92 120
1968 84 67 88
1569 107 86 112
1970 125 100 131
1971 128 102 134
1972 147 118 154
1973 180 144 188

El número índice para cada año se interpreta en términos del período base.
Por ejemplo, el número índice A para 1973 quiere decir que las ventas aumenta
ron en un 44 % respecto al año 1970. El índice B se calculó usando como base
el promedio de las ventas de los años 1968 y 1969 (que es, 95.500 9. Este
caso es usual cuando un sólo año no es representativo como para ser considera
do año base.

En consecuencia, un índice simple está dado por la relación

I = 100 (12.1)
x
o '
donde x es el valor de la variable del n-ésimo período, y x el valor de la
o
variabl2 en el período base.

Veamos ahora los índices simples mediante el método de amnegado4, cuando


se tienen distintos artículos y diferentes unidades de medida. En cuanto a
las notaciones para el cálculo de los números indices, optaremos por seguir la
misma nomenclatura que siguen la mayoría de los textos.

La siguiente tabla de precios y cantidades de cuatro artículos cualesquiera


con distintas unidades de medida, la utilizaremos para explicar la mayor par-
te de nuestro estudio, a manera de ejemplo y modelo.

TABLA 12.3 Precios unitarios y Cantidades de tres años, para los artícu-
los A,B,C y U.

Precio por Unidad Cantidad


Art. Unidad
1971 1972 1973 1971 1972 1973

A docena 1,20 1,25 1,50 9,000 12.500 13.000


litro 10,00 11,25 12,80 500 500 400
C libra 7,80 8,00 9,20 2.000 3.000 3.500
D kilo 6,00 7,50 9,00 2.500 3.000 4.000
- 261 -

Si nuestro interés es determinar el bldice de peeeas (IP) por el méto-


do de agregación simple, primero se suman los precios de todos los artículos
para cada año y luego se calcula el índice en función del año base elegido;
es decir
1::1) (12.2)
IP • (100)
ro
donde 1::p indica el total de los precios del n-ésimo año, y 5::po la suma
n
de los precios del año base.

Ejemplo 12.2 Determinemos el índice de precios simple de agregados, to


mando como el año base a 1971, para la información de la
Tabla 12.3. Los cálculos se dan en la Tabla 12.4.

TABLA 12.4 Cálculo del índice de precios de cuatro


artículos mediante el método de agrega-
ción (1971-100)
1971 1972 1973
Artículo
Po pl P2
ir
A 1,20 1,25 2,50
B 10,00 11,25 12,80
C 7,80 8,00 9,20
D 6,00 7,50 9,00

Total() 25,00 28,00 32,50


IP
1971..100 100 112 130

Una observación interesante es que, si en lugar de calcular los índices


de los totales, calculamos de los promedios de los precios, el índice no se
altera. Por ejemplo si en la Tabla 12.4, en lugar de loe totales ponemos
los promedios, tendremos:

1971 1972 1973


Po PI P2
Promedio 6,25 7,00 8,125
IP 100 112 130

Así que es indiferente tomar los totales o los promedios.

Otra característica obvia, es que cualquier cambio de precio en algar


artículo, implica cambio de indice.

De la misma manera que se calculó el índice de precios, podemos deter-


minar el índice de cantidad (IQ) simple por el método de agregación. Es de
cir,
- 262 -

IQ qn (100) (12.3)
--o
dondeLq ea la suma de las cantidades del n-ésimo período, y:ECIo el agre-
gado de as cantidades del año base.

Otro tipo de índices simple, son aquellos que se obtienen como Pnomedío
Slmsole de Indíce4 Reiatívoa. El promedio simple de relativos es, en efecto,
una media aritmética de relativos. Así, el índice de precios por este mé-
todo viene dado por
19n
—) loa
/P `P o (12.4)
n

y el índice de cantidades, por


qn
% (-100
)
(12.5)
IQ
n

De manera que, para cacular índices por este método, es suficiente ha-
llar los indices de cantidades simple (12.1) para cada artículo, y luego pro
mediarlos de acuerdo al número de artículos.

Ejemplo 12.3 Determinemos ahora el índice de precios para la informa-


ción de la Tabla 12.3, por el método de promediar los ín-
dices relativos de cada artículo. La Tabla 12.5 nos muestra estos cálculos.

TABLA12.5 Cómputos del promedio simple de índices


de precios relativos de cuatro art. (1971=100)

1971 1972 1973

Artículo P1
=1.100 .100 P2
—.100
Po po Po

A 100 104,2 125,0


8 100 112,5 128,0
C 100 102,6 117,9
D 100 125,0 150,0

400 444,3 520,9


Indice
Precios 100 111,1 130,2

El índice IP = 130,2, nos indica que en promedio los precios tuvieron un


incremento de 30,2% en relación al año 1971.

Por este mismo método, el índice de cantidades (IQ) para la información


de la Tabla 12.3, se da en la Tabla 12.6
- 263 -

TABLA 12.6 Cómputos del promedio simple de índices


de cantidades relativas,de cuatro artí-
culos (1971..100)

1971 1972 1973


Artículo
(q o /qo )100 (q lq o )100 (q2lo,o)100

A 100 138,9 144,4


B 100 100,0 80,0
C 100 150,0 175,0
D 100 120,0 160,0
400 508,9 559,4
IQ 100 127,2 139,9

A este tipo de índices, algunos autores los llaman índícea de aetatívoa,


o promedio de relativos no ponderados.

Recordemos que la media aritmética es afectada fuertemente por la exis-


tencia de valores extremos. Entonces, los índices que acabamos de ver, por
tratarse de promedios de relativos, están también influenciados por relativos
extremos. Por ejemplo, si una partida poco importante aumenta marcadamente,
aumentará también el índice, lo que puede desvirtuar el verdadero promedio de
las partidas más impotentes. Esta dificultad se salva ponderando los valo -
res de precios o cantidades de acuerdo a la importancia de las variables. En
la sección que sigue veremos cómo se calculan índices ponderados de relativos,
que son los más importantes en la investigación económica.

12.3

Indices de Relativos
Ponderados

Como dijimos al finalizar la sección an


teríor, veremos adice4 compautna, los mismos que se obtienen promediando
los valores relativos, ponderándolos adecuadamente conforme a la importancia
de cada variable.

Antes de nada, recordemos que el "valor" de varias unidades de un mismo


artículo desde un punto de vista simple, es la multiplicación del precio por
la cantidad, esto es, y = p.q. Análogamente, el valor de un agregado de va-
lores esL_v nrIpq.

Si llamamos poqo al valor del año base, y promediamos el índice de pre-


-cios relativos ponderando por estos valores, tendremos
- 264 -

O )* Poqo
Po . 100 = FPncill • 100 (12.6)
Poqo
57.:P000
que es el Ud:Cu de Pítecio4 de LaSpeystea (In).
En forma análoga para las cantidades, se tiene

E:(29 Poqo
O0 100 = 100 (12.7)
2::P0qo 2::Pcgo
que es el Indice de CanUdade4 de LASPEYRES
Ejemplo 12.4 Calculemos el índice de precios ponderados con los valo-
res del ato base, para la información de la Tabla 12.3.

21S .. 100 (Ato base: 1971=100)


TABLA 12.7 Cálculo de IPL = —1
Pogo
•,
Cantidad P R E C I 0 Valor Teórico
1971 1971 1972 1973 1911 1972 19(3
Art.
go Po P1 P2 Poqo Plclo P2clo

A 9.000 1,20 1,25 1,50 10.800 11.250 13.500


B 500 10,00 11,25 12,80 5.000 5.625 6.400
2.000 7,80 8,00 9,20 15.600 16.000 18.400
D 2.500 6,00 7,50 9,00 15.000 18.750 22.500
TOTAL 46.400 51.625 6o.800
IPL 100 111,3 131

El índice 111,3 podemos interpretar: "La lista de productos vendidos


en 1971 produciría una utilidad de 11,3% más a precios vendidos en 1972 que
la utilidad obtenida en 1971". En otras palabras, de acuerdo a este índice
los valores vendidos en promedio cubre 11,3% de 1971 a 1972.
De la misma manera podamos calcular los índices de cantidad de Laspey-
res (usando 12.7).
Por otro lado, si consideramos el valor tal que se considere el precio
del período base y la cantidad de un período dado, es decir poqn como ponde
ración, tendremos

• Erto P°111 . 100 EPnqn (12.8)


, 100
EPoqn 2__ Poqn
que es el Indice de PneeZo4 de PAASCHE FIPPJ.
-265-

Ahora si consideramos los relativos de lea cantidades y ponderamos con


pncio, tendremos .

Fi(?) Pngo
o 100 27:Pncin 100 (12.9)
EPnqo Pn o
que es el adíee de cantidade4 de PAASCHE (IQP).
Ejemplo 12.5 Veamos el cálculo del índice de precios de Paasche, para
la información de la Tabla 12.3.

TABLA 12.8 Cálculo IPP n 100 (Año base 1971 100)


EPn
oin
PRECIO CANTIDAD
Artículo
1971 1972 1973 1971 1972 1973
Po 1 P2 go gl '
12

A 1,20 1,25 1,50 9.000 12.500 13.000


B 10,00 11,25 12.80 500 500 400
C 7,80 8,00 9,20 2.000 3.000 3.500
51. D 6,00 7,50 9,00 2.500 3.000 4.000

Valor actual en
el año dado Valor teórico

1971 1972 1973 1971 1972 1973


popo P11 P2(12 popo Pog1 Pog 2

10.800 15.625 19.500 10.800 15.000 15.600


5.000 5.625 9.120 5.000 5.000 4.000
15.600 24.000 32.200 15.600 23.400 27.300
15.000 22.500 36.000 15.000 18.000 24.000
46.400 67.750 92.820 46.400 61.400 70.900
IPP 100 110,3 130,9

El índice 130,9 para 1973 se puede interpretar: "La lista de produc -


tos vendidos en 1973 da un ingreso de 30,9 2 más que la del período base".

De las tablas 12.7 y 12.8, podemos facilmente obtener los siguientes


indices:
- 266 -
101 - 111542 100 = 70. 00 . 100 = 152,8
—2--
2.__Pollp k6.400

IQP - EP21-2 100 - 62'820 = 152,7


EP2clo 60.600

Un índice compuesto de bastante utilidad, es el adict de FISHER (lla-


mado también, índice ideal). Se trata de la media geométrica de los indi -
ces de Laspeyres y Paasche. De esta matera, el índice de precios de Fischer
(IPF), está dado por

2::P40 2:Pncin (12,10)


IFF = IPL x IPP =
EPollo p0 n
análogamente, el índice de cantidad de Fischer (IQ?), es

IQF 5::PoQn
IQL x IQP
JJJ EPoqo flag°

12.4

Indices de Valor y
Pruebas de Consistencia

A partir del concepto simple, de que


el valer es e:julvalente al precio por la cantidad, v = pq, es de esperar
que para un año dado el índice de valor (IV) sea equivalente a la multiplí
catión del Índice de precios (IP) y el índice de cantidad (IQ), es decir
IV = IP x IQ (12.12)

El indice ae vato2 está dado por la expresión

111 = 100 (12.13)


III/0410
Si se cumple la relación 12.12, entonces el índice de valor puede uti
lizarse como pnaeba de comatencía de los índices de precios y cantidades.
No tcda ccmbinación de indices de precios e indices de cantidad satisfacen
esta relación, así por ejemplo,

IPL x IQL f IV
ya que
EPnc-o x
EPocin EPncln
t
7710 ZIWO EPoqc
- 267 -

también

IPP x IQP ¢ IV
En cambio los índices de Fische?, sí satisfacen la relación 12.12, es
decir

IPF x IQF = IV

ya que
2
E:Pncin E:Pbeln Ar:Pncill) 5:1Pnqn
tr
Scr
á rwit ri
ptR r1/2<70 nocro E 0V0
Por otro lado, una combinación entre índices de Laspmyres y de Paashe,
también cumplen la relación indicada, así,

IPL x IQP - IV
y IPP x IQL m IV

La forma de probar la consistencia entre loa índices de cantidad y pre-


cio, se la conoce también como el criterio de keverthibitAdad de éactoke6.

e Otro criterio para juzgar los números índices, es el de la Aevemikaí-


dad tempo4at. Este método nos dice que si loe números índices de dos perío-
dos cualesquiera son construidos por el mismo método, pero con bases inver -
Lides, entonces existe reciprocidad entre ellos. Ea decir, que el producto
de los índices debe ser igual a la unidad. Por ejemplo, si el Indice de pre
cica para 1973 ea 160 con 1966=100, entonces el

Indice de 1968 con base 1973, es IP le100—.100 = 62.5 1


160
Luego el producto de los dos índices, da

160% x 62,5% 5 1,6 z 0,625 = 1


Una buena cantidad de los índices simples satisfacen esta prueba de re-
'0,ersibilidad, y no así muchas fórmulas de los índices compuestos.

12.5

Otros aspectos relacionados


con Números Indices

Las fórmulas que hemos presentado ante


".riormente, sirven de base para la construcción de muchos otros índices. EP
general, puede decirse que la Única variante radica en adecuar copveniente -
mente lae ponderaciones, según sea el caso particular que se esté tratando,
- 268 -

con el fin de obtener indicadores razonables.


Antes de ver otras características respecto de los números índices, va-
le la pena decir unas dos líneas respecto de la determinación del potado ba
de.
Vimos que una vez elegido el período base y el modelo de índice, el pro
blema de la construcción de los números índices, se reduce a simples osera -
ciones aritméticas. Además, es intuitivo que el período base será aquél que
se desee usar para medir los cambios de una variable en una serie de tiempo.
Sin embargo, debe tenerse mucho cuidado en la elección del período base, ya
que éste debe ser en lo posible, el más representativo de la serie temporal.
Algunos entendidos en la materia, consideran que el período base debe ser
aquél en el cual los cambios de la variable en estudio no sufrieron varia-
ciones considerables; o lo que es lo mismo, el período en que hubo o hay ma-
yor estabilidad. Cuando no existe un sólo período en que ésto ocurra, se
suele tomar el promedio de dos o tres períodos como período base. Además,
un factor importante que no debe descuidarse, es lo relaciónado con las pon
deraciones. En la mayoría de los casos, el período en que los factores que
sirven para las ponderaciones son en promedio estables, es el que debe tomar
se como período base. Por último, el período base se suele elegir en función
los fines que se persigan, por ejemplo, de acuerdo a la política económi
ca predeterminada a seguir.
Veamos ahora algunos casos interesantes que se presentan en el contex-
to de los números índices.
Todos los casos que hemos visto hasta ahora, se refieren a índices de
base constante. También es posible en algunos casos, recurrir a índicea de
han sof:ab/e. La construcción de estos índices es muy simple, ya que gene-
ralmente se hace una relación de un período cualquiera respecto del período
anterior. El Cuadro 12.9 nos muestra un ejemplo de indices de base fija y
de base variable.

TABLA 12.9

Indice Indice de base


Año variable
1968=100
1968 100 -
1969 115 115
1970 98 85
1971 110 112
1972 125 137
1973 140 112

Otro caso es el que se refiere a empatme de adieta. Muchas veces


se tienen dos índices con base fija en distintos periodos, respecto de una
misma variable. Un caso tal puede ser como el que presenta la Tabla 12.10
- 269 -
TABLA 12.10

kilo Indice Indice


1966=100 1968=100
1966 100
1967 110
1968 112 100
1969 98
1970 115
1971 110
1972 140
1973 145

Ahora, si nuestro interés ea continuar la serie de los índices con base


1966, mediante una regla de tres simple se consigue este fin; igualmente si
se desea completar la serie de los índices con base 1969 = 100. La Tabla
12.11, nos muestra este procedimiento.

TABLA 12.11

Año Indice Indice


1966=100 1969=100
1966 100 89,3
1967 110 98,2
1968 112 100
1969 109,8 98
1970 128,8 115
1971 123,2 110
1972 156,8 14o
1973 162,4 145

Una aplicación interesante de los números índices, es la que se refiere


a la deflación o deflactación. Este modelo se refiere a la metodología que
consiste en expresar los precios corrientes en precios constantes. Como ve-
remos, se trata de un fenómeno económico inverso al de la inflación. A menu
, do en el léxico económico se escucha hablar, "a precios constantes" y"a pre-
cios corrientes". Lo que se quiere indicar con estas expresiones, es sim -
plemente: en el primer caso se refiere a que la unidad monetaria se la consi
dere con su poder adquisitivo de un período base; y el segundo caso, con su
poder adquisitivo en el período dado.

En general, para cualquier deflactacidn, se usa la relación


Valor de la moneda deflactada 2
Valor de la moneda original
Indice de Precios
Los valore* de una moneda deflactados, también suelen recibir el nombre
de, pesos constantes, salarios o ingresos reales, poder de compra, etc.
- 270-

El siguiente ejemplo práctico nos ilustran estas ideas.

Ejemplo 12.6 Ripotéticamente, supongamos que los ingresos promedio men


sueles de los asalariados en la industria textil en cierta
ciudad para los arios 1966 a 1970 son los que se dan en la columna (1) de la
Tabla 12.12. Se trata de calcular los Ingresos reales a partir de los ín
dices de precios al consumidor con base 1968 • 100 (Columna 2 de la misma Ta
bla).

Para ésto, será suficiente usar la relación

Ingreso promedio mensual por año


Ingreso promedio real Indice de Precios al Consu-
midor

TABLA 12.12 Cálculo del Ingreso promedio real, para la informa-


ción del ejemplo 12.6

Ingreso promedio Indice de precios Ingresos


de un asalariado al consumidor Reales por mes
Año (1968-100) (En $ de 1968)
(1) (2) 1(1)/(2)J .100

1966 370 82 451,22


1967 380 87 436,78
1968 400 100 400,00
1969 510 115 443,48
1970 670 122 549,18

Los números índices pueden aplicarse, por ejemplo a las siguientes si -


tuaciones: Para estimar costos; para comparar cambios de costos de produc-
ción; para medir el efecto de factores exógenos, tales como huelgas y paros;
para indicar cambios de período a período en volúmenes físicos de producción;
para medir variaciones de precios de materias primas; para medir cambios en
ingresos monetarios y poder adquisitivo de los ingresos; para análisis de da
tos financieros de balance; análisis de series económicas; cambios del comer
cio exterior, etc., etc.

Otra de las aplicaciones del muestreo, es contribuir a la obtención de


números índices apropiados.

12.6

Ejercicios

1. Describa brevemente cada uno de los siguientes términos: a) Período base,


b) Precio relativo, c) Precios fijos, d) Distinción entre los valores "mo
netaríos" y los valores "reales".
-271 -

2.Dada la siguiente información

Años Precios Cantidad


1970 2 3
1971 6 2
1972 8 10
1973 21 34

Qué año base se debe tomar para que se cumpla la prueba IPx IQ s IV?

3.La depreciación monetaria de un país determinado aumenta cada año, duran


te el período 1968-1973, en un 15% constante de año a año. Corregir la
siguiente serie de valores de la depreciación monetaria:

Años Valores Años Valores

1968 8 1971 25
' 1969 11 1972 27
1970 20 1973 31

4.Supongamos que los datos que se presentan a continuación indican „los in-
gresos totales de una compañía metalúrgica y el índice de precios al por
mayor de metales para el período 1968-1973

Ingresos totales Indice de Precios


Año de la Compañía de metales
(Millones de $.) (1966-1967 a 100)

1968 1.345,8 115,4


1969 1.415,2 120,2
1970 1.636,5 136,6
1971 1.500,2 148,4
1972 1.800,3 151,2
1973 2.024,4 149,1

Se pide:

4.1 Restablecer los ingresos totales para cada año en términos de pre-
cios promedio en 1966-1967.
4.2 Qué tipo de información se obtiene de la serie de los ingresos' a
precios constantes?. Explique.
4.3 En qué porcentaje disminuyeron los ingresos a los precios de 1966-
1967, entre 1972 y 1973?
4.4 Restablezca los ingresos para 1972 y 1973, a los precios de 1973.

1.00/rv11.
Erratas de importancia advertidas:

Página Erratas: Debe decir:

6 En c) del Ejemplo 1.4


dice: Transito Tránsito
47 En el Ejemplo 3.14
dice: d318-12•6 d2=18-12∎6
101 En 5.9, en la segunda fila
dice: ...Tomas Bayes Tomás Bayas
175 En el Ejercicio 6., en la última
fila dice: .., almenos.. al menos
En el Ejercicio 7., después de
50%, dice: siendo verdadera siendo la verdadera
191 En (9.10) dentro de la raiz cua-
drada, dice: M(x2) 11(82)
235 En la tercera expresión del Teo-
rema 11.4.6, falta el símbolo de a
la senatoria E .1z(T.-1-ix
n J.)2
247 Al inicio de las igualdades
dice: z 0,959 le z~,959
r
zp■ 0,90 = 1(3=0,90
En 1.7 del Ejercicio 1.,
dice: ... latura... altura
248 Ea 2.3 del Ejercicio 2.,
+ + + +
dice: Ye - A + b x Sce a + b x
APENDICE S
r

á-
- 275 -

?AULA In: Función de Distribución Poisson

›x -A
F (t) = -=r
x x. e-
x=0

A
[t] .50 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0
0 .607 .368 .135 .050 .018 .007 .002 .001 .000 .000 -
1 .910 .736 .406 .199 .092 .040 .017 .007 .003 .001 -
2 .986 . .920 .677 .423 .238 .125 .062 .030 .014 .006 .003 .
3 .998 .981 .857. .647 .433 .265 .151 .082 :042 .021 .010
4 1.000' .996 .947 ..815 .629 .440 .285 .173 .100 .055 .029
5 1.000 .999 .983 .961 .785 ' .616 .446 .301 .191 .116 .067
6 1.000 1.000 .995 .966 .889 .762 .606 .450 .313 .207 .130
7 1.000 1.000 ..999 .988 .949 .867 .744 :599 .453 .324 .220
8 1.000 1.000 1.000 .996 .979 .932 .847 .729 .593 .456 .333
9. 1.0.00 1.000 1.000 .999 .992 .968 .916 .830 .717 .587 .458
10 1.000 1.000 1.000
1.000 .917 .985 .957 .901 .816 .706 .583
11 1.000 1.000 1.000
1.000 .999 .995 .980 .947 .888 .803 .697
12 1.000 1.000 1.000
1.000 1.000 .998 .991 .973 .936 .876 .792
13 1.000 1.060 1.000
1.000 1.000 1999 .996 .987 .966 .926 .864
14 1.000 1.000 1.000
1.000 1.000 1.000 .999 .994 .983 .959 .917
15 1.000' 1.000 1.000
1.000 1.000 1.000 .999 .998 .992 .978 .951
16 1.000 1.000 1.000
1.000 1.000 1.000 1.000 .999 .996 ,989 .973
17 1.000 1.000 1.000
1.000 1.000 1.000 1.000 1.000 .998 .995 .986
18 1.000 1.000 1.000
1.000 1.000 1.000 1.000 1.000 .999 .998 .993
19 1.000 1.000 1.000
1.000 1.000 1.000 1.000 1.000• 1.000 .999 .997
'20 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 .998
21 1.000 1.000 1.000 1.000 1.000 1.000 1.000 -1.000 1.000 1.000 .999
22 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
- 276 -

TABLA 2A: Función de Distribución Normal Estandar


2
1 e x 2 dx
N (z)
11;

1 2 3 4 5. 6 7 8 9
z 0
.5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
.0 .5000 .5040 .5714 .5753
.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675
.5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
.5793 .5832 .6480 .6517
.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443
.6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
.4 .6554 .6591
.6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.5 .6915 .6950 .7517 .7549
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486
.7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.7 .7580 .7611 18106 .8133
.8 .7181 .7910 .7939 .7967 .7995 .8023 .8051 .8079
.8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
.9 .8159 .3186
.8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1.0 .8413 3438 .8790 .8810 .8830
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770
.8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1.2 .8849 .8869 .9162 .9177
1.3 ‘9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147
.9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1.4 .9192 .9207
.9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.5 .9332 .9345 .9535 .9545
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525
.9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.7 .9554 .9564 .9700 .9706
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693
.9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
1.9 .9713 .9719
.9783 .9788 .9793• .9798 .9803 .9808 .9812 .9817
2.0 .9773 .9778 .9854 .9857
2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850
.9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890
2.2 .9861 .9864 .9913 .9916
2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911
.9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2.4 .9918 .9920
.9941 .9943 ..9945 .9946 .9948 .9949 .9951 .9952
2.5 .9938 .9940 .9963 .9964
2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962
.9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2.7 .9965 .9966 .9981
2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980
.9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
2.9 .9981 .9982
3.0 .9987
- 277 -

TABLA 3A: Función de Dietribuci6n t de Student


Ft(x) = P(tlx) = 1 - a

g.1. 1 -a
. 50 .75 .90 .95 .975 .99 .995 .9995 -®
1 •325 1.000 3.078 6.314 12.706 31.821 63.657 636.619
2 .289 .816 1.886 2.920 4.303 6.965 9.925 31.598
3 .277 .765 1.638 2.353 3.182 4.541 5.841 12.941
4 .271 .741 1.533 2.132 2.776 3.747 4.604 8.610
5 .267 .727 1.476 2.015 2.571 3.365 4.032 6.859
6 .265 .718 1.440 1.943 2.447 3.143 3.707 5.959
7 .263 .711 1.415 1.895 2.365 2.998 3.499 5.405
8 .262 .706 1.397 1.860 2.306 2.896 3.355 5.041
9 .261 .703 1.383 1.833 2.2B2 2.821 3.250 4.781
10 .260 .700 1.372 1.812 2.228 2.764 3.169 4.587
11 .260 .697 1.363 1.796 2.201 2.718 3.106 4.417
12 .259 .695 1.356 1.782 2.179 2.681 3.055 4.318
13 .259 .694 1.350 1.771 2.160 2.650 3.012 4.221
14 .258 .692 1.345 1.761 2.145 2.624 2.977 4.140
15 .258 .691 1.341 1.753 2.131 2.602 2.947 4.073
16 .258 .690 1.337 1.746 2.120 2.583 2.921 4.015
17 .257 .689 1.333 1.740 2.110 2.567 2.898 3.965
18 .257 .688 1.330 1.734 2.101 2.552 2.878 3.922
19 .257 .688 1.328 1.729 2.093 2.539 2.861 3.883
20 .257 .687 1.325 1.725 2.086 2.528 2.845 3.850
21 .257 .686 1.323 1.721 2.080 2.518 2.831 3.819
22 .256 .686 1.321 1.717 2.074 2.508 2.819 3.792
23 .256 .685 1.319 1.7]4 2.069 2.500 2.807 3.767
24 .256 .685 1.318 1.711 2.064 2.492 2.797 3.745
25 .256 .684 1.316 1.701 2.060 2.485 2.787 3.725
a 26 .256 .684 1.315 1:706 2.056 2.479 2.779 3.707
27 .256 .684 1.314 1.703 2.052 2.473 2.771 3.690
28 .256 .683 1.313 1.701 2.048 2.467 2.763 3.674
29 .256 .683 1.311 1.699 2.045 2.462 2.756 3.659
30 .256 .683 1.310 1.697 2.042 2.457 2.750 3.646
LO .255 .681 1.303 1.684 2.021 2.423 2.704 3.551
60 .254 .679 1.296 1.671 2.000 2.390 2.660 3.460
120 .254 .677 1.289 1.658 2.980 2.358 2.617 3.373
.253 .674 1.282 1.645 2.960 2.326 2.576 3.291
- 278 -

TABLA 4A: Funci6n de Distribución X?


t
F l(t) =f f e(x)dx • 1 -
0 X,
g.1 1 - a
.005 .010 .025 .050 .100 .250 .500 .750 .900 .950 .975 .990 .995 -,
1 - - - .004 .016 .10 .45 1.32 2.71 3.84 5.02 6.63 7.88
2 .01 .02 .05 .10 .21 .58 1.39 2.77 4.61 5.99 7.38 9.21 10.6
3 .72 .11 .22 .35 .58 1.21 2.37 4.11 6.25 7.81 9.35 11.3 12.8
4 .21 .30 .48 .71 1.06 1.92 3.36 5.39 7.78 9.49 11.1 13.3 14.9
5 .41 .55 .83 1.15 1.61 2.67 4.35 6:63 9.24 11.1 12.8 15.1 16.7
6 .68 .87 1.24 1.64 2.20 3.45 5.35 7.84 10,6' 12.6 14.4 16.8 18.5
7 .99 1.24 1.69 2.17 2:83 4.25 6.35 9.04 12.0 14.1 16.0 18.5 20.3
8 1.34 1.65 2.18 2.73 3.49 5.07 7.34 10.2 13.4 15.5 17.5 20.1 22.0
9 1.73 2.09 2.70 3.33 4.17 5.90 8.34 11.4 14.7 16.9 19.0 21.7 23.6
10 2.16 2.56 3.25 3.94 4.87 6.74 9.34 12.5 16.0 18.3 20.5 23.2 25.2
11 2.60 3.05 3.82 4.57 5.58 7.58 10.3 13.7 17.3 19.7 21.9 24.7 26.8
12 3.07 3.57 4.41) 5.23 6.30 8.44 11.3 14.8 18.5 21.0 23.3 26.2 28.3
13 3.57 4.11 5.01 5.89 7.04 9.30 12.3 16.0 19.8 22.4 24.7 27.7 -29.8
14 4.07 4.66 5.63 6.57 7.79 10.2 -13.3 17.1 21.1 23.7 26.1 29.1 31.3
15 4.60 5.23 6.26 7.26 8.55 11.0 14.3 18.2 22.3 25.0 27,5 30.6 32.8
16 5.14 5.81 6.91 7.96 9.31 11.9 15.3 19.4 23.5 26.3 28.8 32.0 34.3
17 5.70 6.41 7.56 8.67 10.1 12.8 16.3 20.5 24.8 27.6 30.2 33.4 35.7
18 6.26 7.01 8.23 9.39 10.9 13.7 17.3 21.6 26.0 28.9 31.5 34.8 37.2
19 6.84 7.63 8.91 10.1 «11.7 14.6 18.3 22.7 27.2 30.1 32.9 36.2 38.6
20 7.43 8.26 9.59 10.9 12.4 15.5 19.3 23.8 28.4 31.4 34.2 37.6 40.0
21 8.03 8.90 10.3 11.6 13.2 16.3 20.3 24.9 29.6 32.7 35.5 38.9 41.4
22 8.64 9.54 11.0 12.3 14.0 17.2 21.3 26.0 30.8 33.9 36.8 40.3 42.8
21 9.26 10.2 11.7- 13.1 14.8 18.1 22.3 27.1 32.0 35.2 38.1 41.6 44.2
24 9.89 10.9 12.4 13.8 15.7 19.0 23.3 28.2 33.2 36.4 39.4 43.0 45.6
25 10.5 11.5 13.1 14.6 16.5 19.9 24.3 29.3 34.4 37.7 40.6 44.3 46.9
26 11.2 12.2 13.8 15.4 17.3 20.8 25.3 30.4 35.6 38.9 41.9 45.6 48.3
27 11.8 12.9 14.6 16.2 18.1 21.7 26.3 31.5 36.7 40.1 43.2 47.0 49.6
28 12.5 13.6 15.3 16.9 18.9 22.7 27.3 32.6 37.9 41.3 44.5 48 51.0
29 13.1 14.3 16.0 17.7 19.8 23.6 28.3 33.7 39.1 42.6 45.7 49.6 52.3
30 13.8 15.0 16.8 18.5 20.6 24.5 29.3 34:8 40.3 43.8 47.0 50.9 53.7
Respuestas de Ejercicios
Seleccionados

CAPITULO 2

Ejercicios 2.5

5.1) No 5.2) No 5.3) SS 5.4) No 5.5) No 5.6) No 6.1) Tiene im-


portancia' 6.2)Salamente si existe un dato observado 6.3) No. 6.4) La
afirmación no es cierta 6.5)Por definición NI = n1 6.7) No necesaria -
mente 9) de 0,08 = 4/n se obtiene n.

CAPITULO 3

Ejercicios 3.11
/
2.1) M(X) = 67,86 Me = 67,27 Mo 66,43 2.2) M(X) = 111,7 Me = 70
Mo = 60 3.1) No necesariamente 3.2) No necesariamente, se puede dar pa
ra muchos casos. Por ejemplo, pruebe para el caso en que hayan 3 mujeres y
10 hombres 3.4) El caso más simple, para que se cumpla la aseveración ,
es que haya el mismo número de obreros en cada sector. Sin embargo, exis -
ten muchos casos en que para diferentes números de obreros en los sectores
se cumple la aseveración. Analice e intente hallar el número de obreros de
cada sector (que no sean iguales) 3.5) No necesariamente 3.6) No nece -
seriamente 3.8)No, es la misma constante 3.9) Poco factible si no hay
más información 4) 25,7 5) 40 Igh. 9) 291

CAPITULO 4

Ejercicios 4.5

2a) ta media queda incrementada en un punto y la desviación estandar no


cambia 2b) La nota media y la desviación estandar se incrementan en 5%.
3) En A 4) 7 y 9 5) Determine primero x1, x y vx haciendo x =50-k ,
3 4'
x =50+k y x ••501-21( 6) n =6 , n =1 (aproximados)
3 4 8.1) No 8.3)1 No
4 5
10) Calcule directamente M(Y) y V(Y).
9.1) S/
- 280 -

CAPITULO 5

Ejercicios 5.1

1.5) V 1.10) F 2.3) F 2.6) V 2.9) V 3) SI, NO, NO 7.1) IrCE


7.2) FCE 13) A=B 14) No 16) R = {2,3 12} 17) A = 1(1,6),
(2,5),(3,4),(4,3),(5,2),(6,1)} Arg{(1,2),(2,1)) A3= 1(4,8),(5,5),(6,4)}
18) n = {0,1 2 k}

Ejercicios 5.2

2) Xl= {(i,j) i,j=1,2,...,10} 3) ri= {(i,j) i,j=1,2 10, i # j }


4)A4111,211,38,413} 6) A = 1(Calvo,Ojos pardos),(Calvo,Ojos azules)) ,
C={ (Cabello pardo,Ojos pardos)} 7.1) 1/3 7.3) 2/3 7.5) 1 8.3) 1/3
8.4) 1/3 8.7) 1/6 8.9) 5/6 9) No 11) P(AlBi) = 1/3 •It i=1,2,3,4
13) 5/12, 7/12

CAPITULO 6

Ejercicios 6.8

1) Px(x) = 1/6 si x=3,4,6,7 3) F (x) =


x
O si x< 0
= 1/3 si x=5 = 1/3 si 0/12[C1
= O e.o.c. = 2/3 si 1<x<2
= 1 si x)2 -v
5) 12 (t) = O si t < O
X 7S.45c=1/600 Tx
2 = 1/360.000
t(2-t) si Olt <1
I •
ge 1 si t31 10) -0,75 $ 11).2, 1 •
12) pxy(x,y) = 1/8 si (x,y) (2,2),(3,2),(2,3),(3,4),(4,3),(4,4)
= 1/4 si (x,y) = (3,3)
= O e.o.c. •
Px(x) = 1/4 si x = 2, 4
=1/2 si x = 3
= O e.o.c.
CAPITULO 7

E ercicios 7.7
/ (10)x.
2,4,5
1) 5/6, 5/6, 0,5948, 0,1962 2) 0,8170, 0,2 3)()( 2
x 5-x / 5
4) 6,a, 0,6065 5) 0,2865, 0,3621, 4 0 6) 1/3, 36 7) 0,44, 0,44
8)0,2928 9) 0,1587 , 0,3085 10) 0,2119 , 0,0227 , 56,4 onzas 11) En-
tre 2,496 y 2,504 , 0,0668 , 0,516 12) 95%, 88%, 67%

• CAPITULO 8

Ejercicios 8.11

•1) 14 2) 0,4207 , 0,1587 6) 250 7) 3.376 8) A O 9) 0,4448


10) 0,383 11) 0,2146 12) 1 - Plz1(200-10/a)/031
- 281 -

CAPITULO 94,
Ejercicios 9.5
1) 1.027 2.1) 74,2 a_125,8 2.3) 99 % 3.1) 105 3.2) 79,2 a 130,8
3.3) Sí 4.1) Si p = Rin 5) 52,92 a 143,08 6) 256 7.1) 0,588 a 0,612
7.2) 2401 10) 5,5 , 1,8333 11) 1,5
CAPITULO 10
Ejercicios 10.6
3) Recomendar se incremente el contenido de la carne envasada 4) Está so-
breestimada 5) Con un nivel de significación de 0,01 no se rechaza H en
cambio con 0,05 sí se rechaza. Analizar. 6) No ce válida 8) Existe° di-
ferencia.
CAPITULO 11
Ejercicios 11.14
1.2) Ye=-75,1 + 0,86x 1.3) (0,68 , 1,05) 1.4) (62,54 , 67,46)
1.5) Con un nivel de significación de 0,05 , no se acepta que b=0 1.6) Se
rechaza la hipótesis He: b=6 1.7) 70,3 Kg. 1 .8) 176,3 cros. 2.1) b+=0,8
2.2) Por cada unidad de cambio en X, Y cambia en O ,8 2.3) Ye = 6 + 0,8X
2.4)No se rechazaría la hipótesis E0: 6=1 3) No se rechaza la hipótesis
propuesta 4.1) 0,7 5.2) Ye = 297,16 + 0,055 X 5.3) 0,055

Ejercicios 11.18
2) Ye = 10,99 - 0,036 X2 - 0,57 X2 5) Ye = 0,39 X2+ 0,25 X2
6.1) C • 12,178 + 0,252Y+ 1,527N

CAPITULO 12
Ejercicios 12.6
2) Cualquier año 4.1) 1968 - 1.166,2 4.3) Incrementa 14%
69 - 1.177,4
70 - 1.198,0
71 - 1.010,9
72 - 1.190,7
73 - 1.357,7
4.4) 1972 - 1.775,4
1973 - 2.024,4
-283-

BIBLIOGRAFIA CONSULTADA

Arkin, H. y CaltonRaymond: "Statistical Methods", Barnes y Noble Books ,


New York (1970).
Azorfn, Poch Francisco: "Curso de Muestreo y Aplicaciones", Editorial A-
guilar, España (1969).
Cochran G., William: "Técnicas de Muestreo". CECSA. México (1971)
Cansado, Enrique: "Estadística General", CIENES, Santiago de Chile (1970)
Casa Aruta, Ernesto: "200 Problemas de Estadística Descriptiva", Edito -
rial Vieens-Vives, España (1965).
Freeman, Harold: "Introducción a la Inferencia Estadística", Editorial
Trillas, México (1970).
Chou, Ya-Lun: "Statistical Analysis", Holt Rinehart Winston, Estados Uni-
dos (1969).
Chernoff, Herman y Lincoln E. Moses: "Teoría y Cálculo Elemental de las
Decisiones", CECSA, España (1967).
Guenther C., William: "Introducción a la Inferencia Estadística", Mac
Graw Bill Co., España (1968).
Hohel G., Paul: "Introducción a la Estadística Matemática", Editorial A-
riel, España (1968).
Larson 3., Harold: "Introduction to Probability Theory and Statistical
Inference", Wiley International Edition, EE.UU. (1969).
Lindgren, B.W.: "Estatistical Theory": Mac Minan, New York (1970).
Lindgren, B.W. y Mc Etrath G. W.: "Probability and Statiatic", Mac Mi-
nan, EE. UU. (1970).
, Probability and Statistical Applications",
Meyer, Paul L.: "Introductor)
Addison-Wealey, EE.UU. California (1970).
Mood, M. A. y Graybill A. F.: "Introducción a la Teoría de la Estadís
tica", Aguilar, España (1969).
Neter, J. y Wasserman W.: "Fundamentos de Estadística Aplicada a los Ne-
gocios y la Economía", Cía. Editorial CECSA Continental S.
A., México (1968).
Nuñez del Prado B., Arturo: "Estadística Básica para Planificación", E-
dición Siglo XXI Editores S. A., México (1972).
Ostle, Bernard: "Estadística Aplicada", Editorial Limusa Willey S. A. ,
Mexico (1968).
-284-

Riekmers, A. D. y Toos H. N.: "Introduccién a la Estadística", CEC:


España (1971).
Shao P., Stephen: "Estadística para Economistas y Administradores de
Empresas, Herrero Hermanos SUCS S. S., México (1970).
Spiegel R., Murray: "Estadística", Serie Compendios Schaum's, Mc Graw
Hill, Colombia (1969).
Tücker G., Howard: "Introduccién a la Teoría Matemética de las Proba-
. bilidades y a la Estadística", Editorial Vicens-Vives, Es
' paila (1966).
Wadsworth, P. G. y Bryan Joseph:"Introduction to Probability and Ran-
don Variables", Mac Graw Hill Book Company Inc., New York
(1960).
Hogg, Robert V. y Craig Allen T.: "Introduction to Hathematical Sta -
tistics", Mc Millan, EE.UU. (1969).

A4,0 39 93
uf