Está en la página 1de 86

Universidad Tecnica Federico Santa Mara

Departamento de Matematica
Probabilidad y Estadstica
Apuntes del curso.
Recopilado por: Francisca Gonz alez Lopez
Santiago, 31 de julio de 2012

Indice general
1. Estadstica Descriptiva 3
1.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1. Estadstica Descriptiva e Inferencial . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2. Etapas de una Investigaci on Estadstica . . . . . . . . . . . . . . . . . . . . . 3
1.1.3. Conceptos B asicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2. Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1. Conceptos b asicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2. El Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.3. Muestreo Aleatorio Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.4. Muestreo Estraticado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Clasicaci on de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.1. Nominales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.2. Ordinales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.3. Intervalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4. Organizaci on de la Informaci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5. Medidas de Tendencia Central y Dispersi on . . . . . . . . . . . . . . . . . . . . . . 11
1.5.1. Medidas de Tendencia Central . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5.2. Medidas de tendencia central, posici on y dispersi on. . . . . . . . . . . . . . . 11
1.6. Estadsitica Bivariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6.1. Frecuencia Absoluta y Frecuencia Relativa . . . . . . . . . . . . . . . . . . . 15
1.6.2. Tablas de Contingencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6.3. Distribuciones Marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6.4. Distribuciones Condicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6.5. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.6.6. Asociaci on, Dependencia o Correlaci on . . . . . . . . . . . . . . . . . . . . . 17
1.6.7. Ajuste de Curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2. Probabilidades 22
2.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2. Modelo de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.1. Espacio Muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.2. Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.3. Medida de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2.4. Espacios Probabilsticos Finitos . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3. Probabilidad Condicionada e Independencia . . . . . . . . . . . . . . . . . . . . . . 31
1
2.3.1. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.2. Probabilidad Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.3. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4. Variables Aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4.2. Variables Aleatorias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.4.3. Variables Aleatorias Continuas . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4.4. Localizaci on y dispersi on de una variable aleatoria . . . . . . . . . . . . . . . 40
2.4.5. Casos especiales de distribuciones probabilidad . . . . . . . . . . . . . . . . . 42
2.4.6. Funciones de Variables Aleatorias . . . . . . . . . . . . . . . . . . . . . . . . 48
2.4.7. Aproximacion de distribuciones . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.5. Vectores Aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.5.1. Distribucion Conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.5.2. Distribuciones Conjuntas Especiales . . . . . . . . . . . . . . . . . . . . . . . 54
2.5.3. Distribucion Marginal y Condicional . . . . . . . . . . . . . . . . . . . . . . 56
2.5.4. Esperanza y Varianza Condicional . . . . . . . . . . . . . . . . . . . . . . . . 58
2.6. Nociones de Convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3. Inferencia Estadistica 62
3.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.2. Estimaci on Puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.2.1. Metodo de Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.2.2. Metodo de M axima Verosimilitud . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3. Insesgamiento y eciencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.4. Estimaci on Intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.4.1. Intervalo de Conanza para la media . . . . . . . . . . . . . . . . . . . . . . 69
3.4.2. Intervalo de Conanza para una proporcion . . . . . . . . . . . . . . . . . . 70
3.4.3. Intervalo de Conanza para la varianza . . . . . . . . . . . . . . . . . . . . . 70
3.4.4. Intervalo de Conanza para la diferencia de medias . . . . . . . . . . . . . . 71
3.4.5. Intervalo de Conanza para la comparacion de varianzas . . . . . . . . . . . 73
3.5. Pruebas de Hipotesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.5.2. Prueba de Hipotesis para la media . . . . . . . . . . . . . . . . . . . . . . . 76
3.5.3. Prueba de Hipotesis para la proporci on . . . . . . . . . . . . . . . . . . . . . 77
3.5.4. Prueba de Hipotesis para la varianza . . . . . . . . . . . . . . . . . . . . . . 77
3.5.5. Prueba de Hipotesis para la diferencia de medias . . . . . . . . . . . . . . . . 78
3.5.6. Prueba de Hipotesis para la diferencia de proporciones . . . . . . . . . . . . 80
3.5.7. Prueba de Hipotesis para la comparacion de varianzas . . . . . . . . . . . . . 80
4. Bibliografa 82
2
Captulo 1
Estadstica Descriptiva
1.1. Introducci on
Por estadstica entendemos los metodos cientcos por medio de los cuales podemos recolectar,
organizar, resumir, presentar y analizar los datos numericos relativos a un conjunto de individuos u
observaciones y que nos permiten extraer conclusiones validas y efectuar decisiones logicas basadas
en dichos an alisis. Utilizamos la estadstica para aquellos casos en los que tenemos una gran canti-
dad de observaciones y cuya aparici on se rigen solo por las leyes del azar o aleatorias.
1.1.1. Estadstica Descriptiva e Inferencial
La estadstica puede subdividirse en dos amplias ramas: la estadstica inductiva o inferencial y
la estadstica deductiva o descriptiva.
Estadstica Inductiva o Inferencial
Entendemos por estadstica inductiva si a partir de una m.a., sucientemente representativa del
universo, podemos inferir (inducir) conclusiones estadsticamente v alidas para todo el universo. Es-
to obliga a plantear simultaneamente las condiciones bajo las cuales dichas conclusiones son v alidas.
Estadstica Descriptiva o Deductiva
Entendemos por estadstica descriptiva si al analizar una m.a., solo se pueden obtener conclu-
siones v alidas para la muestra, sin que se puedan o se requieran generalizar sus resultados para todo
el universo.
1.1.2. Etapas de una Investigacion Estadstica
A un cuando los tipos de problemas a los cuales puede aplicarse la estadstica matematica son
bastante heterogeneos, en muchos casos los pasos de una investigaci on estadstica son similares.
a) Formulaci on del problema. Para investigar con exito un problema dado, primero tenemos
que crear conceptos precisos, formular preguntas claras e imponer limitaciones adecuadas al
3
problema, tomando en cuenta el tiempo y dinero disponible y la habilidad de los investigadores.
Algunos conceptos tales como: Artculo defectuoso, servicio satisfactorio a la clientela, observa-
ciones demogracas, grados de pureza de un mineral, tipo de traco, etc., pueden variar de
caso en caso, y en cada situaci on especca, necesitamos coincidir en deniciones apropiadas
para los terminos que se incluyen.
b) Dise no del experimento. Es deseable obtener un maximo de informacion empleando un
mnimo de costo y tiempo. Esto implica determinar el tama no de la muestra o la cantidad y
tipo de datos.
c) Experimentacion o coleccion de datos. En toda investigacion esta etapa es la que consume
m as tiempo.

Esta debe aplicarse con reglas estrictas y con pautas preestablecidas.
d) Tabulacion y descripci on de los resultados. Los datos experimentales se ilustran en
diagramas, gracos, pictogramas, etc. Obteniendose adem as, medidas descriptivas que repre-
senten el proceso efectuado.
e) Inferencia estadstica y formulacion de la respuesta. Al aplicar el metodo estadstico
seleccionado en la etapa b), podemos inferir conclusiones obtenidas de la muestra acerca de
la poblacion respectiva.
1.1.3. Conceptos Basicos
Universo: Es el conjunto de todos los datos u observaciones de un suceso. El universo se des-
igna usualmente con la letra U. El universo puede ser nito, innito contable e innito no contable
(dependiendo del tipo de universo es el tipo de analisis del problema).
Poblaci on: Elementos del universo que tienen una caracterstica com un y es la que tratamos
de estudiar.
Muestra Aleatoria (m.a.): Es un subconjunto de la poblaci on, donde sus elementos son
escogidos al azar (no existe relacion en la elecci on de los elementos).
4
1.2. Muestreo
1.2.1. Conceptos basicos
Marco Muestral: El Marco Muestral es el conjunto de unidades del cual se seleccionar a una
muestra.
Unidades de Muestreo: Las unidades del Marco Muestral se llaman Unidades de Muestreo.
Es importante notar que toda unidad de la poblacion debe estar asociada a una y s olo una unidad del
Marco Muestral. Esto nos permitir a dise nar mecanismos de selecci on de la muestra de tal forma que
toda unidad de la poblacion se encontrara en, al menos, una de las posibles muestras seleccionadas
y en el caso del Muesteo Probabilstico nos permitir a inducir una probabilidad de selecci on a cada
elemento de la poblaci on.
1.2.2. El Muestreo
El Muestreo es la disciplina que trata con el conjunto de metodos, tecnicas y procedimientos
para tomar u obtener una particular muestra a efectos de realizar inferencias inductivas a partir de
la misma. Existen dos grandes categoras de muestreo: el Muestreo Probabilstico y el Muestreo No
Probabilstico.
En el Muestreo No Probabilstico, pueden existir unidades de la poblacion que no pueden ser
seleccionadas en ninguna de las muestras posibles, o bien, aunque exista una probabilidad de selec-
ci on positiva para cada una de estas unidades de la Poblacion, esta probabilidad es desconocida.
Un ejemplo de este tipo de Muestreo No Probabilstico es el Muestreo por Cuotas, muy utilizado
en los estudios de mercadeo y en algunas encuestas de opini on.
Con el Muestreo No Probabilstico, en general, las observaciones para una muestra particular
se obtienen mas r apidamente y a menor costo que en el Muestreo Probabilstico. Por otra parte,
los errores ajenos al muestreo (errores en las operaciones de recoleccion y procesamiento de
la informaci on), son m as f aciles de controlar cuando se utiliza Muestreo Probabilstico. En todo
caso, s olo con el Muestreo Probabilstico es posible obtener indicadores de conabilidad del error
inferencial de cada estimaci on obtenida a traves de la muestra.
1.2.3. Muestreo Aleatorio Simple
Es un dise no muestral bastante utilizado cuando se cuenta con una lista o directorio para usar
como Marco Muestral. Se distinguen dos casos de m.a.s.: Muestreo sin Reemplazo y Muestreo con
Reemplazo. De las N unidades de la poblaci on se selecciona al azar (igual probabilidad para cada
unidad) una unidad.

Esta se separa (sin reposici on) y de las N-1 restantes unidades de la poblaci on
se selecciona, tambien al azar, una segunda unidad. De las N-2 unidades restantes se vuelve a
seleccionar al azar una tercera unidad y as sucesivamente hasta completar las n unidades de la
muestra.
5
1.2.4. Muestreo Estraticado
El Muestreo Estraticado se presenta cuando la Poblaci on se encuentra particionada en L gru-
pos y en todos y cada uno de estos grupos se aplica en forma independiente un dise no muestral, no
necesariamente igual en todos ellos. En tal caso, los grupos de la particion se llaman Estratos y la
partici on de dice que es una Estraticaci on.
La Estraticaci on puede tener su origen en los propios objetivos del Estudio o en la intenci on de
contar con Estratos homogeneos que pueden hacer m as eciente el Dise no Muestral.
Ejemplos de Estraticaciones en funci on de los objetivos del estudio son, por ejemplo, las di-
visiones poltico administrativas (los Estratos pueden ser Regiones, Provincias, Departamentos o
Distritos, etc.) en una Encuesta Nacional, Ramas de Actividad Econ omica en una Encuesta Indus-
trial; P ublico y Privado en una Encuesta sobre Educacion, etc.
Ejemplos de Estratos creados para obtener una mayor homogeneidad en cada uno de ellos son:
Empresas Grandes, Medianas, Peque nas y Micro, en una Encuesta Industrial: Manzanas con hog-
ares de ingresos mayoritariamente altos, medios y bajos, etc.
6
1.3. Clasicaci on de variables
Hay que hacer notar que toda variable puede clasicarse en uno de los niveles de medici on, los
que se dar an en orden creciente en cuanto a la riqueza de los datos.
1.3.1. Nominales
La variable induce en la poblaci on una subdivisi on y los datos s e pueden clasicar en clases,
donde cada clase est a completamente denida y diferenciada de las dem as.
La recopilaci on se reduce a contar el n umero de individuos de la muestra que pertenecen a cada
clase.
1.3.2. Ordinales
En este nivel la variable de clasicacion tiene un orden implcito (admite grados de calidad u
ordenamiento) entre grupos o clases, esto signica que existe una relaci on de orden entre las clases.
No es posible cuanticar la diferencia entre los individuos pertenecientes a una misma clase.
1.3.3. Intervalares
La informacion obtenida en este caso es de tipo cuantitativo o numerico y es posible agruparla
en intervalos. En este nivel se considera no solo la informacion perteneciente al orden, sino adem as,
el tama no relativo de los intervalos a que pertenece cada uno de los individuos. En este nivel es
posible cuanticar la diferencia de dos individuos pertenecientes al mismo intervalo y tambien a
intervalos distintos. En esta escala esta involucrado el concepto de unidad de distancia y la distancia
entre dos medidas puede ser expresada en funci on de esta unidad.
7
1.4. Organizaci on de la Informacion
Una coleccion de datos tomados de un suceso (sometido a estudio) nada nos dice si no lo orde-
namos convenientemente para extraer as la informaci on que se desea.
Los conceptos m as usuales se detallan a continuaci on:
a.- El n umero de clases o intervalos
Es una subdivisi on del rango en varios grupos o intervalos (se designa por la letra k),
N umero de clases = 1 + 3.3log(n)
donde n es el n umero total de datos. Como el n umero de clases debe ser un n umero entero,
este se aproxima al entero superior, identicandolo con la letra k.
Para valores de n menores a 20, el n umero de clases corresponde a k =

n.
b.- Intervalo o Clase
Una subdivisi on del rango en componentes (de acuerdo a la magnitud, atributos, etc.) se
llaman clases, categoras, intervalos o celdas. Se designan por la letra C con un subndice que
indica la clase a que pertenecen, por ejemplo C
1
, C
2
, . . . , C
k
.
c.- Ancho del Intervalo
El ancho de la clase es la diferencia entre el lmite superior e inferior de la clase. Se designa
por la letra . En general, el ancho de cada clase puede o no ser del mismo tama no. En el caso
de que todos sean iguales el valor de se dene como:
I =
R + 1
k
donde R = Dato mayor en la muestra - dato menor de la muestra
El valor de I se aproxima al entero superior (cuando los datos son enteros).
d.- Marca de la Clase
La marca de clase es el punto medio de la clase o intervalo. Se designa por las letras MC
i
(el
subndice indica la clase a la que le corresponde).
e.- Frecuencia Absoluta
El n umero de datos que pertenecen a una clase se llama frecuencia absoluta de la clase. Se
designa por la letra n con un subndice (que indica la clase a que pertenece) por ejemplo:
n
1
, n
2
, . . . , n
k
.
Nota: La suma de todas las frecuencias absolutas debe ser igual al n umero total de datos n.
f.- Frecuencia Relativa
A la proporci on de datos que pertenecen a una clase con respecto al total se llama frecuencia
relativa. Se designa por la letra f con un subndice (que indica la clase a que pertenece). Por
8
ejemplo: f
1
, f
2
, . . . , f
k
.
Notas:
i. La suma de todas las frecuencias relativas debe ser igual a 1.
ii. Frecuencia relativa = frecuencia absoluta/n umero total de datos =
n
i
n
g.- Frecuencia Absoluta Acumulada
El n umero de datos que estan desde la primera clase hasta la clase i-esima, se llama frecuencia
absoluta acumulada de la clase i-esima. Se designa por la letra N con un subndice (que indica
la clase a que pertenece) por ejemplo: N
1
, N
2
, . . . , N
k
.
Nota:
N
1
= n
1
N
2
= n
1
+ n
2
= N
1
+ n
2
.
.
.
N
i
= n
1
+ n
2
+ . . . + n
i
= N
i1
+ n
i
i = 1, 2, . . . , k.
y debe vericarse que N
k
= n (n umero total de datos)
h.- Frecuencia Relativa Acumulada
El n umero de datos que estan desde la primera clase hasta la clase i-esima con respecto al
total de datos, se llama frecuencia relativa acumulada de la clase i-esima. Se designa por la
letra F con un subndice (que indica la clase a que pertenece) por ejemplo: F
1
, F
2
, . . . , F
k
.
Nota:
F
1
= f
1
=
N
1
n
F
2
= f
1
+ f
2
= F
1
+ f
2
=
N
2
n
.
.
.
F
i
= f
1
+ f
2
+ . . . + f
i
= F
i1
+ f
i
=
N
i
n
i = 1, 2, . . . , k.
y debe vericarse que F
k
= 1.
Ejemplo 1.4.1 Las notas obtenidas en un certamen, en escala 1 a 7 fueron:
3, 5, 6, 3, 4, 4, 7, 2, 1, 2, 3, 3, 4, 4, 6, 2, 7, 5, 3, 4, 4, 1, 2, 2, 3, 5, 4, 6, 5, 5.
Lo que se puede tabular como:
9
Clase Nota n
i
f
i
N
i
F
i
C
1
1 2 0.067 2 0.067
C
2
2 5 0.167 7 0.233
C
3
3 6 0.200 13 0.233
C
4
4 7 0.233 20 0.667
C
5
5 5 0.167 25 0.833
C
6
6 3 0.100 28 0.933
C
7
7 2 0.067 30 1
Suma 30 1
Ejercicios 1 En una empresa se considera la siguiente muestra correspondiente a la resistencia de
50 lotes de algodon medidas en libras necesarias hasta romper una madeja.
74 87 99 88 90 101 91 83 97 94
105 110 99 94 104 97 90 88 89 90
79 105 96 93 93 90 91 102 94 106
101 96 97 103 108 90 102 91 76 109
110 94 101 97 106 86 88 97 107 107
1. Encuentre el n umero de clases y el rango de la muestra
2. Determine la amplitud de la clase
3. Construya un cuadro resumen indicando intervalos, marca de clase, frecuencias absoluta, rel-
ativa, absoluta acumulada y relativa acumulada.
4. Graque las frecuencias absolutas. Comente.
Ejercicios 2 Se identico una muestra de estudiantes que posea automoviles producidos por la
General Motors y se registro la marca de cada automovil. A continuacion se presenta la muestra
que se obtuvo (Ch = Chevrolet, P = Pontiac, O = Oldsmobile, B = Buick, Ca = Cadillac):
Ch B Ch P O B Ch Ch Ca Ch
B P O P P Ch P O O Ca
Ch B Ch B P O Ca P Ch Ch
O Ch Ch B P Ch Ca O Ch B
B O Ch Ch O Ch Ch B Ch B
Construya una tabla de distribucion de frecuencias y genere un graco adecuado.
10
1.5. Medidas de Tendencia Central y Dispersion
1.5.1. Medidas de Tendencia Central
La idea es resumir los datos en un solo valor; un valor que represente a todo un conjunto
de datos, este tiene que ser un n umero o una clase hacia el cual tienen tendencia a concentrarse
mayoritariamente el conjunto de datos, usualmente este se ubica en las clases m as o menos centrales,
o sea, que es un valor central o de posicion central a cuyo alrededor se distribuyen todos los datos
del conjunto, de all el nombre de Medidas de Tendencia Central (M.T.C.). Las mas comunes son
la mediana, moda, media o promedio, media geometrica, etc.
Estas y otras medidas nos sirven para resumir la informacion presentada en cuadros y poder
relacionar y comparar entre s, de una manera sencilla, un conjunto de distribuciones de frecuencias.
Una vez determinadas las Medidas de Tendencia Central de una distribucion, nos interesa de-
terminar como se reparten (dispersan, desvan) los datos a uno y otro lado de la medida central. 0
sea, es necesario cuanticar la representatividad de la medida de tendencia para poder caracterizar
la distribuci on. Si la dispersi on es peque na indica gran uniformidad y la informaci on tiende a con-
centrarse en torno a la medida central, por el contrario, una gran dispersion indica que los datos
est an alejados de ella.
Las medidas de dispersion mas usuales son: desviacion media, desviaci on tpica o est andar,
rango, rango semi-intercuartlico, rango percentil, etc.
1.5.2. Medidas de tendencia central, posici on y dispersi on.
a. Media
La medida central m as representativa es la media o promedio. Como tales valores tienden a
situarse en el centro del conjunto de los datos ordenados seg un su magnitud, los promedios se
conocen tambien como medidas de centralizacion.
La media aritmetica o media de un conjunto de n n umeros X
1
, X
2
, . . . , X
n
se denota por X
y se dene como
X =
1
n
n

i=1
X
i
para datos no agrupados. Si los datos est an ordenados en una tabla (datos agrupados) en
las que se conocen las respectivas marcas de clase MC
i
, y ellas se presentan con frecuencias
absolutas n
i
, la media aritmetica es:
X =
1
n
k

i=1
n
i
MC
i
11
b. Moda
La moda cruda de una serie de n umeros es aquel que se presenta con la mayor frecuencia, es
decir, es el valor m as com un.
Una distribucion que tiene una sola moda se llama unimodal (caso m as usual). Es posible
encontrar variables bimodales, trimodales, etc.
Para datos agrupados, la moda puede obtenerse mediante el n umero dado por:
Moda = l
mo
+

1

1
+
2
I
donde:
m
o
= clase modal (clase con mayor frecuencia absoluta)
l
mo
= lmite inferior del intervalo de la clase modal

1
= n
mo
- n

mo

2
= n
mo
- n
+
mo
n
mo
= es la frecuencia de la clase modal
n
+
mo
= es la frecuencia de la clase posterior a la clase modal
n

mo
= es la frecuencia de la clase anterior a la clase modal
I = ancho del intervalo de la clase modal.
Propiedades de la Moda:
- Puede no existir y cuando existe no es necesariamente unica.
- No se ve afectada por valores extremos.
c. Mediana
Es el valor de la variable que ocupa la posicion central , en un conjunto de datos ordenados.
Si el n umero de observaciones es impar, es la observaci on central de los valores, una vez que
estos han sido ordenados en orden creciente o decreciente. Si el n umero de las observaciones
es par, se calcula como el promedio de las dos observaciones centrales.
Propiedades de la Mediana:
- La mediana en un conjunto de datos es unica
- No es sensible a la presencia de datos extremos
- En un conjunto de datos, la mitad de ellos son iguales o menores que la mediana, y la otra
mitad, iguales o mayores que la mediana.
Para datos agrupados, el n umero mediana viene dada por:
M
e
= l
Me
+
n
2
N

Me
n
Me
I
donde:
l
Me
= lmite inferior del intervalo de la clase mediana
n = n umero total de datos
12
N
Me
= frecuencia absoluta acumulada hasta la clase anterior a la clase mediana
n
Me
= es la frecuencia de la clase mediana
I = ancho del intervalo de la clase mediana.
d. Percentiles
El percentil q es un valor de la variable tal que el q % de los datos es menor que el y, por lo
tanto, el (1-q) % es mayor. Son una medida de posici on que no reejan la tendencia central.
Si X
1
, X
2
, . . . , X
n
es una secuencia ordenada de datos, el percentil q se encuentra en la posici on
q(n + 1)
100
Para datos agrupados, nos referimos a la clase en el cual se encuentra al menos el q % de los
datos, digamos C
p
, por lo que
P
q
= l
p
+
n q/100 N

p
n
p
I
p
donde:
l
p
= lmite inferior de la clase a la cual pertenece el percentil q
I = ancho del intervalo C
p
.
e. Varianza
Es una constante que representa dispersi on media de una variable aleatoria X , respecto a su
valor medio. Puede interpretarse como medida de variabilidad de la variable.
Se dene la varianza de una serie de observaciones X
1
, . . . , X
n
como
s
2
=
1
n
n

i=1
(X
i
X)
2
o equivalentemente
s
2
=
1
n
n

i=1
X
2
i
X
2
La varianza para datos agrupados con sus respectivas frecuencias absolutas n
i
, y las marcas
de clase MC
i
, se representa por:
s
2
=
1
n
k

i=1
n
i
(MC
i
X)
2
o equivalentemente
s
2
=
1
n
k

i=1
n
i
MC
2
i
X
2
En ambos casos, se dene la desviacion estandar como s =

s
2
, tmabien una medida de
dispersi on de los datos respecto de la media.
13
Ejemplo 1.5.1 Considere los datos de consumo de enrga electrica de 80 usuarios:
Consumo (Kwh) N
o
de usuarios
5 - 25 4
25 - 45 6
45 - 65 14
65 - 85 26
85 - 105 14
105 - 125 8
125 - 145 6
145 - 165 2
Total 80
a.- Construya un histograma de la variable consumo
b.- Determine la media y mediana de la variable consumo.
c.- Calcule el percentil 25 y 75 para la variable consumo.
d.- Calcule la varianza de la variable consumo.
e.- Que porcentaje de usuarios consumen mas de 100 Kwh?
f.- Que porcentaje de los usuarios consume entre 50 y 150 Kwh?
Ejercicios 3
Los datos que se muestran a continuacion representan el costo de la energa electrica durante el
mes de julio del 2006 para una muestra aleatoria de 50 departamentos con dos recamaras en una
ciudad grande. Costo de energa electrica en dolares.
96 171 202 178 147 102 153 197 127 82
157 185 90 116 172 111 148 213 130 165
141 149 206 175 123 128 144 168 109 167
95 163 206 175 130 143 187 166 139 149
108 119 150 154 114 135 191 137 129 158
Construya una tabla de distribucion de frecuencias, calcule medidas de tendencia central y genere
un graco adecuado.
Ejercicios 4
Un polica de una ciudad, usando radar, verico la velocidad de los automoviles que circulaban por
una calle de la ciudad:
27 23 22 38 43 24
25 23 22 52 31 30
29 28 27 25 29 28
26 33 25 27 25
21 23 24 18 23
Construya una tabla de distribucion de frecuencias, calcule medidas de tendencia central y genere
un graco adecuado.
14
1.6. Estadsitica Bivariada
Ahora, supongamos que queremos estudiar el comportamiento de la variable de clasicacion
bidimensional (X, Y ), asociada a dos variables de clasicacion unidimensionales X e Y , respectiva-
mente, en una muestra de tama no n de la poblacion. Entonces dividimos la muestra en r clases A
i
,
seg un la variable X, y en s clases B
j
, seg un Y .
Llamamos n
ij
al n umero de elementos de la muestra que pertenecen simult aneamente a la clase
A
i
y la clase B
j
. Podemos luego considerar una clase o modalidad A
i
B
j
formada por elementos de
la muestra que pertenecen simultaneamente a A
i
y a B
j
. Se observa que hay r s modalidades A
i
B
j
.
1.6.1. Frecuencia Absoluta y Frecuencia Relativa
Deniciones de interes:
n
ij
: frecuencia absoluta del n umero de elementos pertenecientes a A
i
B
j
f
ij
: frecuencia relativa del n umero de elementos en A
i
B
j
con respecto al total n, donde
f
ij
=
n
ij
n
, i = 1, . . . , r; j = 1, . . . , s
1.6.2. Tablas de Contingencia
Cuadro de doble entrada donde se puede resumir la informaci on acerca de las frecuencias, ya
sean absolutas o relativas, como se muestra a continuacion:
Y
B
1
B
2
. . . B
s
X A
1
n
11
n
12
. . . n
1s
n
1+
A
2
n
21
n
22
. . . n
2s
n
2+
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A
r
n
r1
n
r2
. . . n
rs
n
r+
n
+1
n
+2
. . . n
+s
n
1.6.3. Distribuciones Marginales
n
i+
: es el n umero de elementos de la muestra que pertenecen a la clase A
i
, sin importar la clase
B
j
a la que esten asociados (suma de los valores de la la i-esima de la tabla de contingencia de
frecuencias)
n
i+
=
s

j=1
n
ij
, i = 1, . . . , r
n
+j
: es el n umero de elementos de la muestra que pertenecen a la clase B
j
seg un Y, sin importar
la clase A
i
a la que esten asociados (suma de los valores de la columna j-esima de la tabla de
contin-gencia de frecuencias)
n
+j
=
r

i=1
n
ij
, j = 1, . . . , s
15
f
i+
: frecuencia relativa de las clases A
i
sin importar las clases B
j
.
f
i+
=
n
i+
n
, i = 1, . . . , r
f
+j
: frecuencia relativa de las clases B
j
sin importar las clases A
i
.
f
+j
=
n
+j
n
, j = 1, . . . , s
1.6.4. Distribuciones Condicionales
La distribucion condicional consiste en estudiar las frecuencias asociadas a las clases de una
variable cuando nos restringimos a los elementos de una clase dada seg un la otra variable, esto es,
estudiar el comportamiento de una variable dado un valor jo de la otra. Para calcular la proporcion
de individuos muestrales que seg un Y caen en B, conociendo que seg un X ya pertenecan a A, se
debe evaluar:
f
B/A
=
n
B/A
n
donde f
B/A
es la frecuencia relativa condicional del subconjunto B de Y dado que X pertenece
al subconjunto A.
La distribucion de X condicionada a Y se dene como
f
i/j
=
f
i/j
f
+j
=
n
ij
n
+j
i = 1, . . . , r
y
r

i=1
f
i/j
= 1
La distribucion de Y condicionada a X se dene como
f
j/i
=
f
j/i
f
i+
=
n
ij
n
i+
j = 1, . . . , s
y
s

j=1
f
j/i
= 1
Ejemplo 1.6.1 Sea X la edad e Y la categora correspondiente al puesto de trabajo. Dada la
siguiente tabla de contingencia, calcular la distribucion condicional de Y, dado que X es 25-30 y
35-45.
X\Y I II III n
i+
15-20 20 20 5 45
20-25 15 12 8 35
25-30 10 15 10 35
30-35 5 20 25 50
35-40 5 10 30 45
n
+j
55 77 78 210
16
Ejercicios 5 Una muestra aleatoria de 1000 votantes registrados se clasicaron de acuerdo con su
posicion en la categoras de ingreso bajo, medio o alto y si estan a favor o no de la nueva reforma
de impuestos, resultados que se muestran en la tabla a continuacion:
Nivel de ingreso
Reforma de impuestos Bajo Medio Alto Total
A favor 182 213 203 598
En contra 154 128 110 402
Total 336 351 313 1000
Determine distribuciones marginales por las y columnas.
1.6.5. Independencia
Dada una informacion en una Tabla de Contingencia, se dice que las variables X e Y son
independientes, s y solo s, la frecuencia relativa conjunta es igual al producto de las frecuencias
relativas marginales.
f
ij
= f
i+
f
+j
i = 1, . . . , r j = 1, . . . , s
Si las variables X e Y no son independientes entre s, se dice que existe una asociaci on entre
ellas. De modo que el conocimiento de una de las variables presente alguna informaci on respecto de
la otra. Nuestro objetivo es medir de alguna forma esta relaci on existente y poder ademas describir
de que forma (lineal, exponencial, potencial, etc.) estan relacionadas.
1.6.6. Asociacion, Dependencia o Correlaci on
En estadstica Descriptiva se dice que dos variables cuantitativas est an asociadas, son depen-
dientes, o est an correlacionadas si cuando se aumentan los valores de una variable, los valores
de la otra tienden a:
i) o bien a aumentar (y se dice que la asociaci on dependencia es directa o que la correlacion es
positiva)
ii) o bien a disminuir (y se dice que la asociacion o dependencia es inversa o que la correlaci on
es negativa)
Cuando no se presenta esta tendencia se dice que las variables no est an asociadas o no son depen-
dientes o no est an correlacionadas.
La asociaci on, correlacion o dependencia en Estadstica Descriptiva, no implica relaci on causa-
efecto. En otras palabras, si cuando una variable aumenta la otra tiende a aumentar (o a disminuir)
no es posible armar que esta ultima aumenta (o disminuye) PORQUE la primera variable aumenta.
Indicadores de Asociacion: Covarianza
La covarianza entre dos variables, X e Y esta dada por:
cov(X, Y ) =
n

i=1
(x
i
x)(y
i
y)
n
17
o equvalentemente
cov(X, Y ) =
1
n
n

i=1
x
i
y
i
x y
La covarianza es una medida de asociaci on lineal, pero tiene la desventaja que su interpretacion
depende de las unidades de medici on.
Si cov(X,Y)> 0, la asociaci on es directa o positiva.
Si cov(X,Y)< 0, la asociaci on es inversa o negativa.
Si cov(X,Y) 0, no hay asociaci on lineal.
Indicadores de Asociacion: Correlaci on
La correlacion lineal entre dos variables se dene como
corr(X, Y ) =
n

i=1
(x
i
x)(y
i
y)

_
n

i=1
(x
i
x)
2
n

i=1
(y
i
y)
2
Si corr(X, Y ) = 1, la correlaci on es la maxima correlaci on positiva o directa.
Si corr(X, Y ) = 1, la correlaci on es la m axima correlacion negativa o inversa.
Si corr(X, Y ) 0, no existe correlaci on o dependencia.
Una formula alternativa para calcular correlaci on es
corr(X, Y ) =
s
XY
s
X
s
Y
donde s
X
y s
Y
son las desviaciones estandar de X e Y , respectivamente, y donde s
XY
es la covarianza
entre X e Y .
Otra formula alternativa es
corr(X, Y ) =

x
i
y
i

x
i
__

y
i
_
/n

x
2
i

_

x
i
_
2
/n

y
2
i

_

y
i
_
2
/n
Si bien no existe una regla general para decir si una correlaci on es alta media o baja, en este
curso podemos adoptar el siguiente criterio:
18
Ejemplo 1.6.2 .
1. Consideremos los siguientes datos, donde X indica la temperatura media diaria en grados
Farenheit e Y , el consumo diario correspondiente de gas natural en pies c ubicos.
X,F

50 45 40 38 32 40 55
Y,ft
3
2.5 5.0 6.2 7.4 8.3 4.7 1.8
Realice un diagrama de dispersion y calcule el coeciente de correlacion
X,Y
, si ademas cuenta
con las siguientes medidas de resumen:

x
i
= 300;

y
i
= 35,9;

x
2
i
= 13218;

y
2
i
= 218,67;

x
i
y
i
= 1431,8
2. Considere los siguientes datos donde X, representa el n umero de sucursales que 10 bancos
diferentes tienen en un area metropolitana, e Y es la correspondiente cuota del total de
depositos mantenidos por los bancos.
X 198 186 116 89 120 109 28 58 34 31
Y 22.7 16.6 15.9 12.5 10.2 6.8 6.8 4.0 2.7 2.8
a) Construya un diagrama de dispersion entre X e Y.
b) Calcule covarianza y correlacion.
3. Un gerente de una empresa automotriz piensa que si aumentan el porcentaje de comision
pagada al vendedor de automoviles, aumenta la venta. Para vericar este supuesto se realizo un
estudio sobre 15 concesionarios similares. Sean
X: Comisiones pagadas a vendedores de autos en un mes ( %)
Y: Ganancias netas por ventas, en el mismo mes (Millones de $)
Obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
X 3.6 5.2 5.3 7.3 5.0 5.2 3.0 3.1 3.2 7.5 8.3 6.1 4.9 5.8 7.1
Y 11.3 14.7 18.5 20.0 12.4 15.4 9.6 11.3 8.1 27.9 24.6 18.8 13.9 12.1 23.7
Realice un graco de dispersion, calcule covarianza y correlacion, se cumple el supuesto del
gerente?
19
1.6.7. Ajuste de Curvas
En el problema de ajuste a curvas se desea que dado un par de variables (X, Y ) encontrar una
curva que se ajuste de la mejor manera a los datos. La curva est a denida en forma parametrica, y se
deben encontrar los valores de sus parametros para hacer que alguna medida de error se minimice.
Regresion Lineal Simple
Con la regresi on lineal simple se pretende ir m as all a de ver la asociaci on entre dos variables.
En concreto se quiere:
(i) Investigar la naturaleza de la asociaci on.
(ii) Construir un modelo que describa la relacion entre ambas variables.
(iii) Predecir
Supongamos que un diagrama de dispersi on de los datos de los puntos (x
i
, y
i
) indica una relacion
lineal entre las variables X eY o, alternativamente, que el coeciente de correlaci on es cercano a 1
o -1. Entonces el siguiente paso es encontrar la recta L que en lag unsentido ajuste los datos.
En general, el modelo de regresi on lineal simple lo podemos plantear como la recta :
y
i
= a + bx
i
, i = 1, . . . , n. (1.1)
donde
y
i
: es la variable respuesta o dependiente para el individuo i;
x
i
: es la variable explicativa o independiente para el individuo i,
a : representa el intercepto con el eje Y, y se interpreta como el valor que toma y cuando x=0.
b : representa la pendiente de la recta, y se interpreta como la cantidad que aumenta(disminuye) y
cuando x aumenta(disminuye) en una unidad.
La pendiente y el intercepto pueden calcularse de la siguiente manera:
b =
rs
y
s
x
=
cov(X, Y )
s
2
X
y a = y b x
Ejemplo 1.6.3 Considere los datos de los ejemplos 1.6.2 y encuentre la recta que se ajusta a cada
conjunto de datos.
Algunas veces el diagrama de puntos no indica una relaci on lineal entre las variables X e Y pero
se podr a observar alguna otra curva tpica y bien conocida Y = f(X) que puede aproximar los datos;
se le llama curva de aproximacion. Algunas de esas curvas tpicas son las siguientes analizamos la
relaci on entres X e Y y determinamos que esta no se ajusta auna recta podemos analizar, entre
otros, los dos siguientes casos:
20
Ajuste Exponencial
Si entre log(y) y x observamos una relaci on lineal, usaremos la curva exponencial:
y
i
= ae
bx
i
, i = 1, . . . , n.
Este ajuste se puede reducir a una regresi on lineal de la siguiente forma
log(y
i
) = a

+ b

x
i
, i = 1, . . . , n.
donde
a

=log(a)
b

=b
Ajuste Polinomial
En este caso lo que hacemos es ajustar la relacion entre x e y a traves de un polinomio de grado
p:
y
i
=
0
+
1
x
i
+
2
x
2
i
+
3
x
3
i
, . . . ,
p
x
p
i
i = 1, . . . , n.
Al incluir potencias de X logramos mayor exibilidad en el modelo.
Si p=1, estamos en el caso de regresi on lineal.
Si p=2, la regresi on se llama cuadr atica.
Otros Ajustes
Hiperbola
Si entre 1/y y x observamos un relaci on lineal usaremos la hiperbola:
y =
1
a + bx
o
1
y
= a + bx
Curva Geometrica
Si entre log(y) y log(x) observamos una relacion lineal usaremos la curva potencial:
y = ax
b
o log(y) = log(a) + b log(x)
21
Captulo 2
Probabilidades
2.1. Introducci on
Uno de los problemas que deberemos considerar e intentar evaluar, es el elemento de aleatoriedad
que se asocia a la ocurrencia de ciertos eventos cuando se lleva a cabo un experimento. En muchos
casos debe tenerse la capacidad de resolver un problema de probabilidad mediante el conteo del
n umero de casos posibles sin realmente anotar cada uno de ellos.
Teorema 2.1.1 Si una operacion puede realizarse de n
1
formas, y si por cada una de estas una
segunda operacion puede llevarse a cabo de n
2
formas, entonces las dos operaciones pueden realizarse
juntas de n
1
n
2
formas.
Ejemplo 2.1.1 Cuantos son los resultados posibles cuando se lanza un dado dos veces?
Teorema 2.1.2 (Principio Multiplicativo) Si una operacion puede realizarse de n
1
formas, y
si por cada una de estas puede efectuarse una segunda en n
2
formas, y para cada una de las dos
primeras se puede efectuar una tercera de n
3
formas, y as sucesivamente, entonces la secuencia de
k operaciones pueden realizarse de n
1
n
2
. . . n
k
formas.
Ejemplo 2.1.2 Cuantos men us que consisten de sopa, postre y bebida existen si se puede selec-
cionar entre 4 sopas diferentes, 5 clases de postres y 4 bebidas?
Ejemplo 2.1.3 Cuantos n umeros pares de tres dgitos pueden formarse con los dgitos 1, 2, 5, 6
y 9?
22
Con frecuencia interesa un conjunto que contiene como elementos todos los posibles ordenes o
arreglos de un grupo de objetos. Por ejemplo, se puede desear conocer cu antos arreglos diferentes
son posibles para sentar a 6 personas alrededor de una mesa, o bien, cu antas formas diferentes
exiten de tomar 5 ramos de un total de 8.
Denici on 2.1.1 Una permutacion es un arreglo de todos, o parte de, un conjunto de objetos.
Considerense las tres letras a, b y c. Las permutaciones posibles son abc, acb, bca, cab, bac y
cba. Se puede ver que hay 6 distintos arreglos. Con el principio multiplicativo se pueded llegar a
que la respuesta es 6 sin escribir todas las posibles combinaciones. Hay n
1
= 3 posibilidades para la
primera posicion, despues n
2
= 2 para la segunda y unicamente n
3
= 1 posibilidades para la ultima,
lo que da un total de n
1
n
2
n
3
= 3 2 1 = 6 permutaciones.
En general, se pueden acomodar n objetos distintos en n (n 1) (n 2) . . . (3) (2) (1)
formas. Este producto se representa por el smbolo n!, que se lee n factorial. Por denici on, 1! =
1 y 0! = 1.
Teorema 2.1.3 El n umero de permutaciones de n distintos objetos es n!
El n umero de permutaciones de las cuatro letras a, b, c y d ser a de 4! = 24. Considerese ahora
el n umero posible de ellas al tomar las cuatro letras, pero de dos a la vez. Seran ab, ad, ac, ba, ca,
bc, cb, bd, db, cd, dc. De una nueva cuenta con el Teorema 7.1, se tiene dos posiciones para llenar
con laa n
1
= 4 posibilidades para la primera y, por lo tanto, n
2
= 3 posibilidades para la segunda,
para un total de n
1
n
2
= 4 3 = 12 permutaciones. En general, n objetos distintos, si se toman r a
la vez, pueden acomodarse en n (n 1) (n2) (n r + 1) formas.
Teorema 2.1.4 El n umero de permutaciones de n objetos distintos tomando r a la vez, es:
n
P
r
=
n!
(n r)!
Ejemplo 2.1.4 De cuantas maneras se puede programar 3 ayudantas en 3 distintos horarios, si
los alumnos tienen 5 modulos disponibles?
Las permutaciones que se dan al acomodar objetos en un crculo se llaman permutaciones
circulares. Dos de estas no se consideran diferentes a menos que a los objetos correspondientes en
los dos arreglos les preceda o les siga un objeto diferente al avanzar en el sentido de las manecillas
del reloj. Por ejemplo, si 4 personas juegan a las cartas, no se tiene una nueva permutaci on si todas
se mueven una posicion en esa direccion. Al considerar a una en un lugar jo y acomodar a las otras
tre en 3! formas diferentes, se encuentra que hay 6 acomodos dsitintos para el juego de cartas.
Teorema 2.1.5 El n umero de permutaciones de n objetos distintos agregados en un crculo es
(n-1)!
Hasta ahora se han considerado permutaciones de objetos diferentes. Esto es, todos los objetos
eran distintos o totalmente distinguibles. Si consideramos la palabra OSO, entonces las 6 permuta-
ciones de las letras de esta palabra son O
1
SO
2
, O
1
O
2
S, SO
1
O
2
, O
2
SO
1
, O
2
O
1
S, SO
2
O
1
, por lo que
unicamente tres son distintas. Por lo tanto, con tres letras, siendo dos iguales, se tienen 3!/2! = 3
diferentes permutaciones.
23
Teorema 2.1.6 El n umero de permutaciones diferentes de n objetos de los cuales n
1
son de un
tipo, n
2
son de un tipo, . . ., n
k
de un k- esimo tipo, es:
n!
n
1
!n
2
! n
k
!
Ejemplo 2.1.5 De cuantas formas diferentes pueden acomodarse 3 ampolletas rojas, 4 amarillas
y 2 azules en un panel con 9 espacio para 9 luces?
Con frecuencia interesa el n umero de formas en que se pueden repartir n objetos en r subconjun-
tos llamados celdas. La partici on se logra si la interseccion de cada par posible de r subconjuntos
es el conjunto vaco y si la uni on de todos los subconjuntos da como resultado el conjunto original.
No importa el orden de los objetos dentro de una celda.
Teorema 2.1.7 El n umero de formas de partir un conjunto de n objetos en r celdas con n
1
ele-
mentos en la primera celda, n
2
elementos en la segunda, y as sucesivamente, es:
_
n
n
1
n
2
n
r
_
=
n!
n
1
!n
2
! n
r
!
donde n
1
+ n
2
+ + n
r
= n
Ejemplo 2.1.6 De cuantas formas distintas pueden 7 cientcos acomodarse en un laboratorio
para tres personas y dos laboratorios para dos personas?
En muchos problemas interesa el n umero de formas posibles de seleccionar r objetos de un
total de n sin importar el orden. Estas selecciones se llaman combinaciones. Una combinaci on es
realmente una partici on en dos celdas, una de las cuales contiene los r objetos que se seleccionaron
y la otra, los (n r) objetos restantes.
Teorema 2.1.8 El n umero de combinacioines de n objetos distintos, tomando r a la vez es
_
n
r
_
=
n!
r!(n r)!
Ejemplo 2.1.7 Encuentre el n umero de comites que pueden formarse con 4 qumicos y 3 fsicos y
que comprendan 2 qumicos y 1 fsico.
Ejercicios 6 .
1. A los participantes de una convencion se les ofrecen 6 recorridos por da para visitar lugares
de interes durante los 3 das de duracion del evento. De cuantas formas puede una persona
acomodarse para hacer alguno de ellos?
2. Si un experimento consiste en lanzar un dado y despues seleccionar aleatoriamente una letra
del alfabeto, cuales son los posibles resultados?
3. De cuantas formas pueden plantarse, a lo largo de la lnea divisoria de una propiedad, 3
robles, 4 pinos y 2 arces, si uno no distingue entre los arboles de la misma clase?
24
2.2. Modelo de Probabilidad
En el estudio de la estadstica interesa, b asicamente, la presentaci on e interpretaci on de resul-
tados aleatorios que se dan en un estudio planeado o en una investigaci on cientca. Por ejemplo,
es posible registrar el n umero de accidentes que ocurren mensualmente en una determinada inter-
secci on de calles, con el proposito de justicar la instalci on de un semaforo; clasicar los artculos
que salen de una lnea de ensamble como defectuosos o no defectuosos; o bien, tener interes en
conocer el volumen de gas que se libera durante una reacci on qumica cuando la concentracion de
un acido vara. De aqu que se manejen datos experimentales, que representan conteos o mediciones,
o tal vez datos categ oricos que puedan clasicarse de acuerdo con alg un criterio.
Necesitamos entonces una forma matem atica para cuanticar la incertidumbre.
Utilizaremos la palabra experimento, E, para describir cualquier proceso que genere un conjun-
to de datos. Un ejemplo muy simple de un experimento consiste en el lanzamiento de una moneda
la aire. En este caso s olo existen dos resultados posibles: cara o sello. Otro experimento podra
ser el lanzamiento de un proyectil y la observaci on de su velocidad en un perodo de tiempo. Las
opiniones de los votantes respecto de un candidato a alcalde tambien pueden considerarse como
observaciones de un experimento. Aqu interesan particularmente las observaciones que se obtienen
en la repeticion de un experimento. En la mayor parte de los casos los resultados depender an del
azar y, por lo tanto, no pueden pronosticarse con certidumbre. Si un qumico realiza varias veces
un analisis bajo las mismas condiciones y obtiene diferentes mediciones, ello indica la existencia
de un elemento de aleatoriedad en el procedimiento experimental. Incluso cuando una moneda se
lanza al azar repetidamente, no es posible garantizar que en un lanzamiento dado se obtendra co-
mo resultado una cara. No obstante, s se conoce el conjunto completo de posibilidades para cada
lanzamiento.
2.2.1. Espacio Muestral
Denici on 2.2.1 Al conjunto de todos los resultados posibles de un experimento estadstico se le
llama espacio muestral y se representa por la letra S.
A cada resultado en un espacio muestral se le llama elemento del espacio muestral o simple-
mente punto muestral.
Ejemplo 2.2.1 Determine el espacio muestral del siguiente experimento: se lanza una moneda y
si sale cara, se lanza un dado; si sale sello, se vuelve a lanzar.
2.2.2. Eventos
Denici on 2.2.2 Un evento A, respecto a un espacio muestral S, asociado a un experimento E,es
un subconjunto de resultados posibles.
Es claro que S en s mismo es un evento y tambien lo es el conjunto vaco. Cualquier resultado
individual tambien puede considerarse como un evento.
25
Denici on 2.2.3 El complemento de un evento A con respecto a S es el conjunto de todos los
elementos de S que no estan en A, es decir, es el suceso que se da si A no ocurre. Denotamos el
complemento de A por el smbolo A
c
, tambien escrito

A.
Denici on 2.2.4 La interseccion de dos eventos A y B, AB, es el evento que contiene a todos
los elementos comunes a A y a B, es decir, es el evento que ocurre si A y B ocurren.
Denici on 2.2.5 Dos eventos A y B son mutuamente excluyentes o disjuntos si AB = ,
esto es, si A y B no tienen elemento comunes.
Denici on 2.2.6 La union de los dos eventos A y B, AB es el evento que contiene a todos los
elementos que pertenecen a A, o a B o a ambos.
Ejemplo 2.2.2 Sea el experimento
E: lanzar un dado y observar el n umero que sale,
y sean los eventos:
A: sale un n umero par,
B: sale un n umero impar,
C: sale un n umero primo.
Determinar el espacio muestral y los elementos de los siguientes conjuntos:
a) A C
b) B C
c) C
c
Denici on 2.2.7 Sea A la clase de eventos (aleatorios) de S. A es un - algebra de subconjuntos
de S (no vaco) si:
i) S A
ii) A A A
c
A
iii) A
1
, A
2
, . . . A

i=1
A
i
A
Nota: (S,A) se llama espacio medible.
Ejercicios 7 Demuestre las siguientes propiedades:
i) A
ii) A
1
, A
2
, . . . , A
n
A

n
i=1
A
i
A,

n
i=1
A
i
A
iii) A
1
, A
2
, . . . A

i=1
A
i
A
26
2.2.3. Medida de Probabilidad
Finalmente, dado un - algebra A de eventos de S, para concretar nuestro modelo debemos
introducir una medida de probabilidad sobre (S,A).
Denici on 2.2.8 Una medida de probabilidad P sobre (S,A) es una funcion
P : A [0, 1]
tal que cumple con los siguientes tres axiomas de Kolmogorov:
A1 P(A) > 0 A A
A2 P(S) = 1
A3 Si A
1
, A
2
, . . . A son disjuntos dos a dos, entonces
P
_

_
i=1
A
i
_
=

i=1
P(A
i
)
(S, A, P)se llama modelo de probabilidad.
Lema 1 Sea (S, A, P) un modelo de probabilidad. Entonces valen las siguientes propiedades:
a) P() = 0
b) Si A
1
, . . . , A
n
A son disjuntos dos a dos, entonces
P
_
n
_
i=1
A
i
_
=
n

i=1
P(A
i
)
Propiedades de P
Dado un modelo de probabilidad (S, A, P) se desprende de A1, A2 y A3 que:
P1) P(A
c
) = 1 P(A)
P2) A B P(A) P(B)
P3) P(A B) = P(A) +P(B) P(A B)
P4) P(

i=1
A
i
)

i=1
P(A
i
)
Ejercicios 8 .
1. Un espacio muestral S se compone de cuatro elementos, es decir, S = {a
1
, a
2
, a
3
, a
4
}. Bajo
cuales de las siguientes funciones S llega a ser un espacio probabilstico?
a)
P(a
1
) = 1/2 P(a
2
) = 1/3 P(a
3
) = 1/4 P(a
4
) = 1/5
27
b)
P(a
1
) = 1/2 P(a
2
) = 1/4 P(a
3
) = 1/4 P(a
4
) = 1/2
c)
P(a
1
) = 1/2 P(a
2
) = 1/4 P(a
3
) = 1/8 P(a
4
) = 1/8
d)
P(a
1
) = 1/2 P(a
2
) = 1/4 P(a
3
) = 1/4 P(a
4
) = 0
2. Sean tres sucesos A, B y C. Encuentre expresiones para los siguientes sucesos en lenguaje de
conjuntos.
a) Solo ocurre A.
b) Ocurren tanto B como C, pero no as A.
c) Los tres sucesos ocurren.
d) Ninguno de los tres sucesos ocurre.
e) A lo mas dos de ellos ocurren.
f) Al menos dos de los sucesos ocurren.
g) Al menos uno de los sucesos ocurre.
h) Exactamente dos de ellos ocurren.
28
2.2.4. Espacios Probabilsticos Finitos
Consideremos un espacio muestral S y la clase A de todos los sucesos. S se convierte en un
espacio probabilstico asignando probabilidades a los sucesos de A de tal forma que satisfaga los
axiomas de probabilidad.
Espacios nitos equiprobables
Supongamos que S es un espacio muestral nito con n elementos y supongamos que las caractersti-
cas fsicas del experimento sugieren que a varios de los resultados se les asignen probabilidaes iguales.
Entonces S se convierte en un espacio probabilstico, llamado espacio nito equiprobable, si a ca-
da punto se le asigna probabilidad 1/n y si a cada suceso A que contiene r puntos, probabilidad r/n.
Por lo tanto,
P(A) =
n(A)
n(S)
Teorema 2.2.1 Sea S un espacio muestral nito, y para cualquier A S sea
P(A) =
n(A)
n(S)
Entonces P cumple los axiomas A1, A2 y A3.
Ejemplo 2.2.3 Supongamos que se elige aleatoriamente a un estudiante entre 80, de los cuales
30 estudian matematicas, 20 qumica y 10, ambas. Hallar la probabilidad p de uqe un estudiante
esta estudiando matematicas o qumica.
Sea S un espacio muestral nito, digamos S ={a
1
, a
2
, . . . , a
n
} un espacio probabilstico nito, o
modelo probabilstico nito, se obtiene asinando a cada punto a
i
de S un n umero real p
i
llamado
probabilidad de a
i
, que cumple con las siguientes propiedades:
a) cada p
i
es no negativo, p
i
0
b)

n
i=1
p
i
= 1
Ejercicios 9 .
1. Supongamos que A y B son sucesos con
P(A) = 0,6; P(B) = 0,3 y P(A B) = 0,2
Hallar la probabilidad de
a) A no ocurra.
b) B no ocurra.
c) A o B ocurran
d) Ni A ni B ocurran
29
2. Un naipe ingles consta de 52 cartas agrupadas en cuatro pintas (corazon, pique, trebol y
diamante) y 13 n umeros (As, 2, . . ., 9, 10, J, Q K). Se elige consecutivamente al azar y
sin reemplazo cinco cartas de este naipe. Calcule las probabilidades de los siguientes eventos
o sucesos:
a) Las primeras tres cartas son diamantes y las dos ultimas son pique.
b) Hay exactamente cuatro cartas del mismo n umero.
c) Hay tres cartas de un mismo n uumero y dos de otro.
3. Consideremos el experimento de extraer cartas de una baraja.
Cual es la probabilidad de extraer dos reyes?
a) sin devolver la 1
a
carta.
b) con devolucion.
4. En un colegio hay 60 alumnos de Bachillerato. De ellos 40 estudian ingles, 24 estudian frances
y 12 los dos idiomas. Se elige al azar un alumno. Determinar las probabilidades de los sigu-
ientes sucesos:
a) Estudia al menos un idioma.
b) No estudia ingles o estudia frances.
c) Estudia frances sabiendo que tambien estudia ingles.
d) Estudia frances sabiendo que estudia alg un idioma.
e) Estudia ingles sabiendo que no estudia frances.
30
2.3. Probabilidad Condicionada e Independencia
2.3.1. Probabilidad Condicional
Denici on 2.3.1 Supongamos que A, B son sucesos de un espacio muestral S. La probabilidad
condicional que A ocurra dado que B ha ocurrido, P(A | B) se dene y denota como
P(A | B) =
P(A B)
P(B)
, P(B) > 0
y
P(A | B) = 0, si P(B) = 0.
P(A | B) mide en cierto modo la probabilidad relativa de A con respecto al espacio reducido de
B.
Ejemplo 2.3.1 Hallar P(B | A) si:
1. A es un subconjunto de B.
2. A y B son mutuamente excluyentes. (Asumimos que P(A) > 0)
Teorema 2.3.1 Supongamos que S es un espacio equiprobable, y que A y B son sucesos. Entonces
P(A | B) =
n(A B)
n(B)
es una medida de probabilidad
Ejemplo 2.3.2 Se tiran un par de dados y se dene
A: salga 2 en al menos uno de los dados
B: la suma es 6.
Encontrar P(A | B) y P(A)
Teorema 2.3.2 (Multiplicacion para la probabilidad condicional)
P(A B) = P(B | A)P(A)
Corolario 1 P(A B C) = P(C | A B) P(B | A) P(A)
Ejemplo 2.3.3 Un lote contiene 12 objetos de los cuales 4 son defectuosos. Se sacan tres objetos
al azar del lote, uno detras de otro. Hallar la probabilidad de los tres no sean defectuosos.
31
Denici on 2.3.2 Los sucesos A y B son independientes si P(AB) = P(A)P(B), de cualquier
otra forma seran dependientes.
Esta denicion nos lleva a concluir que A y B son sucesos independientes si
P(A | B) = P(A) y P(B | A) = P(B)
Nota:
1.- Se dice que A
1
, A
2
, . . . , A
n
A son dos a dos independientes ssi
P(A
i
A
j
) = P(A
i
) P(A
j
) i < j
2.- Independencia dos a dos no implica independencia completa.
3.- La complementacion de uno o m as eventos no destruye la independencia.
4.- Sea C A un evento tal que P(C) > 0. Entonces A y B son condicionalmente independientes
dado C,
AB | C P(A B | C) = P(A | C) P(B | C)
5.- Observemos que los eventos disjuntos no son independientes a menos que uno de ellos tenga
probabilidad cero. Es decir, supongamos A B = y A y B son independientes. Entonces
P(A)P(B) = P(A B) = 0
y por lo tanto
P(A) = 0 o P(B) = 0
Ejemplo 2.3.4 .
1. Demostrar que si A y B son sucesos independientes, entonces A

y B

son sucesos indepen-


dientes.
2. Urna de Polya
Una urna contiene a chas azules y r chas rojas. El experimento consiste en:
(i) Extraer una cha y observar su color.
(ii) Devolver la cha con t chas adicionales del mismo color.
(iii) Seguir iterando
Para tres ectracciones dena:
A
i
: la i-esima cha es azul, i= 1, 2, 3.
Calcule P(A
1
A
2
A
3
)
3. Juan y Pedro juegan a obtener la puntuacion mas alta lanzando sus dados. El dado de Juan
tiene cuatro caras con la puntuacion 5 y las otras dos caras con el 1. El dado de Pedro tiene
dos caras con el 6, otras dos con el 4 y las otras dos con el 1. Hallar:
a) La probabilidad de que gane Pedro.
b) La probabilidad de empatar.
32
2.3.2. Probabilidad Total
Denici on 2.3.3 Una familia de eventos B
1
, . . . , B
n
A se llama particion de S si:
k
_
i=1
A
i
= S y A
i
A
j
= i = j.
Teorema 2.3.3 Supongamos que los sucesos A
1
, A
2
, . . . , A
k
forman una particion de S. Entonces
para cualquier evento B se tiene que
P(B) =
k

i=1
P(B | A
i
)P(A
i
)
2.3.3. Teorema de Bayes
Teorema 2.3.4 Bajo las mismas condiciones del teorema anterior se tiene que
P(A
i
| B) =
P(B | A
i
)P(A
i
)

k
j=1
P(A
j
)P(B | A
j
)
Ejercicios 10 .
1. Supongamos que tenemos las tres cajas siguientes:
La caja A tiene 3 chas rojas y 5 blancas.
La caja B tiene 2 rojas y una blanca.
La caja C tiene 2 rojas y 3 blancas.
Se escoge una caja al azar, y una cha de dicha caja. Si la cha es roja, hallar la probabilidad
de que sea de la caja A.
2. En una ciudad el 40 % de la gente se considera conservadora (C), el 35 % liberales (L), y el
25 % independientes (I). Durante las elecciones votaron el 45 % de los conservadores, el 45 %
de los liberales y el 60 % de los independientes tambien. Si se elige un votante al azar, hallar
la probabilidad de que el votante sea conservador, liberal e independiente. bilidad de que esta
persona tenga el cancer en cuestion? lidad de que el proceso de llenado de las botellas haya
sido a baja velocidad, si se sabe que la botella esta efectivamente con un volumen incorrecto?
3. Un estudiante cuenta, para un examen, con la ayuda de un despertador, el cual consigue
despertarlo en un 80 % de los casos. Si oye el despertador, la probabilidad de que realice el
examen es 0,9 y, en caso contrario, de 0,5.
a) Si va a realizar el examen cual es la probabilidad de que haya odo el despertador?
b) Si no realiza el examen, cual es la probabilidad de que no haya odo el despertador?
4. En una casa hay tres llaveros A, B y C, el primero con 5 llaves, el segundo con 7 y el tercero
con 8, de las que solo una de cada llavero abre la puerta del trastero. Se escoge al azar un
llavero y, de el, una llave para intentar abrir el trastero. Se pide:
33
a) Cual sera la probabilidad de que se acierte con la llave?
b) Cual sera la probabilidad de que el llavero escogido sea el tercero y la llave no abra?
c) Y si la llave escogida es la correcta, cual es la probabilidad de que pertenezca al primer
llavero A?
5. Demuestre que si A, B y C son independientes, entonces A es independiente de (B

).
6. Sean A
1
, A
2
y A
3
sucesos tales que A
1
A
2
A
3
= , y A
1
A
2
= A
1
A
3
= A
2
A
3
.
Sabiendo que P(A
1
) = 1/4 y P(A
2
) = 1/2. Hallar P(A
3
).
7. Cual es la probabilidad que la corriente llegue de A a B en el siguiente sistema si cada
componente falla de manera independiente con probabilidad p?
8. Una compa na dedicada al transporte p ublico explota tres lneas de una ciudad, de forma que
el 60 % de los autobuses cubre el servicio de la primero lnea, el 30 % cubre la segunda y el
10 % cubre el servicio de la tercera lnea. Se sabe que la probabilidad de que, diariamente,
un autob us se avere es del 2 %, 4 % y 1 %, respectivamente, para cada lnea. Determina la
probabilidad de que, en un da, un autob us sufra una avera.
9. En un concurso se dispone de cinco sobres, dos de ellos contienen premio y los otros tres no.
Se pide a un primer concursante que escoja un sobre y observe si tiene premio, y a un segundo
concursante que elija otro de los restantes y observe si tiene premio.
a) Escriba el conjunto de resultados posibles asociado a este experimento e indique la prob-
abilidad de cada uno de ellos.
b) Que probabilidad tiene el segundo concursante de obtener premio?
c) Cual es la probabilidad de que ambos concursantes obtengan premio?
10. Supongamos que tenemos las tres cajas siguientes:
La caja A tiene 3 chas rojas y 5 blancas.
La caja B tiene 2 rojas y una blanca.
La caja C tiene 2 rojas y 3 blancas.
Se escoge una caja al azar, y una cha de dicha caja. Si la cha es roja, hallar la probabilidad
de que sea de la caja A.
34
11. El gerente de una empresa regional dispone de dos autos; uno proporcionado por la empresa y
el otro de su propiedad. La probabilidad que utilice su auto es 2/5 y la probabilidad que utilice
el auto de la empresa es 3/5. Ademas se sabe que le gerente llega a tiempo a las reuniones
de la empresa con probabilidad 1/5 y que, si utiliza el auto de la empresa, la probabilidad de
llegar a tiempo a esas reuniones es 1/4.
Cual es la probabilidad que llegue a tiempo a una reunion, dado que utilizo su propio auto?
Dado que el gerente llego a tiempo a la reunion, cual es la probabilidad que haya utilizado el
auto de la empresa?
12. En la empresa Coca-Cola el llenado de las botellas con bebida es realizado automaticamente
por una maquina que funciona a distintas velocidades. La probabilidad de que el llenado sea
incorrecto es de 0.001 cuando el proceso se realiza a baja velocidad. Cuando el proceso de
llenado se realiza a alta velocidad, la probabilidad de llenado incorrecto es de 0.01. Suponga
que el 25 % de las botellas son llenadas cuando el proceso se realiza a alta velocidad, mientras
que el resto de botellas son llenadas a una baja velocidad.
a) Cual es la probabilidad de encontrar una botella con un volumen incorrecto en su inte-
rior?
b) Cual es la probabilidad de encontrar una botella llena con un volumen incorrecto y que
haya sido llenada cuando el proceso se realiza a baja velocidad?
c) Cual es la probabilidad de que el proceso de llenado de las botellas haya sido a baja
velocidad, si se sabe que la botella esta efectivamente con un volumen incorrecto?
d) Si se encuentra una botella llenada con un volumen incorrecto, Cual es la probabilidad
de que haya sido llenada cuando el proceso se realiza a alta velocidad?
35
2.4. Variables Aleatorias
2.4.1. Introducci on
Informalmente una variable aleatoria puede denirse como una funcion numerica sobre , el
espacio muestral:
X : R
X es una funci on tal que asigna a cada un n umero.
Nota: Usualmente, el recorrido de X, Rec(X), es un subconjunto de R.
Ejemplo 2.4.1 Sea = {CC, CS, SC, SS} y sea la variable aleatoria denida por
X() = n umero de caras,
Cual es el recorrido de la variable aleatoria X?
Formalmente:
Denici on 2.4.1 Dado un modelo de probabilidad (, A, P), diremos que una funcion
X : R
es una variable aleatoria ssi
{ : X() x} A, x R
X es una variable aleatoria en (, A, P) ssi { : X() x} es un evento (aleatorio) en
A, x R
Notaci on: Si el valor de la variable aleatoria se denota por una letra min uscula , la variable
se denota por la letra may uscula correspondiente. Normalmente se utilizan las ultimas letras del
alfabeto.
El suceso el valor x de X pertenece al conjunto Bse denota por X B. Cuando B = {x} se
simplica la notacion a {X = x}.
Denici on 2.4.2 Dada una variable aleatoria X denida en (, A, P), la distribucion de prob-
abilidad inducida por X en R se dene, para un evento B R como:
P
X
(B) = P(X
1
(B))
donde X
1
(B) = { : X() B} es un evento en .
Conocer la distribucion de probabilidad para un subconjunto B implica que podemos P
X
para
cualquier B R (medible).
En general, cada B R medible puede generarse a partir de uniones y/o intersecciones de
intervalos de la forma [a
n
, b
n
]. La colecci on de estos intervalos de la forma (a, b] genera una -
algebra en R, llamada -algebra de Borel y denotada por B. Los elementos de B se llaman
Borelianos y son subconjuntos medibles de R.
36
Proposicion 1 P
X
es una medida de probabilidad en (R, B) (R, B, P
X
) es una medida de
probabilidad (inducida por la variable aleatoria X).
Denici on 2.4.3 La funcion denida por
F
X
(x) = P
X
((, x])
= P(X x), x R
se llama funcion de distribucion acumulada, f.d.a, de la variable aleatoria X.
Propiedades
Sea F
X
(x), x R, la funci on distribucion de X,
P1)
lm
x
F
X
(x) = 0 y lm
x
F
X
(x) = 1
(0 F
X
(x) 1 x)
P2) Si x
1
< x
2
, entonces F
X
(x
1
) F
X
(x
2
)
(F
X
es no decreciente en R)
P3)
lm
xx
0
F
X
(x) = F
X
(x
0
) x
0
R
(F
X
es continua por la derecha)
37
2.4.2. Variables Aleatorias Discretas
F
X
(x), x R, es discreta ssi la variable aleatoria X es discreta, es decir, X asume valores en
un subconjunto contable de R.
X() {x
1
, x
2
, . . .} R
En tal caso, F
X
(x), x R, puede representarse como:
F
X
(x) =

tx
P(X = t), x S,
donde
P(X = x), x R, se llama funcion de probabilidad.
Sigue de la denici on de P(X = x), x R, que:
i)
P(X = x) 0 x R
ii)

xR
P(X = x) = 1
iii)
P
X
(B) = P(X B) =

xB
P(X = x)
Ejemplo 2.4.2
Un dado no equilibrado asigna a la cara con el n umero x probabilidades dadas por
p(x) = c 0, 7
x
0, 3
6x
, x = 1, . . . , 6
1. Calcule el valor de c.
2. Haga una tabla con los valores de la funcion de distribucion F.
3. Utilice la tabla para calcular la probabilidad que
(i) El n umero este entre 2 y 4.
(ii) El n umero sea mayor que 2.
Considere un estuche con 5 lapices rojos, 3 azules y 2 verdes. Se denen los siguientes eventos:
X
1
: n umero de lapices azules al extraer 5 lapices, con reposicion.
X
2
: n umero de lapices azules al extraer 5 lapices, sin reposicion.
X
3
: n umeros de extracciones necesarias hasta obtener el primer lapiz rojo.
X
4
: n umero de extracciones necesarias hasta obtener el tercer lapiz verde, con reposicion.
38
1. Determine la funcion de probabilidad de cada variable denida
2. Considere ahora la siguiente situacion. Se extraen 6 lapices al azar y con reposicion. Cual
es la probabilidad de obtener 3 rojos, 2 azules y 1 verde?
Ejemplo 2.4.3 Si 50 % de los automoviles extranjeros que vende una agencia esta equipado para
trabajar con diesel, encuentre una formula para la distribucion de probabilidad del n umero de modelos
diesel entre los proximos 4 automoviles que venda esta agencia. Determine la f.d.a de la variable
de interes.
39
2.4.3. Variables Aleatorias Continuas
F
X
(x), x R es continua ssi existe una funci on no negativa f
X
(x), x R, tal que:
F
X
(x) =
_
x

f
X
(t)dt, x R
f
X
(x) =
dF
X
(x)
dx
donde f
X
(x) se denomina funcion de densidad de la variable aleatoria X.
Note que:
i)
f
X
(x) 0 x
ii)
_

f
X
(x) dx = 1
iii)
P
X
(B) = P(X B) =
_
B
f
X
(x)dx
Si B es un intervalo, por ejemplo, B = (a, b), entonces se tiene lo siguiente:
P
X
(B) = P(a < X < b)
= P(a < X < b)
= P(a < X b) pues P(X = b) = 0,
= F
X
(b) F
X
(a)
=
_
b

f
X
(x) dx
_
a

f
X
(x) dx =
_
B
f
X
(x) dx
Ejemplo 2.4.4 Suponga que el error de la temperatura de reaccion, en

C, para un experimento
controlado de laboratorio es una variable aleatoria continua X, que tiene funcion de densidad de
probabilidad:
f
X
(x) =
_
x
2
3
, -1 < x < 2
0, e.o.c.
a) Verique la condicion (ii).
b) Encuentre P(0 < X 1)
Denici on 2.4.4 La distribucion acumulada F
X
(x) de una variable aleatoria continua X con
densidad f
X
es:
F
X
(x) = P(X x) =
_
x

f
X
(t) dt x R
Ejemplo 2.4.5 Para la funcion de densidad del ejemplo anterior, encuentre F
X
y utilcela para
calcular P(0 < X 1)
40
2.4.4. Localizacion y dispersi on de una variable aleatoria
Denici on 2.4.5 La esperanza de una variable aleatoria X se dene como:
E(X) =
_

i=1
x
i
f
x
(x
i
), X discreta
_

xf
X
(x)dx, X continua
Notacion:
X
= E(X)
Propiedades
1.- La esperanza matematica es un operador lineal, esto es, si E(X) esta bien denida, entonces
E(aX + b) = aE(X) + b
2.- Si X e Y son variables aleatorias, entonces
E(X + Y ) = E(X) + E(Y )
3.- Si X e Y son variables aleatorias con esperanzas bien denidas y tales que
X() Y ()
entonces E(X) E(Y )
Denici on 2.4.6 La mediana de una variable aleatoria X es alg un n umero m tal que:
P(X m) 1/2 y P(X m) = 1/2
Notas:
i) Si X tiene distribucion simetrica y E(X) < , entonces E(X) es una mediana para X.
ii) Si X tiene distribuci on asimetrica, la mediana de X puede ser una mejor medida de local-
izaci on.
Dos distribuciones pueden tener la misma localizacion y ser completamente diferentes, por lo
que hay que considerar una medida de dispersi on de la variable, la mas com un, es la varianza.
Denici on 2.4.7 La varianza de una variable aleatoria X se dene como
V (X) = E[(X E(X))
2
]
V (X) =
_

i=1
(x
i
E(X))
2
P(X = x
i
)
_

(x E(X))
2
f
X
(x)dx
Notacion:
2
X
= V (X)
41
Propiedades
1.- V (X) = E(X
2
) (E(X)
2
)
2.- V (X) 0, V (X) = 0 X = c
3.- V (aX + b) = a
2
V (X)
4.- Si X e Y son variables aleatorias, entonces
V(X + Y ) = V(X) + V(Y ) 2 Cov(X, Y )
S olo en el caso en que X e Y son variables aleatorias independientes, entonces
V(X + Y ) = V(X) + V(Y )
Ejemplo 2.4.6 Sea X la variable aleatoria que cuenta el n umero de caras en tres lanzamientos de
una moneda honesta. Determine el recorrido, la funcion de distribucion, valor esperado y varianza
de X.
Ejemplo 2.4.7 Sea A un evento en (, A, P), con P(A) = p, con 0 p 1. Usted paga $1 se A
ocurre y $0 si A

ocurre.
Sea X la ganancia obtenida en un ensayo de este experimento. Determine esperanza y varianza de
X.
42
2.4.5. Casos especiales de distribuciones probabilidad
Distribuci on Bernoulli
Consideremos un experimento con solo dos resultados posibles, uno que se llame exito (E) y
otro, fracaso (F). Los resultados sucesivos e independientes de tal experimento se llaman pruebas
o experimentos Bernoulli.
En realidad, cualquier experiemnto puede ser usado para denir un ensayo Bernoulli simplemente
denotando alg un evento de interes, A, como exito y su complemento, A

, como fracaso.
Notaci on: X Bernoulli(p) y su funci on de probabilidad esta dada por
P(X = x) = p
x
(1 p)
1x
, x = 0, 1
donde
E(X) = p
V (X) = p(1 p)
Distribuci on Binomial
Un experimento que consiste de n ensayos Bernoulli independientes, cada uno con probabilidad
de exito p, se llama un experimento Binomial con n ensayos y parametro p.
Al decir ensayos independientessignica que los ensayos son eventos indeoendientes esto es, lo
que ocurra en un ensayo no tiene efecto en el resultado observado para cualquier otro ensayo.
Denici on 2.4.8 Sea X el n umero total de exitos observados en un experimento Binomial con n
ensayos y parametro p. Entonces X se llama variable aletoria Binomial con parametros n y p
y se denota
X Bin(n, p)
y su funcion de probabilidad esta dada por
P(X = x) =
_
n
x
_
p
x
(1 p)
nx
, x = 0, 1, . . . , n
Teorema 2.4.1 La esperanza y varianza de la distribucion Binomial estan dadas por:
E(X) = n p
V (X) = n p (1 p)
Ejemplo 2.4.8 Se sabe que el n umero de pacientes graves en una urgencia es una variable aleatoria
Binomial con una media de 12 pacientes graves y una varianza de 3. Determine la probabilidad que
en un da haya a lo menos 2 pacientes en estado grave.
43
Distribuci on Geometrica
Denici on 2.4.9 Si se realizan repetidos experimentos Bernoulli independientes con probabilidad
de exito p, entonces la distribucion de la variable aleatoria X, el n umero de experimentos necesarios
hasta encontrar el primer exito sigue una distribucion geometrica de parametro p y se denota
por:
X Geo(p)
con funcion de probabilidad dada por
P(X = x) = (1 p)
x1
p, x = 1, 2, 3, . . .
Teorema 2.4.2 La esperanza y varianza de la distribucion geometrica estan dadas por:
E(X) =
1
p
V (X) =
1 p
p
2
Ejemplo 2.4.9 Cacule la probabilidad de que deba lanzar un dado por lo menos 6 veces hasta
obtener un 5.
Distribuci on Binomial Negativa
Denici on 2.4.10 Consideremos ensayos Bernoulli independientes con probabilidad de exito p en
cada ensayo. Si X es el n umero de ensayos necesarios para observar el r-esimo exito, entonces X
se llama variable aleatoria Binomial negativa con parametros r, y p su funcion de probabilidad
esta dada por
P(X = x) =
_
x 1
r 1
_
p
r
(1 p)
xr
, x {r, r + 1, . . .}
y se denota por
X BinNeg(r, p)
Teorema 2.4.3 La esperanza y varianza de la distribucion Binomial Negativa estan dadas por:
E(X) =
r
p
V (X) =
r(1 p)
p
2
Ejemplo 2.4.10 Cacule la probabilidad de que deba lanzar un dado por lo menos 6 veces hasta
obtener 5 tres veces.
44
Distribuci on Poisson
Denici on 2.4.11 Una variable aleatoria X que cuenta el n umero de eventos que ocurren en un
perodo de tiempo tiene distribucion Poisson de parametro > 0, y su funcion de probabilidad
esta dada por
P(X = x) =
e

x
x!
, x = 0, 1, . . .
y se denota por
X Poisson()
Teorema 2.4.4 La esperanza y varianza de la distribucion Poisson estan dadas por:
E(X) =
V (X) =
Ejemplo 2.4.11 Se sabe que los pacientes llegan de acuerdo a una distribucion Poisson con = 3
pacientes/minuto. Cuando llegan mas de 4 pacientes por minuto la secretaria se ve sobrepasada y
el servivio de atencion es calicado como deciente. Cual es la probabilidad de que el sistema sea
calicado como no deciente?
Distribuci on Uniforme
Denici on 2.4.12 Una variable aleatoria X tiene distribucion uniforme si su densidad se dis-
tribuye por igual entre dos valores cualquiera a y b. Su funcion de densidad esta dada por
f
X
(x) =
_
1
ba
, a < x < b,
0, e.o.c.
Notacion: X U(a, b)
Teorema 2.4.5 La esperanza y varianza de la distribucion Uniforme estan dadas por:
E(X) =
a + b
2
V (X) =
(b a)
2
12
Ejemplo 2.4.12 En los das del verano, X, el tiempo de retraso de un tren del Metro, se puede
modelar como distribuida uniformemente entre 0 y 20 minutos.
1. Calcule la probabilidad de que el tren llegue por lo menos con 8 minutos de retraso.
2. Calcule la desviacion estandar del tiempo de retraso del tren.
45
Distribuci on Exponencial
Denici on 2.4.13 Suponga que los eventos suceden aleatoriamente a lo largo del tiempo, con un
tiempo esperado entre eventos . Sea X, la variable aleatoria que cuenta el tiempo para el siguiente
evento, entonces X tiene distribucion exponencial y su funcion densidad esta dada por
f
X
(x) =
_
1

e
x/
, x > 0,
0, e.o.c.
donde > 0 y se denota por
X exp()
Teorema 2.4.6 La esperanza y varianza de la distribucion Exponencial estan dadas por:
E(X) =
V (X) =
2
Ejemplo 2.4.13
En un centro rural para la atencion de emergencias el tiempo entre llegadas sigue una distribucion
exponencial con un tiempo media de llegadas de 1.25 horas. Encuentre la probabilidad de que el
tiempo entre llegadas sea mayor a 1 hora. Encuentre la probabilidad de que el tiempo entre llegadas
sea mayor a 2 horas.
Distribuci on Normal
Denici on 2.4.14 La variable aleatoria X tiene distribucion normal con media y varianza

2
si su funcion de densidad esta dada por
f
X
(x) =
1

2
2
e

(x)
2
2
2
, < x <
Notacion: X N(,
2
)
Denici on 2.4.15 Si Z es una variable aleatoria normal con media 0 y varianza 1, entonces Z se
llama variable aleatoria normal estandar.
Cualquier variable aleatoria normal X se puede transformar en una variable aleatoria normal
estandarizada Z, sustrayendo el valor esperado y dividiendo el resultado por .
Ejemplo 2.4.14 Considere la distribucion normal estandar con media = 0 y desviacion = 1.
1. Cual es la probabilidad que z sea mayor que 2,6?
2. Cual es la probabilidad que z sea menor que 1,3?
3. Cual es la probabilidad que z este entre -1.7 y 3.1?
4. Cual es el valor de z que corta el 15 % menor de la distribucion?
46
Ejercicios 11 .
1. Clasique las siguientes variables como discretas o continuas.
X : el n umero de accidentes de automovil por a no en la ciudad de Santiago.
Y : el tiempo que toma jugar 18 hoyos de golf.
M : la cantidad de leche producida anualmente por una vaca en particular.
N : el n umero de huevos que pone mensualmente una gallina.
P : el n umero de permisos para la construccion de edicios que otorga mensualmente una
municipalidad.
Q : la cantidad de kilos de manzanas que exporta una empresa.
2. Si p(x) = c (5 x) para x = 0, 1, 2, 3. Cual es el valor de c?
3. Ciertos temes son producidos por una maquina, cada item es clasicado como de primera o
segunda calidad; los temes de segunda calidad representan al 5 % de la produccion total. Si se
inspeccionan temes hasta que se encuentra el quinto de segunda calidad,
a) Determine la variable aleatoria y su funcion de probabilidad.
b) Cual es el n umero esperado de temes que se deben inspeccionar para detectar el quinto
de segunda calidad?
c) Cual es la probabilidad de que se tengan que inspeccionar 7 artculos?
4. Suponga que cada una de las llamadas que hace una persona a una estacion de radio muy pop-
ular tiene una probabilidad de 0.02 de que la lnea no este ocupada. Suponga que las llamadas
son independientes.
a) Cual es la probabilidad de que la primera llamada que entre sea la decima que realiza
la persona?
b) Cual es la probabilidad de que sea necesario llamar mas de cinco veces para hallar
desocupada la lnea?
5. En un estudio realizado por una empresa de vialidad se determino que cuando hay un mayor
ujo y congestion, pasan por una caja de peaje 4 vehculos por minuto.
a) Si la empresa quiere premiar a aquellos cajeros que atiendan mas de 4 vehculos por
minutos. Cual es la probabilidad de premiar a un cajero.
b) Por el contrario la empresa quiere descontar el sueldo de aquellos cajeros que atiendan
menos de 4 vehculos por minutos. Cual es la probabilidad de que la empresa descuente
el sueldo de un cajero?
6. El gerente de un restaurante que solo da servicio mediante reservas sabe, por experiencia,
que el 20 % de las personas que reservan una mesa no asistiran. Si el restaurante acepta 25
reservas pero solo dispone de 20 mesas, cual es la probabilidad de que a todas las personas
que asistan al restaurante se les asigne una mesa?
47
7. Una empresa electronica observa que el n umero de componentes que fallan antes de cumplir
100 horas de funcionamiento es una variable aleatoria de Poisson. Si el n umero promedio de
estos fallos es ocho,
a) cual es la probabilidad de que falle un componente en 25 horas?
b) y de que fallen no mas de dos componentes en 50 horas?
c) cual es la probabilidad de que fallen por lo menos diez en 125 horas?
8. Supongase que la produccion de un da de 850 piezas manufacturadas contiene 50 piezas que
no cumplen con los requerimientos del cliente. Se seleccionan del lote dos piezas al azar y sin
reemplazo. Sea la variable aleatoria X igual al n umero de piezas de la muestra que no cumplen.
Cual es la funcion de distribucion acumulada de X?
9. Un lote contiene 100 piezas de un proveedor de tubera local y 200 unidades de un proveedor
de tubera del estado vecino. Si se seleccionan cuatro piezas al azar y sin reemplazo,
a) cual es la probabilidad de que todas sean del proveedor local?
b) Cual es la probabilidad de que dos o mas piezas de la muestra sean del proveedor local?
c) Cual es la probabilidad de que al menos una pieza de la muestra sea del proveedor local?
10. Supongamos que el n umero de imperfecciones en un alambre delgado de cobre sigue una dis-
tribucion Poisson con una media de 2.3 imperfecciones por milmetro.
a) Determine la probabilidad de 2 imperfecciones en un milmetro de alambre.
b) Determine la probabilidad de 10 imperfecciones en 5 milmetros de alambre.
c) Determine la probabilidad de al menos una imperfeccion en 2mm de alambre
11. Una variable aleatoria continua X que puede tomar valores entre x=2 y x=5 tiene una funcion
de densidad
f
X
(x) =
2(1 + x)
27
Calcule
a) P(X < 4)
b) P(3 < X < 4)
12. Una maquina que marca n umeros telefonicos al azar selecciona aleatoriamente cuatro dgitos
entre 0000 y 9999 (incluido ambos). Trate a la variable Y, el n umero seleccionado, como
si fuese continua (aun cuando hay solo hay 10000 posibilidades discretas) y uniformemente
distribuida.
a) Encuentre P(0300 < Y < 1300)
b) P(Y > 5555)
c) Encuentre la varianza de Y
48
13. En una central nuclear ocurren aleatoriamente a lo largo del tiempo eventos poco comunes
(problemas menores de operacion). El tiempo medio entre dos eventos es 40 das.
a) Cual es la probabilidad de que el tiempo para el siguiente evento poco com un se en-
cuentre entre 20 y 60 das?
b) Cual es la probabilidad de que pasen mas de 60 das sin probemas?
c) Encuentre la desviacion estandar del tiempo para el siguiente evento poco com un.
d) Un analisis de los archivos de la central nuclear muestra que los eventos poco comunes
suceden con mayor frecuencia los nes de semana, que hipotesis subyacente a las re-
spuestas de las preguntas anteriores se pone en duda?
14. Sea Z una variable aleatoria normal estandarizada. Calcule:
a) P(0 Z 1,96)
b) P(Z > 1,96)
c) P(1,96 Z 1,96)
d) P(0 Z 1,96)
15. Los ingresos anuales de los profesores de la universidad siguen una distribucion normal con
media 18600 dolares y una desviacion estandar de 27000 dolares. Encuentre la probabilidad
de que un profesor seleccionado al azar tenga
a) un ingreso anual inferior a 15000 dolares.
b) un ingreso mayor a 21000 dolares.
c) un ingreso mayor a 25000 y de a lo mas 30000 dolares.
49
2.4.6. Funciones de Variables Aleatorias
Denici on 2.4.16 Sea X una variable aleatoria y sea g una funcion con dominio en S y valores
en R. El valor esperado de g(X) esta dado por
E(g(X)) =
_

i=1
g(x
i
)P(X = x
i
), X discreta
_

g(x)f(x)dx, X continua
Momentos y funciones generadoras de momentos
Denici on 2.4.17 Dada una variable aleatoria X se denen:
(i)
E(X
k
) =
_

i=1
x
k
i
f
x
(x
i
), X discreta
_

x
k
f
X
(x)dx, X continua
como el k-esimo momento (no centrado) de X.
(ii)
E((X )
k
) =
_

i=1
(x
i
)
k
f
x
(x
i
), X discreta
_

(x )
k
f
X
(x)dx, X continua
como el k-esimo momento centrado de X.
Denici on 2.4.18 La funcion generadora de momentos (f.g.m.) de una variable aleatoria X
se dene como
M
X
(t) =
_

i=1
e
tx
i
f
x
(x
i
),
_

e
tx
f
X
(x)dx,
con t R.
Ejemplo 2.4.15 Determine su funcion generadora de momentos para las siguientes distribuciones:
a) X Bin(n, p)
b) X N(0, 1)
Teorema 2.4.7 Sea X una variable aleatoria con funcion generadora de momentos M
X
(t). En-
tonces
E(X
k
) =
d
k
M
X
(t)
dt
k

t=0
50
Ejemplo 2.4.16 Utilizando las respectivas f.g.m calcule la media de X si
a) X Bin(n, p)
b) X N(0, 1)
Teorema 2.4.8 (Teorema de Unicidad)
Sean X e Y dos avriables aleatorias con funciones generadoras de momentos M
X
(t) y M
Y
(t), re-
spectivamente. Si M
X
(t) = M
Y
(t) para todos los valores de t, entonces X e Y tienen la misma
distribucion de probabilidad.
Teorema 2.4.9 Si Y = cX + d, entonces M
Y
(t) = e
td
M
X
(ct)
Ejemplo 2.4.17 Sea X una variable aleatoria con distribucion normal estandar. Determine la
f.g.m. de Y = + X.
Ejemplo 2.4.18
Sea X U(a, b).
1. Obtenga una expresion para el percentil p de la distribucion. Interprete geometricamente este
resultado.
2. Para n entero positivo, determine E(X
n
).
Suponga que la v.a. X solo puede asumir los valores -1 y 1 con probabilidad 1/2. Encuentre
1. La funcion generadora de momentos de X.
2. Los primeros cuatro momentos centrados de X.
Una v.a. tiene funcion densidad dada por:
f(x) =
_
2e
2x
, x 0
0, e.o.c.
Determine:
1. La funcion generadora de momentos de X.
2. Los primeros cuatro momentos centrados de X.
La funcion de probabilidad de X, n umero de defectos importantes en un electrodomestico selecciona-
do al azar es
x 0 1 2 3 4
P(X = x) 0.08 0.015 0.45 0.27 0.185
Determine la funcion generadora de momentos de X y a apartir de ella, su esperanza y varianza.
51
Transformacion de variables
Frecuentemente, en estadstica, se presenta la necesidad de deducir la distribucion de probabili-
dad de una funcion de una o mas variables aleatorias. Por ejemplo supongamos que X es una variable
aleatoria discreta con distribuci on de probabilidad f(x) y supongamos ademas que Y = g(X) de-
ne una transformaci on uno a uno entre los valores de X e Y . Se desea encontrar la distribuci on
de probabilidad de Y . Es importante resaltar el hecho que la transformaci on uno a uno implica
que cada valor de x est a relacionado con un, y s olo un valor de y = g(x) y que cada valor de y
est a relacionado con un, y s olo un valor de x = g
1
(y).
Teorema 2.4.10 Sea X una variable aleatoria discreta con distribucion de probabilidad f(x). Si
Y = g(X) dene una transformacion uno a unn entre los valores de X e Y de tal forma que la
ecuacion y = g(x) pueda resolverse unicamente para x en terminos de y. Entonces la distribucion
de probabilidad de Y es
f
Y
(y) = f
X
(g
1
(y))
Ejemplo 2.4.19 Sea X una variable aleatoria geometrica con distribucion de probabilidad
f
X
(x) =
3
4
_
1
4
_
x1
, x = 1, 2, . . .
a) Encuentre al distribucion de la variable aleatoria de Y = X
2
b) Encuentre la distribucion para la variable aleatoria Z = 4 5X
Teorema 2.4.11 Suponga que X es una variable aleatoria continua con distribucion de probabilidad
f(x). Sea Y = g(X), con g una funcion uno a uno entre los valores de X e Y . Entonces la
distribucion de probabilidad de Y esta dada por
f
Y
(y) = f
X
(g
1
(y))|J|
donde J = (g
1
(y))

y recibe el nombre de Jacobiano de la tranformacion.


Ejemplo 2.4.20 .
a) Sea X una variable aleatoria continua con funcion densidad
f
X
(x) =
x
12
, 1 < x < 5
Encuentre la distribucion de probabilidad de la variable aleatoria Y = 2X 3.
b) Sea X una variable aleatoria con densidad Beta(a,b), es decir,
f
X
(x) =
(a + b)
(a)(b)
x
a1
(1 x)
b1
, 0 < x < 1.
Determinar la distribucion de Y = 1 - X.
52
Teorema 2.4.12 Sea X una variable aleatoria continua con funcion densidad f
X
(x). Si Y = g(X)
es una transfromacion entre los valores de X e Y que no es uno a uno, es decir, para cada y R
existen k inversas, x
i
= g
1
i
(y), i = 1, . . . , k, entonces la distribucion de probabilidad de Y es
f
Y
(y) =
k

i=1
f
X
(g
1
i
(y))|J
i
|
donde
|J
i
| =
d
dy
g
1
i
(y) i = 1, . . . , k.
Ejemplo 2.4.21 . Sea X una variable aleatoria con densidad
f
X
(x) =
1
2
e
|x|
, < x < .
Determinar la distribucion de Y = |X|.
Ejercicios 12 .
1. Si X U(0, 1), encontrar al funcion densidad de Y = e
X
2. Se dice que X tiene distribucio Weibull si
f
X
(x) =
_
x
1
exp(x

), x > 0;
0, e.o.c.
Se asume que > 0 y > 0. Determine E(X). Cual es la distribucion de Y = X

?
53
2.4.7. Aproximaci on de distribuciones
Sea una variable aleatoria X Bin(n, p), por ejemplo, suponga que recoge la opini on de una
muestra de 1000 electores para saber su sentir en pro del fortalecimiento del gobierno de la ciudad.
Cu al es la probabilidad de encontrar 460 o menos electores a favor del fortalecimiento si suponemos
que el 50 % de la poblacion est a a favor de el?
En este caso, sea X el n umero de electores en pro del fortalecimiento, con X Bin(1000, 1/2),
entonces para calcular la probabilidad pedida P(X 460) debemos sumar 461 terminos, lo que no
parece una tarea f acil.
En este tipo de situaciones, donde el n umero de ensayos es demasiado grande ( 20), aproxi-
maremos nuestra distribuci on de probabilidad a otro distribucion, dependiendo del valor de p, la
probabilidad de exito.
Aproximaci on Poisson a la distribucion Binomial
Se sugiere aproximar a la distribuci on Poisson una distribucion binomial para valores de n muy
grandes y de p muy peque na. La regla es aproximar si p < 0,05 y n 20. Si n 100 la aproxi-
maci on es buena siempre y cuando np > 10.
En ambos casos = np y en vez de utilizar X Bin(n, p) usamos X P(np).
Ejemplo 2.4.22 Se sabe que el 5 % de los libros encuadernados en cierto taller tienen encuader-
naciones defectuosas. Determine la probabilidad de que 2 de 100 libros encuadernados en ese taller,
tengan encuadernaciones defectuosas, usando,
a) la formula de la distribucion Binomial,
b) la aproximacion de Poisson a la distribucion Binomial.
Aproximaci on Normal a la distribucion Binomial
Se sugiere aproximar la distribucion Normal a una distribucion binomial cuando n es muy
grande y los valores de p son cercanos a 0.5.
En tal caso, = np y
2
= np(1 p). Esta aproximaci on debera utilizarse solo si np 5 y
n(1 p) 5.
Ejemplo 2.4.23 Se considera un sindicato laboral en el cual el 40 % miembros esta a favor de la
huelga. Si se seleccionan 15 miembros de manera aleatoria, cual es la probabilidad de que 10 apoyen
un paro? Calcule dicha probabilidad utilizando las distribuciones Binomial y Normal por separado
y compare.
Ejercicios 13 El 45 % de todos los empleados del centro de capacitacion gerencial tiene ttulos
universitarios. Cual es la probabilidad de que de los 150 empleados seleccionados aleatoriamente,
72 tengan un ttulo univeristario?
54
2.5. Vectores Aleatorios
Denici on 2.5.1 X = (X
1
, X
2
, . . . , X
n
) es un vector aleatorio denido en (, A, P) ssi X
1
, X
2
, . . . , X
n
son variables aleatorias denidas en el mismo modelo (, A, P).
2.5.1. Distribuci on Conjunta
Denici on 2.5.2 La funcion denida por
F
X
1
,X
2
,...,Xn
(x
1
, x
2
, . . . , x
n
) = P(X
1
= x
1
, X
2
= x
2
, . . . , X
n
= x
n
), x R
se llama funcion distribucion conjunta de X
1
, X
2
, . . . , X
n
Denici on 2.5.3 Sea X = (X
1
, X
2
, . . . , X
n
) un vector aleatorio en (, A, P). Diremos que:
a) X = (X
1
, X
2
, . . . , X
n
) es discreto ssi
Rec(X)= Rec(X
1
, X
2
, . . . , X
n
)
es un subconjunto contable (nito o no) de R
n
.
En tal caso, la distribucion de probabilidad puede representarse mediante
P(X
1
= x
1
, X
2
= x
2
, . . . , X
n
= x
n
) = P
_
n

i=1
{X
i
= x
i
}
_
As,
(i) P(X = x) 0 x R
n
(ii)

P(X = x
i
) = 1
b) X = (X
1
, X
2
, . . . , X
n
) es continuo ssi existe una funcion
f
X
1
...Xn
: R
n
R
no negativa tal que
F
X
1
...Xn
(x
1
, . . . , x
n
) =
_
x
1


_
xn

f
X
1
...Xn
(t
1
, . . . , t
n
)dt
n
dt
1
, x R
En tal caso
f
X
1
...Xn
(x
1
, . . . , x
n
) =

n
x
1
x
n
F
X
1
...Xn
(x
1
, . . . , x
n
)
Ejemplo 2.5.1 Sean X e Y variables aleatorias con funcion distribucion conjunta dada por
F
XY
(x, y) =
_
(1 e
x
)(1 e
y
), x >0, y > 0;
0, e.o.c.
Determine f
XY
.
55
Denici on 2.5.4 La distribucion de probabilidad de X = (X
1
, X
2
, . . . , X
n
) se dene como:
P
X
(B) = P(X B) B B
n
As, P
X
(B), B B
n
, es una medida de probabilidad.
(P
X
, B
n
, R
n
) es una medida de probabilidad.
Proposicion 2 B B
n
P
X
(B) = P(X B) =
_

xB
P(X = x), X discreta
_
xB
f
X
(x)dx, X continua
Teorema 2.5.1 Sea X un vector aleatorio continuo n- dimensional con densidad f
X
(x). Sea g =
(g
1
, g
2
, . . . , g
n
) una funcion. Considere el vector aleatorio Y = g(X). Esto signica que se considera
la transformacion
y
1
= g
1
(x
1
, . . . , x
n
)
y
2
= g
2
(x
1
, . . . , x
n
)
.
.
.
y
n
= g
n
(x
1
, . . . , x
n
)
Finalamente supongase que g y g
1
son continuas y dieferenciables. Entonces la densidad de Y es
f
Y
(y) = |J|f
X
(g
1
(y), g
1
2
(y), . . . , g
1
n
(y)) y R
n
Ejemplo 2.5.2 Sean X e Y dos variables aleatorias continuas con distribucion de probabilidad
conjunta
f(x, y) =
_
4xy, 0 < x < 1, 0 < y < 1;
0, e.o.c.
Encuentre la densidad conjunta de W = X
2
y Z = XY .
56
2.5.2. Distribuciones Conjuntas Especiales
Algunas distribuciones multivariadas conocidas se enuncian a continuaci on:
Suponga que realiza N experimentos inpedendientes, en cada uno de los cuales puede obtener
uno de los k resultados posibles, cada uno con probabilidad p
1
, p
2
, . . . , p
k
, respectivamente, y desea
contar cu antas repeticiones de cada resultado obtuvo.
Denici on 2.5.5 Las variables aleatorias X
1
, X
2
, . . . , X
k
tienen una distribucion multinomial
si y solo si su distribucion de probabilidad conjunta esta dada por
P(X
1
= x
1
, X
k
= x
k
, . . . , X
k
= x
k
, ) =
_
n
n
1
n
2
n
k
_
p
x
1
1
p
x
2
2
. . . p
x
k
k
donde
r

j=1
n
j
= n y
k

i=1
p
i
= 1
Lo que se denota como
(X
1
, . . . , X
k
) Mult(n, p
1
, p
2
, . . . , p
k
)
Ejemplo 2.5.3 Suponga que los errores de cierto procedimiento de medicion tienen distribucion
normal de media 0 y desviacion estandar 2, en milmetros. Suponga que se toman 10 mediciones
independientes. Calcule la probabilidad que: por lo menos 9 mediciones tengan errores menores a
los 2 milmetros y que no mas de una medicion tenga error mayor a los 3 milmetros.
Considere un conjunto de N elementos, de los cuales M
1
son de la primera clases, M
2
de la
segunda clase, y as sucesivamente, hasta M
k
de la k-esima clase, donde

M
i
= N.
Denici on 2.5.6 Las variables aleatorias X
1
, . . . , X
k
tienen una distribucion hipergeometrica
multivariada si y solo si su distribucion de probabilidad conjunta esta dada por
P(X
1
= x
1
, . . . , X
k
= x
k
) =
_
M
1
x
1
_
. . .
_
M
k
x
k
_
_
M
n
_
donde
k

i=1
x
i
= n, y
k

i=1
M
i
= N
Ejemplo 2.5.4 En un panel de presuntos jurados participan 6 hombres casados, tres hombres
solteros, siete mujeres casadas y cuatro mujeres solteras. Si la seleccion es al azar, cual es la
probabilidad de que el jurado consita de 4 hombres casados, un soltero, cinco mujeres casadas y dos
solteras?
57
Entre las distribuciones multivariadas continuas, la distribuci on normal multivariada es de es-
pecial importancia, ya que es una generalizaci on de la distribuci on normal en una variable.
Denici on 2.5.7 El vector aleatorio (X, Y ) tiene una distribucion normal bivariada si y solo
si su funcion densidad conjunta esta dada por
f(x, y) =
1
2
1

2
_
1
2
exp
_

1
2(1
2
)
__
x
1

1
_
2
+
_
y
2

2
_
2
2
_
x
1

1
__
y
2

2
___
para x R, y R,
1
,
2
> 0, y 1 < < 1.
Teorema 2.5.2 Si dos variables aleatorias tienen una distribucion normal bivariada, son inpeden-
dientes si y solo si = 0.
58
2.5.3. Distribuci on Marginal y Condicional
Dada la distribuci on de probabilidad conjunta f(x, y) de las variables aleatorias X e Y , la
distribuci on de probabilidad f(x) de X se obtiene al sumar f(x, y) sobre todos los valores de Y .
De la misma forma, la distribucion de probabilidad f(y) se obtiene al sumar f(x, y) sobre todos
los valores de X. Cuando X e Y son variables aleatorias continuas, las sumas se reemplazan por
integrales.
Denici on 2.5.8 Las distribuciones marginales de X e Y estan dadas por
p
X
(x) =

y
f
XY
(x, y) y p
Y
(y) =

x
f
XY
(x, y)
para el caso discreto y
f
X
(x) =
_
y
f
XY
(x, y)dy y f
Y
(y) =
_
x
f
XY
(x, y)dx
para el caso continuo.
Denici on 2.5.9 Sean X e Y dos variables aleatorias discretas o continuas. La distribucion
condicional de la variable aleatoria Y, dado que X=x, esta dada por:
f
Y |X
(y) =
f
XY
(x, y)
f
X
(y)
, f
X
(x) > 0
Ejemplo 2.5.5 Suponga que la fraccion X de atletas hombres y la fraccion Y de atletas mujeres
que terminan la carrera del maraton puede describirse por la funcion densidad conjunta
f
XY
(x, y) = 8xy, 0 x 1, 0 y x.
Encuentre f
X
, f
Y
y f
Y |X
y determine la probabilidad de que menos de 1/8 de las mujeres que se
inscribieron para un maraton en particular la nalicen, si se sabe que exactamente 1/2 de los atletas
hombres terminaron la carrera.
Denici on 2.5.10 Sean X e Y dos variables aleatorias, discretas o continuas, con distribucion
de probabilidad conjunta f
XY
y distribuciones marginales f
X
y f
Y
, respectivamente. Las variables
aleatorias X e Y se dice que son independientes estadsticamente, ssi
f
XY
(x, y) = f
X
(x)f
Y
(y), x, y R
59
Ejercicios 14 . Sea X e Y variables aleatorias independientes con funciones densidades marginales
f
X
(x) = xe
x
, x > 0 y f
Y
(y) = e
y
y > 0
Sean
Z = X + Y, y W =
X
X + Y
1. Determine las respectivas densidades marginales de Z y W.
2. Son Z y W variables aleatorias independientes?
3. Obtenga la funcion generadora de momentos de Z, M
Z
(t).
60
2.5.4. Esperanza y Varianza Condicional
Denici on 2.5.11 Dado un vector aleatorio (X,Y) la esperanza condicional de Y dado X=x
se dene como
E(Y |X = x) =
_

y
y P(Y = y|X = x), X discreta
_

y f
Y |X
(y)dy, X continua
M as generalmente, si g : R R
E(g(Y )|X = x) =
_

y
g(y)P(Y = y|X = x), X discreta
_

g(y)f
Y |X
(y)dy, X continua
Proposicion 3 Si E(|Y |) <
E[E(Y | X)] = E(Y )
Ejemplo 2.5.6 Sea Y |X = x U(0, 1 x) y f
X
(x) = 2(1 x), si 0 < x < 1. Determine E(Y ).
Propiedades:
i) E(c|X = x) = c
ii) E(Y
1
+ Y
2
|X = x) = E(Y
1
|X = x) + E(Y
2
|X = x)
iii) E(cY |X = x) = c E(Y |X = x)
iv) E(g(X, Y )|X = x) = E(g(x, Y ))
En particular,
E(g
1
(X)g
2
(Y )|X = x) = g
1
(x)E(g
2
(Y )|X = x)
v) E(g(Y )|X = x) = E(g(Y )) X es independiente de Y.
Denici on 2.5.12 La varianza condicional de Y dado X=x se dene como
V(Y |X = x) = E[(Y E(Y |X = x))
2
|X = x]
=
_

y
(y E(Y |X = x))
2
P(Y = y|X = x), X discreta
_

(y E(Y |X = x))
2
f
Y |X
(y)dy, X continua
Teorema 2.5.3 Suponga que E(Y
2
) <
V(Y ) = E(V(Y |X)) + V(E(Y |X))
61
Ejemplo 2.5.7 Sean X e Y variables aleatorias continuas tales que X U(0, 1) e Y |X = x
U(x, x + 1).
Calcule:
a) E(Y |X = x) y V(Y |X = x).
b) E(Y ) y V(Y ).
c) La densidad condicional de X dado Y = y.
d) E(X|Y = y) y E(Y |X = x).
e) Considere las funciones de variables aleatorias h(Y ) = E(X|Y ) y k(X) = E(Y |X). Calcule la
funcion de densidad de h(Y ) y la funcion de densidad de k(X).
Ejercicios 15 .
Sean X e Y variables aleatorias tales que Y |X = x Bin(x, p) y X Poisson(). Determine la
distribucion de Y y calcule su esperanza.
62
2.6. Nociones de Convergencia
El objetivo de esta seccion es estudiar el comportamiento de una secuencia de variables aleatorias,
{Z
1
, Z
2
, . . . , Z
n
}, cuando n .
Denici on 2.6.1 Sea {Z
n
, n 1} una secuencia de variables aleatorias en (, A, P) y sea R
una constante.
Diremos que Z
n
converge en probabilidad para ssi
> 0, P(|Z
n
| ) 0, cuando n
Notaci on: Z
n
P

Adem as, note que Z


n
P
(Z
n
)
P
0
Denicion 2.6.2 Sea {Z
n
, n 1} una secuencia de variables aleatorias denidas en (, A, P) y
sea Z otra variable aleatoria, cuya distribucion no depende de n, la cual no necesita estar denida
sobre el mismo espacio de probabilidad donde se encuentran denidas las Z
n
s.
Diremos que Z
n
converge en distribucion para Z ssi
F
Zn
(z) = P(Z
n
z) P(Z z) = F
Z
(z)
cuando n , z donde F
Z
es continua.
Notacion: Z
n
D
Z o F
Zn
F
Z
Las deniciones anteriores motivan el siguiente teorema:
Teorema 2.6.1 (del Lmite Central)
Sean X
1
, X
2
, . . . , X
n
una secuencia de variables aleatorias independientes con media y varianza

2
< . Entonces,

n
X
n

D
N(0, 1)
donde
X
n
=
n

i=1
X
i
n
Aplicaci on:
Para n sucientemente grande
X
n
N(,
2
/n)
63
Ejercicios 16 . La distribucion de las perdidas mensuales de una empresa en unidades monetarias
(u.m.) es aproximadamente normal, con una media de = 3500 y una varianza de
2
= 184900.
1. Cual es al probabilidad de que las perdidas mensuales sean inferiores a 2500 u.m.?
2. Que valor separa el 5 % inferior de la distribucion de las perdidas mensuales?
3. Describa la distribucion de medias muestrales de tama no 5 tomadas de esta poblacion.
4. Que valor separa el 5 % inferior de la distribucion muestral de tama no 5?
5. Dada una muestra de las perdidas de 5 meses, cual es la probabilidad de que las perdidas
mensuales sean inferiores a 2500 u.m.?
6. Cual es al probabilidad de que solo uno de los cinco meses se tenga una perdida menor a
2500 u.m.?
64
Captulo 3
Inferencia Estadistica
3.1. Introducci on
La teora de la inferencia estadstica consiste en aquellos metodos por los que se realizan in-
ferencias o generalizaciones acerca de una poblaci on. La tendencia actual es la distinci on entre el
metodo clasico de estimaci on de un par ametro en la poblacion, por medio del cual las inferencias se
basan de manera estricta en informaci on que se obtiene de una muestra aleatoria seleccionada de la
poblaci on, y el metodo bayesiano, que utiliza el conocimiento subjetivo previo sobre la distribuci on
de probabilidad de los par ametros desconocidos junto con la informacion que proporcionan los datos
de la muestra. En este curso desarrollaremos los metodos cl asicos para estimar los parametros de
la poblacion desconocidos como la media, proporci on y varianza mediante el c alculo de estadsticas
de muestras aleatorias.
La inferencia estadstica se puede dividir en doa areas principales: estimacion y pruebas de
hip otesis. La estimacion de un parametro poblacional puede ser puntual, es decir, por alg un
metodo deteminamos una formula en funci on de los datos para calcular el valor de este en la mues-
tra, o intervalar, donde adem as de calcular el valor del par ametro en la muestra establecemos un
grado de precision de nuestra estimaci on. Con las pruebas de hipotesis lo que queremos es llegar a
la decisi on correcta acerca de una hipotesis preestablecida, con alguna medici on de la precisi on de
nuestra decisi on.
Algunos conceptos de interes se denen a continuaci on.
Denici on 3.1.1 Las variables aleatorias X
1
, . . . , X
n
corresponden a una muestra aleatoria de
tama na n de una poblacion con funcion densidad f(x) si
X
1
, . . . , X
n
son mutuamente independientes
X
1
, . . . , X
n
tienen funcion densidad marginal f(x)
las variables X
1
, . . . , X
n
se denominan independientes e identicamente distribuidas, iid, y escribi-
mos
X
i
iid
f(x), i = 1, . . . , n.
65
Denici on 3.1.2 Sea Z
1
, . . . , Z
k
un muestra aleatoria de la distribucion N(0, 1). Sea Y =

k
i=1
Z
2
i
.
Entonces Y tiene distribucion chi-cuadrado de Pearson con k grados de libertad y se denota
por
Y =
k

i=1
Z
2
i

2
k
Teorema 3.1.1 La esperanza y varianza de una distribucion
2
estan dadas por
E(Y ) = k
V(Y ) = 2k
Denici on 3.1.3 Sea Z
0
, Z
1
, . . . , Z
k
una muestra aleatoria de la distribucion N(0, 1) y sea Y =

k
i=1
Z
2
i
. Entonces
X =
Z
0
_
Y/k
tiene distribucion t-Student con n grados de libertad y se denota por
X t
n
Teorema 3.1.2 Si X
1
, . . . , X
n
es una muestra aleatoria de X N(,
2
) entonces:
a)
X =
1
n
n

i=1
X
i
y
s
2
=
1
n 1
n

i=1
(X
i
X)
2
son independientes.
b)
(n 1)s
2

2

2
n1
Denici on 3.1.4 Sean X, Y dos variables aleatorias independientes que tienen distribucion
2
con
n y m grados de libertad, respectivamente, es decir,
X
2
n
e Y
2
m
Entonces la variable aleatoria
Z =
X/n
Y/m
se tiene distribucion F con n y m grados de libertad y se denota por
Z F
n,m
66
3.2. Estimaci on Puntual
Denici on 3.2.1 Un estimador puntual corresponde a cualquier funcion de la muestra
g(X
1
, X
2
, . . . , X
n
)
3.2.1. Metodo de Momentos
Denici on 3.2.2 Sea X
1
, X
2
, . . . , X
n
una muestra aleatoria de una variable X, proveniente de una
poblacion con funcion de densidad f

, con
= (
1
,
2
, . . . ,
k
)
El estimador de momentos

de corresponde a la solucion del sistema de ecuaciones
E(X
1
) =
1
n
n

i=1
X
1
i
E(X
2
) =
1
n
n

i=1
X
2
i
=
.
.
.
E(X
k
) =
1
n
n

i=1
X
k
i
Debiendose plantear tantas ecuaciones como parametros se desea estimar.
Ejercicios 17 Si X
1
, X
2
, . . . , X
n
iid
f, encuentre los estimadores de momentos si f es
1. U(, 2)
2. N(,
2
)
67
3.2.2. Metodo de Maxima Verosimilitud
Denici on 3.2.3 Sea X
1
, . . . , X
n
una muestra aleatoria proveniente de una poblacion con funcion
densidad f

. Se dene la funcion de verosimilitud como la funcion densidad conjunta del vector


X
1
, . . . , X
n
y esta dada por
L(, x) =
n

i=1
f

(x
i
)
Ejercicios 18 Si X
1
, X
2
, . . . , X
n
iid
f, encuentre una expresion simplicada para la funcion de
verosimilitud si f es
1. exp()
2. (, ), con conocido.
3. Bin(n, p) con n conocido.
4. Poisson()
Denici on 3.2.4 Un estimador maximo verosmil, EMV, de , basado en una muestra X
corresponde a

(X)
el cual se obtiene al resolver

j
log(L(, x)) = 0 j = 1, . . . , k
Ejercicios 19 Si X
1
, X
2
, . . . , X
n
iid
f, encuentre los estimadores de maxima verosimilitud si f es
1. exp()
2. (, ), con conocido.
3. Bin(n, p) con n conocido.
4. Poisson()
Denicion 3.2.5 Consideremos una familia de distribuciones con parametro para una vari-
able aleatoria X y con funcion de verosimilitud asociada L(, x). Se dice que la log- verosimiltud
de X pertenece a una familia exponencial ssi existen funciones
1
, . . . ,
k
y t
1
, . . . , t
k
R,
tales que
log L(, x) = log h(x) + log c() +
k

j=1

j
()t
j
(x)
con h y c funciones positivas denidas en R
68
Ejemplo 3.2.1 Sea la variable aleatoria X con funcion densidad
f(x) =
_
(1 )
x1
, x = 1, 2, . . . , (0,1);
0, e.o.c.
Determine si f(x) pertenece a la familia exponencial.
Ejemplo 3.2.2 Sea X
1
, . . . , X
n
una muestra aleatoria de X cuya densidad es
f(x) =
1

2
2
exp
_

1
2
2
(x )
2
_
con x R, = (,
2
), < < ,
2
> 0, desconocidos. Determine si esta distribucion pertenece
a la familia exponencial.
69
3.3. Insesgamiento y eciencia
Denici on 3.3.1 Un estimador puntual

de es insesgado si
E(

) =
Si

no es insesgado , se denomina sesgo de

a
b(

) = E(

)
Por lo tanto, un estimador es insesgado si su distribuci on tiene como valor esperado al par ametro
que se desea estimar.
Ejercicios 20 Si X
1
, X
2
, . . . , X
n
iid
f, determine si los estimadores de momentos y maxima verosimil-
itud son insesgados para f
1. exp()
2. (, ), con conocido.
3. Bin(n, p) con n conocido.
4. Poisson()
Denici on 3.3.2 El error cuadr atico medio de un estimador

de corresponde a
ECM(

) = E(

)
2
= V(

) + (b(

))
2
Ejemplo 3.3.1 Sea X
1
, . . . , X
n
iid
exp() y consideremos

= 1/x. Calcule el ECM(

).
Denici on 3.3.3 Se dene la matriz de informacion de Fisher como
I() = E
_

logL(, x)
_
2
Lema 2 Sea la funcion f

tal que
d
d
E
_

logL(, x)
_
=
_

__

logf

(x)
_
f

(x)
_
dx,
entonces,
E
_

logL(, x)
_
2
= E
_

2
logL(, x)
_
70
Teorema 3.3.1 Cramer - Rao.
Sea X
1
, . . . , X
n
una muestra con funcion densidad f

que satisface la conmutatividad entre el oper-


ador integral y diferencial y sea g(X) = g(X
1
, . . . , X
n
) un estimador donde E(g(X)) es diferenciable
como funcion de . Entonces
V(g(X))
(
d
d
E(g(X))
2
E
_

log L(, x)
_
2
Observacion: La cantidad
(
d
d
E(g(X))
2
E
_

log L(, x)
_
2
se llama cota de Cramer-Rao y todo estimador que alcance esta cota sera llamado eciente.
Es claro que si g(X) es un estimador insesgado para entonces se cumple que
V(g(X))
1
E
_

log L(, x)
_
2
es decir, la cota de Cramer- Rao es igual a I()
1
.
Denici on 3.3.4 Un estimador g(X) de se dice eciente si
I()
1
V(

)
= 1
Teorema 3.3.2 Si

es el EMV de , entonces para cualquier funcion g(), el EMV de g() es g(

)
Ejercicios 21 .
Sea X
1
, . . . , X
n
una muestra aleatorio con funcion densidad
f
X
(x) =
x

2
e
x/
x > 0, > 0
1. Determine el estimador de momentos y el EMV de .
2. Determine si

es insesgado, calcule su varianza y comparela con la cota de Cramer- Rao.
Es este estimador eciente?
71
3.4. Estimaci on Intervalar
Adem as de las estimaciones puntuales de un par ametro, hay estimaciones por intervalos que
estipulan, con un cierto grado de conanza, que el par ametro se encuentra entre dos valores del
estadstico estimado. Supongamos una variable aleatoria poblacional X que tiene media cuyo
valor es desconocido. De una muestra aleatoria de taman no n, el valor x de la media muestral X
se puede usar para estimar al 95 % de conanza como sigue:
Denido E, el margen de error y la signicancia , tal que
P( E x + E) = 1
lo que es equivalente a la ecuacion
P(x E x + E) = 1
Entonces (x E, x + E) se llama intervalo de conanza del 100(1 ) % para .
Formalmente:
Denici on 3.4.1 Un estimador intervalar para un parametro , dados los valores x = (x
1
, . . . , x
n
)
de una variable aleatoria X, es cualquier par de funciones L(x
1
, . . . , x
n
) y U(x
1
, . . . , x
n
) que satisface
L(x) U(x) para todo x. El intervalo aleatorio [L(X), U(X)] se denomina un estimador intervalar.
Denici on 3.4.2 Para un parametro cualquiera , se dene un conjunto de conanza 1
como un conjunto C(x) tal que
P( C(X)) = 1
Denicion 3.4.3 Una variable aleatoria Q(X, ) corresponde a un pivote si su distribucion no
depende de ning un parametro. Es decir, la distribucion de Q(X, ) es la misma, para todo .
Ejemplo 3.4.1 Encuentre una cantidad pivotal si X
1
, . . . , X
n
son una muestra aleatoria N(,
2
)
y a partir de esta construya un conjunto o intervalo de conanza para la media poblacional.
3.4.1. Intervalo de Conanza para la media
Sea X
1
, . . . , X
n
iid
N(,
2
). Un intervalo de conanza para la media poblacional cuando la
varianza poblacional es conocida es
x E
donde E = z
1/2
/

n.
Ejemplo 3.4.2 Una aerolnea necesita estimar el n umero medio de pasajeros en un vuelo de re-
ciente apertura. Para ello, toma una muestra de 40 das y encuentra una media muestral de 112.0
pasajeros y una desvaicion estandar de 25. Encuentre un intervalo de conanza al 95 % para la
media poblacional.
72
Sea X
1
, . . . , X
n
iid
N(,
2
). Un intervalo de conanza para la media poblacional cuando la
varianza poblacional es desconocida es
x E
donde E = t
(n1,1/2)
s/

n.
Ejemplo 3.4.3 En una aerolnea se resgistran los tiempos de espera promedio de atencion en meson
de 14 das, obteniendo los siguientes resultados:
4.3 5.2 2.1 6.2 5.8 4.7 3.8 9.3 5.0 4.1 6.0 8.7 0.5 4.9
Encuentre un intervalo de conanza al 95 % para el tiempo de espera medio.
3.4.2. Intervalo de Conanza para una proporcion
Sea Y Bin(n, p). Por teorema del lmite central sabemos que
p (E( p), V( p))
Se puede mostrar que E( p) = p y V( p) =
p(1p)
n
.
As, el intervalo de conanza al (1 )100 % para una proporci on esta dado por
p E
donde E = z
1/2

_
p(1 p)
n
.
Ejemplo 3.4.4 En un colegio de Ense nanza Media hay matriculados 800 alumnos. A una muestra
seleccionada aleatoriamente de un 15 % de ellos, se les pregunto si utilizaban la cafetera del colegio.
Contestaron negativamente un total de 24 alumnos.
a) Estime el porcentaje de alumnos que utilizan la cafetera del colegio.
b) Determine, con una conanza del 99 %, el error maximo cometido con dicha estimacion.
3.4.3. Intervalo de Conanza para la varianza
Sea X
1
, . . . , X
n
una muestra aleatoria de una poblacion normal con media y varianza
2
. Un
intervalo de conanza para la varianza poblacional
2
est a dado por
_
(n 1)s
2

2
(n1,1/2)
,
(n 1)s
2

2
n1,/2
_
donde s
2
=
1
n1

n
i=1
(X
i
X)
2
.
73
Ejemplo 3.4.5 Un vendedor de muebles de madera para armar (desarmados) importa las piezas
desde el norte de Europa para abaratar costos. En cierto modelo, el cliente debe insertar cuatro
patas redondas en hoyos ya perforados. Para un ajuste adecuado, el diametro de las patas debe ser
ligeramente menor que un centmetro. Inevitablemente, hay cierta variacion en los diametros de
las patas. El vendedor compra patas a un proveedor bajo la especicacion de que el diametro medio
debe ser de 0.995 cm y desviacion estandar menor que 0.03 cm. Como parte del control de calidad
se obtuvo una muestra aleatoria de 121 patas la cual arrojo una media de 0.99516 y desviacion
estandar de 0.01825. Calcule un IC al 95 % para la desviacion estandar del lote.
En caso de contar dos muestras aleatorias, puede ser de interes comparar los siguientes paramet-
ros :
3.4.4. Intervalo de Conanza para la diferencia de medias
Sean X
1
, . . . , X
n
iid
N(
X
,
2
X
) e Y
1
, . . . , Y
m
iid
N(
Y
,
2
Y
), ambas muestras independientes. Un
intervalo de conanza para la diferencia de media entre poblaciones est a dado por
(x y) E
donde E cambiara de acuerdo a la informacion con respecto a la varianza.
Podemos identicar 3 casos:
a)
2
X
y
2
Y
conocidas.
E = z
1/2

2
X
n
+

2
Y
m
es decir
(
X

Y
)
_
(x y) z
1/2

2
X
n
+

2
Y
m
_
b)
2
X
y
2
Y
desconocidas pero iguales (
2
X
=
2
Y
=
2
).
Se utiliza el estimador de
2
dado por
s
2
p
=
(n 1)s
2
X
+ (m1)s
2
Y
n + m2
con
s
2
X
=
1
n 1

(X
i
X)
2
y s
2
Y
=
1
m1

(Y
i
Y )
2
El margen de error esta dado por
E = t
(n+m2,1/2)
s
p
_
1
n
+
1
m
74
Por lo tanto, el IC para la diferncia de medias cuando las varianzas son iguales pero descono-
cidas esta dado por
(
X

Y
)
_
(x y) t
(n+m2,1/2)
s
p
_
1
n
+
1
m
_
c)
2
X
y
2
Y
desconocidas y distintas.
Se dene
E = t
(,1/2)

_
s
2
X
n
+
s
2
Y
m
donde
=
_
s
2
x
n
+
s
2
y
m
_
2
(s
2
x
/n)
2
n1
+
(s
2
y
/m)
2
m1
As, el IC para la diferncia de medias cuando las varianzas son desconocidas y distintas
est a dado por
(
X

Y
)
_
(x y) t
(,1/2)

_
s
2
X
n
+
s
2
Y
m
_
Ejemplo 3.4.6 .
a) Se realiza un estudio para comparar los contenidos de nicotina de dos marcas de cigarrillos.
10 cigarrillos de la marca A dieron un contenido promedio de nicotina de 3,1ml/gr, con una
desviacion estandar de 0,5ml/gr, mientras que 8 cigarrillos de la marca B dieron un contenido
promedio de nicotina 2,7ml/gr, con una desviacion estandar de 0,7ml/gr. Suponiendo que los
datos son muestras aleatorias provenientes de dos poblaciones normales con varianzas iguales.
Encuentre un IC del 95 % para la verdadera diferencia en el contenido de nicotina de las dos
marcas.
b) Una compa na tiene dos departamentos que producen identicos productos. Se sospecha que las
producciones por hora son diferentes en los dos departamentos. Para averiguar esto se consid-
eran muestras aleatorias de horas de produccion que proporcionan la siguiente informacion:
Departamento 1 n
1
= 64 x
1
= 100
2
1
= 256
Departamento 2 n
2
= 49 x
2
= 90
2
2
= 196
Hallar un IC del 95 % para la diferencia verdadera entre las producciones medias de los de-
partamentos. Comente.
75
3.4.5. Intervalo de Conanza para la comparacion de varianzas
Sean X
1
, . . . , X
n
iid
N(
X
,
2
X
) e Y
1
, . . . , Y
m
iid
N(
Y
,
2
Y
), ambas muestras independientes y de
media desconocida. Para comparar las varianzas de ambas muestras podemos utilizar el intervalo
de conanza para la diferencia para el cuociente
2
x
/
2
y
dado por
_
s
2
x
s
2
y
F
(n1,m1,/2)
,
s
2
x
s
2
y
F
(n1,m1,1/2)
_
Ejemplo 3.4.7 Se realiza un estudio para comparar los contenidos de nicotina de dos marcas de
cigarrillos. 10 cigarrillos de la marca A dieron un contenido promedio de nicotina de 3,1ml/gr, con
una desviacion estandar de 0,5ml/gr, mientras que 8 cigarrillos de la marca B dieron un contenido
promedio de nicotina 2,7ml/gr, con una desviacion estandar de 0,7ml/gr. Suponiendo que los datos
son todos independientes, encuentre un IC del 95 % para la diferencia de varainzas.
76
3.5. Pruebas de Hip otesis
3.5.1. Introducci on
A menudo los datos muestrales sugieren que algo relevante est a sucediendo en la poblaci on o
proceso subyacente. Como suponemos que los datos provienen de una muestra aleatorio y por lo
mismo, estan sujetos a cierto grado de variacion aleatoria, la pregunta es si el resultado o el efecto
aparente en la muestra es una indicacion de que algo est a sucediendo en la pobalci on (o proceso)
subyacente o si el resultado observado es posiblemente una casualidad, producto de la variaci on
aleatoria.
Por esta razon es que postulamos una conjetura (o varias) que nos permita estimar si los resul-
tados aparentes en una muestra indican que en realidad algo est a pasando. De manera formal, la
conjetura puede postular en forma de hip otesis estadstica.
Denici on 3.5.1 Una hipotesis estadstica es una aseveracion o conjetura con respecto a una
o mas poblaciones.
En nuestro caso en particular, una hipotesis es una armacion sobre un parametro poblacional.
La verdad o falsedad de una hipotesis estadstica nunca se sabe con albosuta certeza a menos
que examinemos toda la poblacion. Esto, por supuesto, sera poco pr actico en la mayora de las
situaciones. En su lugar, tomamos una muestra aleatoria de la poblaci on de interes y utilizamos
los datos contenidos en esta muestra para proporcionar evidencia que apoye o no la hipotesis. La
evidencia de la muestra que es inconsistente con la hip otesis que se establece conduce al rechazo de
esta, mientras que la evidencia que la apoya conduce a su aceptacion.
La estructura de la prueba de hip otesis se formular a con el uso del termino hip otesis nula (H
0
),
hip otesis que deseamos probar como verdadera. En caso contrario, es decir, si la rechazamos, esta-
mos aceptando como verdadera la hip otesis alternativa (H
1
), que en general escribimos como
H
0
:
0
vs H
1
:

0
Denici on 3.5.2 Una prueba de hipotesis es una regla de decision que especifca para que val-
ores de la muestra la decision es aceptar H
0
como verdadera y para que valores de la muestra la
decision es aceptar H
1
como verdadera.
Para vericar si H
0
es verdadera debemos resumir la informacion de los datos en un estadsti-
co de prueba. Dicho estadstico se calcula para ver si la informaci on que entregan los datos es
razonablemente compatible con la hip otesis nula.
Para decidir a favor de la hip otesis nula debemos establecer una region de aceptaci on, la cual
identicar a los valores del estadstico de prueba que son relativamente probables dada la hipotesis
nula y los valores que no lo son. En que valor del estadstico de la prueba comenzamos a decir que
los datos apoyan a a la hip otesis alternativa? Para contestar esta pregunta se requiere conocer la
distribuci on muestral del estadstico de prueba. Los valores del estadstico de prueba que son suma-
mente improbables bajo la hipotesis nula forman una region de rechazo para la prueba estadstica.
77
Cuando realizamos una prueba, podemos tomar dos decisiones. Por tanto, podemos cometer dos
tipos de error:
Error de tipo I: rechazar la hipotesis nula, H
0
dado que esta es verdadera.
Error de tipo II: no rechazar la hipotesis nula H
0
, dado que la hip otesis alternativa H
1
es correcta.
Las consecuencias de estos tipos de error son diferentes y generalmente intentaremos minimizar el
error de tipo I.
Ejemplo 3.5.1 Determine los errores de tipo I y II.
1. H
0
: el acusado es culpable
H
1
: el acusado es inocente
2. H
0
: el paciente esta enfermo
H
1
: el paciente esta sano
La prueba adecuada sera aquella que minimizara la probabilidad de cometer los dos tipos de
error simult aneamente, lo cual, con estadstica cl asica, es imposible.
En consecuencia, se trata de minimizar la probabilidad de cometer Error tipo II, sujeto a que
la probabilidad de cometer Error tipo I no exceda un valor predeterminado . Este ultimo error es
tambien llamado nivel de signicancia.
Algunas propiedades importantes respecto de estos errores son:
Los errores de tipo I y tipo II est an relacionados. Una disminuci on en la probabilidad de uno
por lo general tiene como resultado un aumento en la probabilidad del otro.
El tama no de la region de rechazo, y por tanto la probabilidad de cometer error tipo I, siempre
se puede reducir al ajustar el o los valores crticos.
Un aumento en el tama no muestral n reducir a y (error tipo II) de forma simult anea.
Si la hipotesis nula es falsa, es un maximo cuando el valor real de un par ametro se aproxima
al valor hipotetico . Entre m as grande sea la distancia entre el valor real y el valor hipotetico,
ser a menor .
Denicion 3.5.3 La potencia de una prueba es la probabilidad de rechazar H
0
dado que una
alternativa especca es verdadera, y se puede calcular como 1 .
Diferentes tipos de pruebas se comparan al contrastar propiedades de potencia.
A pesar de estar jo, la probabilidad de cometer error de tipo I puede ser calculada y recibe el
nombre de valor-p.
78
Denici on 3.5.4 El valor-p de una prueba de hipotesis es el menor valor de para el cual
rechazamos la hipotesis nula.
Calculado este valor, la regla ser a rechazar la hip otesis nula si valor p < .
En este curso estudiaremos pruebas de hipotesis para tres parametros poblacionales: media,
varianza y proporcion.
3.5.2. Prueba de Hipotesis para la media
Sea X
1
, . . . , X
n
una muestra aleatoria de una distribuci on con media y varianza
2
> 0.
Considere las hip otesis generales
H
0
:
0
vs H
1
:

0
Es decir, queremos probar alg un valor o rango de valores para la media, cuando la varianza es
conocida. La estadstica de prueba apropiada se basa en la variable X, que por TCL sabemos
distribuye N(,
2
/n) y que si estandarizamos obtenemos
Z =
X
/

n
N(0, 1)
Entonces distinguiremos tres casos:
Hip otesis Nula Hip otesis Alternativa Rechazo H
0
si
=
0
=
0
|z
0
| z
1/2

0
>
0
z
0
z
1

0
<
0
z
0
z
1
donde
z
0
=
x
0
/

n
Ejemplo 3.5.2 Una muestra aleatoria de 100 muertes registradas en un servicio el a no pasado
muestra una vida promedio de 71.8 a nos. Suponga una desviacion estandar poblacional de 8.9 a nos.
esto parece indicar que la vida media hoy en da es mayor a 70 a nos? Utilice un nivel de signi-
cancia de 5 %.
Sea X
1
, . . . , X
n
una muestra aleatoria de una distribucion con media , desconocida y varianza
s
2
> 0, esto quiere decir que la varianza es estimada en la muestra. Considere las hipotesis generales
H
0
:
0
vs H
1
:

0
Es decir, queremos probar alg un valor o rango de valores para la media, cuando la varianza es
desconocida, por lo que la reemplazamos por s
2
, el estimador insesgado de la varianza. La estadstica
de prueba apropiada se basa en la variable X, que por TCL sabemos distribuye N(,
2
/n) y adem as
n1

2
s
2

2
, con las que podemos construir el estadstico
Z =
X
s/

n
t(n 1)
Entonces distinguiremos tres casos:
79
Hip otesis Nula Hip otesis Alternativa Rechazo H
0
si
=
0
=
0
|t
0
| t
1/2

0
>
0
t
0
t
1

0
<
0
t
0
t
1
donde
t
0
=
x
0
s/

n
Ejemplo 3.5.3 Se arma que una aspiradora gasta en promedio 46 kilowatt-hora al a no. Se toma
una muestra aleatoria de 12 hogares indica que las aspiradoras gastan un promedio de 42 kilowatt-
hora al a no con una desviacion estandar de 11.9 kilowatt-hora, esto sugiere que las aspiradoras
gastan, en promedio, menos de 46 kilowatt-hora anualmente con 5 % de signicancia?
3.5.3. Prueba de Hipotesis para la proporci on
Es de interes probar la hip otesis que la proporcion de exitos de un experimento binomial es
igual a un valor especco o est a en un rango de valores. Sea X la variable aleatoria que cuenta el
n umero de exitos y sea p = X/n la estimacion del par ametro p. Entonces, para n grande, podemos
establecer que
Z =
x np
_
np(1 p)
=
p p
_
p(1p)
n
N(0, 1)
Entonces distinguiremos tres casos:
Hip otesis Nula Hip otesis Alternativa Rechazo H
0
si
p = p
0
p = p
0
|z
0
| z
1/2
p p
0
p > p
0
z
0
z
1
p p
0
p < p
0
z
0
z
1
donde
z
0
=
p p
0
_
p
0
(1 p
0
)/n
Ejemplo 3.5.4 Un medicamento que se prescribe actualmente se considera efectivo en un 60 %.
Resultados experimentales con un nuevo farmaco se asministar a una muestra aleatoria de 100
personas, de las cuales 70 se aliviaron. Esta es evidencia suciente para concluir que el nuevo
medicamento es superior al que se receta actualmente? Use = 5 %
3.5.4. Prueba de Hipotesis para la varianza
Sean X
1
, . . . , X
n
una muestra de una variable aleatoria con distribuci on N(,
2
), ambos par amet-
ros desconocidos. Sabemos que si s
2
es el estimador insesgado de
2
, es decir,
s
2
=
1
n 1

(x
i
x)
2
entonces
(n 1)s
2

2

2
(n1)
80
Entonces, si es de interes probar que la varianza poblacional esta en un intervalo dado, distinguire-
mos tres casos:
Hip otesis Nula Hip otesis Alternativa Rechazo H
0
si

2
=
2
0

2
=
2
0
Q
0

2
n1,1/2
o Q
0

2
n1,/2

2

2
0

2
>
2
0
Q
0

2
n1,1

2

2
0

2
<
2
0
Q
0

2
n1,
donde
Q
0
=
(n 1)s
2

2
0
Ejemplo 3.5.5 Se tienen los pesos de 10 paquetes de semillas de pasto distribuidas por cierta
compa na, de la cuales se obtuvo x = 46,12 y s
2
= 0,286. La empresa desea saber si los pesos
registrados presentan evidencia para asegurar que la varianza poblacional es mayor a 0.2, con un
nivel de signicancia de 5 %.
3.5.5. Prueba de Hipotesis para la diferencia de medias
Si tenemos dos muestras de tama no n y m de poblaciones independientes, X e Y, con medias

X
y
Y
, estas pueden ser comparadas usando la diferencia
1

2
, cuyo estimador es x y. La
distribuci on de esta diferencia depender a de la informacion respecto de la relacion entre las varianzas
poblacionales
2
X
y
2
Y
, de los cuales podemos identicar tres casos.
Varianzas conocidas.
El estadstico de prueba es
(X Y ) d
_

2
X
n
+

2
Y
m
N(0, 1)
Las hipotesis a contrastar son:
Hip otesis Nula Hip otesis Alternativa Rechazo H
0
si

X

Y
= d
X

Y
= d |z
0
| z
1/2

X

Y
d
X

Y
> d z
0
z
1

X

Y
d
X

Y
< d z
0
z
1
donde
Z
0
=
(x y) d
_

2
X
n
+

2
Y
m
Ejemplo 3.5.6 Una muestra aleatoria de tama no n
1
= 25, que se toma de una poblacion normal
con una desviacion estandar
1
= 5,2, tiene una media x
1
= 81. Una segunda muestra aleatoria
de tama no n
2
= 36, que se toma de una poblacion normal diferente con una desviacion estandar
= 3,4, tiene una media x
2
= 76. Pruebe la hipotesis de las medias son iguales con un nivel de
signicancia del 5 %.
81
Varianzas desconocidas pero iguales.
2
X
=
2
Y
=
Si las varianzas desconocidas, debemos estimarlas, incorporando el hecho que sean iguales. En-
tonces, dados s
2
X
y s
2
Y
, los estimadores insesgados de
2
X
y
2
Y
, respectivamente, denimos
s
2
p
=
(n 1)s
2
X
+ (m1)s
2
Y
n + m2
El estadstico de prueba es
(X Y ) d
s
p
_
1
n
+
1
m
t

con = n + m2.
Las hipotesis a contrastar son:
Hip otesis Nula Hip otesis Alternativa Rechazo H
0
si

X

Y
= d
X

Y
= d T
0
t
,1/2

X

Y
d
X

Y
> d T
0
t
,1

X

Y
d
X

Y
< d T
0
t
,1
donde
T
0
=
(x y) d
s
p
_
1
n
+
1
m
Ejemplo 3.5.7 Una compa na armadora de automoviles grande trata de decidir si compra llantas
de la marca A o de la B para sus nuevos modelos. Se lleva a cabo un experimento, para ayudar a
llegar a una decision, en el que se usan 12 llantas de cada marca. Las llantas se utilizan hasta que
se acaban. Los resultados son
Marca A :x
1
= 37900km s
1
= 5100km
Marca B :x
2
= 39800km s
2
= 5900km
Pruebe la hipotesis que no hay diferencias entre las dos marcas de llantas con un nivel de signi-
cancia del 5 %, suponiendo que las varianzas poblacionales son iguales.
Varianzas desconocidas y distintas.
Si las varianzas desconocidas y distintas, el estimador de la varianza de
X

Y
es
s
2
p
=
s
2
X
n
+
s
2
Y
m
El estadstico de prueba es
(X Y ) d
s
p
t

con
=
_
s
2
X
n
+
s
2
Y
m
_
2
_
(s
2
X
/n)
2
n1
+ (
(s
2
Y
/m)
2
m1
_
Las hipotesis a contrastar son:
82
Hip otesis Nula Hip otesis Alternativa Rechazo H
0
si

X

Y
= d
X

Y
= d |T
0
| t
,1/2

X

Y
d
X

Y
> d T
0
t
,1

X

Y
d
X

Y
< d T
0
t
,1
donde
T
0
=
(x y) d
s
p
t

Ejemplo 3.5.8 Para el ejemplo anterior, realice la prueba para la hipotesis que las llantas de la
marca A son mejores que las de B, suponiendo que las varianzas poblacionales son distintas.
3.5.6. Prueba de Hipotesis para la diferencia de proporciones
Si tenemos dos muestras independientes X
1
, . . . , X
n
y Y
1
, . . . , Y
m
de poblaciones Bernoulli de
par ametros p
1
y p
2
, respectivamente, estas pueden ser comparadas usando la diferencia p
1
p
2
utilizando que
(p
1
p
2
) d
_
p
1
(1p
1
)
n
+
p
2
(1p
2
)
m
N(0, 1)
Las hipotesis a contrastar son:
Hip otesis Nula Hip otesis Alternativa Rechazo H
0
si
p
1
p
2
= d p
1
p
2
= d |z
0
| z
1/2
p
1
p
2
d p
1
p
2
> d z
0
z
1
p
1
p
2
d p
1
p
2
< d z
0
z
1
donde
z
0
=
( p
1
p
2
) d
_
p
1
(1 p
1
)
n
+
p
2
(1 p
2
)
m
Ejemplo 3.5.9 En un estudio para estimar la proporcion de residentes de cierta ciudad y sus
suburbios que estan a favor de la construccion de una planta de energa nuclear, se encuentra que
63 de 100 residentes urbanos estan a favor de la construccion mientras que solo 59 de 125 residentes
suburbanos la favorecen. Hay una diferencia signicativa entre las proporcion de residentes urbanos
y suburbanos que favorecen la construccion de la planta nuclear? Use = 0,05.
3.5.7. Prueba de Hipotesis para la comparacion de varianzas
Sean X
1
, . . . , X
n
una muestra aleatoria de la distribucion N(
X
,
2
X
), independiente de Y
1
, . . . , Y
m
una muestra aleatoria de una distribuci on N(
Y
,
2
Y
), con todos los par ametros son desconocidos.
Las varianzas poblacionales pueden ser comparadas usando el cuociente
2
X
/
2
Y
cuyo estimador es
s
2
X
/s
2
Y
. Entonces

2
X

2
Y
k F
n1,m1
Entonces, si es de interes probar que las varianzas poblacionales est an en una raz on dada es
83
Hip otesis Nula Hip otesis Alternativa Rechazo H
0
si

2
X

2
Y
=
1
k

2
X

2
Y
=
1
k
F
0
F
n1,n2,1/2
o F
0
F
n1,n2,/2

2
X

2
Y

1
k

2
X

2
Y
>
1
k
F
0
F
n1,n2,1

2
X

2
Y

1
k

2
X

2
Y
<
1
k
F
0
F
n1,n2,
donde
F
0
=
s
2
X
s
2
Y
k
Ejemplo 3.5.10 Para el ejemplo 16.9, determine si las varianzas son iguales o distintas con 2.5 %
de conanza.
84
Captulo 4
Bibliografa
85