Está en la página 1de 340

Probabilidad y estadstica

Unidad Temas Subtemas


1 Estadstica descriptiva. 1.1 Conceptos bsicos de estadstica.
1.1.1 Definicin de estadstica.
1.1. !nferencia estadstica.
1.1." Teora de decisin.
1.1.# Poblacin.
1.1.$ %uestra aleatoria.
1.1.& Parmetros aleatorios.
1.1.7 Enfoque clsico.
1.1.' Enfo(ue )ayesiano.
1. Descripcin de datos.
1..1 Datos a*rupados y no
a*rupados.
1.. +recuencia de clase.
1.." +recuencia relativa.
1..# Punto medio.
1..$ ,mites.
1..& -isto*rama.
1.2.7 Histograma de frecuencia
relativa.
1." %edidas de tendencia central.
1.".1 %edia aritm.tica/ *eom.trica y
ponderada.
1.". %ediana.
1."." %oda.
1.# %edidas de dispersin.
1.#.1 0arian1a.
1.#. Desviacin estndar.
1.#." Desviacin media.
1.#.# Desviacin mediana.
1.#.$ 2an*o.
1.$ Parmetros para datos a*rupados.
1.$.1 ,a media.
1.$. ,a desviacin tpica.
1.& Distribucin de frecuencias.
1.6.1 Distribuciones numricas.
1.6.2 Distribuciones categricas.
1.&." Distribuciones acumuladas.
1.&.# Distribuciones porcentuales.
1.&.$ Distribuciones porcentuales
acumuladas.
1.7 Tcnicas de agrupacin de datos.
1.7.1 Lmites de clase.
1.7.2 Rango de clase.
1.7.3 Fronteras de clase.
1.7.4 Marca de clase.
1.3.$ !ntervalo de clase.
1.3.& Dia*rama de tallos y 4o5as.
1.3.3 Dia*rama de Pareto.
1.3.' Dia*rama de puntos.
1.' -isto*rama.
1.'.1 Dia*rama de barras.
1.'. Pol*ono de frecuencias.
1.'." 65ivas.
1.'.# 7rficas circulares.
1.8 Distribuciones muestrales.
Probabilidad. .1Teora elemental de probabilidad.
.1.1 Concepto clsico y como
frecuencia relativa.
2.1.2 nterpretacin subjetiva de la
probabilidad.
. Probabilidad de eventos.
..1 Definicin de espacio muestral.
2.2.2 Discreto y continuo.
.." Definicin de evento.
..# Simbolo*a/ uniones e
intersecciones.
..$ Dia*ramas de 0enn.
." T.cnicas de conteo.
.".1 Dia*rama de rbol.
.". 9otacin factorial.
."." Permutacin.
.".# Combinaciones.
.".$ Teorema del )inomio.
2.4Probabilidad con tcnicas de conteo.
2.4.1 Aplicacin del concepto clsico
de probabilidad.
.#. E5ercicios de permutacin.
.#." E5ercicios de combinaciones.
.#.# :;iomas.
.#.$ Teoremas.
.$Probabilidad condicional.
.$.1 Dependiente.
.$. !ndependiente.
2.6 Ley multiplicativa.
.&.1 Clculo de probabilidad de
eventos.
2.6.2 Conjuntos.
.&." Problemas de eventos
independientes.
.&.# Eventos dependientes.
.&.$ Dia*ramas de rbol.
.3 Eventos !ndependientes.
2.7.1 Aplicacin de teoremas.
.3. 2e*la de )ayes.
.3." Conocer teoremas y reali1ar
e5ercicios.
.3.# 2esolver problemas (ue
apli(uen el teorema.
" +unciones y
distribuciones
muestrales.
".1 +uncin de probabilidad.
".1.1 0ariables aleatorias discretas.
".1. 0ariables aleatorias continuas.
". Distribucin binomial.
3.2.1 Conceptos de ensayos repetidos.
".. Conceptos de ensayos de
)ernoulli.
3.2.3 Smbolos de representacin
"." Distribucin 4iper*eom.trica.
".".1 %uestra con reempla1o.
3.3.2 %uestra sin reempla1o.
".# Distribucin de Poisson.
3.5 Esperan1a matemtica.
3.5.1 Medida de una variable aleatoria.
".$. 0alor esperado.
3.6 Propiedades de la curva Binomial.
3.6.1 Propiedades geomtricas.
3.6.2 Parmetros.
".3 Distribucin normal.
3.7.1 Distribucin de la
probabilidad continua.
3.7.2 Ecuacin de la normal.
3.7.3 Grficas.
3.7.4 Tablas.
3.7.5 Aplicaciones
".' :pro;imacin de la binomial a
la normal.
3.9 Otras distribuciones muestrales.
".8.1 Distribucin T<student.
3.9.2 Distribucin = cuadrada.
3.9.3 Distribucin F.
3.9.4 CPU..
# Estadstica aplicada. #.1 !nferencia estadstica.
#.1.1 Concepto.
#.1. Estimacin.
#.1." Prueba de 4iptesis.
#.1.# %.todo clsico de estimacin
>puntual?.
4.1.5 Estimador nsesgado.
4.1.6 Varianza de un estimador
puntual.
#. !ntervalos de confian1a.
#..1 Estimacin por intervalo.
4.2.2 Lmites de confianza.
#.." !ntervalo de confian1a para
medida con varian1a conocida.
#..# !ntervalo de confian1a para
medida con varian1a
desconocida.
#..$ !ntervalo de confian1a para
proporciones.
#." Pruebas de 4iptesis.
#.".1 Prueba de 4iptesis para la
media poblacional.
#.". Prueba de 4iptesis para
diferencias de medias.
#."." Prueba de 4iptesis para
proporciones.
$ 2e*resin y
correlacin.
$.1!ntroduccin.
5.1.1 Grficas de los datos.
$.1. 0ariables de re*resin
independientes.
$.1." 2e*resin lineal simple.
5.1.4 Coeficientes de regresin.
5.1.5 Lneas de regresin ajustada.
5.2Diagrama de dispersin.
5.2.1 Tabla de datos.
5.2.2 Construccin de diagramas.
$."Estimacin mediante la lnea de
re*resin.
5.3.1 Ecuacin de la recta como ajuste
de datos.
$.". %odelos.
$.#%.todos de mnimos cuadrados.
$.#.1 Ecuaciones normales.
5.4.2 Estimacin de los coeficientes de
regresin.
5.5Error estndar de estimacin.
$.&Coeficientes de determinacin y
correlacin.
5.6.1 Coeficiente de determinacin de
la muestra.
$.&. Coeficiente de correlacin de la
muestra.
5.6.3 Error estndar del coeficiente de
regresin.
5.7Problemas prcticos de ajuste de curvas.
Unidad 1. Estadstica descriptiva.
1.1Conceptos bsicos de estadstica.
1.1.1 Definicin de estadstica.
Definicin de estadstica.
El trmino estadstica tiene su raz en la palabra Estado. Surge cuando se hace necesario para sus intereses cuantificar
conceptos. En la mayora de los casos esta cuantificacin se har en funcin de unos fines econmicos o militares. El estado
quiere conocer censo de personas, de infraestructura, de recursos en general, para poder obtener conclusiones de esta
informacin.
Actualmente la estadstica es una ciencia. o es ya una cuestin reser!ada al estado. "odramos
decir que se encuentra en la totalidad del resto de ciencias. #a razn es clara$ por una parte la estadstica
proporciona tcnicas precisas para obtener informacin, %recogida y descripcin de datos& y por otra parte
proporciona mtodos para el anlisis de esta informacin .
'e ah el nombre de ES(A')S(*+A 'ES+,*"(*-A, ya que el ob.eti!o ser, a partir de una muestra
de datos %recogida seg/n una tcnica concreta&, la descripcin de las caractersticas ms importantes,
entendiendo como caractersticas, aquellas cantidades que nos proporcionen informacin sobre el tema de
inters del cual hacemos el estudio.
Si bien no hay una definicin de estadstica e0acta, se puede decir que la 1estadstica es el estudio de los
mtodos y procedimientos para recoger, clasificar, resumir y analizar datos y para hacer inferencias
cientficas partiendo de tales datos1.
Esta definicin cubre gran parte de la acti!idad del cientfico. Es importante obser!ar que el ob.eto del que
realiza el anlisis estadstico son los datos y las obser!aciones cientficas por s mismos, mas que el
material qumico que inter!iene en el estudio.
"or lo tanto no es posible trazar lmites rgidos entre la qumica, la estadstica y la matemtica.
#a estadstica se puede di!idir en 2 categoras, la 1estadstica descripti!a1 y la 1inferencia estadstica1.
#a estadstica descripti!a implica la abstraccin de !arias propiedades de con.untos de obser!aciones,
mediante el empleo de mtodos grficos, tabulares numricos. Entre estas propiedades, estn la
frecuencia con que se dan !arios !alores en la obser!acin, la nocin de un !alor tpico o usual, la cantidad
de !ariabilidad en un con.unto de datos obser!ados y la medida de relaciones entre 2 mas !ariables.
El campo de la estadstica descripti!a no tiene que !er con las implicaciones o conclusiones que se puedan
deducir de con.untos de datos. #a estadstica descripti!a sir!e como mtodo para organizar datos y poner
de manifiesto sus caractersticas esenciales con el propsito de llegar a conclusiones.
La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una
poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de
extraer conclusiones sobre el comportamiento de estas variables.
Las variables pueden ser de dos tipos:
0ariables cualitativas o atributos: no se pueden medir numricamente (por ejemplo: nacionalidad, color
de la piel, sexo).
0ariables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales).
Las variables tambin se pueden clasificar en:
0ariables unidimensionales@ slo recogen informacin sobre una caracterstica (por ejemplo: edad de
los alunmos de una clase).
0ariables bidimensionales@ recogen informacin sobre dos caractersticas de la poblacin (por ejemplo:
edad y altura de los alumnos de una clase).
0ariables pluridimensionales@ recogen informacin sobre tres o ms caractersticas (por ejemplo: edad,
altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas@ slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos
(puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un
vehculo puede ser 80,3 km/h, 94,57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
!ndividuo: cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si
estudiamos la altura de los nios de una clase, cada alumno es un individuo; si estudiamos el precio de la
vivienda, cada vivienda es un individuo.
Poblacin@ conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informacin
sobre el fenmeo que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la
poblacin ser el total de las viviendas de dicha ciudad.
%uestra@ subconjunto que seleccionamos de la poblacin. As, si se estudia el precio de la vivienda de
una ciudad, lo normal ser no recoger informacin sobre todas las viviendas de la ciudad (sera una labor
muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es
suficientemente representativo.
1.1. !nferencia estadstica.
#a inferencia estadstica se basa en las conclusiones a la que se llega por la ciencia e0perimental
basndose en informacin incompleta. "or e.emplo, 3endel al estudiar la manera como diferan entre s las
plantas de guisantes en altura, color de las semillas, color de las !ainas y color de las flores, tu!o que
hacer sus conclusiones necesariamente basndose en un grupo de plantas relati!amente poco numeroso
comparado con toda la poblacin de plantas de guisantes de un tipo particular.
Al hacer un enunciado, como por e.emplo, sobre el color de las flores, las conclusiones de 3endel
dependan de la muestra particular de plantas disponibles para este estudio.
En la terminologa estadstica, el procedimiento inducti!o implica el hacer inferencias acerca de una
poblacin adecuada uni!erso a la luz de lo a!eriguado en un subcon.unto aparte o muestra.
#a inferencia estadstica se refiere a los procedimientos mediante los cuales se pueden hacer tales
generalizaciones inducciones.
Es importante por todo lo dicho anteriormente, que el proceso de la inferencia cientfica, implica el grado
mas ele!ado de cooperacin entre la estadstica y el estudio e0perimental.
#a *nferencia Estadstica es la parte de la estadstica matemtica que se encarga del estudio de los
mtodos para la obtencin del modelo de probabilidad %forma funcional y parmetros que determinan la
funcin de distribucin& que sigue una !ariable aleatoria de una determinada poblacin, a tra!s de una
muestra %parte de la poblacin& obtenida de la misma.
#os dos problemas fundamentales que estudia la inferencia estadstica son el 1"roblema de la estimacin1
y el 1"roblema del contraste de hiptesis1
+uando se conoce la forma funcional de la funcin de distribucin que sigue la !ariable aleatoria ob.eto de
estudio y slo tenemos que estimar los parametros que la determinan, estamos en un problema de
inferencia estadstica paramtrica 4 por el contrario cuando no se conoce la forma funcional de la
distribucin que sigue la !ariable aleatoria ob.eto de estudio, estamos ante un problema de inferencia
estadstica no paramtrica.
En lo que sigue nos !amos a limitar a problemas de inferencia estadstica paramtrica, donde la !ariable
aleatoria ob.eto de estudio sigue una distribucin normal, y slo tendremos que tratar de estimar los
parmetros que la determinan, la media y la des!iacin tpica.
Esta situacin se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional de
la distribucin de probabilidad, por consideraciones tericas, quedando /nicamente indeterminados los
parmetros que determinan la funcin de distribucin.
+omo las poblaciones en las que se pretende estudiar una determinada !ariable aleatoria, son grandes, es
muy caro o imposible, estudiar a todos sus indi!iduos4 lo que se hace, es estudiar una muestra % una parte&
de la poblacin
En todos estos problemas que estudia la inferencia estadstica .uega un papel fundamental la 1(eora de la
"robabilidad1 %distintas formas funcionales de las distribuciones de probabilidad& y la 1(eora de 3uestras1
%procedimientos para tomar muestras de manera apropiada&.
1.1." Teora de decisin.
TEORA DE DECISIN
Estudio formal sobre la toma de decisiones. Los estudios de casos reales,
que se sirven de la inspeccin y los experimentos, se denominan teora
descriptiva de decisin; los estudios de la toma de decisiones racionales,
que utilizan la lgica y la estadstica, se llaman teora preceptiva de
decisin. Estos estudios se hacen ms complicados cuando hay ms de un
individuo, cuando los resultados de diversas opciones no se conocen con
exactitud y cuando las probabilidades de los distintos resultados son
desconocidas. La teora de decisin comparte caractersticas con la teora
de !uegos, aunque en la teora de decisin el "adversario# es la realidad en
vez de otro !ugador o !ugadores.
$l hacer un anlisis sobre esta teora, y mirndola desde el punto de vista
de un sistema, se puede decir que al tomar una decisin sobre un problema
en particular, se debe tener en cuenta los puntos de dificultad que lo
componen, para as empezar a estudiarlos uno a uno hasta obtener una
solucin que sea acorde a lo que se esta esperando obtener de este, y sino,
buscar otras soluciones que se acomoden a lo deseado.
La teora de decisin, no solamente se puede ver desde el punto de vista
de un sistema, sino en general, porque esta se utiliza a menudo para tomar
decisiones de la vida cotidiana, ya que muchas personas piensan que la vida
es como una de las teoras; La teora del !uego, que para poder empezarlo
y entenderlo hay que saber !ugarlo y para eso se deben conocer las reglas
de este, para que no sur!an equivocaciones al empezar la partida.
%e puede decir que la &eora de decisin es una de las ramas que sirve
para que al dar un paso, no se vaya a dar en falso, porque si se conoce de
esta no hay el porque de equivocarse.
4ttp@AABBB.tuobra.unam.m;ApublicadasAC#C8#1$1$".4tml
Teora de Decisin trata de decisiones contra la naturaleza. Esto se refiere a una situacin donde
el resultado(ganancia, prdida) de una
decisin depende de la accin de otro jugador (la naturaleza). Por ejemplo, si la decisin es de
llevar o no paraguas, la ganancia (llueve o no llueve) depende de la accin ue toma la
naturaleza. Es importante darse cuenta ue en este modelo la ganancia (prdida)concerne solo al
tomador de la decisin. Esta condicin distingue la teora de decisin de la teora de juegos. En
la teora de juegos am!os jugadores est"n interesados en el resultado.
#a informacin fundamental para los pro!lemas en teora de decisin se encuentra representada
en una matriz de ganancias (costos)

#os valores son las ganancias (o prdidas) para cada posi!le com!inacin de decisin con
estado de la naturaleza. El proceso de decisin es el siguinte$
El tomador de decisiones selecciona una de las posi!les decisiones .
Digamos
Despus de tomar la decisin, ocurre un estado de la naturaleza. Digamos el estado j.
#a ganancia reci!ida por el tomador de decisiones es .
El pro!lema del tomador de decisiones es determinar ue decisin tomar%. #a decisin depender"
del comportamiento del tomador de decisiones con respecto a la naturaleza, es decir al estado de
la naturaleza ue sucede. &i creemos ue ocurrir" el estado de la naturaleza j seleccionaremos
naturalmente la decisin ue est" asociada al ma'or valor de en la columna j de la matriz
de ganancias.
Diferentes suposiciones acerca del comportamiento de la naturaleza conducir"n a diferentes
formas de seleccionar la (mejor( decisin.
&i supieramos cual estado de la naturaleza ocurrir", simplemente seleccionaramos la decisin
ue nos lleva a o!tener una ma'or
ganancia para ese conocido estado de la naturaleza. En la pr"ctica, pueden )a!er infinitas
posi!les decisiones. &i esas posi!les decisiones se
representan mediante un vector d ' la ganancia por la funcin con valores reales r(d), el
pro!lema de decisin puede ser formulado como$

ma* r(d) sujeto a la facti!ilidad de las
restricciones so!re d

4ttp@AABBB.inf.utfsm.clADmcriffAfioAtd.4tml
1.1.# Poblacin.
Poblaciones, muestras e inferencia
+omo se ha se5alado anteriormente, el ob.eti!o de la estadstica descripti!a, es la descripcin de los datos
y no la inferencia partiendo de los datos.
6na poblacin de unidades es un grupo de entidades que tienen alguna caracterstica cuantificable en
com/n.
#as unidades pueden ser personas, rboles, bacterias, compuestos qumicos, etc.. "ueden ser finitas o
infinitas en n/mero. #a caracterstica cuantificable puede ser una !ariable continua o discreta.
6na poblacin de obser!aciones es un grupo que consiste en los !alores numricos de una caracterstica
cuantificable determinada en cada elemento de una poblacin de unidades.
#a misma poblacin de unidades tendr en ocasiones mas de una poblacin de obser!aciones asociada.
6na muestra de unidades es un n/mero finito de unidades procedentes de una poblacin de unidades.
6na muestra de obser!aciones es un n/mero finito de obser!aciones procedentes de una poblacin de
obser!aciones.
Es decir una muestra es una parte de una poblacin que aislamos para estudiarla.
Este concepto es de importancia para el anlisis estadstico porque por lo general uno dispone de una
muestra de una poblacin para el estudio que intenta realizar. "or e.emplo, si necesitramos hacer un
promedio de todas las alturas de los habitantes de un pas de 277.777.777 de habitantes %esta sera la
poblacin estadstica&, es lgico suponer lo engorroso que sera medir la altura de todos. Esto se realiza
midiendo las alturas de una muestra de esta poblacin, por e.emplo 87.777 habitantes. Este procedimiento
es inducti!o ya que el in!estigador saca conclusiones acerca de la poblacin basndose en el anlisis de
una muestra de esa poblacin4 esto es hacer una inferencia acerca de una poblacin partiendo de una
muestra.
Se llama inferencia estadstica una conclusin que se refiere a una poblacin de obser!aciones, obtenida
sobre la base de una muestra de obser!aciones.
6na caracterstica descripti!a global de una poblacin de obser!aciones se llama parmetro.
6na caracterstica descripti!a global de una muestra de obser!aciones se llama estadgrafo.
Poblacion:
En estadstica el concepto de poblacin !a ms all de lo que com/nmente se conoce como tal. En
trminos estadsticos, poblacin es un con.unto finito o infinito de personas, animales o cosas que
presentan caractersticas comunes, sobre los cuales se quiere efectuar un estudio determinado. En otras
palabras, la poblacin se define como la totalidad de los !alores posibles %mediciones o conteos& de una
caracterstica particular de un grupo especificado de personas, animales o cosas que se desean estudiar
en un momento determinado. As, se puede hablar de la poblacin de habitantes de un pas, de la
poblacin de estudiantes uni!ersitarios de la zona sur del Estado Anzotegui, de la poblacin de casas de
la 6rbanizacin #os ,os de la ciudad de El (igre, el rendimiento acadmico de los estudiantes del
*6(9AA, el n/mero de carros marca +orola de la ciudad de El (igre, la estatura de un grupo alumnos del
*6(9AA, la talla, etc.
1.1.$ %uestra aleatoria.
6na muestra aleatoria es una muestra sacada de una poblacin de unidades, de manera que todo
elemento de la poblacin tenga la misma probabilidad de seleccin y que las unidades diferentes se
seleccionen independientemente.
6na muestra aleatoria de tama5o n de una poblacin : , es una sucesin de n !ariables aleatorias,
independientes, :8 , :2 ,..., :n , con idntica ley de probabilidad que : . 6na muestra de tama5o n est
constituida por n rplicas de :.
6na !ez que la muestra se haya realizado, es decir, se hayan e0trado los n indi!iduos de la poblacin y
1medido1 la !ariable : en cada uno de ellos, se dispondrn de n datos u obser!aciones $ 08 , 02 ,..., 0n.
"ara que una !ariable aleatoria, definida a partir de una muestra aleatoria de tama5o n, tome !alores, es
necesario disponer de los n datos de la realizacin de tal muestra.
1.1.& Parmetros aleatorios.
#os "armetros$
Son cualquiera caracterstica que se pueda medir y cuya medicin se lle!e a cabo sobre todos los
elementos que integran una poblacin determinada, los mismos suelen representarse con letras griegas. El
!alor de un parmetro poblacional es un !alor fi.o en un momento dado. E.emplo$ #a media Aritmtica ; m
%miu&, #a des!iacin (pica ; s, %Sigma& etctera.
6na parmetro es una medida usada para describir alguna caracterstica de una poblacin, tal como una
media aritmtica, una mediana o una des!iacin estndar de una poblacin.
+uando los dos nue!os trminos de arriba son usados, por e.emplo, el proceso de estimacin en inferencia
estadstica puede ser descrito como le proceso de estimar un parmetro a partir del estadstico
correspondiente, tal como usar una media muestral % un estadstico para estimar la media de la poblacin
%un parmetro&.
#os smbolos usados para representar los estadsticos y los parmetros, en ste y los siguientes captulos,
son resumidos en la tabla siguiente$
(abla 8
Smbolos para estadsticos y parmetros correspondientes
3edida Smbolo para el estadstico Smbolo para el parmetro
%muestra& %"oblacin&
3edia : <
'es!iacin estndar s
/mero de elementos n
"roporcin p "
1.1.3 Enfo(ue clsico.
El enfoque clsico analiza la serie considerando cada variable por separado y en funcin del tiempo; se
ha convertido en un mtodo estndar de estudio de estas series, y es aceptado de forma unnime por los
estadsticos; por tanto es el que se describir en el presente tema.
El enfoque clsico: Dice que si hay x posibles resultados favorables a la ocurrencia de un evento A y z
posibles resultados desfavorables a la ocurrencia de A, y todos los resultados son igualmente posibles y
mutuamente excluyente (no pueden ocurrir los dos al mismo tiempo), entonces la probabilidad de que
ocurra A es:
P(A) = __ x __
(x+z)
El enfoque clsico de la probabilidad se basa en la suposicin de que cada resultado sea igualmente
posible. Este enfoque es llamado enfoque a priori porque permite, (en caso de que pueda aplicarse)
calcular el valor de probabilidad antes de observar cualquier evento de muestra.
E5emplo: Si tenemos en una caja 15 piedras verdes y 9 piedras rojas. La probabilidad de sacar una
piedra roja en un intento es:
P(A) = ____9____= 0.375 o 37.5%
9+15
http://html.rincondelvago.com/probabilidades_1.html
1.1.' Enfo(ue )ayesiano.
#a estadstica !a'esiana le de!e su nom!re al tra!ajo pionero del reverendo T)omas +a'es
titulado ,An Essay towards solving a Problem in the Doctrine of Chances- pu!licado
pstumamente en ./01 en la ,Philosophical Transactions of the Royal ociety of !ondon-.
El artculo fue enviado a la 2eal &ociedad de #ondres por 2ic)ard Price, amigo de +a'es, en
./03, uin escri!i$
,4o a)ora le mando un ensa'o ue )e encontrado entre los papeles de nuestro fallecido amigo
T)omas +a'es, ' el cual, en mi opinin, tiene un gran mrito, ' !ien merece ser preservado... En
una introduccin ue l )a escrito para este ensa'o, l dice, ue su o!jetivo en un principio fue,
descu!rir un mtodo por el
cual se pueda juzgar la pro!a!ilidad de ue un evento tenga ue ocurrir !ajo
circunstancias dadas, ' !ajo la suposicin de ue nada es conocido so!re dic)o
evento, salvo ue, !ajo las mismas circunstancias, ste )a ocurrido un cierto
n5mero de veces ' fallado otro tanto... 6ualuier persona juiciosa ver" ue el
pro!lema au mencionado no es de ninguna manera una simple especulacin
producto de la curiosidad, sino un pro!lema ue se necesita resolver para contar
con un fundamento seguro para todos nuestros razonamientos concernientes a
)ec)os pasados ' a lo ue pro!a!lemente ocurra de a) en adelante... El propsito
a m me parece es, mostrar u razones nosotros tenemos para creer ue en la
constitucin de las cosas e*isten le'es fijas de acuerdo con las cuales las cosas
pasan, ' ue, por lo tanto, el funcionamiento del mundo de!e ser el efecto de la
sa!idura ' el poder de una causa inteligente, ' as, confirmar el argumento
tomado desde las causas finales para la e*istencia de la deidad.-
7unue la o!ra de T)omas +a'es data 'a de )ace m"s de dos siglos, la estadstica
!a'esiana es relativamente nueva, ' actualmente ostenta un gran desarrollo aunue no
ajeno a tam!in grandes controversias.
Inferencia Bayesiana
8n punto importante en la definicin cl"sica de inferencia es ue el par"metro 9, el cual es
desconocido, es tratado como constante en vez ue como varia!le. Esta es la idea fundamental
de la teora cl"sica, pero conduce a ciertos pro!lemas de interpretacin.
&i :;.<, ;.3= es un intervalo del >?@ de confianza para 9, sera cmodo decir ue )a' un >?@
de pro!a!ilidad de ue 9 est en el intervalo. &in em!argo, esto es incongruente con la idea de
ue 9 no es aleatorio. Dado ue 9 es fijo, solo e*isten dos opciones$ 9 est" dentro o est" fuera
del intervalo. El 5nico elemento aleatorio en este modelo es y, por lo ue la interpretacin
correcta del intervalo consistira en decir ue, si se repite el procedimiento muc)as veces,
entonces a la larga, el >?@ de los intervalos contendran a 9.
Toda inferencia !asada en la estadstica cl"sica es forzada a tener este tipo de interpretacin
frecuencial, aunue sin em!argo, nosotros solo contamos con un intervalo para interpretar.
El marco terico en el cual se desarrolla la inferencia !a'esiana es idntico al de la teora
cl"sica. &e tiene un par"metro po!lacional 9 so!re el cual se desea )acer inferencias ' se tiene
un modelo de pro!a!ilidad p(yA 9) el cual determina la pro!a!ilidad de los datos o!servados y
!ajo diferentes valores de 9. #a diferencia fundamental entre la teora cl"sica ' la !a'esiana
est" en ue 9 es tratado como una cantidad aleatoria. 7s, la inferencia !a'esiana se !asa en
p( 9 A y) en vez de p(y A 9), esto es, en la distri!ucin de pro!a!ilidades del par"metro dados los
datos.
#a inferencia !a'esiana, se puede resumir como el proceso de ajustar un modelo de
pro!a!ilidad a un conjunto de datos ' resumir los resultados mediante una distri!ucin de
pro!a!ilidades para los par"metros del modelo ' para cantidades desconocidas pero
o!serva!les tales como predicciones para nuevas o!servaciones. #a caracterstica esencial de
los mtodos !a'esianos est" en su uso e*plcito de pro!a!ilidades para cuantificar la
incertidum!re en inferencias !asadas en el an"lisis estadstico de los datos. Esto permite un
manejo muc)o m"s natural e intuitivo de la inferencia, salvando por ejemplo el pro!lema de
la interpretacin frecuencial de los resultados. &in em!argo, para )acer uso de un enfoue
!a'esiano, es necesario especificar una distri!ucin de pro!a!ilidades a priori p( 9), la cual
representa el conocimiento ue se tiene so!re la distri!ucin de 9 previo a la o!tencin de los
datos.
Esta nocin de una distri!ucin a priori para el par"metro constitu'e el centro del
pensamiento !a'esiano ', dependiendo de si se es un defensor o un opositor a esta
metodologa, su principal ventaja so!re la teora cl"sica o su ma'or vulnera!ilidad.
Caractersticas de la Aproximacin Bayesiana
De acuerdo con BCDagan (.>>1), se pueden identificar cuatro aspectos fundamentales ue
caracterizan la apro*imacin !a'esiana a la inferencia estadstica$
Enformacin a Priori. Todos los pro!lemas son 5nicos ' tienen su propio conte*to. De tal
conte*to se deriva informacin a priori, ' es la formulacin ' uso de esta informacin a
priori la ue diferencia la inferencia !a'esiana de la estadstica cl"sica.
Pro!a!ilidad &u!jetiva. #a estadstica !a'esiana formaliza la nocin de ue todas las
pro!a!ilidades son su!jetivas, dependiendo de las creencias individuales ' la informacin
disponi!le. 7s, el an"lisis !a'esiano resulta personal, 5nico de acuerdo con las creencias
individuales de cada uno.
7uto consistente. 7l tratar al par"metro 9 como aleatorio, la inferencia !a'esiana se !asa
completamente en la teora de la pro!a!ilidad. Esto tiene muc)as ventajas ' significa ue
toda inferencia puede ser tratada en trminos de declaraciones pro!a!ilsticas para 9.
Fo ,ad)ocGer'-. De!ido a ue la inferencia cl"sica no puede )acer declaraciones
pro!a!ilsticas acerca de 9, varios criterios son desarrollados para juzgar si un estimador
particular es en alg5n sentido ,!ueno-. Esto )a conducido a una proliferacin de
procedimientos, frecuentemente en conflicto unos con otros. #a inferencia !a'esiana deja
de lado esta tendencia a inventar criterios ad )oc para juzgar ' comparar estimadores al
!asarse e*clusivamente en la distri!ucin posterior para e*presar en trminos
e*clusivamente pro!a!ilsticos toda inferencia referente al par"metro.
Objeciones a la Inferencia Bayesiana.
#a principal o!jecin a la inferencia !a'esiana, es ue las conclusiones dependen de la
seleccin especfica de la distri!ucin a priori. 7unue para otros esto es lo interesante de la
apro*imacin !a'esiana, este es un de!ate a5n no cerrado. &in em!argo, antes de dejar esta
caracterstica, se de!e seHalar ue inclusive en inferencia cl"sica, ' adem"s en investigacin
cientfica en general, estos conocimientos a priori son utilizados implcitamente. 7s por
ejemplo, el conocimiento a priori es utilizado para formular un modelo de verosimilitud
apropiado. En prue!as de )iptesis, las creencias a priori acerca de la plausi!ilidad de una
)iptesis son frecuentemente utilizadas para ajustar el nivel de significancia de la prue!a. 7s,
si se cree ue los datos pueden conducir al rec)azo de la )iptesis, esto se puede ajustar
escogiendo un nivel de significancia !astante alto. En este sentido entonces, la inferencia
!a'esiana formaliza la incorporacin de la informacin a priori, la cual es incorporada
frecuentemente ,de!ajo de la mesa- en el an"lisis cl"sico.
)ttp$IItarJi.lamolina.edu.peIKre'zaguirreIE+.)tm
1.Descripcin de datos.
1..1 Datos a*rupados y no a*rupados.
Clculo de la mediana a partir de datos no agrupados:
Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o
ascendente. Si el conjunto de datos contiene un nmero impar de elementos, el de en medio en el arreglo
es la mediana. Si hay un nmero par de observaciones, la mediana es el promedio de los dos elementos
de en medio.

Mediana = (n + 1) / 2
Clculo de la mediana a partir de datos agrupados:
1. Encontrar qu observacin de la distribucin est ms al centro (Mediana = (n + 1) / 2).
2. Sumar las frecuencias de cada clase para encontrar la clase que contiene a ese elemento ms
central.
3. Determinar el nmero de elementos de la clase y la localizacin de la clase que contiene al
elemento mediano.
4. Determinar el ancho de cada paso para pasar de una observacin a otra en la clase mediana,
dividiendo el intervalo de cada clase entre el nmero de elementos contenido en la clase.
5. Determinar el nmero de pasos que hay desde el lmite inferior de la clase mediana hasta el
elemento correspondiente a la mediana.
6. Calcular el valor estimado del elemento mediano multiplicando el nmero de pasos que se
necesitan para llegar a la observacin mediana por el ancho de cada paso. Al producto sumarle
el valor del lmite inferior de la clase mediana.
7. Si existe un nmero par de observaciones en la distribucin, tomar el promedio de los valores
obtenidos para el elemento mediano calculados en el paso nmero 6.
Clculo de la moda a partir de datos no agrupados:
En ocasiones, el azar hace que un solo elemento no representativo se repita lo suficiente para ser el valor
ms frecuente del conjunto de datos. Es por esta razn que rara vez utilizamos la moda de un conjunto
de datos no agrupados como medida de tendencia central.
Por esta razn, siempre que utilizamos la moda como medida de tendencia central de un conjunto de
datos, debemos calcular la moda de datos agrupados (buscar la clase modal).
Clculo de la moda de datos agrupados:
Cuando los datos ya se encuentran agrupados en una distribucin de frecuencias, podemos poner que la
moda est localizada en la clase que contiene el mayor nmero de elementos, es decir, en la clase que
tiene mayor frecuencia. Para determinar un solo valor para la moda a partir de esta clase modal:
Mo = Lmo + [d1 / (d1 + d2 )] w
Lmo = lmite inferior de la clase modal.
d1 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por
debajo de ella.
d2 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por
encima de ella.
w = ancho del intervalo de la clase modal.
1.. +recuencia de clase.
'istribucin de frecuencia de clase o de datos Agrupados$
Es aquella distribucin en la que la disposicin tabular de los datos estadsticos se encuentran ordenados
en clases y con la frecuencia de cada clase4 es decir, los datos originales de !arios !alores adyacentes del
con.unto se combinan para formar un inter!alo de clase. o e0isten normas establecidas para determinar
cundo es apropiado utilizar datos agrupados o datos no agrupados4 sin embargo, se sugiere que cuando
el n/mero total de datos %& es igual o superior =7 y adems el rango o recorrido de la serie de datos es
mayor de 27, entonces, se utilizar la distribucin de frecuencia para datos agrupados, tambin se utilizar
este tipo de distribucin cuando se requiera elaborar grficos lineales como el histograma, el polgono de
frecuencia o la o.i!a.
#a razn fundamental para utilizar la distribucin de frecuencia de clases es proporcionar me.or
comunicacin acerca del patrn establecido en los datos y facilitar la manipulacin de los mismos. #os
datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la informacin obtenida
de una in!estigacin sea mane.able con mayor facilidad.
+omponentes de una distribucin de frecuencia de clase
8.> ,ango o Amplitud total %recorrido&.> Es el lmite dentro del cual estn comprendidos todos los !alores de
la serie de datos, en otras palabras, es el n/mero de diferentes !alores que toma la !ariable en un estudio
o in!estigacin dada. Es la diferencia entre el !alor m0imo de una !ariable y el !alor mnimo que sta
toma en una in!estigacin cualquiera. El rango es el tama5o del inter!alo en el cual se ubican todos los
!alores que pueden tomar los diferentes datos de la serie de !alores, desde el menor de ellos hasta el !alor
mayor estando incluidos ambos e0tremos. El rango de una distribucin de frecuencia se designa con la
letra ,.
2.> +lase o *nter!alo de clase.> Son di!isiones o categoras en las cuales se agrupan un con.unto de datos
ordenados con caractersticas comunes. En otras palabras, son fraccionamientos del rango o recorrido de
la serie de !alores para reunir los datos que presentan !alores comprendidos entre dos limites.
"ara organizar los !alores de la serie de datos hay que determinar un n/mero de clases que sea
con!eniente. En otras palabras, que ese n/mero de inter!alos no origine un n/mero peque5o de clases ni
muy grande. 6n n/mero de clases peque5o puede ocultar la naturaleza natural de los !alores y un n/mero
muy alto puede pro!ocar demasiados detalles como para obser!ar alguna informacin de gran utilidad en
la in!estigacin.
(ama5o de los *nter!alos de +lase
#os inter!alos de clase pueden ser de tres tipos, seg/n el tama5o que estos presenten en una distribucin
de frecuencia$ a& +lases de igual tama5o, b& clases desiguales
de tama5o y c& clases abiertas.
?.>Amplitud de +lase, #ongitud o Ancho de una +lase
#a amplitud o longitud de una clase es el n/mero de !alores o !ariables que concurren a una clase
determinada. #a amplitud de clase se designa con las letras *c. E0isten di!ersos criterios para determinar la
amplitud de clases, ante esa di!ersidad de criterios, se ha considerado que lo ms importante es dar un
ancho o longitud de clase a todos los inter!alos de tal manera que respondan a la naturaleza de los datos y
al ob.eti!o que se persigue y esto se logra con la practica.
@.>"unto medio o 3arca de clase
El centro de la clase, es el !olar de los datos que se ubica en la posicin central de la clase y representa
todos los dems !alores de esa clase. Este !alor se utiliza para el calculo de la media aritmtica.
=.>Arecuencia de clase
#a frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el n/mero
total de !alores de las !ariables que se encuentran presente en una clase determinada, de una distribucin
de frecuencia de clase.
B.> Arecuencia ,elati!a
#a frecuencia relati!a es aquella que resulta de di!idir cada uno de los fi de las clases de una distribucin
de frecuencia de clase entre el n/mero total de datos%& de la serie de !alores. Estas frecuencias se
designan con las letras fr4 si cada fr se multiplica por 877 se obtiene la frecuencia relati!a porcentual %fr C&.
D.>Arecuencias acumuladas
#as frecuencias acumuladas de una distribucin de frecuencias son aquellas que se obtienen de las sumas
sucesi!as de las fi que integran cada una de las clases de una distribucin de frecuencia de clase, esto se
logra cuando la acumulacin de las frecuencias se realiza tomando en cuenta la primera clase hasta
alcanzar la ultima. #as frecuencias acumuladas se designan con las letras fa. #as frecuencias acumuladas
pueden ser menor que %faE que& y frecuencias acumuladas mayor que %faFque&.
G.> Arecuencia acumulada relati!a
#a frecuencia acumulada relati!a es aquella que resulta de di!idir cada una de las fa de las diferentes
clases que integran una distribucin de frecuencia de clase entre el n/mero total de datos %& de la serie de
!alores, estas frecuencias se designan con las letras far. Si las far se multiplican por 877 se obtienen las
frecuencias acumuladas relati!as porcentuales y las mismas se designan as$ far C.
1.." +recuencia relativa.
Frecuencia relativa:
#a frecuencia absoluta, es una medida que est influida por el tama5o de la muestra, al aumentar el
tama5o de la muestra aumentar tambin el tama5o de la frecuencia absoluta. Esto hace que no sea una
medida /til para poder comparar. "ara esto es necesario introducir el concepto de frecuencia relati!a, que
es el cociente entre la frecuencia absoluta y el tama5o de la muestra. #a denotaremos por fi
Donde N L TamaHo de la muestra
#a frecuencia relati!a de un inter!alo se obtiene di!idiendo la frecuencia dl inter!alo, entre el n/mero total
de datos.

+uando el resultado se multiplica por 877 obtenemos la H A,E+6E+*A ,E#A(*-A
"I,+E(6A# H.
+2ECUE9C!: 2E,:T!0: > 4 i ?
,a frecuencia relativa es el cuociente entre la frecuencia absoluta > f i ? y el
nEmero total de datos > n ?.
En nuestro e5emplo/ n F $C@
T:),:@
x
i
f
i
h
i

0 4 00!
" # 0"!
$ "$ 0$4
% "0 0$0
4 ! 0"&
' 4 00!
& $ 004
( " 00$
72:+!C6S@
http$JJKKK.eneayudas.clJestentrada.htmLrelati!a
1..# Punto medio.
El punto medio de un intervalo se puede obtener de varias formas. Posiblemente la ms
fcil consiste en sumar los lmites inferiores de dos intervalos consecutivos y dividir
entre dos. Ejemplo:
Puntuaciones frecuencia
200-299 2
300-399 8
400-499 6

En el ejemplo anterior 200 es el lmite inferior del primer intervalo y 300 el lmite inferior
del segundo intervalo. Por lo tanto el punto medio del primer intervalo es (200+300)/2 =
250
De igual forma el punto medio del segundo intervalo es 350.
Nota:
Algunos autores definen el punto medio como el punto que se encuentra a
mitad de camino entre los llamados lmites exactos de cada intervalo. Por
lo tanto calculan el punto medio sumando los lmites exactos del intervalo
y dividiendo entre 2. (Vase Hinkle capt.2)
http://rrpac.upr.clu.edu:9090/~amenend/poligonofre.htm
"unto medio o 3arca de clase
El centro de la clase, es el !olar de los datos que se ubica en la posicin central de la clase y representa
todos los dems !alores de esa clase. Este !alor se utiliza para el calculo de la media aritmtica.
Punto medio de clase o marca de clase@ Para fines de anlisis de datos, los valores de las clases se representan a travs del
punto medio de clase o marca de clase. El punto medio de clase se define como la semi-suma de los limites de clase. El punto
medio de clase se identifica como Xi, donde Xi = (limite superior + limite inferior).
Pasos para construir una distribucin de frecuencias: conocidos ya todos los elementos tericos necesarios para la construccin y
comprensin de una distribucin de frecuencias vamos a proceder a mostrar los pasos requeridos para su ejecucin.
1 Determinar el recorrido o rango.
R = X mx. - X mn.
2 Calcular el intervalo de clase, siempre que se conozca l numero de clases.
R = R
NC
3 Calcular l numero de clases, siempre que se conozca el intervalo de clase.
NC = R
Ci
Como se puede observar en el segundo y tercer paso resultara muy difcil resolver estas ecuaciones por simples mtodos
matemticos ya que cada una de ellas presenta dos incgnitas. Como solucin a este problema surge la formula s Sturgees que
se expresa as:
Ci = R .
1+3.22 log N
Donde R = recorrido y N = numero total de valores.
En lo referente al punto medio de cada clase, este es usado para representar mediante un solo valor el recorrido de cada clase y
sirve adems para los fines de anlisis estadsticos de los datos. Es importante sealar con relacin a la construccin de una
distribucin de frecuencias que el lector o usuario tenia plena libertad en la pre-escogencia del intervalo de clase, en funcin de la
naturaleza de los datos y su conveniencia tcnica.
http$JJhtml.rincondel!ago.comJestadistica>en>la>toma>de>decisiones.html
1..$ ,mites.
,mite de una funcin en un punto. Propiedades.
7) #EMETE EF 8F P8FTB.
7.) !"mite finito$
&e dice ue la funcin ' L f(*) tiene por lmite l cuando * tiende )acia a, ' se representa por
(Es decir, ue si fijamos un entorno de l de radio , podemos encontrar un entorno de a de radio
, ue depende de , de modo ue para cualuier valor de * ue est en el entorno E(a, )
e*ceptuando el propio a, se tiene ue su imagen f(a) est" en el entorno E(l, ).)
7<) !"mite infinito$ (7 partir de a)ora usaremos la notacin matem"tica para )acer m"s corta la
definicin).
+) P2BPEED7DE& DE #B& #NMETE&.
+.) siempre ue no aparezca la indeterminacin .
+<) con .
+3) siempre ' cuando no aparezca la indeterminacin .
+1) siempre ' cuando no aparezcan las indeterminaciones e .
+?) con , siempre ' cuando tengan sentido las potencias ue
aparecen.
+0) siempre ' cuando tengan sentido las potencias ue
aparecen ' no nos encontremos con indeterminaciones de los tipos .
6) #EMETE& #7TE27#E&.
6.) !"mite por la iz#$ierda$
6<) !"mite por la derecha$
TEB2EM7$ E*iste el lmite si ' solo si e*isten los limites laterales (por la derec)a ' por la
izuierda) ' am!os coinciden. (Demostracin inmediata).
TEB2EM7$ &i e*iste el lmite, ste es 5nico. (Demostracin inmediata).
Todo lo dic)o anteriormente es tam!in v"lido si consideramos ue el lmite vale en
lugar de l.
. ,mites en el infinito. :sntotas de una curva.
7) #EMETE& EF E# EFOEFETB.
7.) !"mite finito.
7<) !"mite infinito.
Todo lo referente a las propiedades de los lmites vistas en la pregunta anterior es v"lido si
escri!imos en lugar de a. Da' casos ue parecen indeterminaciones ' no lo son
realmente.
+) 7&NFTBT7& DE 8F7 682P7.
+.) As"ntotas verticales.
&e dice ue ' L f(*) tiene una asntota vertical en *La si o alguno (o am!os) de los
lmites laterales vale . Es decir, puede )a!er asntota vertical por la derec)a, por la izuierda
o por am!os lados. #a posicin de la curva respecto a la asntota depender" del signo de los
lmites laterales. 6omo ejemplo, determinar la asntota vertical ' su posicin con respecto a la
gr"fica de la funcin
+<) As"ntotas horizontales.
&e dice ue ' L f(*) tiene una asntota )orizontal en 'L! si . #a asntota puede
aparecer cuando #a posicin de la gr"fica de la funcin
respecto a la asntota vertical se determina estudiando si el signo de f(*) Q ! es positivo o negativo
cuando . 6omo ejemplo, determinar la asntota )orizontal ' su posicin con respecto a la
gr"fica de la funcin
+3) As"ntotas oblic$as.
Dada la funcin ' L f(*), si se verifica ue
a) b) c)
entonces se dice ue ' L m* R ) es una asntota o!licua de dic)a funcin para . #a
asntota puede aparecer cuando Para estudiar la posicin de
la gr"fica de la funcin con respecto a la asntota !asta estudiar el signo de f(*)Q(m* R )). 6omo
ejemplo, determinar la asntota o!licua ' su posicin con respecto a la gr"fica de la funcin
". Clculo de lmites.
7) EFDETE2MEF76ESF
En la ma'ora de los casos !asta con efectuar las operaciones indicadas.
Ejemplo.Q
En otros casos, so!re todo en auellos en ue aparecen radicales, !asta con multiplicar ' dividir
por la e*presin radical conjugada.
Ejemplo.Q
+) EFDETE2MEF76ESF
En la ma'ora de los casos !asta con efectuar las operaciones indicadas.
Ejemplo.Q
6) EFDETE2MEF76ESF
6uando solo aparecen funciones racionales, !asta con descomponer factorialmente el numerador
' el denominador.
Ejemplo.Q
En auellos casos en ue aparecen funciones irracionales (radicales), !asta con multiplicar '
dividir por la e*presin radical conjugada.
Ejemplo.Q
D) EFDETE2MEF76ESF
En la ma'ora de los casos !asta con dividir el numerador ' denominador por la ma'or potencia
de * del denominador.
Ejemplos.Q
E) EFDETE2MEF76EBFE& Q Q
Para determinar estos lmites tendremos en cuenta ue$
de donde resulta ue$
pudiendo aparecer otras indeterminaciones, ue resolveremos por los mtodos anteriores o por
mtodos ue aprenderemos en temas posteriores.
En el caso de la indeterminacin podemos aplicar con ma'or facilidad la siguiente igualdad$
7plicar la igualdad anterior a la resolucin del siguiente lmite$
O) #EMETE& DE O8F6EBFE& T2ETBFBMUT2E67&.
En algunos casos podemos utilizar un lmite mu' conocido, ue es$
7plica lo anterior para resolver los siguientes lmites$
(Usa la frmula del sen(x/2))
En los casos anteriores puede ocurrir ue aplicando lo dic)o anteriormente no podamos resolver
la indeterminacin. Estos casos, al igual ue en el apartado E), se resolver"n en los temas
siguientes aplicando la 2egla de #VDWpital.
#. +uncin continua en un punto y en un intervalo.
Diremos ue la funcin ' L f(*) es continua en x = a si$
a. E*iste f(a), es decir, f(*) est" definida en *La.
!. E*iste el .
c. 7m!os valores coinciden, es decir .
&i tenemos en cuenta la definicin de lmite, podemos o!tener la siguiente definicin euivalente$
Diremos ue ' L f(*) es continua en el (a,b) si es continua en cada uno de los puntos del
intervalo a!ierto (a,!).
Diremos ue ' L f(*) es continua por la derecha en x=a si .
Diremos ue ' L f(*) es continua por la izquierda en x=a si .
Diremos ue ' L f(*) es continua en el [a,b] si$
a. ' L f(*) es continua en el intervalo a!ierto (a,!).
!. ' L f(*) es continua por la derec)a en *La.
c. ' L f(*) es continua por la izuierda en *L!.
TEB2EM7$ &i ' L f(*) es continua en * L a e*iste el . (#a demostracin es inmediata)
&in em!argo, el teorema recproco no es cierto en general. 6omo ejemplo compro!arlo para$
TEB2EM7 DE 6BF&E2P76ESF DE# &ETFB
&ea 'Lf(*) una funcin continua en *La siendo f(a) distinto de ; e*iste un entorno de *La en
el ue los valores de f(*) tienen el mismo signo ue f(a).
Demostracin$
&upongamos ue f(a)X; (si fuese negativo, se razonara de modo similar).
Tomemos . Por la continuidad de 'Lf(*) en *La se tiene ue$
Es decir$
Por lo tanto$ f(*)X;. (6omo se uera demostrar)
TEB2EM7 DE 76BT76ESF DE #7 O8F6ESF
&i ' L f(*) es continua en * L a ' L f(*) est" acotada en un cierto entorno de * L a.
Demostracin$
Tomemos . Por la continuidad de ' L f(*) en * L a se tiene ue$
de modo ue es un intervalo acotado, por lo tanto 'Lf(*) est" acotada en el
entorno de *La.
$. 6peraciones con funciones continuas.
&ean f(*) ' g(*) dos funciones continuas en *La, se tiene entonces ue$
a. es continua en *La.
!. es continua en *La.
c. es continua en *La si .
d. es continua en *La suponiendo ue f(a)X; (para ue tenga sentido la potencia).
TEB2EM7$ &i f(*) es continua en *La ' g(*) es continua en 'Lf(a) es continua en
*La.
Demostracin$
De lo dic)o anteriormente resulta ue$
&. Discontinuidades.
&e dice ue una funcin ' L f(*) es discontinua en x = a si no es continua en dic)o valor de *, es
decir, no cumple alguna de las tres condiciones de continuidad.
TEPB& DE DE&6BFTEF8ED7DE&
7) Evitable$ 6uando e*iste el pero no coincide con el valor de f(a) por una de estas dos
razones, son distintos los valores o no e*iste f(a).
+) De salto$ 6uando e*iste el lmite por la derec)a ' por la izuierda (siendo am!os finitos) pero
no coinciden.
6) Asint%tica$ 6uando alguno de los lmites laterales (o am!os) no es finito. Puede ser asinttica
por la derec)a, por la izuierda o por am!os lados.
D) Esencial$ 6uando no e*iste alguno de los lmites laterales (o am!os). Puede serlo por la
derec)a, por la izuierda o por am!os lados.
&i ' L f(*) tiene una discontinuidad evita!le en * L a, llamaremos verdadero valor de la funcin
en x=a al . Dic)o valor es el ue convierte a la funcin en continua.
&i ' L f(*) tiene una discontinuidad de salto en *La, llamaremos salto de la funcin en x=a al
valor .
Estudiar, como aplicacin de lo anterior, la continuidad ' discontinuidades de las funciones
elementales vistas en el captulo anterior ' de las funciones definidas a trozos.
3. El Teorema del valor intermedio de )ol1ano y el Teorema de e;istencia
de e;tremos absolutos de Geierstrass.
TEB2EM7 DE +B#Y7FB
&i ' L f(*) es una funcin continua en el :a,!= siendo distintos los signos de dic)a funcin en los
e*tremos del intervalo, es decir, tal ue f(c)L;.
Demostracin$
&upongamos ue f(a)Z; ' f(!)X; (&e razona de forma an"loga si ocurre lo contrario).
&i el teorema est" demostrado. En caso contrario, la funcin tomar" en dic)o punto
un valor del mismo signo ue f(a) o ue f(!).
&ea el nuevo intervalo donde )a' cam!io de signo.
&i el teorema est" demostrado. En caso contrario, repetimos el proceso anterior,
o!tenindose una sucesin de intervalos encajados tales ue cada uno es
la mitad del anterior ' la funcin toma valores opuestos en los e*tremos de cada intervalo. Dic)a
sucesin define un n5mero real . Demostremos ue f(c)L;.
&upongamos ue por el TEB2EM7 DE 6BF&E2P76ESF DE# &ETFB, e*istir" un
entorno de c donde se mantendr" el mismo signo ue en c. &in em!argo, por la construccin
anterior, dic)o entorno contendr" uno al menos de los , donde la funcin toma!a valores
opuestos. #legamos pues a una contradiccin f(c)L;.
6onsecuencia$ &i ' L f(*) es continua en a,! ' G es un valor comprendido entre los valores de f(a)
' f(!) (o al revs) (+asta aplicar el Teorema de +olzano a g(*)Lf(*)QG.)
TEB2EM7 DE [EEE2&T27&&$ &i ' L f(*) es continua en :a,!= f(*) alcanza el m"*imo ' el
mnimo a!soluto en dic)o intervalo :a,!=.
Demostracin$
7) Peamos, en primer lugar, ue f(*) est" acotada en :a,!=.
&upongamos ue no lo est". 6onsideremos el punto medio ' los su!intervalos '
f(*) no est" acotada en uno de ellos, al menos, ue llamaremos . Dividamos en dos
mitades ' llamemos a auella parte de las dos (al menos) en la ue f(*) no est" acotada.
2epitamos el proceso indefinidamente, o!teniendo una sucesin de
intervalos encajados, cada uno la mitad del anterior, donde f(*) no est" acotada.
&ea c el n5mero real ue define esta sucesin. 6omo f es continua en :a,!= f es continua en c
por el TEB2EM7 DE 76BT76ESF DE #7 O8F6ESF, e*istir" un entorno de c en el ue la
funcin est" acotada. Pero en dic)o entorno ' por construccin estar"n incluidos a partir de uno
todos los , donde la funcin no esta!a acotada. #legamos a una contradiccin, luego f(*) est"
acotada en :a,!=.
+) Peamos, a continuacin, ue f(*) alcanza el m"*imo en :a,!=. (7n"logamente se demuestra
ue alcanza el mnimo).
&i f(*) est" acotada en :a,!= siendo m el nfimo o e*tremo inferior
' M el supremo o e*tremo superior. &i en alg5n punto de :a,!= resulta ue f(*)LM, el teorema
estar" demostrado.
g(*) est"
acotada en :a,!= M no es el e*tremo
superior de f, en contra de lo supuesto. #uego necesariamente )a de e*istir un
f(*) alcanza un m"*imo a!soluto en :a,!=.
6onsecuencia (Teorema de Dar!ou*)$ &i 'Lf(*) es continua en :a,!= f(*) toma en dic)o
intervalo todos los valores comprendidos entre el m"*imo ' el mnimo. ( &u demostracin es
inmediata a partir de la consecuencia del teorema de +olzano ' del teorema de [eierstrass.
http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/39-1-u-continuidad.html
Sin duda, el teorema ms importante en Estadstica es el teorema del lmite central. No solamente es
importante desde el punto de vista terico sino por su gran trascendecia en mtodos estadsticos.
Teorema del lmite central.- Cuando el tamao de la muestra (nmero de observaciones en cada
muestra) se vuelve suficientemente grande, la distribucin en el muestreo de la media se puede
aproximar con la distribucin normal. Esto es vlido cualquiera que sea la distribucin de los valores
individuales en la poblacin.
Ahora la pregunta que surge con todo seguridad en este momento es que tamao de muestra es
Hsuficientemente *randeH. Se ha dedicado gran parte de la investigacin estadstica a esta pregunta
particular. Los estadsticos han encontrado que no importa lo no normal que sea la distribucin de la
poblacin, una vez que el tamao de la muestra es, cuando menos menos de 30, la distribucin en el
muestreo de la media ser aproximadamente normal.
La aplicacin del teorema del lmite central a diferentes poblaciones, se puede explicar con referencia a
las sguientes figuras. Cada una de las distribuciones muestrales ilustradas se ha obtenido con el uso de
la computadora para seleccionar 500 diferentes muestras a partir de sus respectivas distribuciones
poblacionales. estas muestras se seleccionaron para tamaos variables (n = 2,4,8,16,32) a partir de
cuatro distribuciones continuas diferentes (normal, uniforme, en forma de U y exponencial).
La primera figura, ilustra la distribucin en el muestreo de la media seleccionada de una poblacin
normal. Es sabido, que si la poblacin tiene distribucin normal, la distribucin en el muestreo de la media
tambin tendr distribucin normal cualquiera que sea el tamao de la muestra. En la figura se puede
observar que para cada tamao de muestra estudiado, la distribucin en el muestreo de la media tiene
una distribucin aproximadamente normal.
Distribucin normal y distribucin de la muestra de la media de $CC muestras de tamaIo nF / #/ '/
1'/ "
La segunda figura, presenta la distribucin en el muestreo de la media basada en una poblacin que
sigue una distribucin continua (regular). Como se ilustra en el panel (a) de la la figura, para muestras de
tamao n = 1, cada valor en la poblacin tiene la misma probabilidad. No obstante cuando se seleccionan
muestras slo de dos, hay un Hm;imoH o Hlimitacin centralH. Por ello, en este caso se pueden
observar ms valores "cercanos a" la media de l apoblacin, que en los extremos. Asimismo, conforme
aumenta el tamao de la muestra, la distribucin en el muestreo de la media se aproxima con rapidez a
una distribucin normal. En este caso, uan vez que hay muestras de cuando menos ocho observaciones,
la media muestral sigue, ms o menos, una distribucin normal.
Distribucin continua >rectan*ular? y distribucin de la media de $CC muestras de tamaIo nF / #/
'/ 1'/ "
La tercera figura, se relaciona con la distribucin en el muestreo de la media obtenida con la poblacin en
forma de U. En el panel (a) de la figura se puede observar que esta poblacin, aunque es simtrica, tiene
su menor frecuencia en el centro y su mayor frecuencia en los extremos inferior y superior de la
distribucin. Aunque la poblacin tiene muy pocos valores cerca del centro, incluso cuando el tamao de
la muestra sea slo de dos, muchas de las medias muestrales ya estn reunidas alrededor del centro de
las distribuciones. Un examen de los otros paneles revele que una vez que el tamao de la muestra llega
a ocho, la distribucin en el muestreo de la media tiene distribucin aproximadamente normal.
Distribucin en forma de U y distribucin de la muestra de la media de $CC muestras de tamaIo nF
/ #/ '/ 1'/ "
Y por ltimo la cuarta figura, ejemplifica la distribucin en el muestreo de la media obtenida con una
poblacin con fuerte sesgamiento a la derecha, llamada la distribucin exponencial. En la figura se
aprecia que conforme aumenta el tamao de la muestra, la distribucin en el muestreo se vuelve menos
sesgada. Cuando se toman muestras de tamao 16, la distribucin en el muestreo tiene un ligero
sesgamiento, mientrs que, para muestras de tamao 32, la distribucin en el muestreo de la media
parece tener distribucin normal.
Distribucin e;ponencial y distribucin de la muestra de la media de $CC muestras de tamaIo nF
/ #/ '/ 1'/ "
Entonces, el Teorema del ,mite Central es de importancia crucial en el uso de la inferencia estadstica
para llegar a conclusiones en cuanto a una poblacin. Le permite al investigador hacer inferencias en
cuanto a la media de la poblacin sin tener que conocer la forma especfica de la ditribucin de la
poblacin. Esto significa que el estadstico muestral calculado, como la media muestral, la desviacin
estndar y la proporcin, suministran la informacin necesaria para estimar los valores reales en la
poblacin.
1..& -isto*rama.
Se utiliza en datos cuantitativos en distribuciones de frecuencia. Son rectngulos verticales unidos entre
s, en donde sus lados son los lmites reales inferior y superior de clase y cuya altura es igual ala
frecuencia de clase.
Con la distribucin de frec. anterior se tiene:
)I*+O,-A.A
Un histograma es un resumen grfico de la variacin de un conjunto de datos. La naturaleza grfica del
histograma nos permite ver pautas que son difciles de observar en una simple tabla numrica. Esta
herramienta se utiliza especialmente en la Comprobacin de teoras y Pruebas de validez.
Cmo interpretar los 4isto*ramas@
Sabemos que los valores varan en todo conjunto de datos. Esta variacin sigue cierta pauta. El propsito
del anlisis de un histograma es, por un lado, identificar y clasificar la pauta de variacin, y por otro
desarrollar una explicacin razonable y relevante de la pauta. La explicacin debe basarse en los
conocimientos generales y en la observacin de las situaciones especficas y debe ser confirmada
mediante un anlisis adicional. Las pautas habituales de variacin ms comunes son la distribucin en
campana, con dos picos, plana, en peine, sesgada, truncada, con un pico aislado, o con un pico en el
extremo.
Construccin de un 4isto*rama@
P:S6 1
Determinar el rango de los datos: RANGO es igual al dato mayor menos el dato menor; R = > - <
P:S6
Obtener en nmero de clases, existen varios criterios para determinar el nmero de clases ( o
barras). Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases,
dependiendo de como estn los datos y cuntos sean. Un criterio usado frecuentemente es que el
nmero de clases debe ser aproximadamente ala raz cuadrada del nmero de datos, por ejemplo, la raz
cuadrada de 30 ( nmero de artculos) es mayor que cinco, por lo que se seleccionan seis clases.
P:S6 "
Establecer la longitud de clase: es igual al rango entre el nmero de clases.

P:S6 #
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relacin al
resultado del PASO 2 en intervalos iguales.
P:S6 $
Graficar el histograma: se hace un grfico de barras, las bases de las barras son los intervalos de clases
y altura son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los
rectngulos se obtiene el polgono de frecuencias.
E5emplo @
A una fabrica de envases de vidrio, un cliente le est exigiendo que la capacidad de cierto tipo de botella
sea de13 ml, con una tolerancia de ms menos 1 ml. La fbrica establece un programa de mejora de
calidad para que las botellas que se fabriquen cumplan con los requisitos del cliente.

E5emplos de otros tipos de representaciones *rficas@
Hay histogramas donde se agrupan los datos en clases, y se cuenta cuntas observaciones (frecuencia
absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases estn
definidas de modo natural, p.e sexo con dos clases: mujer, varn o grupo sanguneo con cuatro: A, B, AB,
O. En las variables cuantitativas, las clases hay que definirlas explcitamente (intervalos de clase).



Se representan los intervalos de
clase en el eje de abscisas (eje
horizontal) y las frecuencias,
absolutas o relativas, en el de
ordenadas (eje vertical).




A veces es ms til representar
las frecuencias acumuladas.





O representar simultneamente
los histogramas de una variable
en dos situaciones distintas.



Otra forma muy frecuente, de
representar dos histogramas de
la misma variable en dos
situaciones distintas.





Otra forma



En las variables cuantitativas o
en las cualitativas ordinales se
pueden representar polgonos de
frecuencia en lugar de
histogramas, cuando se
representa la frecuencia
acumulativa, se denomina ojiva.
Un histograma es un diagrama de barras que se utiliza para
representar una distribucin de frecuencias agrupadas de datos
cuantitativos.
Un histograma debe tener:
o 8n ttulo para identificar la po!lacin de donde salen los datos.
o El eje )orizontal en donde se colocan los valores de las clases.
o El eje vertical en donde se representa el n5mero de datos en cada una de las clases.
Tam!in se puede utilizar la frecuencia relativa para )acer el )istograma.
1..3 -isto*rama de frecuencia relativa.
1." %edidas de tendencia central.
Al describir grupos de obser!aciones, con frecuencia se desea describir el grupo con un solo n/mero. "ara
tal fin, desde luego, no se usar el !alor mas ele!ado ni el !alor mas peque5o como /nico representante,
ya que solo representan los e0tremos. mas bien que !alores tpicos. Entonces sera mas adecuado buscar
un !alor central.
#as medidas que describen un !alor tpico en un grupo de obser!aciones suelen llamarse medidas de
tendencia central..Es importante tener en cuenta que estas medidas se aplican a grupos mas bien que a
indi!iduos. un promedio es una caracterstica de grupo, no indi!idual.
.edidas de +endencia Central
.edia aritm/tica &uma de los valores de una serie de medidas respecto del n5mero de
valores e*istentes. &u c"lculo euivale a *
i
In, siendo n el tamaHo de
la muestra ' x
i
cada uno de los valores.
.ediana Palor ue ueda en el centro tras la divisin de una serie de valores
ordenados en dos partes iguales, una superior ' una inferior. Para
determinarla de!e seguirse los siguientes pasos$
Qordenar los datos de menor a ma'or
Qsi el n5mero de datos es impar corresponde al ue ueda en el centro
Qsi el n5mero de datos es par corresponde al valor medio de los dos
datos centrales
.oda Palor ue se presenta con m"s frecuencia en una serie de mediciones.
1.".1 %edia aritm.tica/ *eom.trica y ponderada.
Media aritmtica
#a medida de tendencia central ms ob!ia que se puede elegir, es el simple promedio de las
obser!aciones del grupo, es decir el !alor obtenido sumando las obser!aciones y di!idiendo esta suma por
el n/mero de obser!aciones que hay en el grupo.
En realidad hay muchas clases de promedios y sta se la llama media aritmtica para denotar la suma de
un grupo de obser!aciones di!idida por su n/mero.
MMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMM
.edia aritm/tica
#lamando *l, ..., *G a los datos distintos de un car"cter en estudio, o las marcas de clase de los intervalos en los ue se
)an agrupado dic)os datos, ' ni,..., nG a las correspondientes frecuencias a!solutas de dic)os valores o marcas de
clase, llamaremos media aritm&tica de la distri!ucin de frecuencias a
en donde n es la frecuencia total.
Ejemplo
1:
#a media aritmtica de las veinticinco familias encuestadas ser"$
es decir, las familias encuestadas tienen un n5mero medio de )ijos de .V0\.
Ejemplo
2:
&e midieron los niveles de colinesterasa en un recuento de eritrocitos en ]mu^mol'min'ml de 31
agricultores e*puestos a insecticidas agrcolas, o!tenindose los siguientes datos$
Endividuo Fivel Endividuo Fivel Endividuo Fivel
. .;,0 .3 .<,< <? ..,\
< .<,? .1 .;,\ <0 .<,/
3 ..,. .? .0,? </ ..,1
1 >,< .0 .?,; <\ >,3
? ..,? ./ .;,3 <> \,0
0 >,> .\ .<,1 3; \,?
/ ..,> .> >,. 3. .;,.
\ ..,0 <; /,\ 3< .<,1
> .1,> <. ..,3 33 ..,.
.; .<,? << .<,3 31 .;,<
.. .<,? <3 >,/
.< .<,3 <1 .<,;
#a distri!ucin de frecuencias las marcas de clase ser"$
Entervalo (
i
/V?Q> >Q.;V? .;V?Q.< .<Q.3V? .3V?Q.? .?Q.0V?
Marca de 6lase )
i
\V<? >V/? ..V<? .<V/? .1V<? .?V/?
Orecuencia n
i
3 \ .; .; . < %n
i
L<?
la cual proporciona una media aritmtica de
.01IA A-I+.0+ICA.
Es la medida de tendencia central m"s utilizada en estadstica ' es la ue se conoce como el
promedio de las o!servaciones, sin em!argo, de!ido a la confusin ue )a' con el trmino
promedio.
#a media es el valor correspondiente a una lnea imaginaria ue compensa los valores ue se
e*ceden de la media ' los ue uedan por de!ajo de sta^ de esta manera, la media es ma'or ue
el valor m"s peueHo, ' menor ue el valor m"s grande.
6uando se dispone de datos no agrupados, la media se puede calcular con precisin al sumar
todos los valores o!servados ' dividir el total entre el n5mero de o!servaciones. &i las utilidades
anuales de cinco empresas (en millones de dlares) fueron <, <, 1, / ' .?, la media aritmtica
sera igual a$
2 + 2 + 4 + 7 + 15 30
-------------------- = ---- = 6
5 5
Este n5mero (0) sera la media po!lacional si el sistema de inters contuviera slo cinco
empresas, por ejemplo, un sistema de inters son todos los fa!ricantes de aviones en los Estados
8nidos o todos los fa!ricantes de cerveza en Detroit. &era una media muestral si se refiere slo a
cinco empresas de entre un grupo de inters muc)o ma'or, como cinco entre docenas de
fa!ricantes de aviones en el mundo o cinco entre cientos de cerveceras en los Estados 8nidos. El
procedimiento anterior se resume como$
2ara 3na poblacin4
2ara 3na m3estra4
en donde es la suma de todos los valores de la po!lacin (o muestra) o!servados, F es el
n5mero de o!servaciones en la po!lacin ' n es el de o!servaciones en la muestra.
2ropiedades de la media aritm/tica
.. #a suma de las desviaciones o diferencias de cada valor respecto a la media es igual a
cero.
<. #a suma de los cuadrados de las desviaciones de cada valor respecto a la media es un
valor mnimo.
3. #a media puede utilizarse para determinar el valor total de la po!lacin. (F5mero de
elementos) _ (Media) L Total de la po!lacin
1. #a media se afecta sustancialmente )acia arri!a o )acia a!ajo con la presencia de valores
e*tremos (mu' grandes o mu' peueHos) respecto a la media.
050.26O Mediante el uso de la ta!la 3.., calcule la media aritmtica de las utilidades ganadas
por las .;; multinacionales m"s grandes con oficinas en los Estados 8nidos.
Ta!la 3..
*O67CION L (/\ 00< I .;;) L /\<.0< millones de dlares
#a solucin se puede encontrar por c"lculo manual o, muc)o m"s r"pidamente, por computadora
despus de ue los datos de la ta!la 3.< se le )a'an introducido.
Media geomtrica
#a media geomtrica de un con.unto de obser!aciones es la raz n sima de su producto. El clculo de la
media geomtrica e0ige que todas las obser!aciones sean positi!as.
.01IA ,0O.0+-ICA.
Esta es una medida ue puede aplicarse al crecimiento e*ponencial o inters compuesto, pues
o!tiene la raz ensima de un grupo de n datos multiplicados entre s, por ejemplo, la raz c5!ica
del producto de 3 datos, o la raz octava del producto de \ datos. El resultado o!tenido, al
elevarse a la potencia ensima, produce el producto de todos los datos multiplicados entre s.
2ara 3na poblacin4
2ara 3na m3estra4
Caractersticas de la media 8eom/trica4
.. El c"lculo de la media geomtrica est" !asado en todos los elementos de un conjuntos de
datos. El valor de cada elemento de dic)o conjunto afecta as el valor de la media
geomtrica.
<. &i uno de los valores es cero, el valor de T es cero.
3. &i uno de los valores es negativo ' el n5mero de datos es par, el valor de T es imaginario
' no tiene interpretacin.
&i uno de los valores es negativo ' el n5mero de datos es impar, aunue T e*iste, su valor
no es representativo.
1. #a media geomtrica es afectada por valores e*tremos en una menor cantidad ue lo es la
media aritmtica. Por ejemplo, la media geomtrica de los valores ., 1 ' .0 es 1, mientras
ue la media aritmtica de los mismos valores es /. El valor / es m"s cercano al valor alto
.0 ue el valor 1 lo es de .0. El valor de T es siempre menor ue el valor de la media de
los mismos datos, e*cepto cuando todos los valores en una serie son iguales, tales como la
media geomtrica ' la media aritmtica para los valores 1, 1 ' 1 ue son am!as 1.
?. #a media geomtrica da igual ponderacin a las tasas de cam!io iguales. En otras
pala!ras, al promediar tasas de cam!io geomtricamente, la tasa ue muestra el do!le de
su !ase es compensada por la otra ue muestra la mitad de su !ase^ la tasa ue muestra un
uinto de su !ase^ ' as sucesivamente. #as tasas de cam!io son ordinariamente
e*presadas en porcentajes. Puesto ue la !ase de cada proporcin e*presada en porciento
es siempre igual a .;;@, el promedio de dos proporciones las cuales se compensan
de!er" ser .;;@ tam!in.
0. #a media geomtrica de las proporciones de los valores individuales con respecto a cada
valor precedente en una secuencia de valores es la 5nica medida de tendencia central
apropiada para las proporciones. #a media aritmtica de las proporciones no dar" un
resultado consistente.
050.26O #as ventas mensuales de una tienda por departamentos ' las proporciones de las
ventas mensuales a la ventas en cada mes previo de Enero a Ma'o, est"n dadas en la ta!la
siguiente$
Ta!la 3.3
6alcule la media geomtrica as como la media aritmtica de las tasas ' comp"relas.
*O67CION #a media geomtrica de las tasas es ..<; .<;@ ' la media aritmtica es ..3;?
.3;.?@.
6omparacin de las ventas calculadas mediante la media aritmtica ' la media geomtrica$
Ta!la 3.1
Media armnica
Es el in!erso de la media aritmtica de los in!ersos de las obser!aciones.
.01IA A-.ONICA.
#a media armnica (D) de n o!servaciones `., `<, ... , `n es el inverso (multiplicativo) de la
media aritmtica de los inversos de las o!servaciones.
2ara la poblacin4
2ara la m3estra4
6aractersticas de la media armnica$
.. #a media armnica como la media aritmtica ' la geomtrica, se calcula usando todos los
elementos en un conjunto de valores. El valor de cada elemento en todos los datos afecta,
por lo tanto, el valor de la media armnica. &in em!argo, la media armnica es aun menos
afectada por valores e*tremos ue la media geomtrica. #a magnitud relativa de las tres
diferentes medias para los mismos datos puede ser e*presada como sigue$
<. #a media armnica no es tan frecuentemente usada como una medida de tendencia central
de un conjunto de datos como es la media aritmtica. &in em!argo, es 5til en caos
especiales para promediar velocidades. #a razn de cam!io usualmente indica la relacin
entre dos tipos diferentes de unidades de medida ue pueden ser e*presadas
recprocamente. Por ejemplo si una persona camin .; millas en < )oras, la razn de su
velocidad de caminar puede ser e*presada$
3 10 m!llas
4 ------------ = 5 m!llas/"ora
5 2 "oras
6 rec!#rocamen$e%
7 2 "oras
& ----------- = 1/5 "oras/m!lla
' 10 m!llas
.;. #a media armnica de!er" usarse cuando un valor constante, el cual tiene la misma
unidad ue el numerador ( millas) de cada razn dada, es igualmente aplica!le a cada
elemento en los datos.
050.26O &i un automvil recorre las primeras .; millas a 3; mp) ' las segundas a 0; mp), a
primera vista pareciera ue la velocidad promedio de 3; ' 0; es de 1? mp). Pero este tipo de
media se suele definir en Osica como la distancia total recorrida divida entre el tiempo total
empleado en recorrerla, ' como la distancia total es de <; millas ' el tiempo total es .I3 R .I0 de
)ora, se tiene ue la velocidad media es$
vel L <; I ( .I3 R .I0 ) L 1; mp)
Es interesante o!servar ue esta media se puede calcular como una media armnica de 3; ' 0;,
es to es$
D L < I ( . I 3; R . I 0; ) L 1; mp).
Media ponderada
En ciertas circunstancias no todas las obser!aciones tienen igual peso. En general si se tienen
obser!aciones con sus respecti!os pesos es$
.01IA 2ON10-A1A.
#a media o promedio simple es la medida de tendencia central m"s utilizada^ sin em!argo,
cuando algunos de los valores por promediar son m"s importantes ue otros, por ejemplo, al
evaluar a un empleado, su calificacin en conocimientos, puntualidad, presentacin ' otros
conceptos tiene una importancia relativa diferente en funcin a uin, )ace la evolucin.
Tal vez no sea lo mismo un empleado con .; en conocimientos, .; en puntualidad ' / en
presentacin (promedio L >), ue otro con .; en conocimientos, / en puntualidad ' .; en
presentacin (promedio L >).
6uando los valores por promediar tienen diferentes grados de importancia entre s, de!e utilizarse
el promedio ponderado, el cual aplica un factor de ponderacin (o importancia relativa) a cada
uno de los valores ue se van a promediar.
2ara 3na poblacin4
2ara 3na m3estra4
donde es la suma de todos los pesos (J) multiplicada por los valores o!servados (`), en
tanto ue es igual a F (el n5mero de o!servaciones de la po!lacin) o n (e n5mero de
o!servaciones de la muestra).
050.26O En una empresa dada, el sueldo por )ora es de ? dlares para .;; tra!ajadores, de .;
dlares para ?; tra!ajadores ' de .? dlares para diez tra!ajadores. a6u"l es el sueldo promedio%
*O67CION
L ((.;;_?) R (?;_.;) R (.;_.?)) I (.;; R ?; R .;) L /..>
El resultado dista muc)o del sueldo por )ora promedio no ponderado de .; dlares.
1.". %ediana.
Itra medida de tendencia central que se utiliza con mucha frecuencia es la mediana, que es el !alor
situado en medio en un con.unto de obser!aciones ordenadas por magnitud.
La mediana
#a mediana %3d& es una medida de posicin que di!ide a la serie de !alores en dos partes iguales, un
cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual que ella.
Es por lo tanto, un parmetro que esta en el medio del ordenamiento o arreglo de los datos organizados,
entonces, la mediana di!ide la distribucin en una forma tal que a cada lado de la misma queda un n/mero
igual de datos.
"ara encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es ordenar los
datos en una forma creciente o decreciente y luego se ubica la posicin que esta ocupa en esa serie de
datos4 para ello hay que determinar si la serie de datos es par o impar, luego el n/mero que se obtiene
indica el lugar o posicin que ocupa la mediana en la serie de !alores, luego la mediana ser el n/mero
que ocupe el lugar de lo posicin encontrada.
.ediana
#a mediana es otra medida de posicin, la cual se define como auel valor de la varia!le tal ue,
supuestos ordenados los valores de sta en orden creciente, la mitad son menores o iguales ' la
otra mitad ma'ores o iguales
7s, si en la siguiente distri!ucin de frecuencias,
)
i
n
i
*
i
; 3 3
. < ?
< < /
/
ordenamos los valores en orden creciente,
; ; ; . . < <
el . ser" el valor ue cumple la definicin de mediana.
#gicamente, en cuanto el valor de la frecuencia total sea ligeramente ma'or, este procedimiento
resulta invia!le. Por esta razn, daremos a continuacin una frmula ue permita calcularla. Fo
o!stante, ser" necesario distinguir los casos en los ue los datos vengan agrupados de auellos en
los ue vengan sin agrupar.
1atos sin a8r3par4
#as gr"ficas siguientes, correspondientes a un diagrama de frecuencias a!solutas acumuladas,
recogen las dos situaciones ue se pueden presentar$
&i la situacin es como la de la figura de la derec)a, es decir, si
&i la situacin ue se presenta es como la de la figura de la izuierda, entonces la mediana ueda
indeterminada, aunue en este caso se toma como mediana la media aritmtica de los dos valores
entre los ue se produce la indeterminacin^ as pues, si
F
jQ.
L nI< Z Fj
entonces la mediana es
Ejemplo
1:
#a distri!ucin de frecuencias acumuladas del ejemplo del n+mero de hijos era
N9 de hijos:x
i
; ; . < 3 1
<rec3encias Ac3m3ladas:N
i
; ? .. .> <3 <?
' como es nI<L.<V? ' en consecuencia
.. Z .<V? Z .>
la mediana ser" M
e
L <.
1atos A8r3pados
#as gr"ficas siguientes, correspondientes a pol"gonos de frec$encias absol$tas ac$m$ladas, nos
plantea de nuevo dos situaciones diferentes a considerar$
El m"s sencillo, el de la derec)a, en el ue e*iste una frecuencia a!soluta acumulada F
j
tal ue
nI< L F
j
, la mediana es M
e
L *
j
.
&i la situacin es como la ue se representa en la figura de la izuierda, en la ue
F
jQl
Z nI< Z F
j
entonces, la mediana, est" en el intervalo :*
jQ.
, *
j
), es decir entre *
jQ.
' *
j
, tom"ndose en ese caso,
por razonamientos de proporcionalidad, como mediana el valor
siendo c
j
la amplitud del intervalo :*
jQ.
, *
j
).
Ejemplo:
#a distri!ucin de frecuencias del ejemplo de los niveles de colinesterasa es$
Entervalo (
i
/V?Q> >Q.;V? .;V?Q.< .<Q.3V? .3V?Q.? .?Q.0V?
Orecuencia n
i
3 \ .; .; . <
Orecuencia 7cumulada *
i
3 .. <. 3. 3< 31
7l ser nI< L ./ ' estar
.. Z ./ Z <.
la mediana estar" en el intervalo :.;V? , .<), ' aplicando la frmula anterior, ser"
.01IANA.
Es valor del elemento de la posicin central de los datos individuales, ordenados de ma'or a
menor (o viceversa), ' es el punto ue marca la mitad de valores ma'ores ue l, es decir, est" a
la mitad, con el ?;@ de valores a su derec)a ' el ?;@ de valores a su izuierda.
Es la medida de tendencia central m"s utilizada en estadstica ' es la ue se conoce como el
promedio de las o!servaciones, sin em!argo, de!ido a la confusin ue )a' con el trmino
promedio.
Para calcular la mediana$
Brdene los datos, de ma'or a menor o viceversa.
6alcule la posicin de la mediana$
n + 1 ( + 1
)!s!c!n de la med!ana = ------- = -------
2 2
Determine el elemento de la posicin central, ue es finalmente la mediana. (&i el n5mero
de datos es par, de!er" o!tener el promedio del valor de los dos elementos centrales.)
Caractersticas b=sicas de la mediana
.. El valor de la mediana se afecta por el n5mero de datos, no por la magnitud de ning5n
valor e*tremo.
<. Es igualmente pro!a!le ue cualuier o!servacin escogida al azar sea ma'or o menor
ue la mediana.
3. &e puede determinar, incluso en distri!uciones con intervalos a!iertos.
1. #a suma de los cuadrados de las desviaciones respecto a la mediana es un valor mnimo.
En los casos en ue los datos contengan valores e*tremos, ' considerando la cuarta propiedad de
la media, es mejor utilizar la mediana en lugar de la media como medida de tendencia central.
050.26O 8se los datos de la ta!la 3.< para calcular la utilidad mediana o!tenida por las cien
multinacionales m"s grandes de los Estados 8nidos.
Ta!la 3.<
*O67CION El arreglo ordenado tiene un par de o!servaciones. En consecuencia, )a' dos
valores centrales de ?3< ' ?3? millones de dlares. #a mediana es la media aritmtica, es decir,
(?3< millones R ?3? millones) I < L ?33.3 millones de dlares
ue es un n5mero mu' distinto de la media aritmtica de todas las cifras
1."." %oda.
Itra medida de tendencia central es la moda. #a moda es el !alor que ocurre con mas frecuencia en un
con.unto de obser!aciones.
La moda
#a moda es la medida de posicin que indica la magnitud del !alor que se presenta con ms frecuencia en
una serie de datos4 es pues, el !alor de la !ariable que ms se repite en un con.unto de datos. 'e las
medias de posicin la moda es la que se determina con mayor facilidad, ya que se puede obtener por una
simple obser!acin de los datos en estudio, puesto que la moda es el dato que se obser!a con mayor
frecuencia. #a moda se designa con las letras 3o.
.oda
#a moda se define como auel valor de la varia!le al ue corresponde m"*ima frecuencia
(a!soluta o relativa). Para calcularla, tam!in ser" necesario distinguir si los datos est"n o no
agrupados.
Datos sin agrupar$
Para datos sin agrupar, la determinacin del valor o valores ('a ue puede )a!er m"s de uno)
modales es mu' sencilla. +asta o!servar a ue valor le corresponde una ma'or n
i
. Ese ser" la
moda.
7s en el ejemplo del n5mero de )ijos, la simple inspeccin de la ta!la siguiente proporciona
como valor para la moda el M
d
L <.
N9 de hijos:x
i
; ; . < 3 1
N9 de familias:n
i
; ? 0 ! 1 < %n
i
L<?
Datos agrupados$
&i los datos se presentan agrupados en intervalos es necesario, a su vez, distinguir si stos tienen
o no igual amplitud.
&i tienen amplitud constante c, una vez identificado el intervalo modal :*
jQ.
, *
j
), es decir el
intervalo al ue corresponde ma'or frecuencia a!soluta n
j
L ma*bn
l
, ..., n
G
c, la moda se define,
tam!in por razones geomtricas, como
Ejemplo:
Este ejemplo presenta un caso de distri!ucin !imodal, 'a ue tanto el intervalo :.;V? Q .<) como
el :.< Q .3V?) tienen frecuencia a!soluta m"*ima. De!eramos aplicar, por tanto, para cada uno de
los dos intervalos la frmula anterior, determinando as las dos modas de la distri!ucin. Fo
o!stante, este ejemplo presenta adem"s la peculiaridad adicional de ser am!os intervalos modales
contiguos. En esta situacin se considera la distri!ucin unimodal, eligiendo como moda el
e*tremo com5n, M
d
L .<.
&i los intervalos tuvieran distinta amplitud c
j
, primeros de!emos normalizar las frecuencias
a!solutas n
j
, determinando los cocientes
' luego aplicar la regla definida para el caso de intervalos de amplitud constante a los l
j
. Es decir,
primero calcular el l
j
L ma*bl
.
,...., l
G
c para determinar el intervalo modal :*
jQ.
, *
j
) ' luego aplicar
la frmula
siendo c
j
la amplitud del intervalo modal :*
jQ.
, *
j
).
Ejemplo:
#as frecuencias normalizadas correspondientes al ejemplo de intervalos con distinta amplitud
ser"n,
E
i
n
i
l
i
;Q<; \ ;V1
<;Q3; > ;V>
3;Q1; .< .V<
1;Q1? .; <
1?Q?; > .V\
?;Q0; .; .
0;Q\; \ ;V1
\;Q.;; 1 ;V<
con lo ue el intervalo modal es el :1; Q 1?) ' la moda
7 diferencia de lo ue ocurre con la media o con la mediana, s es posi!le determinar la moda en
el caso de datos cualitativos. 7s, en el ejemplo del tratamiento de radiaci%n seg$ido de cir$g"a
puede afirmarse ue la causa modal por la ue no fue completado el tratamiento es M
d
L
re)usaron ciruga.
.O1A.
#a moda es el valor m"s frecuente de un conjunto de datos en ocasiones se presentan dos o m"s
valores ue se repiten con ma'or frecuencia. En este caso, a los datos se les conoce como
!imodales o multimodales, respectivamente.
#a moda es la 5nica medida de tendencia central ue se puede aplicar a datos del tipo cualitativo,
por ejemplo$ analizar el color de ojos (caf, negro, azul) de una po!lacin. Es mu' f"cil de
determinar, !asta con o!servar detenidamente al conjunto de datos ' ver cu"l es el ue m"s se
repite^ sin em!argo, no es mu' 5til por ue puede ocurrir ue una distri!ucin tenga dos o m"s
valores ue se repitan con la misma frecuencia, en tal caso se tienen dos o mas modas. Tam!in
puede ocurrir ue no e*ista ning5n valor ue se repita ' entonces no )a!r" moda. Por otra parte
puede ser un valor e*tremo el de ma'or frecuencia ' difcilmente podra ser considerado una
medida de tendencia central.
En la pr"ctica, la moda raras veces se usa para descri!ir datos no agrupados, es muc)o m"s
frecuente su designacin para datos agrupados.
1.# %edidas de dispersin.
La dispersin puede medirse en trminos de la diferencia entre dos valores seleccionados del conjunto de
datos. Las medidas de distancia son: el alcance, el alcance interfractil y el alcance intercuartil.
:lcance.
Es la diferencia entre el ms alto y el ms pequeo de los valores observados.
Alcance = valor de la observacin ms alta valor de la observacin ms pequea
El alcance es fcil de entender y de encontrar, pero su utilidad como medida de dispersin es limitada.
Slo toma en cuenta los valores ms alto y ms bajo de una distribucin y no considera ninguna otra
observacin del conjunto de datos. gnora la naturaleza de la variacin entre todas las dems
observaciones, y se ve muy influido por los valores extremos.
Las distribuciones de extremo abierto no tienen alcance, pues no existe un valor ms alto o ms bajo en
la clase de extremo abierto.
:lcance interfractil.
En una distribucin de frecuencias, una fraccin o proporcin dada de los datos cae en un fractil o por
debajo de ste. La mediana, por ejemplo, es el fractil 0,5, puesto que la mitad de los datos es menor o
igual a este valor. Los fractiles son parecidos a los porcentajes. En una distribucin cualquiera, el 25% de
los datos est en el fractil 0,25 o por debajo de ste; igualmente, 25% de los datos cae en el vigsimo
quinto percentil o por debajo de ste. El alcance interfractil es una medida de la dispersin entre dos
fractiles de una distribucin de frecuencias, es decir, la diferencia entre los valores de los dos fractiles.
Los fractiles tienen nombres especiales, dependiendo del nmero de partes iguales en que se dividen los
datos. Los fractiles que los dividen en 10 partes iguales se conocen como deciles. Los cuartiles dividen
los datos en cuatro partes iguales. Los percentiles dividen el conjunto de datos en 100 partes iguales.
:lcance intercuartil.
El alcance intercuartil mide aproximadamente qu tan lejos de la mediana tenemos que ir en cualquiera
de las dos direcciones antes de que podamos recorrer una mitad de los valores del conjunto de datos.
Para calcular este alcance, dividimos nuestros datos en cuatro partes, cada una de las cuales contiene
25% de los elementos de la distribucin. Los cuartiles son, entonces, los valores ms alto y ms bajo de
estas cuatro partes, y el alcance intercuartil es la diferencia entre los valores del primer cuartil y el tercer
cuartil.
SUE!E"#$%
El punto fractil es siempre el punto en el o debajo del cual cae la proporcin establecida de valores.
.edidas de 1ispersin
Amplit3d Diferencia entre los valores ma'or ' menor de un conjunto de datos
o!tenidos en una medicin.
Coeficiente de
>ariacin
Euivale a la desviacin tpica e*presada en porcentaje respecto de la
media aritmtica. Es la desviacin tpica partido por la media
aritmtica.
1es>iacin estandar Medida de la dispersin de una distri!ucin de frecuencias respecto
de su media. Euivale a la raiz cuadrada de la varianza. &e e*presa
como si corresponde a la po!lacin total o como s si corresponde
a una muestra de la po!lacin
-an8o Medida euivalente a la amplitud
?alor @ Medida del n5mero de desviaciones estandar ue un valor se aleja
de la media
YL (*
i
Q `) I s o YL (*
i
Q ) I
?arianAa Medida de la variacin de una serie de o!servaciones respecto de la
media. Euivale a la dispersin respecto de la media en una serie de
datos continuos. &u c"lculo corresponde a$ (*
i
Q )
<
In si
corresponde a la po!lacin total o (*
i
Q `)
<
I(nQ.) si corresponde a
una muestra de esa po!lacin, siendo o B la media, n el tamaHo
de la po!lacin o de la muestra ' x
i
cada uno de los valores.
1.#.1 0arian1a.
E0iste otro mecanismo para solucionar el efecto de cancelacin para entre diferencias positi!as y
negati!as. Si ele!amos al cuadrado cada diferencia antes de sumar, desaparece la cancelacin$
Esta frmula tiene una des!enta.a, y es que sus unidades no son las mismas que las de las obser!aciones,
ya que son unidades cuadradas.
Esta dificultad se soluciona, tomando la raz cuadrada de la ecuacin anterior$
Variana
Es otra de las !ariaciones absolutas y la misma se define como el cuadrado de la des!iacin tpica4 !iene
e0presada con las mismas letras de la des!iacin tpica pero ele!adas al cuadrado, as S2 y s2. #as
formulas para calcular la !arianza son las mismas utilizadas por la des!iacin tpica, e0ceptuando las
respecti!as races, las cuales desaparecen al estar ele!ados el primer miembro al cuadrado.
?arianAa
Denotando por )
,
-...-)
/
los datos o las marcas de clase, llamaremos varianza a
siendo a la media de la distri!ucin.
7s en el ejemplo del n+mero de hijos la varianza es
s
<
L 1V<1 Q (.V0\)
<
L .V1./0.
' en ejemplo de los niveles de colinesterasa
s
<
L .33V>/ Q (..V1<0)
<
L 3V1<.
7l valor
se le denomina c$asivarzanza.
?A-IAN@A.
8na medida de dispersin muc)o m"s com5n, ue se calcula al promediar los cuadrados de las
desviaciones individuales a partir de la media, es la media de desviaciones cuadr"ticas o la
varianza.
#a varianza es una medida de dispersin promedia de un conjunto de datos. Para una po!lacin
se constru'e al tomar la diferencia entre cada valor o!servado ' la media po!lacional, elevando al
cuadrado cada una de estas desviaciones ' luego )allando la media aritmtica de los valores
cuadrados. Para una muestra, una e*presin casi an"loga se constru'e con la a'uda de su media.
2ara 3na poblacin
2ara 3na m3estra
050.26O 6alcule la varianza para una po!lacin de F L ? valores$ <, <, 1, / ' .?.
*O67CION Pease la ta!la 3.? ue muestra la forma en ue la varianza se calcula para datos
po!lacionales, procedimiento por dem"s tedioso cuando el numero de o!servaciones es grande.
#os programas modernos para computadora efect5an con suma rapidez este tipo de operacin.
Ta!la 3.?
2-OB60.A* 2-AC+ICO*
Por desgracia )a' dos pro!lemas pr"cticos relacionados con el uso de concepto de varianza.
Primero la varianza tiende a ser un n5mero grande en comparacin con las o!servaciones cu'a
dispersin )a'a de descri!irse. 6uando las o!servaciones originales son iguales a unos pocos
miles de millones, su varianza puede ser igual a muc)os cientos de miles de millones. En
segundo trmino, ' m"s grave es ue la varianza , siendo un n5mero elevado al cuadrado no se
e*presa en las mismas unidades ue los valores o!servados en s.
Pero tam!in )a' !uenas noticias$ am!as dificultades conceptuales se pueden vencer de un solo
golpe al tra!ajar con la raz cuadrada de la varianza, concepto el cual vemos en seguida.
1.#. Desviacin estndar.
VARANZAY DESVACN ESTNDAR
La varianza se asemeja a la desviacin media absoluta en que se basa en la diferencia
entre cada valor del conjunto de datos y la media del grupo. Pero se distingue de ella en
un muy importante aspecto: cada diferencia se eleva al cuadrado antes de sumarse. En
el caso de una poblacin, la varianza se representa con V(X) o, ms habitualmente, con
la letra griega minscula o
2
("sigma cuadrada"). La frmula es
A diferencia de lo que ocurre con las dems estadsticas muestrales ya expuestas, la
varianza de una muestra no equivale exactamente, en trminos de clculo, a la
varianza de una poblacin. El denominador de la frmula de la varianza muestral es un
tanto distinto. En esencia, en esta frmula se incluye un factor de correccin, a fin de
que la varianza muestral sea un estimador insesgado de la varianza de la poblacin. La
varianza muestral es representada por s
2
; su frmula es
En general, es difcil interpretar el significado del valor de una varianza, porque las
unidades en las que se le expresa son valores elevados al cuadrado. Debido en parte a
esta razn, es ms frecuente el uso de la raz cuadrada de la varianza, representada
por la letra griega a (o por s en el caso de una muestra) y llamada desviacin estndar.
Las frmulas son:
Desviacin estndar de la poblacin:
Desviacin estndar de la muestra:
La desviacin estndar es particularmente til en conjuncin con la as llamada
distribucin normal.
EJEMPLO En relacin con los datos de ventas de equipo de aire acondicionado dados
en el ejemplo anterior, la media aritmtica es 10.5 unidades (vase seccin 2.2).
Considerando estos datos de ventas mensuales como la poblacin estadstica de
inters, la desviacin estndar se determina como sigue, de acuerdo con los clculos
de la tabla 3.2:
Tabla 3.2 Hoja de trabajo para el clculo de la desviacin estndar de la poblacin
de los datos de ventas (u= 10.5)
3.7 CLCULOS SMPLFCADOS DE LA VARANZA Y LA DESVACN
ESTNDAR
Las frmulas de la seccin 4.6 se llaman frmulas de desviaciones, porque en cada
caso deben determinarse las desviaciones especficas de los valores individuales
respecto de la media. Sin embargo, se han derivado ya otras frmulas,
matemticamente equivalentes pero que no requieren de la determinacin de cada
desviacin. Dado que por lo general estas frmulas son ms fciles de utilizar en la
realizacin de clculos, se llaman frmulas de clculo.
Las frmulas de clculo son:
Varianza de la poblacin:
Desviacin estndar de la poblacin:
Varianza de la muestra:
Desviacin estndar de la muestra:
EJEMPLO En referencia a los datos de ventas de equipos de aire acondicionado
presentados en el ejemplo anterior, calculamos a continuacin la desviacin estndar
de la poblacin con el uso de la frmula de clculo alternativa y de la tabla 3.3 para
demostrar que la respuesta es la misma que la obtenida con la frmula de desviacin
del ejemplo 6. La media de estos datos es 10.5 unidades.
Tabla 3.3 Hoja de trabajo para el clculo de la desviacin estndar de la poblacin
de los datos de ventas
3.8 CRTERO MATEMTCO ASOCADO CON LA VARANZA Y LA
DESVACN ESTNDAR
En la seccin 2.7 describimos el criterio de mnimos cuadrados y establecimos que la
media aritmtica es la medida de posicin de datos que satisface este criterio.
Remitmonos ahora a la frmula para advertir que la varianza es de hecho una media
aritmtica, en el sentido de que es la suma de algo (desviaciones al cuadrado en este
caso) dividida entre el nmero de tales valores. Exclusivamente desde este punto de
vista, la varianza se asocia por lo tanto con el criterio de mnimos cuadrados. Ntese
tambin que la suma de las desviaciones al cuadrado en el numerador de la frmula de
la varianza es precisamente la suma que se reduce al mnimo al usar la media
aritmtica como medida de posicin. Por consiguiente, la varianza y su raz cuadrada,
la desviacin estndar, tienen una estrecha relacin matemtica con la media, y ambas
se emplean en inferencia estadstica con datos muestrales.
EJEMPLO Remtase a la tabla 3.2, la hoja de trabajo que se us para calcular la
desviacin estndar de los datos de ventas del ejemplo anterior. Obsrvese que la
suma de las desviaciones al cuadrado, 86.00, la cual es el numerador de la frmula de
la desviacin estndar, no puede reducirse optando por cualquier otra medida de
posicin con un valor diferente a la media de la poblacin de 10.5.
3.9 USO DE LA DESVACN ESTNDAR EN LA DESCREPCN DE
DATOS
Tal como se asent en la seccin anterior, la desviacin estndar se emplea junto con
varios mtodos de inferencia estadstica expuestos en posteriores captulos de este
libro. La descripcin de esos mtodos escapa al inters del presente captulo. Sin
embargo, aparte de los usos de la desviacin estndar en la inferencia, introduciremos
brevemente aqu un uso de la desviacin estndar en la descripcin de datos.
Considrese una distribucin de valores de datos tanto simtrica como mesocrtica (ni
plana ni afilada). La curva de frecuencias de una distribucin de este tipo se llama curva
normal. En un conjunto de valores con distribucin normal, siempre ocurre que
aproximadamente 68% de los valores quedan incluidos dentro de un margen de una
desviacin estndar respecto de la media y que aproximadamente 95% de los valores
quedan incluidos dentro de un margen de dos unidades de desviacin estndar
respecto de la media. Estas observaciones se representan como diagramas en las
figuras 3-2a) y b), respectivamente. As, adems de asociarse con el criterio de
mnimos cuadrados, la media y la desviacin estndar se emplean tambin en el
anlisis de variables con distribucin normal.
Fig. 3-2
EJEMPLO Se observa que las cuentas de energa elctrica de una zona residencial
correspondientes al mes de junio tienen una distribucin normal. Si se calcula que la
media de estas cuentas es de $84.00, con una desviacin estndar de $24.00, de ello
se desprende que aproximadamente 68% de las cantidades facturadas se encuentran
dentro de un margen de $24.00 respecto de la media, o entre $60.00 y $108,00.
Asimismo se desprende tambin que aproximadamente 95% de las cantidades
facturadas se hallan dentro de un margen de $48.00 respecto de la media, o entre
$36.00 y $132.00.
!ttp:""###.universidadabierta.edu.m$"%er&st"'puntes"Velasco(oberto)Metod&stad.!tm
Desviacion tipica o estandar
Es la medida de dispersin ms utilizada en las in!estigaciones por ser la ms estable de todas, ya que
para su calculo se utilizan todos los des!os con respecto a la media aritmtica de las obser!aciones, y
adems, se toman en cuenta los signos de esos des!os. Se le designa con la letra castellana S cuando se
traba.a con una muestra y con la letra griega min/scula s %Sigma& cuando se traba.a con una poblacin. Es
importante destacar que cuando se hace referencia a la poblacin l n/mero de datos se e0presa con y
cuando se refiere a la muestra l n/mero de datos se e0presa con n. #a des!iacin tpica se define como$
*nterpretacion de la desviacion estandar
#a des!iacin tpica como medida absoluta de dispersin, es la que me.or nos proporciona la !ariacin de
los datos con respecto a la media aritmtica, su !alor se encuentra en relacin directa con la dispersin de
los datos, a mayor dispersin de ellos, mayor des!iacin tpica, y a menor dispersin, menor des!iacin
tpica.
Desviacin estndar de la poblacin.
La desviacin estndar de la poblacin, o , es simplemente la raz cuadrada de la varianza de la
poblacin. Como la varianza es el promedio de las distancias al cuadrado que van desde las
observaciones a la media, la desviacin estndar es la raz cuadrada del promedio de las distancias al
cuadrado que van desde las observaciones a la media. La desviacin estndar est en las mismas
unidades que las que se usaron para medir los datos.
La raz cuadrada de un nmero positivo puede ser tanto positiva como negativa. Cuando tomamos la raz
cuadrada de la varianza para calcular la desviacin estndar, los estadsticos solamente consideran la
raz cuadrada positiva.
Para calcular la varianza o la desviacin estndar, construimos una tabla utilizando todos los elementos
de la poblacin.
Usos de la desviacin estndar.
La desviacin estndar nos permite determinar, con un buen grado de precisin, dnde estn localizados
los valores de una distribucin de frecuencias con relacin a la media. El teorema de Chebyshev dice que
no importa qu forma tenga la distribucin, al menos 75% de los valores caen dentro de + 2 desviaciones
estndar a partir de la media de la distribucin, y al menos 89% de los valores caen dentro de + 3
desviaciones estndar a partir de la media.
Con ms precisin:
Aproximadamente 68% de los valores de la poblacin cae dentro de + 1 desviacin estndar a
partir de la media.
Aproximadamente 95% de los valores estar dentro de + 2 desviaciones estndar a partir de la
media.
Aproximadamente 99% de los valores estar en el intervalo que va desde tres desviaciones
estndar por debajo de la media hasta tres desviaciones estndar por arriba de la media.
Resultado estndar:
La desviacin estndar es tambin til para describir qu tan lejos las observaciones individuales de una
distribucin de frecuencias se apartan de la media de la distribucin. Una medida que se conoce como
resultado estndar nos da el nmero de desviaciones estndar que una observacin en particular ocupa
por debajo o por encima de la media:
Resultado estndar = (x - ) /
10*?IACION 0*+AN1A-4
#a medida de resumen de dispersin m"s importante se deriva a su vez, de la varianza$
#a desviacin est"ndar es igual a la raz cuadrada positiva de la varianza. 8na medida de
desviacin est"ndar tiene una ventaja inmediata so!re la varianza$ 6ae en el mismo intervalo de
magnitud ' se e*presa en las mismas unidades ue las o!servaciones mismas. En consecuencia,
la desviacin est"ndar de los datos de la ta!la 3.0 es igual a raz(<3.0) L 1.\0^ la desviacin
est"ndar para los datos de utilidad de la ta!la 3.. es igual a raz(/;1 1;\.31 millones de dlares al
cuadrado) L \3>.<> millones.
2ara 3na poblacin
2ara 3na m3estra
CA6C76O* AB-0?IA1O* 10 ?A-IAN@A C 10*?IACION 0*+AN1A-.
7 menos ue la varianza o la desviacin est"ndar )a'an de calcularse en computadora, es !ueno
utilizar un procedimiento a!reviado matem"ticamente ue euivale a las frmulas ue se )an
dado.
2ara 3na poblacin
2ara 3na m3estra
2-OB60.A 2econsidere los datos de po!lacin dados en la primera columna de la ta!la 3.?
para calcular ala varianza ' la desviacin est"ndar o el mtodo !reve.
*O67CION4 Pea la ta!la 3.0 ue llega al mismo resultado de la ta!la 3.?.
Ta!la 3.0
1.#." Desviacin media.
Desviacin media
Esta medida es mas acorde que la de amplitud, ya que in!olucra a todos los !alores del con.unto de
obser!aciones corrigiendo la des!iacin. Nsta medida se obtiene calculando la media aritmtica de la
muestra, y luego realizando la sumatoria de las diferencias de todos los !alores con respecto de la media.
#uego se di!ide por el n/mero de obser!aciones. 6na medida como sta tiene la !enta.a de que utiliza
cada obser!acin y corrige la !ariacin en el n/mero de obser!aciones al hacer la di!isin final. O por
/ltimo tambin se e0presa en las mismas unidades que las obser!aciones mismas.
10*?IACION .01IA AB*O67+A .
#a desviacin media a!soluta es una medida de dispersin promedio de un conjunto de datos, es
igual a la media aritmtica de todas las diferencias a!solutas entre cada o!servacin individual '
la media del conjunto de datos ( aveces, la mediana ), Para datos no agrupados, tenemos^ Para
una po!lacin .
2ara 3na poblacin
2ara 3na m3estra
2-OB60.A Encuentre la desviacin media a!soluta de la lista de utilidades de la ta!la 3.< , 'a
sea al aplicar la frmula o mediante computadora.
*O67CION 8sando la frmula anterior para una po!lacin en millones de dlares,
*-1060-7&662*+*-476-7&662*++*5423-7&662*
+,- = ------------------------------------------------ = 5667
100
6omo se puede ver dic)o c"lculo a mano puede ser !astante tedioso^ 6ualuier pauete de
estadstica para computadora le resolver" el pro!lema.
DESVACN MEDA ABSOLUTA (DMA)
La desviacin media absoluta (DMA) se basa en el valor absoluto de la diferencia entre
cada valor del conjunto de datos y la media del grupo. Se determina entonces el
promedio de estos valores absolutos. Se usan los valores absolutos de las diferencias
porque la suma de todas las diferencias positivas y negativas (no de las diferencias
absolutas) siempre es igual a cero. As, las frmulas respectivas de la DMA de la
poblacin y de la muestra son:
EJEMPLO En referencia a los datos de ventas de equipos de aire acondicionado
dados en el ejemplo anterior, la media aritmtica es 10.5 unidades (vase seccin 2.2).
Con base en los clculos de la tabla 3.1, la desviacin media absoluta se determina de
la siguiente manera:
Tabla 3.1 Hoja de trabajo para el clculo de la desviacin media de los datos de venta
(m = 10.5)
Por lo tanto, podemos decir que, en promedio, la venta de unidades de equipo de aire
acondicionado de un vendedor difiere en 2.6 unidades respecto de la media grupal, en
cualquier direccin.
)ttp$IIJJJ.universidada!ierta.edu.m*I&erEstI7puntesIPelasco2o!ertodMetodEstad.)tm
1.#.# Desviacin mediana.
Desviacin %ediana.
El criterio que gua esta estadstica, radica en el uso de diferencias de cada dato respecto a la mediana
muestral m.
Si estas diferencias son muy grandes, entonces estamos ante un caso de gran variabilidad, y si son
pequeas se espera que la variabilidad sea pequea.
Naturalmente que el criterio que parece ms apropiado es agrupar las discrepancias individuales y
tratarlas en conjunto.
Un agrupamiento natural sera una suma de ellas, pero el slo uso de las diferencias no garantiza que se
pueda medir discrepancias porque algunas (prcticamente la mitad) sern menores que la mediana, con
diferencias negativas, y el resto mayores que la mediana, con diferencias positivas, y al sumar dichos
valores habra compensaciones entre valores negativos y positivos.
Por lo tanto, una salida a esta dificultad es considerar el valor absoluto de la diferencias calculadas y
promediarlos.
Esto conduce a la definicin siguiente:
Dado un conjunto de datos, x1, ..., xn su desviacin mediana d.m., est definida por :
donde m representa la mediana de los datos.
Puede verse entonces que, cuanto mayor sea la dispersin existente entre los datos, tanto mayor tender
a ser el promedio del valor absoluto de las diferencias de los datos, respecto de la mediana muestral.
Esta estadstica se encuentra medida en la misma escala que los datos originales, lo que facilita su
comprensin.
)ttp$IIJJJ.educarc)ile.clIedutecaIestadisticaIdesvmedia.)tm
1.#.$ 2an*o.
,ango.> 'ato mayor menos dato menor.
-an8o4
Es la primera medida ue vamos a estudiar, se define como la diferencia e*istente entre el valor ma'or ' el menor de
la distri!ucin,. #o notaremos como -. 2ealmente no es una medida mu' significativa e la ma'ora de los casos,
pero induda!lemente es mu' f"cil de calcular.
Demos estudiado varias medidas de centralizacin, por lo ue podemos )a!lar de desviacin con respecto a
cualuiera de ellas, sin em!argo, la mas utilizada es con respecto a la media.
RANGO
El rango, o R, es la diferencia entre los valores ms alto y ms bajo incluidos en un
conjunto de datos. As, cuando My representa al mayor valor del grupo y Mn al menor,
el rango de datos no agrupados es
R = My - Mn
EJEMPLO Durante un mes de verano, los ocho vendedores de una empresa de
equipos de calefaccin y aire acondicionado vendieron los siguientes nmeros de
unidades centrales de aire acondicionado: 8,11, 5,14,8,11, 16, 11. El rango del nmero
de unidades vendidas es
R =My - Mn = 16 - 5 = 11.0 unidades
Nota: Para efectos de comparacin, generalmente reportamos las medidas de
variabilidad con un decimal adicional al nivel original de medicin.
RANGOS MODFCADOS
Un rango modificado es un rango que se construye eliminando algunos de los valores
extremos de cada una de las porciones finales de la distribucin. El 50% central es el
rango entre los valores en el 25o. punto percentil y el 75o. punto percentil de la
distribucin. De este modo, tambin es el rango entre el primer y tercer cuartiles de la
distribucin. Por este motivo, al rango del 50% central suele llamrsele rango intercuartil
(RC). As,
RC = Q3 Q1,
Otros rangos modificados de uso comn son el 80% central, el 90% central y el 95%
central.
EJEMPL0 Los datos de ventas de unidades centrales de aire acondicionado
presentados en el ejemplo anterior son, en orden ascendente: 5, 8, 8, 11, 11, 11, 14,
16. En consecuencia, el nmero de observaciones es N= 8 en estos datos de la
poblacin. Para calcular el rango intercuartil, primero debemos determinar los valores
en Q3 (el 75o. punto percentil) y Q1, (el 25o. punto percentil) y despus restar Q1, de
Q3:
)ttp$IIJJJ.universidada!ierta.edu.m*I&erEstI7puntesIPelasco2o!ertodMetodEstad.)tm
1.$ Parmetros para datos a*rupados.
1.$.1 ,a media.
C:,CU,6 DE ,: %ED!: CU:9D6 ,6S D:T6S EST:9 :72UP:D6S.

Para calcular la media de un conjunto de datos agrupados se emplea la siguiente
frmula:


Donde:

0 fi1i
i
/

.
fi
i
/

.
fi= es la frecuencia de la clase i
Mi= es la marca de clase del intervalo i
k= es el nmero de intervalos
%ED!: :2!T%JT!C:
6uando los datos se presentan en una distri!ucin de frecuencias, todos los valores ue caen
dentro de un intervalo de clase dado se consideran iguales a la marca de clase, o punto medio, del
intervalo. #as frmulas G
` L f.`. R f<`< R ...RfG`G L fj`j L f` L f`
jL.
QQQQQQQQQQQQQQQQQQQQQQQQQQQQQ QQQQQQ QQQQQQQ QQQQQQQ
f. R f< R ...R fG G f F
fj
jL.
G
` L 7 R fjdj L 7 R fd
jL.
QQQQQQQQQQQQ QQQQQQQQQQQQ
G
fj F
jL.
son v"lidas para tales datos agrupados si interpretamos `j como la marca de clase, fj con su
correspondiente frecuencia de clase, 7 como cualuier marca de clase conjeturada '
dj L `j e 7 como las desviaciones `j con respecto de 7.
#os c"lculos con las dos ecuaciones anteriores se llaman mtodos largos cortos,
respectivamente .
&i todos los intervalos de clase tienen idntica anc)ura c, las desviaciones dj L `j Q 7 pueden
e*presarse como cuj, donde uj pueden ser ;, t., t<, t3,..., ' la segunda frmula se convierte en
G
` L 7 R fjuj L 7R fu c
jL.
QQQQQQQQ QQQQQQQQQQQQQ
F F
ue es euivalente a la ecuacin ` L 7 R cu. Esto se conoce como mtodo de compilacin para
calcular la media. Es un mtodo mu' !reve ' de!e usarse siempre para datos agrupados con
intervalos de clase de anc)uras iguales. &e de!e notar ue en el mtodo de compilacin los
valores de la varia!le ` se transforman en los valores de la varia!le u de acuerdo con ` L 7 R
cu.
#a media aritmtica de una varia!le estadstica es la suma de todos sus posi!les valores,
ponderada por las frecuencias de los mismos. Es decir, si la ta!la de valores de una varia!le 0 es
0 n
i
f
i
)
.
n
.
f
.
... ... ...
)
/
n
/
f
/
la media es el valor ue podemos escri!ir de las siguientes formas euivalentes$
&i los datos no est"n ordenados en una ta!la, entonces
1.$. ,a desviacin tpica.
Es la raz cuadrada de la !arianza$
Entonces en este caso la unidad de s es la misma que la del con.unto de obser!aciones de la muestra
estadstica.
1es>iacin +pica
#a varianza tiene un pro!lema, ' es ue est" e*presada en unidades al cuadrado. Esto puede
producir una falsa imagen de la dispersin de la distri!ucin. En su lugar suele utilizarse su raz
cuadrada, denominada desviaci%n t"pica. 7s, la desviacin tpica de la distri!ucin de
frecuencias del ejemplo de los niveles de colinesterasa es s 2 .V.>;0 ' la del ejemplo del n+mero
de hijos s L .V\?.
1.& Distribucin de frecuencias.
7n"lisis previo(2ecopilacin de datos).
6uando se trata de comprar una casa, vemos ue no todos los estadounidenses fueron creados
iguales. 7s lo declar la 2eserva federal, ue es la autoridad monetaria m"s alta de los E.8
despus de revisar unos 0.3 millones de solicitudes de )ipotecas ue )a!an sido procesadas por
>3;; instituciones financieras en .>>;. 7l comparar las solicitudes de ciudadanos de razas negra
' !lanca con ingresos similares, pudo notarse ue un \?.3@ de !lancos fueron apro!ados contra
un 00.0 @ de los negros. Por lo tanto la taza de rec)azo para estos 5ltimos (33.1@) fu m"s del
do!le ue la de !lancos (.1./@). #a 2eserva Oederal apo'o su afirmacin con vol5menes de
datos semejantes a los de la ta!la 3.3.
Ta!la 3./
8na vez recopilado estos datos, los estadsticos se ponen a tra!ajar en una tarea igualmente
importante, como lo es la presentacin eficiente de los mismos, para ello analizaremos dos
procedimientos comunes para )acer inteligi!les las recopilaciones de datos$ la construccin de
ta!las ' gr"ficas.
6A 1I*+-IB7CION 10 <-0C70NCIA AB*O67+A 4
#a construccin de una !uena ta!la estadstica es un arte, reuiere muc)o mas ue la sola
presentacin de datos en renglones ' columnas. Emaginemos por ejemplo ue se )a llevado a
ca!o un censo de las .;; compaHas multinacionales ' ue los datos para cada una de ellas se
recopilaron por las utilidades com!inadas de sus operaciones nacionales e internacionales como
se muestra en la ta!la 3..^ aun cuando dic)a ta!la contiene solo .;; n5meros, es confusa. 8na
lista de su contenido en orden de magnitud ascendente o descendente, devendra con seguridad en
una fuente m"s relevante, la ta!la 3.< muestra este detalle.
Ta!la 3.<
De cualuier modo, muc)os usuarios de datos no estaran interesados en el detalle de una u otra
ta!la ' preferiran una condensacin estricta de los mismos^ para ello tendremos ue dividir con
cuidado la escala de informacin en clases ue no se traslapen tomando notas de cuantas
o!servaciones caigan en cada clase ' constru'endo entonces una ta!la so!re estas !ases.
6onscierne a la opinin personal, juzgar cuantos de estos grupos de datos colectivamente
e*)austivos ' mutuamente e*clusivos, llamados clases, sirven mejor al o!jetivo de claridad.
Dic)o juicio vara con la naturaleza de los datos sin ela!orar en cuestin.
&i los datos corresponden a una varia!le cualitativa, por ejemplo tipos de negocios, la cantidad de
categoras cualitativas QQ propiedades sociedades o corporacionesQQ puede apro*imarse m"s a una
clase pero a un entonces e*isten alternativas. &e podran com!inar o!servaciones so!re
propiedades ' sociedades, enumerar datos por separado por empresas peueHas medianas '
grandes.
#os datos ue corresponden a varia!les cuantitativas discretas, como el n5mero de televisores
propiedad de una familia, pueden, an"logamente, clasificarse con !ase al n5mero de posi!ilidades
discretas. #as familias ue no tengan televisor se pueden contar por separado de las ue tienen
una, dos, o m"s, pero, repetimos son posi!ilidades diferentes de clasificar, tam!in se podra
com!inar los conteos de familias ue tiene dos o m"s aparatos.
Por 5ltimo, los datos relacionados con las varia!les cuantitativas continuas, como es el caso del
tonelaje producido por las empresas de la industria del acero, pueden clasificarse del modo ue
m"s convenga. &iempre ue la amplitud de la materia escogida lo permita, la ma'ora de los
practicantes recomiendan entre ? ' <; clases, un n5mero menor sacrifica muc)os detalles ' un
n5mero m"s grande retiene demasiados.
7lgunos estadsticos gustan de usar la regla de &turgess para determinar el n5mero de clases, G.
&eg5n esta regla, G L . R 3.3 log n , en donde n es igual al tamaHo de conjuntos de datos. En
nuestro ejemplo, 6on n L .;; ' log .;; L < , esto viene a ser G L . R 3.3 (<) L /.0 , lo ue podra
redondearse a / u \. 6omo se demostrar", raras veces es desea!le aplicar ciegamente dic)a regla
fija.
Para el caso de datos cuantitativos tam!in se recomienda ela!orar un anc)o de clase igual para
todas las clases, porue facilita las comparaciones entre clase as como el c"lculo de valores de
resumen.
&i tentativamente decidiramos condensar los datos de la ta!la 3.< en / clase de anc)o igual
( numero sugerido por la regla de &turgess ), podramos calcular.
.alor ma/or - ma/or menor en el con0un$o de da$os
,nc"o de clase a#rox!mado = --------------------------------------------------
(1mero deseado de clases
5423 - (-1060)
= -----------------
7
= '261

12 clase 3 -1100 a menos de -200
22 clase 3 -200 a menos de 700
32 clase 3 700 a menos de 1600
42 clase 3 1600 a menos de 2500
52 clase 3 2500 a menos de 3400
62 clase 3 3400 a menos de 4300
72 clase 3 4300 a menos de 5200
&2 clase 3 5200 a menos de 6100
Terminaramos con oc)o clases de anc)ura idntica ' )a!ramos satisfec)o am!as
recomendaciones$ n5mero desea!le de clase e igualdad de anc)os.
Es dudoso ue nuestra creacin de clases sea la apropiada o!servando la distri!ucin de valores
en la ta!la 3.<, as terminaramos con 3 o!servaciones en la primera clase, una segunda clase
repleta con ?/ o!servaciones, la tercera con </ ' slo .3 en las cinco 5ltimas clases (ninguna en
la seis ni en la siete). 7u es donde entra en juego un !uen juicio.
7l notar ue la ma'or parte de las o!servaciones caen entre los lmites cero ' <?;; podramos
dividirlos en cinco clases iguales ' luego poner dos clases m"s grandes en cualuier e*tremo de
la distri!ucin, como lo ilustra la columna uno de la ta!la 3.\. Entonces estaramos listos para
tomar nota del n5mero total de o!servaciones ue caen en cada una de nuestras clases, este
procedimiento ser" f"cil con la a'uda de la ta!la 3.< ' dara los n5meros de la columna tres de la
ta!la 3./.
Ta!la 3.\
6omo indica la Ta!la anterior, el n5mero a!soluto de o!servaciones ue caen en una clase se
conoce como la frec3encia absol3ta de clase. Este concepto, a su vez, da lugar a una definicin
importante$
8n resumen ta!ular, de un conjunto de datos, ue muestre los n5meros a!solutos de
o!servaciones ue caen en cada una de varias clases colectivamente e*)austivas ' mutuamente
e*clusivas, se llama distri!ucin de frecuencia a!soluta.
#os datos de las columnas una ' tres de la ta!la 3.\, como grupo, son un ejemplo. Es difcil ue
esta informacin sucinta puede )a!erse derivado, en forma igualmente r"pida, de los datos sin
ela!orar de la ta!la 3.., incluso )a!ra sido menos posi!le si los datos sin ela!orar fueran muc)o
m"s, como sucede a menudo (e*cepto en li!ros de te*to).
6A 1I*+-IB7CION 10 <-0C70NCIA* -06A+I?A
#a distri!ucin de frecuencias estudiada )asta au, se conoce como a!soluta porue est" !asada
en el conteo de n5meros a!solutos de o!servaciones en cada clase. &in em!argo tam!in se
pueden determinar las fracciones o proporciones de todas las o!servaciones ue caen en varias
clases. 6ualuiera de dic)as proporciones es una frecuencia relativa de clase ' es la razn entre el
n5mero de o!servaciones de un clase en particular ' el n5mero total de o!servaciones )ec)as. En
consecuencia, podemos o!servar otro concepto importante$
8n resumen ta!ular, de un conjunto de datos ue muestre las proporciones de todas las
o!servaciones ue caigan en cada una de varias clases colectivamente e*)austivas ' mutuamente
e*clusivas, se llama distrib3cin de frec3encias relati>a.
050.26O 8se los datos de la ta!la 3.\ para crear una distri!ucin de frecuencias relativa.
*O67CION Pease la ta!la 3.>^ note ue una computadora puede producir la respuesta deseada
(columna tres) una vez ue se le )a'an introducido lmites de clase ' frecuencias a!solutas
(columnas una ' dos).
Ta!la 3.>
Para un ejemplo m"s mundano considrese la ta!la 3..;, ue muestra distri!uciones de
frecuencias )ipotticas de la composicin racial ' se*ual de la fuerza la!oral en una sola empresa
' en toda la industria nacional.
Ta!la 3..;
1.&.1 Distribuciones num.ricas.
1.&. Distribuciones cate*ricas.
1.&." Distribuciones acumuladas.
6A 1I*+-IB7CION 10 <-0C70NCIA* AC7.76A+I?A.
&lo cuando las varia!les son cuantitativas se puede determinar una frec3encia ac3m3lati>a de
clase como la suma de las frecuencias de clase (a!solutas o relativas) para todas las clases,
empezando en cualuier e*tremo de la distri!ucin de frecuencias. En consecuencia encontramos
otro concepto crucial$
8n resumen ta!ular, de un conjunto de datos, ue muestre para cada una de varias clases
colectivamente e*)austivas ' mutuamente e*clusivas el n5mero a!soluto o proporcin de
operaciones ue sean menores o iguales ue los lmites superiores de las clases en cuestin (tipo
#E), o ue sean ma'or o iguales a sus lmites inferiores (tipo ME), se llama distrib3cin de
frec3encias ac3m3lati>a.
050.26O 8se los datos de la ta!la 3... para crear una distri!ucin de frecuencias
acumulativas del tipo #E, luego interprete el resultado.
Ta!la 3...
*O67CION Pease la ta!la 3..<. 7dvierta como la anotacin encerrada en un circulo, en la
columna 3, indica ue /0 compaHas tuvieron utilidades menores de mil millones ' cuando
muc)o fuero iguales al lmite superior de clase de solo menos de mil millones, mientras ue la
anotacin dentro del crculo, en la columna ?, muestra ue un \?@ de empresas generaron
utilidades menores de .?;; millones. Ftese tam!in ue una computadora a la ue se le
introduzcan los datos de la columna . ' <, puede al instante producir los resultados de la columna
3 ' ?.
Ta!la 3..<
2-OB60.A 6on los datos de la ta!la 3... ela!ore una distri!ucin de frecuencias
acumulativas del tipo ME, luego interprete resultados.
*O67CION Pease la ta!la 3..3, donde la anotacin encerrada en un crculo, en la columna 3, se
seHala ue <1 compaHas tuvieron utilidades ma'ores o iguales a mil millones, mientras ue la
anotacin dentro del crculo, de la columna ? , indica ue un ?0@ generaron utilidades de al
menos ?;; millones. Tam!in au a una computadora se le introdujeron los datos de la columna
. ' < ' al instante produjo los resultados de las columnas 3 ' ? .
Ta!la 3..3
1.&.# Distribuciones porcentuales.
CURVAS DE FRECUENCAS
Una curva de frecuencias es un polgono de frecuencias suavizado.
EJEMPLO La figura 1-3 es una curva de frecuencias de la distribucin de salarios
semanales de la tabla 1.2.
En trminos de asimetra, una curva de frecuencias puede ser: 1) asimtrica negativa:
no simtrica con la ..cola- a la izquierda; 2) asimtrica positiva: no simtrica con la
"cola" a la derecha, o 3) simtrica.
Fig. 1-3
EJEMPLO El concepto de asimetra de las curvas de frecuencias se ilustra
grficamente en la figura 1-4.
En trminos de curtosis, una curva de frecuencias puede ser: 1) platicrtica: plana, con
las observaciones distribuidas en forma relativamente pareja entre las clases; 2)
leptocrtica: afilada, con las observaciones concentradas en un estrecho rango de
valores, o 3) mesocrtica: ni plana ni afilada en trminos de la distribucin de los
valores observados.
Fig. 1-4
EJEMPLO En la figura 1-5 aparecen los diversos tipos de curvas de frecuencias en
trminos de curtosis.
Fig. 1-5
http://www.universidadabierta.edu.mx/SerEst/Apuntes/VelascoRoberto_MetodEstad.htm
1.&.$ Distribuciones porcentuales acumuladas.
Una distribucin de frecuencias acumuladas identifica el nmero acumulado de
observaciones incluidas bajo el lmite exacto superior de cada clase de la distribucin.
Las frecuencias acumuladas de una clase pueden determinarse sumando las
frecuencias observadas de esa clase a las frecuencias acumuladas de la clase anterior.
EJEMPLO El clculo de las frecuencias acumuladas se ilustra en la tabla 1.3.
Tabla 1.3 Clculo de las frecuencias acumuladas de los datos de salarlos semanales
de la tabla 1.2
La grfica de una distribucin de frecuencias acumuladas se llama ojiva. En el caso de
distribuciones acumuladas del tipo "y menor que", esta grfica indica las frecuencias
acumuladas bajo cada lmite exacto de clase de la distribucin de frecuencias. Si esa
grfica de lneas se suaviza, se obtiene la curva llamada ojiva.
EJEMPLO En la figura 1-6 se observa una ojiva de la distribucin acumulada de la
tabla 1.3.
Fig.1-6
http://www.universidadabierta.edu.mx/SerEst/Apuntes/VelascoRoberto_MetodEstad.htm
1.3 T.cnicas de a*rupacin de datos.
1.3.1 ,mites de clase.
Llamamos lmites de clase a los valores que definen los extremos de un intervalo.
Por ejemplo: el intervalo 0 a 10 aos, tiene como lmites a los valores 0 10!
1.3. 2an*o de clase.
1.3." +ronteras de clase.
1.3.# %arca de clase.
1.3.$ !ntervalo de clase.
En cada una de las clases de una distribucin de frecuencias, los lmites nominales de
clase inferior y superior indican los valores incluidos dentro de la clase. (Vase la
primera columna de la tabla 1.1) A diferencia de ello, los lmites exactos de clase, o
fronteras de clase, son los puntos especficos que sirven para separar clases
adyacentes en una escala de medicin de variables continuas. Los lmites exactos de
clase pueden determinarse identificando los puntos intermedios entre los lmites
nominales de clase superior e inferior, respectivamente, de clases adyacentes. El
intervalo de clase identifica el rango de valores incluidos dentro de una clase y puede
determinarse restando del lmite exacto de clase superior de la clase el lmite exacto de
clase inferior. Cuando no es posible identificar lmites exactos, el intervalo de clase
puede determinarse restando del lmite nominal inferior de la clase el lmite nominal
inferior de la clase adyacente inferior. Finalmente, para ciertos propsitos es comn que
los valores de una clase sean representados por el punto medio de clase, el cual puede
determinarse sumando la mitad del intervalo de clase al lmite exacto inferior de la
clase.
EfEMP#B En la ta!la ..< se presentan los lmites e*actos de clase ' los puntos medios de clase
de la distri!ucin de frecuencias de la ta!la ....
Ta!la ..< &alarios semanales de .;; tra!ajadores no calificados
* En general, en los lmites exactos de clase slo se expresa un dgito
adicional significativo, en comparacin con los lmites nominales de clase.
Sin embargo, dado que en el caso de las unidades monetarias la unidad
de medida ms precisa relativa al "dlar ms cercano" suele definirse
como "el centavo ms cercano", conviene expresar dos dgitos
adicionales.
EfEMP#B 6alculado con los dos mtodos, el intervalo de clase de la primera clase de la ta!la
..< es g<?>.?; g<3>.?; L g<; (resta del lmite e*acto de clase inferior al lmite e*acto de clase
superior de la clase) g<0; Q g<1; L g<; (resta del lmite nominal de clase inferior de la clase al
lmite nominal de clase inferior de la clase ad'acente superior)
Para efectos de clculo, por lo general es deseable que todos los intervalos de clase de
una distribucin de frecuencias dada sean iguales. La siguiente frmula puede
emplearse para determinar el intervalo de clase aproximado por usar:
EJEMPLO En referencia a los datos originales no agrupados que se agruparon en la
tabla 1.1, supongamos que el salario observado ms alto fue de $358 y el salario
observado ms bajo de $242. Dado que el objetivo es disponer de seis clases con
iguales intervalos de clase,
As, el tamao de clase conveniente ms cercano al valor calculado es $20.
En el caso de datos distribuidos en forma notoriamente no uniforme, como los datos del
sueldo anual para una amplia variedad de ocupaciones, pueden ser requeridos
intervalos desiguales de clase. En este caso, los intervalos de clase mayores se utilizan
para los rangos de valores con relativamente escasas observaciones.
http://www.universidadabierta.edu.mx/SerEst/Apuntes/VelascoRoberto_MetodEstad.htm
1.3.& Dia*rama de tallos y 4o5as.
1IA,-A.A* 10 +A66O* C )O5A*
8n tipo de diagrama poco usual, el diagrama de tallos ' )ojas, com!ina las caractersticas de un
conjunto ordenada de n5meros ' el )istograma de frecuencias. 6onsidere seleccionar una muestra
aleatoria simple de \; personas de una lista completa de suscriptores a un !oletn econmico. &i
cada una de ellas fuera entrevistada, podra aduirirse una variedad amplia de informacin,
inclu'endo lo datos encontrados en la ta!la 3..0.
Ta!la 3..0
8na forma de desplegar estos datos es el diagrama de tallos ' )ojas de la siguiente figura. #os
n5meros de dcada posi!les en la edad de los suscriptores est"n dispuestos en una columna a la
izuierda de una lnea vertical, estos primeros dgitos de los n5meros de dos dgitos se llaman
tallos. &u!secuentemente, se inspecciona cada uno de los n5meros en la ta!la 3..0 ' se registra
slo el segundo dgito como la )oja situada a la derec)a de la lnea vertical junto al tallo
apropiado. El resultado es la siguiente figura ' se interpreta as^ el rengln uno indica ue slo un
suscriptor de la muestra es adolescente ' tiene .> aHos. En el rengln dos vemos ue )a!a cinco
suscriptores de m"s de <; aHos, (<;, <;, <., <? ' <>, respectivamente), 4 as sigue.
DAGRAMAS DETALLO Y HOJAS
Un diagrama de tallo y hojas es una modalidad relativamente simple de organizacin y
presentacin de medidas en un formato de grfica de barras jerrquicamente ordenado.
Se trata de una tcnica comn en el anlisis exploratorio de datos. Como su nombre lo
indica, el anlisis exploratorio de datos es un conjunto de tcnicas de anlisis preliminar
de datos para la deteccin de patrones y relaciones. Tambin las distribuciones de
frecuencias y tcnicas grficas asociadas expuestas en las secciones anteriores de
este captulo suelen emplearse con este propsito. En cambio, el anlisis confirmatorio
de datos incluye los principales mtodos de inferencia estadstica. El anlisis
confirmatorio de datos persigue la extraccin de conclusiones estadsticas definitivas
sobre patrones y relaciones presentes en los datos.
Aunque muy semejante a un histograma, un diagrama de tallo y hojas se diferencia de
ste en que es ms fcil de elaborar y en que muestra los valores reales de los datos,
pues los valores especficos no se pierden por efecto de su agrupamiento en clases
definidas. No obstante, esta tcnica slo es aplicable y significativa si el primer dgito de
la medicin, o quiz los dos primeros, sirve efectivamente de base para la separacin
de los datos en grupos. En consecuencia, cada grupo es anlogo a una clase o
categora en una distribucin de frecuencias. Cuando nicamente se usa el primer
dgito para agrupar las medidas, la denominacin "tallo y hojas" alude al hecho de que
el primer dgito es el tallo, mientras que cada una de las medidas con valor a partir de
ese primer dgito pasa a ser una hoja en el contexto de esta representacin.
EJEMPLO En la tabla 1.4 se presenta el puntaje obtenido por 50 estudiantes en un
examen de contabilidad financiera de 100 puntos. La figura 1-7 es el diagrama de tallo y
hojas de ese puntaje. Advirtase que. adems del patrn general del puntaje, tambin
es posible observar el puntaje individual. En la lnea correspondiente al tallo de 6, por
ejemplo, los dos valores de 2 de las hojas representan a los dos puntajes de 62
incluidos en la tabla 1.4.
Tabla 1.4 Puntajes obtenidos por 50 estudiantes en un examen de contabilidad
financiera
Fig. 1-7 Diagrama de tallo y hojas
)ttp$IIJJJ.universidada!ierta.edu.m*I&erEstI7puntesIPelasco2o!ertodMetodEstad.)tm
1.3.3 Dia*rama de Pareto.
DAGRAMAS DE PARETO
Un diagrama de Pareto se asemeja a un histograma, excepto que es una grfica de
barras de frecuencias de una variable cualitativa, no de datos cuantitativos agrupados
en clases. Las barras de la grfica, que pueden representar frecuencias o frecuencias
relativas (porcentajes) se organizan en orden descendente de izquierda a derecha. Esta
disposicin da como resultado la ubicacin de las categoras ms importantes de datos,
segn su frecuencia de ocurrencia, en las posiciones iniciales de la grfica. Los
diagramas de Pareto se usan en el control de procesos para tabular las causas
asociadas con variaciones de causas atribuibles en la calidad del producto del proceso.
Es comn que solamente unas cuantas categoras de causas se asocien con la
mayora de los problemas de calidad, de modo que los diagramas de Pareto permiten
que tanto equipos de trabajadores como gerentes se concentren en las reas ms
importantes en las que se necesitan acciones correctivas.
EJEMPLO Se encontr que los refrigeradores que no fueron aprobados en la
inspeccin final en una planta ensambladora de aparatos elctricos durante el ltimo
mes tenan defectos debidos a las siguientes causas: ensamble, acabado de laca, fallas
elctricas, abolladuras u otras causas. La figura 1-8, obtenida con Minitab, es el
diagrama de Pareto para la representacin grfica tanto de las frecuencias como de las
frecuencias relativas de cada causa de falla en inspeccin. Como puede verse, la gran
mayora de fallas en inspeccin se deben a defectos en el ensamble y el acabado de
laca.
Diagrama de Pareto de: Defectos
Fig. 1-8
http://www.universidadabierta.edu.mx/SerEst/Apuntes/VelascoRoberto_MetodEstad.htm
1.3.' Dia*rama de puntos.
Dia*rama de puntos
Este grfico muestra un conjunto de puntos, que son la interseccin de las frecuencias (representadas en el eje de ordenadas) y de
los valores de la distribucin (representados en el eje de abscisas).
DAGRAMAS DE PUNTOS
Un diagrama de puntos se asemeja a un histograma en el sentido de que consiste en
una representacin grfica de una distribucin de los valores de los datos. Sin embargo,
se diferencia de ste en que los valores se representan individualmente, en lugar de
agruparse en clases. Los diagramas de puntos se aplican preferentemente a pequeos
conjuntos de datos, en cuyo caso no se garantiza el agrupamiento de valores en clases
de una distribucin de frecuencias. Son particularmente tiles en la comparacin de dos
conjuntos de datos diferentes, o de dos subgrupos de un conjunto de datos.
http://www.universidadabierta.edu.mx/SerEst/Apuntes/VelascoRoberto_MetodEstad.htm
1.' -isto*rama.
)I*+O,-A.A 10 <-0C70NCIA*
#as gr"ficas, induda!lemente, son el medio m"s conocido de presentar datos estadsticos. De una
forma u otra, la informacin condensada en cualuier tipo de ta!la tam!in se puede presentar
con a'uda de una gr"fica. Empecemos por ver la gr"fica de una distri!ucin de frecuencias$
8n )istograma de frecuencias es una representacin gr"fica de una distri!ucin de frecuencias
a!soluta o relativa para datos cuantitativos continuos, de modo tal ue las frecuencias de clase,
a!soluta o relativa, se representen por "reas rectangulares en la gr"fica.
)I*+O,-A.A* 2A-A 1I*+-IB7CION0* 10 <-0C70NCIA* AB*O67+A*.
6onsidrese el caso de graficar la informacin contenida en la ta!la 3.\ en un )istograma de
frecuencias^ dic)o )istograma se di!uja en un conjunto de coordenadas rectilneas ' consta de
una serie de rect"ngulos continuos, tam!in conocidos como !arras o columnas, puestos en el eje
)orizontal de modo ue sus !ases corresponden a las clases de anc)os posi!lemente diferentes '
sus "reas a frecuencias de clase.
Es f"cil ver cmo las clases de utilidades de la columna uno en la ta!la 3.\ pueden representarse
en el eje )orizontal, al comenzar en el lmite inferior de la primera clase ' avanzando al lmite
superior de la 5ltima (en consecuencia, el primer rect"ngulo de un )istograma no necesita
empezar en el punto cero). #os anc)os de las clases pueden medirse en trminos de cualuier
patrn convencional. &i como en la ta!la 3.\, la ma'or parte de las clases a!arcan intrvalos de
?;; millones, ese lmite podra usarse tam!in como la unidad de medida. Ftense las marcas
so!re el eje )orizontal de la figura 3.. ue claramente muestran ue la primera clase )a de ser de
tres unidades de anc)o, ue las clases de la dos a la seis ser"n de una unidad de anc)o ' ue la
5ltima clase constar" de seis unidades de anc)o.
Es muc)o m"s difcil determinar u medir en el eje vertical. #as lneas verticales )an de
levantarse en los lmites de clase para formar los lados de los rect"ngulos cu'as "reas de!an
representar frecuencias de clase, pero ade u longitud de!en ser estas lneas%. 8n recordatorio
de geometra !"sica resuelve con rapidez e pro!lema. El "rea de cualuier rect"ngulo es igual a la
!ase por la altura. #a altura, por lo tanto, es igual al "rea dividida entre la !ase, o !ien, en nuestro
caso, frecuencia ("rea) dividida, entre anc)o de clase (!ase). Esta razn entre frecuencia ' anc)o
de clase tam!in se denomina densidad de frecuencia ' es, inevita!lemente, lo ue de!e medirse
en el eje vertical si las "reas de los rect"ngulos del )istograma de!en corresponder a las
frecuencias de clase. Estas relaciones se resumen en la ta!la 3..1, a)ora lea cuidadosamente el
enca!ezado.
Ta!la 3..1
#uego considere la siguiente figura ' advierta como los datos de la columna cuatro en la ta!la
3..1 (' no los datos de la columna dos) se u!ican en el eje vertical. #a primera clase, por
ejemplo, a!arca un intervalo de . ?;; millones^ el anc)o es tres veces la unidad est"ndar de
medicin utilizada. En consecuencia, la frecuencia de clase a!soluta de tres est" !ien
representada por el "rea del primer rect"ngulo si la altura de este se traza como la densidad de
frecuencia de uno. En esta clase grande es pro!a!le ue se encuentre slo una compaHa por
lmite de ?;; millones. Del mismo modo, la 5ltima clase a!arca 3 ;;; millones^ mide seis
unidades de anc)o. Por lo tanto, la frecuencia a!soluta de tres estar" !ien representada por el "rea
del 5ltimo rect"ngulo slo si la altura es igual a .I<. todo lo anterior parece complicado a primera
vista, )e au una !uena razn para todo este ajuste. &i las alturas de todas las columnas del
)istograma no se di!ujaran con el mismo patrn (como de ?;; millones), las columnas no seran
compara!les ' presentaran una impresin visual falsa. En nuestro caso, di!ujar los rect"ngulos
primero ' 5ltimo con una altura de tres, como la primera ' 5ltima anotaciones de la columna dos,
ta!la 3..1, )ara parecer a estas dos clases m"s importantes de los ue son en realidad. Por el
lmite de ?;; millones, diramos ue estos dos clases m"s importantes de lo ue son en realidad.
Por el lmite de ?;; millones, diramos ue estos dos (campos( est"n mu' escasamente po!lados.
)I*+O,-A.A* 2A-A 1I*+-IB7CION0* 10 <-0C70NCIA* -06A+I?A* Estos se
constru'en con los mismos principios ue los de distri!uciones a!solutas. 8n )istograma
construido so!re las !ases de la s columnas . ' 3 de la ta!la 3..;, por ejemplo, tendra la misma
forma como la ue se muestra en la figura anterior, sin em!argo, las le'endas del eje vertical (',
por lo tanto, las partes altas de las columnas) cam!iaran para reflejar el )ec)o de ue las
proporciones de compaHas, m"s !ien ue los n5meros a!solutos de ellas, se medan por el patrn
de ?;; millones.
+I2O* CO.7N0* 10 )I*+O,-A.A* Da' relativamente pocos tipos comunes de
)istogramas^ ' entre uno ' otro, todos los conjuntos de datos cuantitativos pueden ajustarse en
alguna forma de distri!ucin de frecuencias ue sea la idnea en el rendimiento esperado. #a
siguiente figura deja ver algunas de las formas m"s comunes de )istogramas.
El )istograma del tipo$
a. ilustra la distri!ucin de frecuencias relativa de los di"metros reales de tu!os )idr"ulicos,
supuestamente de un pie de anc)o, producidos durante un da. Este tipo de )istograma
descri!e una distri!ucin normal ue es por lo com5n de muc)as po!laciones (pero no
todas) de mediciones fsicas.
!. muestra una vez m"s las utilidades de las multinacionales de la figura <.<. Esta vez se
indica la proporcin del "rea total del )istograma tomada por cada columna, ue no de!e
confundirse con las alturas de columna dadas en la figura <.<. Esta forma corresponde a la
clase general distri!uciones sesgadas, en las ue )a' relativamente pocas o!servaciones
peueHas concentradas en un lmite angosto a!ajo de una clase dominante, mientras ue
o!servaciones relativamente m"s grandes se e*tienden so!re un lmite amplio de valores
por encima de esa clase.
c. representa las distancias por unidad de volumen de gasolina recorridas por automviles
nuevos, as como el tipo opuesto de distri!ucin sesgada. En este caso, los valores m"s
peueHos se e*tienden de manera amplia !ajo un lmite relativamente importante, pero es
mu' difcil ue )a'a o!servacin alguna por arri!a de l. Esta distri!ucin est" sesgada a
la izuierda.
d. descri!e una distri!ucin e*ponencial. Dic)a representacin es tpica de po!laciones ue
e*)i!en cam!ios con el tiempo, como la vida 5til de la mauinaria. 8na proporcin
relativamente grande de m"uinas duran un aHo, por ejemplo, pero la proporcin de las
ue re!asan ese tiempo por uno, dos, tres o m"s aHos se )ace cada vez m"s peueHa.
e. por 5ltimo, descri!e una distri!ucin rectangular o uniforme. Para un tra!ajo de
construccin, supongamos la madera tiene ue comprarse en largos de oc)o pies como
resultado de ello, se produce un lote de desperdicio donde cada una de las piezas mide
menos de catorce pulgadas. Proporciones casi iguales se encuentran en cada una de las
clases entre cero ' catorce pulgadas.
-isto*rama
El Histograma representa la frecuencia con la que se presentan los diferentes grupos de datos de la variable objeto de estudio. Es
un conjunto de rectngulos, los cuales representan a cada una de las clases. En el eje de abscisas se representan las clases
definidas y en el eje de ordenadas la frecuencia de cada una de ellas.
La amplitud del intervalo de las clases se halla dividiendo el Recorrido entre el nmero de clases.
El Histograma proporciona mucha informacin respecto a la estructura de los datos. Por tanto, es importante analizar la situacin
del centro del Histograma y el ancho del mismo que definen la tendencia central y la variabilidad del conjunto de datos
respectivamente, as como la forma del Histograma que identifica algunas de las caractersticas del proceso en estudio.
< Distribucin Sim.trica Unimodal@ Se caracteriza porque cada una de las observaciones equidistantes al mximo central, tienen
aproximadamente la misma frecuencia. Es tpico de la mayora de los procesos industriales.
< Distribucin :sim.trica@ Es tpica de datos econmicos, y de forma general en distribuciones de renta, consumo de electricidad,
poblacin, tamao de empresas,...
< Distribucin Trian*ular: Es totalmente asimtrica y se presenta al estudiar tiempos entre averas, entre llegadas, entre
accidentes, o en fabricacin donde existe la imposibilidad de superar un valor o bien se ha realizado una seleccin de 100% de
alguna caracterstica.
< Distribucin )imodal@ Se presenta como dos distribuciones muy separadas. Suele aparecer cuando se han recopilado datos a
partir de dos procesos distintos, tales como las caractersticas de una pieza suministrada por dos proveedores diferentes.
< Distribucin 2ectan*ular@ Presenta gran variabilidad. Aparece al mezclar datos de Distribuciones Simtricas Unimodales.
< Distribucin Truncada@ Aparece al presentar datos de procesos que no cumplen las especificaciones, despus de pasar un
control de calidad. Puede ser, tambin un sntoma de una eleccin de un nmero de clases menor al adecuado.
< Distribucin sin Datos en la Kona Central@ Suele aparecer cuando los datos corresponden a un material de mala calidad, y el
"material bueno" ha sido seleccionado previamente.
< Distribucin con Picos en las Colas@ Es una representacin tpica cuando se han sometido a un reproceso, los elementos que
en un primer control cayeron fuera de tolerancias.
)ttp$II)tml.rincondelvago.comIestadisticad</.)tml
1.'.1 Dia*rama de barras.
Dia*rama de barras
Presenta los valores posibles de los datos sin agrupar y sus frecuencias absolutas o relativas. En el eje horizontal aparecen los
datos tratados y en el eje vertical las frecuencias. Sobre el eje horizontal se traza un segmento de longitud proporcional al valor de
las frecuencias.
Diagrama de barras3
6onsiste en levantar, para cada valor de la varia!le, una !arra cu'a altura sea su frecuencia
a!soluta o relativa, dependiendo de la distri!ucin de frecuencias ue estemos representando.
Ejemplo:
As, la representacin grfica de la distribucin de frecuencias del ejemplo del n de hijos ser:
Diagramas de barras. &e utiliza para representar datos cualitativos ' cuantitativos, con
datos de tipo discreto. En el eje * se representan los datos ordenados en clases mientras
ue en el eje y se pueden representar frecuencias a!solutas o relativas.


primera
t ercera
quint a
0
5
10
15
20
25
+
r
e
c
u
e
n
c
i
a
s
clases
Grfica o diagramas de barras
primera segunda tercera cuarta quinta sexta
,-A<ICA* 10 BA--A* C ,-A<ICA* 10 CO67.NA*
7)ora vamos a tra!ajar en dos tipos de gr"ficas ue son, uiz", los m"s comunes ue se
encuentran$ son igualmente efectivos en la presentacin de datos so!re varia!les cualitativas '
cuantitativas.
8na serie de !arras )orizontales, cu'as longitudes son proporcionales a los valores a ser
descritos, se llama gr"fica de !arras^ una serie semejante de columnas verticales se conoce como
gr"fica de columnas. Por lo general, las !arras o las columnas no son contiguas pero en ocasiones
se di!ujan )asta tocarse entre s.
050.26O 6onsidere los datos so!re Mountain 7vation, Enc., de la ta!la 3..?. Elustre la
composicin de empleados por raza ' se*o en$ (a) una gr"fica ordinaria de !arras, (!) una gr"fica
ordinaria de columnas, (c) una gr"fica de columnas componenentes ' (d) una gr"fica de columnas
agrupadas.
Ta!la 3..?
*O67CION Pea a la siguiente ' ver" ue la ma'or parte de programas de computadora puede
di!ujar gr"ficas como las citadas arri!a.
DAGRAMAS DE BARRAS Y GRFCAS DE LNEAS
Una serie de tiempo es un conjunto de valores observados, tales como datos de
produccin o ventas, durante una serie de periodos temporales secuencialmente
ordenados. Para efectos de representacin grfica, tanto los diagramas de barras como
las grficas de lneas son de gran utilidad. En un diagrama de barras, una serie de
barras representa cantidades de una serie de tiempo.
EJEMPLO En el diagrama de barras de la figura 1-9 se recoge la informacin de
ganancias netas (en millones de dlares) de un importante banco comercial durante
una secuencia de aos codificados.
En un diagrama de barras de componentes se marcan subdivisiones en las barras del
diagrama. Por ejemplo, cada barra de la figura 1-9 podra subdividirse en distintas
partes (tal vez diferenciadas con colores) para indicar la contribucin relativa de cada
segmento de la empresa a las ganancias netas de cada ao.
Una grfica de lneas contiene cantidades de series de tiempo unidas entre s por
segmentos lineales.
Fig. 1-9 Diagrama de barras.
EJEMPLO Los datos de la figura 1-9 se presentan en forma de grfica de lneas en la
figura 1-10.
Fig. 1-10 Grfica de lneas.
72L+!C:S DE C622!D:S
Una grfica de corridas es una grfica de valores de datos en el orden secuencial
temporal en que fueron observados. Los valores trazados pueden ser valores
observados individuales o valores compendiados, como en el caso de una serie de
medias muestrales. Cuando a una grfica de este tipo se le agregan los lmites inferior y
superior del muestreo de aceptacin, se le llama grfica de control. La determinacin de
esos lmites.
EJEMPLO En la figura 1-11 se muestra una grfica de corridas de la secuencia de
pesos medios de muestras de cuatro paquetes de papas fritas tomadas en 15
momentos distintos con el mtodo de muestreo de subgrupos racionales. La secuencia
de pesos medios de las muestras fue la siguiente: 14.99, 15.08, 15.05, 14.95, 15.04,
14.91, 15.01, 14.84, 14.80, 14.98, 14.96, 15.00, 15.02, 15.07 y 15.02 onzas. La
especificacin de peso neto promedio por empacar en el proceso es de 15.00 onzas. La
determinacin de si considerar o no como una desviacin significativa a cualquiera de
las desviaciones de estas medias muestrales.
Fig. 1-11 Grfica de corridas.
)ttp$IIJJJ.universidada!ierta.edu.m*I&erEstI7puntesIPelasco2o!ertodMetodEstad.)tm
1.'. Pol*ono de frecuencias.
Pol*ono de frecuencias
Es un grfico que une los puntos que representan la interseccin de las marcas de clase con su frecuencia correspondiente.
Cabe mencionar tambin los grficos de sectores, de rectngulos, pictogramas, etc.
Pol"gono de frec$encias ac$m$ladas3
&e utiliza para representar distri!uciones de frecuencias (relativas o a!solutas) acumuladas.
6onsiste en representar la gr"fica de una funcin ue una por segmentos las alturas
correspondientes a los e*tremos superiores de cada intervalo, tengan o no todos igual amplitud,
siendo dic)a altura igual a la frecuencia acumulada, dando una altura cero al e*tremo inferior del
primer intervalo ' siendo constante a partir del e*tremo superior del 5ltimo.
Ejemplo:
As, para el ejemplo de los Niveles de Colinesterasa, el polgono de frecuencias relativas
acumuladas tendr una representacin grfica de la forma:
Pol*onos de frecuencias.
Son otra forma de representar grficamente distribuciones tanto de frecuencias simples como relativas.
Para construir un polgono de frecuencias sealamos stas en el eje vertical y los valores de la variable
que estamos midiendo en el eje horizontal. A continuacin, graficamos cada frecuencia de clase trazando
un punto sobre su punto medio y conectamos los resultantes puntos sucesivos con una lnea recta para
formar un polgono.
Se aaden dos clases, una en cada extremo de la escala de valores observados. Estas dos nuevas
clases que contienen cero observaciones permiten que el polgono alcance el eje horizontal en ambos
extremos de la distribucin.
Un polgono de frecuencias es slo una lnea que conecta los puntos medios de todas las barras de un
histograma. Por consiguiente, podemos reproducir el histograma mediante el trazado de lneas verticales
desde los lmites de clase y luego conectando tales lneas con rectas horizontales a la altura de los
puntos medios del polgono.
Un polgono de frecuencias que utiliza frecuencias relativas de puntos de dato en cada una de las clases,
en lugar del nmero real de puntos, se conoce como polgono de frecuencias relativas. Este polgono
tiene la misma forma que el polgono de frecuencias construido a partir del mismo conjunto de datos, pero
con una escala diferente en los valores del eje vertical.
Ventajas de los histogramas:
Los rectngulos muestran cada clase de la distribucin por separado.
El rea de cada rectngulo, en relacin con el resto, muestra la proporcin del nmero total de
observaciones que se encuentran en esa clase.
Ventajas de los polgonos de frecuencias:
Es ms sencillo que su correspondiente histograma.
Traza con ms claridad el perfil del patrn de datos.
Se vuelve cada vez ms liso y parecido a una curva conforme aumentamos el nmero de clases
y el nmero de observaciones.
Un polgono alisado mediante el aumento de clases y de puntos de dato se conoce como curva de
frecuencias.
Polgonos de frecuencia:
El polgono de frecuencias es una representacin grfica de la distribucin de frecuencias
que resulta esencialmente equivalente al histograma y se obtiene uniendo mediante
segmentos los centros de las bases superiores de los rectngulos del histograma (es decir,
los puntos de las marcas de clase).
Vase que para cerrar la figura, se une la lnea quebrada con lo que sera la marca de clase
(sobre la superficie del e!e hori"ontal) anterior a la primera y posterior a la #ltima registrada
Polgono de frecuencias


7lternativo al )istograma de frecuencias podemos representar la informacin a travs de los
llamados polgonos de frecuencias. Estos se constru'en a partir de los puntos medios de cada
clase. #a utilizacin de los puntos medios o marcas de clase son llevados al escenario gr"fico
mediante la utilizacin de los polgonos de frecuencias. &e constru'e uniendo los puntos medios
de cada clase localizados en las tapas superiores de los rect"ngulos utilizados en los )istogramas
de las gr"ficas. &u utilidad se )ace necesaria cuando desean destacarse las varia!les de tendencia
central, como son media, modas ' medianas.

Poligonos de frecuencias
0
5
10
15
20
25
pr i mer a ter cer a qui nta
clases
+
r
e
c
u
e
n
c
i
a
s
primera segunda tercera
cuarta quinta sexta
06 2O6I,ONO 10 <-0C70NCIA* C 6A C7-?A 10 <-0C70NCIA*
#a siguiente definicin sugiere dos formas alternas de representar gr"ficamente una distri!ucin
de frecuencias a!soluta o relativa.
8na representacin gr"fica de una distri!ucin de frecuencias a!soluta o relativa, de una varia!le
cuantitativa continua ue aparezca como una figura de muc)os lados, se llama polgono de
frecuencias^ si se da con una curva suave se denomina curva de frecuencias.
Para di!ujar un polgono de frecuencias se usa el mismo conjunto de coordenadas ue para el
)istograma, pero esta vez la marca de clase, o punto medio de cada anc)o de clase, se identifica
como el promedio de los lmites de clase ' se pone un punto arri!a de ella a una altura igual a la
densidad de frecuencias a!soluta o relativa, luego se unen los puntos mediante lneas rectas. Para
completar el polgono, tam!in se di!ujan lneas rectas desde los puntos por encima de la primera
' 5ltima marca de clase, respectivamente, a puntos en el eje )orizontal ue se encuentren a la
mitad de la longitud de la unidad est"ndar de medida a!ajo del m"s !ajo o arri!a del m"s alto
lmite de clase. #a figura siguiente indica cmo el )istograma (a) de la figura anterior puede
convertirse en un polgono.
#a forma de un )istograma tam!in puede apro*imarse por una curva de frecuencias suavizada.
Esta apro*imacin puede lograrse mediante tcnicas matem"ticas o gr"ficas ', por lo general,
sirve al propsito de eliminar irregularidades como resultado del error de muestreo de un
)istograma ue descri!a informacin reunida en una encuesta muestral. #a figura siguiente ilustra
cmo el )istograma (c) puede convertirse en una curva suave de frecuencias.
1.'." 65ivas.
Una distribucin de frecuencias acumuladas nos permite ver cuntas observaciones estn por encima de
ciertos valores, en lugar de hacer un mero registro del nmero de elementos que hay dentro de los
intervalos.
La grfica de una distribucin de frecuencias acumuladas se conoce como ojiva.
En ocasiones, la informacin que utilizamos se presenta en trminos de frecuencias acumuladas
"mayores que". La ojiva adecuada para tal informacin tendra una inclinacin hacia abajo y hacia la
derecha, en lugar de tener una inclinacin hacia arriba y a la derecha.
Podemos construir una ojiva de una distribucin de frecuencias relativas de la misma manera en que
trazamos la ojiva de una distribucin de frecuencias absolutas. Slo habr un cambio: la escala del eje
vertical.
Del ordenamiento de datos podemos construir distribuciones de frecuencias. A partir de las distribuciones
de frecuencias podemos construir distribuciones de frecuencias acumuladas. A partir de stas podemos
trazar una ojiva. Y de esta ojiva podemos aproximar los valores que tenemos en el ordenamiento de
datos. Sin embargo, no podemos recobrar de manera normal los datos originales exactos a partir de
cualquiera de las representaciones grficas que hemos analizado.
Ojiva:
$a misma idea de unir los centros de las bases superiores de los rectngulos de la
distribucin del histograma de frecuencias acumuladas, da lugar al polgono de frecuencias
acumuladas u o!iva.
O5I?A*
6ualuier distri!ucin de frecuencias acumulativa, como las o!servadas en las ta!las 3..< ' 3..3,
tam!in puede graficarse$
8na representacin gr"fica de una distri!ucin de frecuencias acumulativa (tipo #E o tipo ME) se
llama ojiva.
En el caso de una distri!ucin de frecuencias acumulativa del tipo menor o igual ue (#E), cada
frecuencia acumulativa de clase se grafican en forma vertical arri!a del lmite superior de la clase
correspondiente ue, a su vez se mide en forma )orizontal. El panel (a) de la figura anterior, por
ejemplo, muestra una ojiva !asada en las columnas uno ' tres de la ta!la 3..<. #a anotacin en el
crculo en la columna tres a)ora aparece como punto !$ /0 compaHas tuvieron utilidades de
menos de . ;;; millones.
En el caso de una distri!ucin de frecuencias acumulativa del tipo ma'or o igual ue (ME), cada
frecuencia acumulativa de clase se gr"fica en forma vertical arri!a del lmite inferior de la clase
correspondiente. El panel (!) de la figura anterior, por ejemplo, muestra una ojiva !asada en las
columnas uno ' tres de la ta!la 3..3. El n5mero dentro del crculo en la columna tres aparece
a)ora como punto e$<1 empresas tuvieron utilidades de . ;;; o m"s millones.
1.'.# 7rficas circulares.
Diagrama de sectores3
Est" representacin gr"fica consiste en dividir un crculo en tantos sectores circulares como
modalidades presente el car"cter cualitativo, asignando un "ngulo central a cada sector circular
proporcional a la frecuencia a!soluta n
i
, consiguiendo de esta manera un sector con "rea
proporcional tam!in a n
i
.
Ejemplo:
As, los ngulos que corresponden a las cuatro modalidades de la tabla adjunta sern:
Nmero de casos ngulo(grados)
Rehusaron ciruga 26 234
Rehusaron radiacin 3 27
Empeoraron por
una enfermedad
ajena al cncer
10 90
Otras causas 1 9
Y su representacin en un diagrama de sectores ser:
Diagrama de sectores
Este tipo de diagramas puede ser de dos tipo, se puede considerar una figura geomtrica en la ue
la informacin se distri!u'e dentro de la figura como puede ser una dona o un anillo en el ue
cada porcin dentro de la figura representa la informacin porcentual del total de datos. #a
segunda opcin es la utilizacin de pasteles en los ue una porcin del pastel determinada por
sectores individuales la informacin para ese sector especifico.
Frecuencias a travs de sectores, los cuales
pueden ser como el que se muestra a continuacin
16%
10%
15%
21%
11%
15%
5%
4%
3%
primera segunda tercera cuarta quinta
sexta septima octava novena
DAGRAMAS CRCULARES
Un diagrama circular es una figura en forma de pastel cuyas piezas representan
divisiones de una cantidad total, como podra serio la distribucin de las ventas en
dlares de una compaa.
Un diagrama circular de porcentajes es aquel cuyos valores han sido convertidos a
porcentajes para facilitar su comparacin.
EJEMPLO La figura 1-12 es un diagrama circular en el que se describen los ingresos y
el porcentaje de ingresos totales de Xerox Corporation durante un ao reciente de
acuerdo con las categoras actividad principal (que Xerox denomina "zona de
importancia decisiva) mercados en crecimiento, pases en desarrollo y nichos de
oportunidad.
Fig. 1-12 Diagrama circular.
)ttp$IIJJJ.universidada!ierta.edu.m*I&erEstI7puntesIPelasco2o!ertodMetodEstad.)tm
1.8 Distribuciones muestrales.
Considrese que todas las posibles muestras de tamao " que pueden extraerse de una poblacin dada
(con o sin remplazamiento).
Para cada muestra se puede calcular un estadstico, tal como la media, la desviacin tpica, etc., que
variar de una muestra a otra. De esta forma se obtiene una distribucin del estadstico que se conoce
como distribucin muestral.
Si por ejemplo, el estadstico de que se trata es la media muestral,la distribucin se conoce como
distribucin muestral de medias o distribucin muestral de la media. Anlogamente se obtendran
las distribuciones muestrales de las desviaciones tpicas, varianzas, medianas, proporciones, etc.
Para cada distribucin muestral se puede calcular, la media, desviacin tpica, etc. As, pues, se puede
hablar de la media y desviacin de la distribucin muestral de medias, etc.
Si se extrae un nmero de una urna, se puede volver o no el nmero a la urna antes de realizar una
segunda extraccin. En el primer caso, un mismo nmero puede salir varias veces, mientras que en el
segundo un nmero determinado slo puede salir una vez. El muestreo, en el que cada miembro de la
poblacin puede elegirse ms de una vez, se llama muestreo con remplazamiento. mientras que si
cada miembro no puede ser elegido ms de una vez, se llama muestreo con remplazamiento.
D*%+(*,-.*/0 M-&%+('L D& L' M&D*' 1V'(*'02' ./0/.*D'
3 D&%./0/.*D'4
Supongase que una muestra aleatoria de n observaciones se ha extrado de alguna poblacin y que se
ha calculado, digamos, para estimar la media de la poblacin. Debera ser claro que, si tomamos una
segunda muestra aleatoria de tamaon de esta poblacin, sera bastante irrazonable esperar el mismo
valor para , y si tomamos varias muestras ms probablemente ninguna de las sera igual a otra. Las
diferencias entre tales se atribuyen generalmente al azar, y esto trae a colocacin importantes
problemas relativas a su distribucin, en especial los relacionados con la amplitud de sus fluctuaciones.
A manera de ejemplo suponga que 50 muestras aletorias de tamao n =10 se extraen de una poblacin
que tiene la distribucin uniforme discreta
El muestreo es con reempla1o, por as decirlo; de modo que estamos muestreando de una poblacin
infinita. Una forma conveniente de obtener estas muestras es utiliza una tabla de nmeros aleatorios,
haciendo que cada muestra conste de 10 dgitos consecutivos de renglones o columnas aleatoriamente
escogidos. De esta manera, tenemos 50 muestras cuyas medias son
1.1 3.< ?.; 3.? 1.. 1.1 3.0 0.? ?.3 1.1
3.. ?.3 3.\ 1.3 3.3 ?.; 1.> 1.\ 3.. ?.3
3.; 3.; 1.0 ?.\ 1.0 1.; 3./ ?.< 3./ 3.\
?.3 ?.? 1.\ 0.1 1.> 0.? 3.? 1.? 1.> ?.3
3.0 <./ 1.; ?.; <.0 1.< 1.1 ?.0 1./ 1.3
Al agruparlas es una distribucin con las clases 2.0 - 2.9, 3.0 - 3.9, ..., y 6.0 - 6.9, obtenemos
<rec3encia
<.; Q <.> <
3.; Q 3.> .1
1.; Q 1.> .>
?.; Q ?.> .<
0.; Q 0.> 3
Total $C
En esta distribucin y en su histograma, es obvio que la distribucin de las medias tiene claramente la
forma de campana , a pesar que la poblacin misma tiene una distribucin uniforme. Aqu surge la
pregunta de s en realidad nuestro resultado es representativo; esto es, s obtendramos distribuciones
similares al repetir el experimento otra vez.
Para responder esto, tendremos que investigar la distribucin muestral terica de la media, la cual en
el ejemplo nos da las posibilidades de obtener las medias de 2.0 a 2.9, de 3.0 a 3.9, ..., de 6.0 a 6.9 y
quizs para valores menores de 2.0 o mayores que 6.9. A continuacin nos referiremos a algunos
teoremas que dan las expresiones para la y la varianza de distribuciones muestrales de la
media:
!eorema"# Si una muestra aleatoria de tamao n se elige de una poblacin que tiene la media y
varianza
2
, entonces es un valor de una variable aleatoria cuya distribucin tiene la media . Para
muestras tomadas de poblaciones infinitas la varianza de esta distribucin es ; para muestras
extradas de poblaciones finitas de tamao N la varianza es.
D*%+(*,-.*/0 M-&%+('L D& L' P(/P/(.*/0
Cuando se examinan variables cualitativas, la caractersitca que se suele considerar es la proporcin de
.;itos. Como ejemplo, a un encuestador poltico le interesara estimar la proporcin real de votos que
obtendr un candidatos particular.
Se define la proporcin p de xitos como
mientrs que el nmero de xitos se define como
en donde el nmero promedio de xitos fue igual a np y la desviacin estndar del nmero de xitos
fue igual a .
Ahora, el lugar de expresar la variable en trminos del nmero = de xitos se puede convertir con
facilidad la variable a una proporcin de xitos al dividirla entre n, el tamao de la muestra. Por tanto, la
proporcin promedio o esperada de xitos es p, mientrs que la desviacin estndar p de la proporcin
de xitos es igual a
Corforme aumenta el tamao de la muestra, se puede aproximar a la distribucin binomial con la
distribucin normal. La regla emprica es que si np y n &'(p) eran, cuando menos 5 cada una, la
distribucin normal proporciona una buena aproximacin de la distribucin binomial. En la mayor parte de
los casos en los cuales se hacen inferencias en cuanto a la proporcin, el tamao de la muestra es muy
grande, con lo que la distribucin normal arroja una buena aproximacin a la distribucin binomial. Por
tanto, la distribucin normal se puede utilizar para investigar la distribucin en el muestreo de la
proporcin.
Como la distribucin en el muestreo de la proporcin tiene distribucin aproximadamente normal, se tiene
lo siguiente:
y como se estn manejando proporciones muestrales (no medias muestrales, y
ps = proporcin muestral
p = proporcin poblacional
se tiene
Al igual que con os datos cuantitativos, el conocimiento de la distribucin en el muestreo permitir hacer
inferencias en cuanto a un tamao de poblacin, basadas sloen la proporcin de xitos en una sola
muestra. Estos conceptos de la inferencia se vern ms adelante
D*%+(*,-.*/0 M-&%+('L D& D*F&(&0.*'% D& M&D*'% 3
D*F&(&0.*'% D& P(/P/(.*/0&% ./0 V'(*'02' ./0/.*D'
Supngase que se tiene dos poblaciones. Por cada de muestra de tamao 91 extrada de la primera
poblacin se calcula un estadstico S1. Estos proporciona una distribucin muestral del estadstico S1
cuya media y desviacin estndar tpica vienen dadas por s1 y s1, respectivamente. Anlogamente,
para cada muestra de tamao 9 extrada de la segunda poblacin, se calcula un estadsitico S. Esto
igualmente proporciona una distribucin muestral del estadistico S, cuya media y desviacin tpica
vienen dadas por s y s. De todas las posibles combinaciones de estas muestras de las dos
poblaciones se puede obtener una distribucin de las diferencias, S1<S que se conoce como
distribucin muestral de diferencias de los estadsticos. La media y la varianza de esta distribucin
muestral se denotan, respectivamente, por s1<s y s1<s y son dadas por
s1<s F s1 < s y s1<s F
con tal que las muestras no dependan de ninguna forma una de otra, es decir, las muestras sea
independientes.
S S1 y S son las medias muestrales de las dos poblaciones, las cuales vienen dadas por 1 y 2,
entonces la distribucin muestral de las diferencias de medias para poblaciones infinitas con medias y
desviaciones tpicas 1, 1 y 1, , respectivamente, tiene por media y desviacin tpica.
. El resultado se mantiene vlido para poblaciones finitas si el muestreo es con reemplazo. Resultados
similares pueden obtenerse para poblaciones finitas en las que el muestreo se realiza sin reemplazo
partiendo de las ecuaciones anteriores.
Resultados correspondientes pueden deducirse para las distribuciones muestrales de diferencias de
proporciones de dos poblaciones distribuidas binomialmente con parmetros p1/ (1 y p/ (,
respectivamente. En este caso S1 y S corresponden a las proporciones de xito, P1 y P y las ecuaciones
anteriores dan los siguientes resultados
Si 91 y 9 son grandes (91/ 9 mayor igual que 30), las distribuciones muestrales de diferencias de
medias o prporciones se distribuyen muy aproximadamente como una normal.
D*%+(*,-.*/0 M-&%+('L D& L' V'(*'02' 3 ('2/0 D&
V'(*'02'%
La desviacin tpica de la distribucin muestral de un estadstico se conoce tambin como su error
tpico. En la Tabla se han anotado los errores tpicos de distribuciones muestrales para diversos
estadsticos bajo las condiciones de muestreo aleatorio sin remplazamiento para una poblacin infinita (o
muy grande) o con reemplazamiento para una poblacin finita. Tambin se apuntan notas especiales que
indican las condiciones para las que los resultados son vlidos, as como otras notas de inters.
Las cantidades, , , r y / s/ P/ mr denotan respectivamente, las medias, desviaciones tpicas,
proporciones y momentos de orden r respecto de la media en la poblacin y en la muestra.
Es de notar que si el tamao de la muestra N es bastante grande, las distribuciones muestrales son
normales o casi normales. Por esta razn, los mtodos se conocen como m*todos para grandes
muestras. Cuando N < 30, las muestras se llaman pe(ueIas. La teora de pe(ueIas muestras, o
teora de muestreo e;acto, como a veces se conoce se tratar mas adelante.
Cuando los parmetros de la poblacin, tales como , , r se desconocen, pueden estimarse
mediante sus correspondientes estadsiticos muestrales si las muestras son suficientemente grandes.
Unidad . Probabilidad.
.1 Teora elemental de probabilidad.
.1.1 Concepto clsico y como frecuencia relativa.
Concepto cl=sico.
El desarrollo inicial de la pro!a!ilidad se asocia con los juegos de azar. Por ejemplo,
considrense dos dados ue se distingan ' ue no est"n cargados^ el inters recae en los n5meros
ue aparecen cuando se tiran los dados. En la siguiente ta!la se dan los 30 posi!les pares de
n5meros$
8na caracterstica clave de este ejemplo, as como tam!in de muc)os otros relacionados con los
juegos de azar, es ue los 30 resultados son mutuamente e*clu'entes de!ido a ue no pueden
aparecer m"s de un par en forma simult"nea. #os 30 resultados son igualmente pro!a!les puesto
ue sus frecuencias son pr"cticamente las mismas, si se supone ue los dados no est"n cargados '
ue el e*perimento se lleva a ca!o un n5mero suficientemente grande de veces. Ftese ue de los
30 resultados posi!les, seis dan una suma de siete, cinco dan una suma de oc)o, etc. Por lo tanto,
puede pensarse de manera intuitiva ue la pro!a!ilidad de o!tener un par de n5meros cu'a suma
sea siete es la proporcin de resultados ue suman siete con respecto al n5mero total, en este caso
0I30. Es importante ue usted comprenda ue la proporcin 0I30 se o!tiene 5nicamente despus
de ue el e*perimento se realiza un n5mero grande de veces, es decir, despus de efectuar el
e*perimento muc)as veces se o!servar" ue, alrededor de la se*ta parte de ste, la suma de los
n5meros ue aparecen es igual a siete. #a proporcin 0I30 no significa ue en seis tiradas,
forzosamente una dar" como resultado un siete. Para situaciones de este tipo es apropiado el
siguiente concepto de pro!a!ilidad.
2-OBABI6I1A1. &i un e*perimento ue est" sujeto al azar, resulta de n formas igualmente
pro!a!les ' mutuamente e*clu'entes, ' si n7 de estos resultados tienen un atri!uto 7, la
pro!a!ilidad de 7 es la proporcin de n7 con respecto a n.
Concepto como frec3encia relati>a.
En muc)as situaciones pr"cticas, los posi!les resultados de un e*perimento no son igualmente
pro!a!les. Por ejemplo, en una f"!rica las oportunidades de o!servar un artculo defectuoso
normalmente ser" muc)o m"s rara ue o!servar un artculo !ueno. En este caso, no es correcto
estimar la pro!a!ilidad de encontrar un artculo defectuoso mediante el empleo del concepto
cl"sico. En lugar de ste, en muc)as ocasiones se emplea la interpretacin de la pro!a!ilidad
como una frecuencia relativa.
#a interpretacin de una frecuencia relativa descansa en la idea de ue un e*perimento se efect5a
' se repite muc)as veces, ' pr"cticamente !ajo las mismas condiciones. 6ada vez ue un
e*perimento se lleva a ca!o, se o!serva un resultado. Este es impredeci!le dada la naturaleza
aleatoria del e*perimento, la pro!a!ilidad de la presencia de cierto atri!uto se apro*ima por la
frecuencia relativa de los resultados ue posee dic)o atri!uto. 6onforme aumenta la repeticin
del e*perimento, la frecuencia relativa de los resultados favora!les se apro*ima al verdadero
valor de la pro!a!ilidad para ese atri!uto. Por ejemplo$ supngase ue se desea determinar la
proporcin de artculos defectuosos en un proceso de fa!ricacin. Para llevar a ca!o lo anterior,
se muestra un determinado n5mero de artculos^ cada o!servacin constitu'e un e*perimento.
#os resultados pueden clasificarse como defectuosos o no defectuosos. &i el proceso de
fa!ricacin es esta!le, ' asegura as las condiciones uniformes, al aumentar el n5mero de
artculos muestreados, la frecuencia relativa de artculos defectuosos con respecto al n5mero de
unidades muestreadas se apro*imar" cada vez m"s a la verdadera proporcin de artculos
defectuosos.
Para ilustrar la interpretacin de la pro!a!ilidad como frecuencia relativa se simul en una
computadora un proceso de muestreo de n unidades, suponiendo ue el proceso de fa!ricacin
produca un ?@ de artculos defectuosos. Para cada n se o!serv el n5mero de unidades
defectuosas^ los resultados se dan a continuacin, para valores de n entre <; ' .; ;;;$
7 partir de esto es razona!le concluir ue la frecuencia relativa tiende a un valor verdadero de
;.;? conforme n crece. De esta manera, se sugiere el siguiente concepto de la pro!a!ilidad como
frecuencia relativa.
2-OBABI6I1A1. si en un e*perimento se repite n veces !ajo las mismas condiciones ' n+ de
los resultados son favora!les a un atri!uto +, el lmite de n+In conforme n se vuelve grande, se
conceptualiza como la pro!a!ilidad del atri!uto +.
.1. !nterpretacin sub5etiva de la probabilidad.
. Probabilidad de eventos.
+robabilidad de eventos
%ara calcular la probabilidad de eventos es necesario que stos se comporten de una maner
ms o menos estable. %recisamente, se echa mano de la regularidad estadstica, que es
la propiedad de los fenmenos aleatorios, y que consiste en que al aumentar el n#mero de
repeticiones de un e&perimento en condiciones prcticamente constantes, la frecuencia
relativa de ocurrencia para cada evento tiende a un valor fi!o.
'in embargo, al momento de definir la probabilidad de un evento podemos tomar en cuenta
los siguientes criterios(
). $a probabilidad subjetiva de un evento se la asigna la persona que hace el
estudio, y depende del conocimiento que esta persona tenga sobre el tema.
%recisamente por su carcter de sub!etividad no se considera con valide" cientfica,
aunque en la vida diaria es de las ms com#nes que se utili"an al no apoyarse ms
que en el sentido com#n y los conocimientos previos, y no en resultados estadsticos.
<. $a probabilidad frecuencial de un evento es el valor fi!o al que tienden las
frecuencias relativas de ocurrencia del evento de acuerdo a la regularidad estadstica.
Esta definicin sera la ms real, pero proporciona probabilidades apro&imadas, es
decir, proporciona estimaciones y no valores reales. *dems, los resultados son a
posteriori, pues se necesita reali"ar el e&perimento para poder obtenerlo. (%ara ver
un e!emplo ha" click aqu .)
+. $a probabilidad clsica de un evento E, que denotaremos por P(E), se define
como el n#mero de eventos elementales que componen al evento E, entre el n#mero
de eventos elementales que componen el espacio muestral(
Es la definicin ms utili"ada porque supone de antemano, y se necesita como
requisito indispensable, que todos los eventos elementales tienen la misma
probabilidad de ocurrir.
..1 Definicin de espacio muestral.
El conjunto de todos los resultados posi!les diferentes de un determinado e*perimento aleatorio
se denomina Espacio 1$estral asociado a dic)o e*perimento ' se suele representar por h. 7 los
elementos de h se les denomina s$cesos elementales.
7s por ejemplo, el espacio muestral asociado al e*perimento aleatorio consistente en el
lanzamiento de una moneda es hL b6ara, 6ruzc^ el espacio muestral asociado al lanzamiento de
un dado es hLb., <, 3, 1, ?, 0c, siendo 6ara ' 6ruz los sucesos elementales asociados al primer
e*perimento aleatorio ' ., <, 3, 1, ? ' 0 los seis sucesos elementales del segundo e*perimento
aleatorio.
7 pesar de la interpretacin ue tiene el espacio muestral, no es m"s ue un conjunto a!stracto de
puntos (los sucesos elementales), por lo ue el lenguaje, los conceptos ' propiedades de la teora
de conjuntos constitu'en un conte*to natural en el ue desarrollar el 6"lculo de Pro!a!ilidades.
&ea A el conjunto de las partes de , es decir, el conjunto de todos los su!conjuntos de h. En
principio, cualuier elemento de A- es decir, cualuier su!conjunto del espacio muestral
contendr" una cierta incertidum!re, por lo ue trataremos de asignarle un n5mero entre ; ' .
como medida de su incertidum!re. En 6"lculo de Pro!a!ilidades dic)os su!conjuntos reci!en en
el nom!re de s$cesos- siendo la medida de la incertidum!re su pro!a!ilidad. #a tripleta (h,A-P)
reci!e el nom!re de espacio pro!a!ilstico.
Por tanto, asociado a todo e*perimento aleatorio e*isten tres conjuntos$ El espacio muestral , la
clase de los sucesos, es decir, el conjunto de los elementos con incertidum!re asociados a nuestro
e*perimento aleatorio A, ' una funcin real, P$A :;, l=, la cual asignar" a cada suceso
(elemento de A) un n5mero entre cero ' uno como medida de su incertidum!re.
7dvertimos no o!stante, ue la eleccin del espacio muestral asociado a un e*perimento aleatorio
no tiene por u ser 5nica, sino ue depender" de ue sucesos elementales ueramos considerar
como distintos ' del pro!lema de la asignacin de la pro!a!ilidad so!re esos sucesos elementales.
Ejemplo: : "Urna"
6onsideremos el e*perimento aleatorio consistente en e*traer una !ola al azar de una urna
compuesta por tres !olas rojas, dos !lancas ' una verde.
Podemos considerar como espacio muestral
h
.
L bi
.
, i
<
, i
3
c
en donde sea i
.
L !ola roja, i
<
L !ola !lanca ' i
3
L !ola verde, aunue tam!in podamos )a!er
considerado como espacio muestral el conjunto
h
.
L bi
.
, i
<
, i
3
, i
1
, i
?
, i
0
c
en donde i
i
L !ola roja, i 2 ,-4-5- i
i
L !ola !lanca, i2 6-7 ' i
0
L !ola verde, )aciendo las !olas
distingui!les.
7m!os pueden ser considerados espacios mustrales del e*perimento descrito, eligiendo el ue
m"s nos convenga, por ejemplo, a la )ora de asignar la pro!a!ilidad a los sucesos elementales de
uno u otro espacio muestral.
2especto a la clase de los sucesos A, es natural ue sta tenga una estructura tal ue permita
)a!lar no solo de sucesos sino tam!in de su unin, interseccin, diferencia, complementario,
etc., de!iendo ser la clase A- en consecuencia, cerrada a dic)as operaciones entre (conjuntos(
(entre sucesos). Esta es la situacin del conjunto de las partes cuando es finito o inclusive
numera!le (caso, por ejemplo, del espacio muestral asociado al e*perimento aleatorio consistente
en lanzar una moneda )asta ue salga cara por primera vez). En otras ocasiones en las ue sea un
conjunto continuo (por ejemplo, cuando estudiamos el tiempo ue tarda un istopo radioactiva en
volverse inesta!le), de!er" ser A un conjunto estrictamente m"s peueHo ue el conjunto de las
partes de h.
En todo caso podemos pensar en 7 como en el conjunto ue contiene todos los elementos de
inters, es decir, todos los sucesos a los ue les corresponde una pro!a!ilidad.
7puntemos adem"s algunas peculiaridades del 6"lculo de Pro!a!ilidades respecto a la teora de
conjuntos. 7u, el conjunto vacio ; reci!e el nom!re de suceso imposi!le, definido como auel
su!conjunto de ue no contiene ning5n suceso elemental ' ue corresponde a la idea de auel
suceso ue no puede ocurrir.
De forma an"loga, el espacio total reci!e el nom!re de suceso seg$ro al recoger dic)a
denominacin la idea ue representa.
#lamaremos sucesos incompati!les a auellos cu'a interseccin sea el suceso imposi!le.
Por 5ltimo, digamos ue la inclusin de sucesos, 7 +, se interpreta au como ue siempre ue se
cumpla el suceso 7 se cumple el +^ por ejemplo, siempre ue salga el < (suceso 7) sale par
(suceso +).
Ejemplo: "Lanzamiento de un
dado"
El espacio pro!a!ilstico asociado al e*perimento aleatorio consistente en el lanzamiento de un
dado, tendr" como espacio muestras hLb.,<,3,1,?,0c ' como espacio de sucesos el conjunto de
las partes por ser h finito, el cual contiene <
0
elementos,
A 2 b 8, b.c, b<c, b3c, b1c, b?c, b0c, b.,<c, b.,3c, b.,1c, b.,?c, b.,0c, b<,3c, b<,1c, b<,?c,
b<,0c, b3,1c, b3,?c, b3,0c, b1,?c, b1,0c, b?,0c, b.,<,3c, b.,<,1c, b.,<,?c, b.,<,0c, b.,3,1c,
b.,3,?c, b.,3,0c, b.,1,?c, b.,1,0c, b.,?,0c, b<,3,1c, b<,3,?c, b<,3,0c, b<,1,?c, b<,1,0c, b<,?,0c,
b3,1,?c, b3,1,0c, b3,?,0c, b1,?,0c, b.,<,3,1c, b.,<,3,?c, b.,<,3,0c, b.,<,1,?c, b.,<,1,0c, b..,<,?,0c,
b.,3,1,?c, b.,3,1,0c, b.,3,?,0c, b.,1,?,0c, b<,3,1,?c, b<,3,1,0c, b<,3,?,0c, b<,1,?,0c, b3,1,?,0c,
b.,<,3,1,?c, b.,<,3,1,0c, b.,<,3,?,0c, b.,<,1,?,0c, b.,3,1,?,0c, b<, 3, 1, ?, 0c, h c.
B!srvese ue este conjunto contiene los sucesos so!re los ue )a!itualmente se tiene
incertidum!re, como por ejemplo ue salga un n5mero par, b<,1,0c, o un n5mero ma'or ue
cuatro, b?,0c, o simplemente ue salga un seis, b0c, ' ue como se ve es cerrado respecto de las
operaciones entre conjuntos.
El 5ltimo elemento del espacio pro!a!ilstico es la pro!a!ilidad, ue como antes dijimos est"
definida so!re A, asignando a cada suceso un n5mero entre ; ' ..
#a pro!a!ilidad se nos presenta cuando nos enfrentemos a una situacin azarosa.
.. 7zar ' desconocimiento.
Z font no. o defectuoso sea artculo el ue es facti!le tan u numrica manera una de
cuantificar posi!le proceso en e*periencia con 6laro defectuoso. seleccionado si sa!emos
no azar este esencial parte la ' aleatoria) (o azarosa situacin Esta !ueno resultar puede
ese ciegas%%, jja un escoge se produccin toda &i jjdefectuoso%%. jj!ueno%% como
calificarse cada idnticos, son producidos artculos los todos Fo determinado. cantidades
grandes produce industrial piense a'udar^ nos ejemplo 8n desconocimiento. relacionado
est" ElX
<. 7zar e incertidum!re.
Da' otro concepto asociado al azar ' es el de incertidum!re. Peamos un ejemplo. 2especto a una
inversin, podemos estar contemplando invertir una cantidad de dinero. El retorno so!re la
inversin puede ser fijo, como en el caso de una cuenta en un !anco con inters fijo^ pero
pensemos en una empresa. El negocio puede resultar desde un gran *ito )asta un fracaso, es
decir, la ganancia no es fija, sino ue depende del *ito a o!tener. &i no podemos evaluar u tan
facti!le es cada monto posi!le de la ganancia, tenemos una situacin de incertidum!re. Por el
contrario, si podemos tener una idea de u tan pro!a!les son los diferentes resultados ' entonces
tendremos una situacin de riesgo. Esta 5ltima es la ue llamamos aleatoria o azarosa.
0*2ACIO .70*+-A6 C 2-OBABI6I1A1.
El p"rrafo anterior se resume diciendo ue en las situaciones o e*perimentos aleatorios tenemos
dos elementos esenciales$
.. 8na lista de posi!ilidades a futuro$ espacio muestral
<. 8na cuantificacin de la incertidum!re so!re esa lista de posi!ilidades$ asignacin de
pro!a!ilidades.
6ualuier pro!lema o situacin en la pro!a!ilidad, parte de esos dos elementos$ Espacio Muestral
' Pro!a!ilidades.
0*2ACIO .70*+-A6.
El espacio muestral es el conjunto de todos los posi!les resultados de un e*perimento o situacin
aleatoria.
&i en una caja )a' .; manzanas ' < est"n ec)adas a perder (kal menos en este momentol), al
e*traer tres manzanas ' ver cuantas son !uenas podemos o!tener ., < o 3 !uenas (k; !uenas es
imposi!lel). De modo ue en este ejemplo el espacio muestral es$ b ., <, 3 c.
Z font o el ue de en si un &i los todos nos c. .? , . <, ., ;, b es$ muestral espacio entonces
resultan, soles n5mero fij"ramos Pero ?, 1, 3, reueridos, volados fijamos volados, sean )asta
seguidas "guilas tres o!tener falta )agan tirar consiste juegoX
Es claro ue para determinar el espacio muestral en un e*perimento aleatorio es necesario
entender perfectamente$
mu se va a )acer.
mu se va a o!servar o contar.
.. Discreto y continuo.
.." Definicin de evento.
0?0N+O*.
6uando se tiene un espacio muestral llamamos, formalmente evento a cualuier su!conjunto del
espacio muestral.
Decimos ue un evento se realiza, cuando el resultado del e*perimento aleatorio es un elemento
del evento.
#as dos definiciones anteriores son mu' a!stractas. Peamos un par de ejemplos.
En el caso de contar cuantos volados )acen falta para conseguir tres "guilas seguidas o tirar .?
volados^ el espacio muestral son los n5meros$ 3, 1, ?, . . . , .?. 8n evento podra ser b 3, ?, /, . . . ,
.?c. Este evento corresponde a ue el n5mero de tiros necesario sea nn. &i al )acer los volados
los resultados fueran$
77&77&&&777 (au nos detenemos porue )an cado 'a, tres "guilas seguidas), el
evento si se realiz porue el n5mero necesario fue .. ' es nn.
&&&777 (au paramos porue 'a )a' tres "guilas), el evento no se realiz.
Podemos pensar ue cada e*perimento al azar es un juego ' ue un evento es una lista de los
resultados ue )acen ue 4B gane.
Btro ejemplo m"s. 7l comprar llantas para mi auto, puede ser ue manifiesten un defecto de
fa!ricacin dentro del perodo de garanta total ' ue el fa!ricante de!a reponerlas. Tam!in
puede pasar ue el defecto se manifieste en el perodo de garanta parcial ' ue el fa!ricante
!onifiue slo un porcentaje o ue el defecto se manifieste despus de vencido el perodo de
garanta en cu'o caso el fa!ricante no paga nada. Tam!in puede pasar ue las llantas no tengan
defecto de fa!ricacin aparente ' ue no )a'a garanta ue reclamar. 6omo se puede considerar
ue las llantas ue me vendieron se escogieron al azar de entre toda la produccin, tenemos un
e*perimento aleatorio.
El espacio muestral en este e*perimento es$ & L b T, P., P<, P3, F, Bn c. 6on la siguiente
notacin T$ pago total, P. pago del ?;@, P<$ pago del 3;@, P3$ pago del .;@, F$ nada de pago,
Bn$ llantas sin defecto. El evento b Bn c slo se realiza cuando las llantas no tienen defecto.
En este 5ltimo ejemplo se tiene un evento simple porue consta de un solo punto del espacio
muestral. &er" compuesto cuando tiene varios puntos del espacio muestral. &e llama evento
imposi!le al ue no puede ocurrir^ ste evento corresponde al conjunto vaco. Btro evento
e*tremo es el espacio muestral mismo ue, puesto ue siempre ocurre, se llama evento seguro.
Eventos
,uando se reali"a un experimento, que es cualquier proceso que produce un resultado o
una observacin, se van a obtener un con!unto de valores. * este con!unto de valores que
puede tomar una variable se le denomina espacio muestral.
Por ejemplo: 'i se tiene un dado cualquiera, el espacio muestral (EM) es EM-.),/,+,0,1,23.
'i e&isten ms de una variable, el espacio muestral est formado por las combinaciones de
valores de cada una de las variables.
'i tomamos un subcon!unto cualquiera del espacio muestral tenemos lo que se denomina un
evento, y si ste consta de un solo elemento entonces es un evento elemental.
,omo se puede uno imaginar, e&isten eventos que siempre, no importa el n#mero de
e&perimentos o su situacin, ocurren, y en cambio e&isten otros que nunca ocurren. $os que
siempre ocurren son los eventos seguros, y los que nunca son los eventos imposibles.
'in embargo, no todos los resultados son al a"ar, pues si un e&perimento es cualquier
proceso entonces los resultados pueden tomar cualquier tipo de valor. %or esta ra"n, se
define como experimento aleatorio al proceso en el que se pueden predecir con certe"a la
ocurrencia de sus eventos, con e&cepcin del seguro o del imposible. 4ay que hacer la
observacin que esta definicin habla en trminos generales y no especficamente sobre
alg#n e&perimento en particular.
* aqulla variable que est asociada a un e&perimento de este tipo se le denomina variable
aleatoria.
En cambio, a un e&perimento no aleatorio se le denomina experimento determinstico.
,uando hablamos de varios eventos dentro del mismo e&perimento se pueden dar varios
casos.
'i dos o ms eventos no pueden ocurrir simultneamente, se llaman eventos mutuamente
excluyentes, es decir, que la interseccin de ambos eventos es vaca.
%or otro lado, en ocasiones un evento o ms eventos dependen de otro evento previo, es
decir, un evento A ocurre dado que ocurri un evento B. 'i e&iste este tipo de relacin entre
eventos se dice que son eventos dependientes o condicionados (el evento A depende
del evento B, o el resultado del evento A est condicionado al resultado del evento B). %or
otro lado, si no e&iste tal relacin entre eventos se dice que son eventos independientes.
$os criterios de dependencia o de independencia se definirn ms adelante, en trminos de
probabilidad condicional.
..# Simbolo*a/ uniones e intersecciones.
#as operaciones son formas especficas de com!inar conjuntos para formar otros conjuntos.
6onstitu'en un sistema lgico de construccin de nuevos conjuntos en !ase a conjuntos dados.
Estas operaciones ' sus propiedades nos llevan a la Teora de 6onjuntos como un "lge!ra, o sea
como un sistema matem"tico. En particular, se tratan las operaciones de complementacin,
interseccin, unin ' diferencia.
CO.260.0N+ACION
&ea + un su!conjunto cualuiera del conjunto universal . El complemento de + con respecto a
8 se define como el conjunto de elementos de ue no pertenecen a +. &e sim!oliza al
complemento de + por +o, ' se lo especifica por comprensin mediante la e*presin sim!lica$
Esta e*presin se lee as$ (complemento de + es el conjunto de los elementos * ue pertenecen a
8 pero no pertenecen a +(.
2-O2I01A10* 10 6A CO.260.0N+ACION
i. El complemento del conjunto universal 8 es el conjunto vaco p. 2ecprocamente, el
complemento del conjunto vaco es el conjunto universal.
En sm!olos$
ii. a 6u"l es el complemento del complemento de un conjunto %
El complemento de 7 est" formado por todos los elementos de 8 ue no est"n en 7o (o sea por
todos los ue no uedan fuera de 7) ' stos son e*actamente los elementos del conjunto 7.
En sm!olos$
o sea (7o)o L 7.
IN+0-*0CCION
&ean 7 ' + dos conjuntos cualesuiera del conjunto universal . #a interseccin de los
conjuntos 7 ' + , es el conjunto de los elementos de ue son miem!ros tanto de 7 como de +.
&e sim!oliza por 7 +, ' se especifica por comprensin como sigue$
Esta e*presin se lee as$ (7 interseccin +, es el conjunto de elementos de ue pertenecen a 7
' a +.(
2-O2I01A10* 10 6A IN+0-*0CCION
i. De la definicin de interseccin se deduce directamente ue$
#a operacin de interseccin es conmutativa.
ii. la interseccin de dos conjuntos da lugar a dos posi!ilidades distintas$
.. El conjunto de interseccn no es vaco^ al menos, )a' un elemento com5n a am!os
conjuntos 7 ' +.
En sm!olos
<. #os conjuntos 7 ' + no tienen elementos en com5n^ son disjuntos o mutuamente
e*clu'entes.
En sm!olos .
iii. Para cualuier su!conjunto 7 del conjunto universal se cumple ue . Por
definicin de interseccin de conjuntos .
iv. Para cualuier su!conjunto 7 del conjunto universal se cumple ue
Por definicin de interseccin de conjuntos
v. Para cualuier conjunto 7 se cumple ue
Por definicin de interseccin
vi. Para cualuier conjunto 7 se cumple ue
Por definicin de interseccin
vii. &e )a definido a la interseccin como una operacin !inaria. Fo )a' inconveniente en
e*tender su "m!ito de aplicacin ' definir la interseccin de cualuier n5mero (finito o
infinito) de conjuntos, como el conjunto formado por los elementos comunes a todos
ellos. Por ejemplo, para el caso de tres conjuntos 7, + ' c, se define
Para los conjuntos cualesuiera
viii. #a operacin de interseccin es asociativa$
6A IN+0-*0CCION C 6A INC67*ION
i. &ean P, m ' T su!conjuntos cualesuiera del conjunto universal 8. si T est" contenido
tanto en P como en m, tam!in est" contenido en la interseccin .
En sm!olos$ si entonces . 7 su vez, si un conjunto T
est" incluido en la interseccin de dos conjuntos P ' m, entonces est" incluido tam!in en
cada uno de ellos.
En sm!olos$ si entonces .
2esumiendo am!as propiedades se llega a ue$
ii. &ean 7 ' + dos su!conjuntos cualesuiera del conjunto universal . El conjunto
interseccin est" incluido tanto en 7 como en +. En sm!olos$
iii. &ean 2 ' & dos su!conjuntos cualesuiera del conjunto universal 8. &i 2 es un
su!conjunto de &, el conjunto interseccin es igual al conjunto 2. En sm!olos$
7 su vez, si el conjunto 2 es igual a la interseccin ,
esto implica ue . En sm!olos$ 2esumiendo am!as
propiedades, se conclu'e ue
7NION
&ean P ' m dos su!conjuntos cualesuiera del conjunto universal 8. #a unin de los conjuntos P
' m es el conjunto de los elementos de 8 ue pertenecen por lo menos a uno de los conjuntos P
m.
En sm!olos$
Esta e*presin se lee as$ (P unin m es el conjunto de elementos * ue pertenecen a P, a m, o a
am!os (P ' m)(.
2-O2I01A10* 10 6A 7NION
i. De la definicin de unin se deduce directamente ue 7 8 + L + 8 7 #a operacin de
unin de conjuntos es conmutativa.
ii. &ea 7 un su!conjunto cualuiera del conjunto universal 8. #a unin de 7 ' p es igual al
conjunto 7. En sm!olos 7 8 p L 7. Por definicin de unin
iii. &ea 7 un su!conjunto cualuiera del conjunto universal &. #a unin de 7 ' el conjunto
universal es igual al conjunto universal.
En sm!olos$ 7 8 & L &. Por definicin de unin
iv. Para cualuier conjunto 7 se cumple ue 7 8 7 L 7.Por definicin de unin
.
v. #a unin de un conjunto 7 ' de su complemento 7oes el conjunto universal .
En sm!olos$ 7 8 7oL 8.
Por definicin de unin de conjuntos .
vi. &i la unin de dos conjuntos es vaca, am!os conjuntos de!en serlo. En sm!olos$ si 7 8
+ L p entonces 7 L p ' + L p.
vii. #a unin se )a definido como una operacin !inaria. Fo )a' inconveniente en e*tender su
"m!ito de aplicacin ' definir la unin de cualuier n5mero (finito o infinito) de
conjuntos, como el conjunto formado por los elementos ue pertenecen al menos a uno de
ellos.
Por ejemplo, para el caso de tres conjuntos 7, + ' 6, se tiene$
para G conjuntos cualesuiera .
viii. #a operacin de unin es asociativa$
7 8 ( + 8 6 ) L ( 7 8 + ) 8 6 L 7 8 + 8 6.
6A 7NION C 6A INC67*ION
i. &ean 2, & ' m su!conjuntos cualesuiera del conjunto universal 8. &i el conjunto unin 2
8 & es su!conjunto del conjunto m, tanto 2 como & est"n contenidos en m.
En sm!olos$
7 su vez si dos conjuntos 2 ' & est"n contenidos en un tercero m, su unin 2 8 &, es
tam!in un su!conjunto de m$
2esumiendo am!as propiedades, se llega a ue
ii. &ean 7 ' + dos su!conjuntos cualesuiera de 8. #os conjuntos 7 ' + son su!conjuntos
de la unin 7 8 +.
En sm!olos$
Dados dos conjuntos no vacos 7 ' +, si 7 est" incluido en +, el conjunto unin es igual
al conjunto +.
7 su vez, si la unin de dos conjuntos no vacos es igual a uno de ellos, entonces el otro
es su!conjunto del primero. En sm!olos$ si 7 8 + L + entonces .
2esumiendo am!as propiedades se llega a ue
para .
1I<0-0NCIA
&ean 7 ' + dos su!conjuntos cualesuiera del conjunto universal 8. #a diferencia de dos
conjuntos 7 ' + es el conjunto de elementos ue pertenecen a 7 pero no a +.
El conjunto diferencia se denota por 7 Q+ ' se especifica por comprensin mediante la e*presin
2-O2I01A10* 10 6A 1I<0-0NCIA
i. #a operacin de diferencia de conjuntos no es conmutativa.
En sm!olos$
En efecto 7Q+ se )a definido como el conjunto de los elementos de 7 ue no pertenecen a
+, o sea ^ mientras ue + Q 7 es el conjunto de los
elementos de + ue no pertenecen a 7, o sea$ .
ii. De la definicin de diferencia se deduce directamente ue$ .
iii. &i 7 es un su!conjunto de +, no )a' elementos de 7 ue no estn en +, por lo ue el
conjunto 7 Q + carece de elementos.
En sm!olos$
iv. #os conjuntos (7 Q +), (+ Q 7) ' son mutuamente e*clu'entes^ la interseccin de
dos cualesuiera de estos conjuntos es vaca.
En sm!olos$
Ftese adem"s ue . &e dice ue estos conjuntos
son totalmente e*)austivos.
050.26O
*O67CION
050.26O
*O67CION
..$ Dia*ramas de 0enn.
1IA,-A.A* 10 ?0NN
7l tra!ajar con conjuntos, con las relaciones ' operaciones entre ellos, es 5til disponer de un
sistema de representacin gr"fica ue permita visualizar lo ue ocurre e interpretar con diagramas
las deducciones lgicas correspondientes.
El procedimiento usual consiste en di!ujar rect"ngulos, crculos u otras figuras geomtricas,
seg5n un procedimiento ue se conoce como (diagramas de PennQEuler(.
En un diagrama de Penn, el conjunto de puntos interiores de un rect"ngulo se toma como el
conjunto universal. #os su!conjuntos del conjuntos universal se representan por los puntos
interiores de crculos (u otras regiones cerradas) trazados dentro del rect"ngulo.
Elustraremos la utilidad de los diagramas de Penn, considerando diversos ejemplos de
representacin gr"fica.
i. Para un su!conjunto 7 del conjunto universal , el diagrama de Penn es el siguiente$
.
en el ue los puntos interiores a la circunferencia representan al conjunto 7, ' los puntos
de rect"ngulo e*teriores al circulo representan al conjunto 7, ' los puntos de rect"ngulo
e*teriores al crculo representan al conjunto complementario 7o.
ii. Para dos su!conjuntos 7 ' + del conjunto universal , se tienen los siguientes
diagramas$
En el primero se tienen dos conjuntos disjuntos, en el segundo se representan el caso de
inclusin , en el tercero se o!serva el caso de inclusin , ' en el 5ltimo dos
conjuntos con algunos elementos comunes.
Para representar las operaciones entre conjuntos, se tienen los siguientes diagramas$
.
En el primero, la zona ra'ada representa la interseccin ^ en el segundo, se tiene
la unin 7 8 +^ en el tercero, la diferencia 7 Q +, ' en el 5ltimo la diferencia + Q 7.
Tam!in es necesario o!servar ' compro!ar algunas de las propiedades de esas
operaciones.
Por ejemplo, las propiedades
.
se aprecian en la figura +#a^ las propiedades
.
se aprecian en la figura +#!^ las propiedades
.
se aprecian en la figura +E!^ las propiedades
.
se aprecian en la figura +D^ las propiedades
.
se o!servan en los diagramas siguientes$
Oinalmente, para representar gr"ficamente el caso de 3 su!conjuntos del conjunto
universal, son usuales los siguientes diagramas$
60C0* 10 CON57N+O*
4a )emos aprendido cmo o!tener nuevos conjuntos a partir de su!conjuntos dados del conjunto
universal 8, aplicando ciertas operaciones ' sus propiedades. 7)ora resumiremos en un cuadro
5nico las propiedades m"s importantes a las ue o!edecen las operaciones entre conjuntos.
&ean 7, + ' 6 su!conjuntos cualesuiera no vacos de un conjunto universal 8. Entonces,
independientemente de cu"les sean las especificaciones de 8, 7, + ' 6, se verifican las siguientes
le'es de los conjuntos$
E. de identidad
.
EE. de idempotencia
.
EEE. de complementacin
.
EP. de conm3tati>idad
P. de asociati>idad
.
PE. de distrib3ti>idad
.
PEE. de D1e .or8anD
." T.cnicas de conteo.
7) 6BF6EPTB.
&uponga ue se encuentra al final de una lnea de ensam!le final de un producto ' ue un
supervisor le ordena contar los elementos de un lote ue se )a manufacturado )ace unas )oras '
del ue se desconoce el n5mero de productos ue lo constitu'en, de inmediato usted empezar" a
contar un producto tras otro ' al final informar" al supervisor ue son, 1\, ?1 u otro n5mero
cualuiera. 7)ora suponga ue ese mismo supervisor le plantea la siguiente pregunta acu"ntas
muestras o grupos ser" posi!le formar con los productos del lote, si las muestras o grupos a
formar son de oc)o elementos cada una de ellas%.
0n el primer caso el c3antificar los elementos del lote no presenta dific3ltad al83na para la
persona encar8ada de hacerlo pero c3ando se le hace el se83ndo planteamiento al tratar
de formar las m3estras o 8r3pos de ocho elementos la persona encar8ada empeAar= a tener
dific3ltad para hacerlo en casos como este es necesario hacer 3so de las t/cnicas de conteo
para c3antificar los elementos del e>ento en c3estin :el nEmero de m3estras posibles a
formar de ocho elementos; l3e8o FG3/ son las t/cnicas de conteoH

6as t/cnicas de conteo son aG3ellas G3e son 3sadas para en3merar e>entos difciles de
c3antificar.
0jemplos en los G3e definiti>amente haremos 3so de las t/cnicas de conteo seran4
IFC3=ntas comisiones pro limpieAa del instit3to se p3eden formar si hay "'0 al3mnos G3e
desean ay3dar en esta tarea y se desea formar comisiones de ocho al3mnosH
IFC3=ntas representaciones de al3mnos p3eden ser formadas a; si se desea G3e estas
consten solo de al3mnos de In8eniera J3micaH b; se desea G3e el presidente sea 3n
G3micoH c; se desea G3e el presidente y tesorero sean G3micosH 2ara todos los casos se
desea G3e las representaciones consten de once al3mnos.
IFC3=ntas maneras tiene 3na persona de seleccionar 3na la>adora 3na batidora y dos
lic3adoras si enc3entra en 3na tienda ! modelos diferentes de la>adoras ' modelos
diferentes de batidoras y ( modelos diferentes de lic3adorasH

*e les denomina t/cnicas de conteo a4 las combinaciones perm3taciones y dia8rama de
=rbol las G3e a contin3acin se explicar=n y hay G3e destacar G3e /stas nos proporcionan
la informacin de todas las maneras posibles en G3e oc3rre 3n e>ento determinado.
6as bases para entender el 3so de las t/cnicas de conteo son el principio m3ltiplicati>o y el
aditi>o los G3e a contin3acin se definen y se hace 3so de ellos.
Tcnicas de conteo
Las tcnicas de conteo para encontrar el numero de arreglos posibles de objetos en un
conjunto o conjuntos son esenciales en el estudio de la probabilidad. Al contar los
arreglos se puede enlistar o representar todos en forma ramificada es decir esta
representacin se hace en la forma de un rbol denominado diagrama de rbol.
Ej.- Un contador tiene dos sacos negro y beige y 4 camisas: celeste, caf, blanca y azul
de cuantas manera puede combinarse y representar con un diagrama de rbol.
Principio Fundamental del Proceso de Contar
De la seccin anterior se puede establecer una manera eficiente de contar
considerando el principio de multiplicacin, el cual llamaremos: Principio fundamental
del proceso de contar quedando explcitamente de la siguiente manera: Si en una
primera decisin se puede hacer de "n formas diferentes y una segunda decisin en
"m formas diferentes entonces las dos decisiones se pueden hacer en "n por "m o sea
"nm formas diferentes en el orden dado.
Ej.- Cuantas palabras de 4 letras (sin significado) se puede formar con las letras de la
palabra vernica, sin usar mas de una vez cada una de las letras,
8 x 7 x 6 x 5 = 1680
Ej.- Cuantos nmeros de 3 dgitos se pueden formar con los dgitos 6,7,8,9 si :
a) no deben repetirse los dgitos 4 x 3 x 2 = 24
b) deben repetirse los dgitos. 4 x 4 x 4 = 64
Compru.balo
a)
678
679
687
689
697
698
768
769
786
789
796
798
867
869
876
879
896
897
967
968
976
978
986
987
b)
666
667
766
767
866
867
966
967
Contador
Saco
Negro
Beige
2 x
Camisas
Celeste
Caf
Blanco
Azul
Celeste
Caf
Blanco
Azul
4 =
Posibles arreglos:
Negro-celeste
Negro-caf
Negro-blanco
Negro-azul
Beige-celeste
Beige-caf
Beige-blanco
Beige-azul
8
668
669
676
677
678
679
686
687
688
689
696
697
698
699
768
769
776
777
778
779
786
787
788
789
796
797
798
799
868
869
876
877
878
879
886
887
888
889
896
897
898
899
968
969
976
977
978
979
986
987
988
989
996
997
998
999
Ej.- cuntos nmeros de cuatro dgitos de pueden formar con los dgitos del 0-9 si:
a) los dgitos pueden repetirse 9 x 10 x 10 x 10 = 9000
b) los dgitos no pueden repetirse 9 x 9 x 8 x 7 = 4536
c) el ultimo digito debe ser ocho y no pueden repetirse 8 x 8 x 7 x 1 = 448
Ej.- Cuntos juegos de placas para autos que contengan tres letras seguidas de tres
dgitos utilizando para ello las 27 letras del alfabeto y los nmeros del 0-9 si:
a) las letras y dgitos no deben repetirse
27 x 26 x 25 x 10 x 9 x 8 = 12636000
b) las letras y dgitos pueden repetirse
27 x 27 x 27 x 10 x 10 x 10 = 19683000
c) debe iniciar con la letra R
1 x 26 x 25 x 10 x 10 x 10 = 650000
1 x 26 x 25 x 10 x 9 x 8 = 468000
650000 + 468000 = 1118000
Ej.- Se tienen seis hombres y cinco mujeres y se quieren acomodar en una hilera de
butacas de tal manera que las mujeres ocupen los lugares pares , en cuantas formas se
pueden acomodar?
6 x 5 x 5 x 4 x 4 x 3 x 3 x 2 x 2 x 1 x 1 = 86400
.".1 Dia*rama de rbol.
ANA6I*I* CO.BINA+O-IO 2-INCI2IO A1I+I?O C .76+I26ICA+I?O
:1IA,-A.A 10 A-BO6;
7 pesar de la complejidad de muc)os procedimientos avanzados, proporcionados por la
tecnologa moderna, el simple proceso de contar continua jugando un papel importante en
pro!lemas pr"cticos de la vida cotidiana. Tenemos ue contar, por ejemplo, el n5mero de
accidentes ocurridos en los fines de semana, el n5mero de alumnos por grupo, etc. Pero, no todos
los pro!lemas de contar son tan f"ciles como estos. Por ejemplo, para calcular en cuantas formas
podemos sentar a 0 personas una al lado de la otra para una foto, o el n5mero de seHales ue se
pueden )acer usando 1 !anderas todas de diferente color, etc.
Para responder a las preguntas de$ (cuantos ( o ( cual es el n5mero( podramos proceder de dos
formas$
.. enlistar todas las posi!ilidades (si no son muc)as),
<. determinar su n5mero sin enlistarlos. #a determinacin del n5mero sin enlistar todas las
posi!ilidades ue es de lo ue se ocupa la teora com!inatoria mediante algunas reglas o
frmulas^ sin em!argo, podemos au*iliarnos con diagramas para poder tener una idea
intuitiva del pro!lema. #os diagramas m"s usuales son los diagramas de Penn ' los
diagramas de "r!ol.
#os diagramas de "r!ol son gr"ficas ue presentan los resultados posi!les de un evento, as como
la pro!a!ilidad de cada uno de ellos. Dado ue se analizan todos los resultados posi!les de!e ser
. (o .;;@). Esto de!e cumplirse en todas las ramas del "r!ol. &on adem"s una a'uda visual
cuando es necesario tomar en cuenta el orden los elemento. 7 continuacin se dar"n dos ejemplos
en los cuales se muestran los atri!utoa del diagrama de "r!ol$
050.26O 8n cuarto tiene cuatro puertas, llammosla , 7, +, 6 ' D^ estamos interesados en
sa!er de cuantas formas podemos entrar por una puerta ' salir por otra.
*O67CION Para resolver pro!lemas como estos resultan de gran a'uda el diagrama de "r!ol.
6omo podemos o!servar, son doce las posi!ilidades.
050.26O 8na f"!rica de alfileres logra una produccin con solo .@ de alfileres defectuosos.
Prepare un diagrama de "r!ol para dos alfileres ue se toman aleatoriamente.
*O67CION #as ramas izuierdas del "r!ol presentan los resultados posi!les del primer evento
(tomar un alfiler) ' las pro!a!ilidades de ue ocurran. #as ramas derec)as presentan los
resultados posi!les del segundo evento (tomar otro alfiler) ' las pro!a!ilidades de ue ocurran,
suponiendo ue '" ocurri el primer evento.
Pro!a!ilidades de los resultados posi!les$
Pro!a!ilidad(Defectuoso, Defectuoso) L ;.;._;.;. L ;.;;;.
Pro!a!ilidad(Defectuoso, +ueno) L ;.;._;.>> L ;.;;>>
Pro!a!ilidad(+ueno, Defectuoso) L ;.>>_;.;. L ;.;;>>
Pro!a!ilidad(+ueno, +ueno) L ;.>>_;.>> L ;.>\;.
&uma de las pro!a!ilidades de todos los resultados posi!les$
L ;.;;;. R ;.;;>> R ;.;;>> R ;.>\;. L ..;;;; L .;; @
Orecuentemente es mas f"cil calcular la pro!a!ilidad de alg5n evento a partir de las
pro!a!ilidades de otros. Esto puede ser cierto si el evento en cuestin puede representarse como
la unin de otros dos eventos o como el complemento de alguno . Enseguida se presentan dos
principios importantes ue a menudo simplifican el c"lculo de los pro!a!ilidades.
2-INCI2IO A1I+I?O
Bcasionalmente ueremos determinar la pro!a!ilidad de uno entre varios sucesos diferentes. Por
ejemplo, supongamos ue usted e*trae una carta de una !araja de ?< cartas !ien !arajada. a6u"l
es la pro!a!ilidad de ue la carta sea o un re' o una figura negra% El n5mero de sucesos es ?<
(esto es FL?<). Da' 1 re'es ' 0 cartas negras. #a suma parecera ser .;.
Podramos pues suponer ue la pro!a!ilidad de o!tener !ien un re', !ien una carta negra es
.;I?<. Ftese, sin em!rago, ue al llegar a este total )emos contado ciertas cartas dos veces$ los
re'es negros fueron contados tanto en los re'es como en las cartas negras. B!viamente de!emos
contar estas cartas tan solo en uno de los totales. 7s, si incluimos los re'es negros en el total de
las cartas negras la suma revisada ser" < re'es rojos m"s 0 figuras negras para un total de \.
Fuestra pro!a!ilidad ser" pues$
P L \ I ?< L ;..?.
Ftese ue otra posi!ilidad es sumar el n5mero de re'es al n5mero de cartas negras (1 R 0 L .;),
' luego restar el n5mero de cartas con am!as caractersticas (<), 'a ue previamente las )a!amos
aHadido dos veces. 7s nuestra pro!a!ilidad es
P L (1 R 0 Q <) I ?< L \ I ?< L ;..?.
Ftese ue otra posi!ilidad es sumar el n5mero de re'es al n5mero de cartas negras (1 R 0 L .;),
' luego restar el n5mero de cartas con am!as caractersticas (<), 'a ue previamente las )a!amos
aHadido dos veces. 7s nuestra pro!a!ilidad es.
Esto nos lleva de la mano a una formulacin general de el principio de la suma.
+eorema ".%." &i 7 ' + son sucesos, la pro!a!ilidad de o!tener cualuiera de las dos es igual a
la pro!a!ilidad de 7 m"s la pro!a!ilidad + menos la pro!a!ilidad de su ocurrencia conjunta. En
una forma sim!lica, tenemos$
7plicando al ejemplo anterior,
P(7 8 +) L 1I?< R 0I?< Q <I?< L \I?< L ;..?.
Corolario " &i 7 ' + son mutuamente e*clu'entes, entonces
P(7 8 +) L P(7) R P(+).
050.26O a6u"l es la pro!a!ilidad de e*traer una espada o un tr!ol de una !araja !ien
!arajada %
*O67CION 6omo una carta no puede ser al mismo tiempo espada ' tr!ol, estos dos sucesos
son mutuamente e*clusivos. Por tanto, empleando el 6orolario ., tenemos$
P(7 8 +) L .3I?< R .3I?< L <0I?< L ;.?.
Corolario $ &i 7.,7<,73,...,7n son mutuamente e*clu'entes, entonces
P(7. 8 7< 8 73 8 ... 8 7n) L P(7.) R P(7<) R P(73) R ... R P(7n).
Corolario % &i 7.,7<,73,...,7n es una particin de un espacio muestral &, entonces
P(A1 U A2 U A3 U ... U An) = P(A1) + P(A2) + P(A3) + ... + P(An).
= P(S)
= 1.
6omo puede esperarse, el teorema ..3.. se puede generalizar de la siguiente forma$
+eorema ".%.$ Para tres eventos 7, + ' 6
050.26O &i las pro!a!ilidades de ue una persona, al comprar un automvil seleccione el
color verde, !lanco, fus)a, negro, son respectivamente, ;.;>, ;..?,;.<.,;.<3, a6u"l es la
pro!a!ilidad de ue un comprador aduiera un automvil en uno de esos colores %
*O67CION &ean T,[,O ' +, los eventos de ue un comprador seleccione respectivamente un
automvil, verde, !lanco, fus)ia, negro. dado ue estos cuatro son mutuamente e*clu'ente, la
pro!a!ilidad es$
P(G U W U F U B) = P(G) + P(W) + P(F) + P(B)
= 0.09 + 0.15 + 0.21 + 0.23
= 0.68.
Muc)as veces es m"s difcil calcular la pro!a!ilidad de ue un evento suceda ue de ue no lo
)aga. &i este es el caso para cierto evento 7, simplemente se encuentra la P(7o) ' despus se
emplea la siguiente definicin para encontrar P(7) por sustraccin.
+eorema ".%.% &i 7 ' 7oson eventos complementarios, entonces
P(7) R P(7o) L .
050.26O &i las pro!a!ilidades de ue un mec"nico automotriz reparen 3,1,?,0,/,\ o m"s
ve)culos en un da )"!il, cualuiera de la semana son respectivamente ;..<,;..>, ;.<\, ;.<1,
;..;, ' ;.;/ a6u"l es la pro!a!ilidad de ue le d servicio al menos a ? carros el siguiente da de
tra!ajo%
*O67CION &ea E el evento de ue arreglen al menos ? carros. entonces, la P(E)L.QP(Eo),
donde (PEo) es el evento de ue se reparen menos de ? autos dado ue P(Eo) L ;..< R ;..> L
;.3., se sigue con la a'uda del teorema ..3.3 ue
P(E) L . Q ;.3. L ;.0>.
2-INCI2IO .76+I26ICA+I?O
En ocasiones, nos encontramos con la necesidad de determinar la pro!a!ilidad de ocurrencia
simult"nea de dos o m"s sucesos. Por ejemplo, ueremos determinar la pro!a!ilidad de
seleccionar en la po!lacin general del pas una persona ue posea un coeficiente intelectual
(E.m.) de .3; o ma'or, ' ue tenga un ingreso ma'or a los g.<?,;;; pesos anuales. se comprende
ue este pro!lema difiere de aul en ue el principio de adicin es aplica!le. en vez de estar
interesados en determinar la pro!a!ilidad de o!tener al menos uno de los dos resultados posi!les,
ueremos conocer la pro!a!ilidad de o!tener los dos resultados simult"neamente. Para o!tener
este resultado, de!eremos aplicar el principio multiplicativo siguiente$
+eorema ".%.4 Dados dos sucesos 7 ' +, la pro!a!ilidad de o!tener am!os 7 ' + conjuntamente
es el producto de multiplicar la pro!a!ilidad de o!tener uno de los sucesos por la pro!a!ilidad
condicional de o!tener un suceso, dado ue el otro suceso )a ocurrido.
&im!licamente se representa,
2-OB60.A &upngase ue se tiene una caja de fusi!les ue contiene <; piezas, de las cuales ?
est"n defectuosas. si se seleccionan < al azar ' se sacan de la caja en sucesin sin reemplazo del
primero, acu"l es la pro!a!ilidad de ue am!os fusi!les resulten defectuosos %
*O67CION &ea 7 el evento de ue el primer fusi!le est defectuoso ' + el de ue el segundo
fusi!le tam!in^ entonces se interpretan como el evento de ue 7 ocurre, ' a
continuacin lo )ace +. #a pro!a!ilidad de sacar primero un fusi!le defectuoso es .I1^ entonces
la de e*traer un segundo fusi!le defectuoso de los restantes 1 es 1I.>. Por lo tanto,
&i se reemplaza el primer fusi!le ' los restantes se reacomodan antes de sacar el segundo,
entonces la pro!a!ilidad de e*traer un fusi!le defectuoso en la segunda seleccin es a5n .I1, esto
es, P(+A7) L P(+), por lo ue, los eventos 7 ' + son independientes. 6uando esto es verdad, se
puede sustituir la P (+A7) por la P(+) en el teorema ..3.1 para o!tener el siguiente principio
especial de la multiplicacin.
+eorema ".%.' Dos eventos 7 ' + son independientes si ' slo si
Z font para individuales. pro!a!ilidades sus de producto el calcula se simplemente
independientes, eventos dos ocurran ue pro!a!ilidad la o!tener tanto, lo PorX
050.26O 8n par de dados se lanza dos veces. a 6u"l es la pro!a!ilidad de o!tener totales de /
' .. %
*O67CION &ean 7., 7<, +. ' +< respectivos eventos independientes de ue ocurran un / en
el primer lanzamiento, un / en el segundo, un .. en el primero ' un .. en el segundo. #o ue
interesa es la pro!a!ilidad de la unin de los eventos mutuamente e*clu'entes
. Por lo tanto,
Pueden generalizarse los teoremas ..3.1 ' ..3.? para considerar cualuier n5mero de eventos, tal
como se esta!lece en el siguiente teorema.
+eorema ".%.& &i en un e*perimento, los eventos 7., 7<, 73,...,7G pueden ocurrir, entones
&i los eventos 7., 7<, 73,..., 7G son independientes, entonces
050.26O &e sacan tres cartas de juego en sucesin, sin reemplazo, de un pauete ordinario.
Encuentre la pro!a!ilidad de ue se presente el evento , donde 7. es el evento de ue
la primera carta sea un as rojo, 7< el de ue la segunda sea un .; o una sota ' 73 el de ue la
tercera sea ma'or ue 3 pero menor ue /.
*O67CION Primero se definen los eventos
7.$ la primera carta es un as rojo
7<$ la segunda un .; o una sota
73$ la tercera ma'or ue 3 pero menor ue /.
Entonces
' de au, por el teorema ..3.0, se tiene ue
7n dia8rama de =rbol es 3na representacin 8r=fica de 3n experimento G3e consta de r
pasos donde cada 3no de los pasos tiene 3n nEmero finito de maneras de ser lle>ado a cabo.

0jemplos4
".7n m/dico 8eneral clasifica a s3s pacientes de ac3erdo a4 s3 sexo :masc3lino o femenino;
tipo de san8re :A B AB 3 O; y en c3anto a la presin san83nea :Normal Alta o Baja;.
.ediante 3n dia8rama de =rbol di8a en c3antas clasificaciones p3eden
estar los pacientes de este m/dicoH

N
*ol3cin4 A
A B
N
B A
B
. AB N
A
O B

A
N
< B A
B
AB
B
O A
B


*i contamos todas las ramas terminales nos damos c3enta G3e el nEmero de
clasificaciones son $ x 4 x % K $4 mismas G3e podemos en3merarL
.AN .AA .AB .BN .BA .BB etc etc.
.) .) 1os eG3ipos denominados A y B se disp3tan la final de 3n partido de baloncesto
aG3el eG3ipo G3e 8ane dos j3e8os se83idos o complete 3n total de tres j3e8os
8anados ser= el G3e 8ane el torneo. .ediante 3n dia8rama de =rbol di8a de c3antas
maneras p3ede ser 8anado este torneo
*ol3cin4
A K 8ana el eG3ipo A
B K 8ana el eG3ipo B
A
A
A A
B A
B
B B


A
A A
A
B B B
B
B


0n este dia8rama se m3estran G3e hay solo dieA maneras de G3e se 8ane el torneo G3e
se obtienen contando las ramas terminales de este dia8rama de =rbol las G3e es posible
en3merarL
AA ABB ABAA ABABA ABABB etc etc.
<) <) 7n hombre tiene tiempo de j38ar r3leta cinco >eces como m=ximo /l empieAa a
j38ar con 3n dlar ap3esta cada >eA 3n dlar y p3ede 8anar o perder en cada j3e8o
3n dlar /l se >a a retirar de j38ar si pierde todo s3 dinero si 8ana tres dlares :esto
es si completa 3n total de c3atro dlares; o si completa los cinco j3e8os mediante 3n
dia8rama de =rbol di8a c3=ntas maneras hay de G3e se efect3/ el j3e8o de este
hombre.



*ol3cin4
M4 , M4
, M%
M% ,
, 2 M$
2 ,M%
M$ 2
M" 2 M0
M% , M4
M$ ,
M" , M$
, 2 M$
, M$
2 2
M" 2 M"
2 M0 2 M0
M0

*i contamos las ramas terminales nos daremos c3enta G3e hay "" maneras de G3e este
hombre lle>e a cabo s3s ap3estas en este dia8rama se han representado los cinco j3e8os o
ap3estas G3e este hombre tiene tiempo de j38ar.
2-OB60.A* 2-O270*+O*
". *i 3na pr3eba se compone de "$ pre83ntas de >erdaderoIfalso a. Fde c3antas maneras
diferentes 3n est3diante p3ede dar 3na resp3esta para cada pre83ntaH b. * de antemano el
maestro le dice G3e la primera pre83nta es >erdadera Fc3=ntas maneras tiene de contestar
esta pr3ebaH. a. rK40#& maneras b. rK$04! maneras
$. 7n fabricante tiene dific3ltades para obtener re8istros consistentes de resistencias a la
tensin entre tres m=G3inas localiAadas en la planta de prod3ccin el laboratorio de
in>esti8acin y el laboratorio de control de calidad respecti>amente al mismo tiempo hay
c3atro posibles t/cnicos N+om=s 0nriG3e -afael y 5a>ierI G3ienes operan al menos 3na de
las m=G3inas a pr3eba re83larmente a. Fc3=ntos pares operadorIm=G3ina deben incl3irse
en 3n experimento planeado en el G3e cada operador maneje todas las m=G3inasH b. *i se
reG3iere G3e cada par operadorIm=G3ina pr3ebe ocho especimenes Fc3=ntos especimenes
de pr3eba se necesitan para el procedimiento nte8roH Nota4 3n esp/cimen se destr3ye
c3ando se mide s3 resistencia a la tensin.
a. a. rK"$ pares b. rK#& especimenes
%. 7n inspector de constr3cciones tiene G3e re>isar el cableado de 3n n3e>o de
departamentos ya sea el l3nes el martes mi/rcoles o j3e>es a las ! A. .. a las "0 A. .. o
a las $ 2. .. a. Fc3=ntas maneras tiene este inspector de hacer las re>isiones del cableadoH
b. Obten8a las maneras en G3e el inspector p3ede realiAar las re>isiones del cableado
haciendo 3so ahora de 3n dia8rama de =rbol. a y b. rK"$ maneras

4. *i los cinco finalistas de 3n torneo internacional de 8olf son 0spaOa 0stados 7nidos
2ort38al 7r383ay y 5apn a. 1i8a de c3antas maneras es posible G3e se otor83e 3n
primero se83ndo l38ar y tercer l38ar b. Considerando G3e el primer l38ar lo 8ana
2ort38al y el se83ndo lo 8ana 0stados 7nidos Fc3antas maneras hay de G3e se otor83en los
l38ares antes mencionadosH. a. rK&0 maneras b. rK% maneras
'. 7na comp3tadora de propsito especial contiene tres conm3tadores cada 3no de los
c3=les p3ede instalarse de tres maneras diferentes. F1e c3antas maneras diferentes p3ede
instalarse el banco de conm3tadores de la comp3tadoraH rK $( maneras
&. F1e c3antas maneras ordenadas p3ede pro8ramar 3n director de tele>isin seis
comerciales en los seis intermedios para comerciales d3rante la transmisin tele>isi>a del
primer tiempo de 3n partido de hocPeyH si a. los comerciales son todos diferentes b. dos
de los comerciales son i83ales c. *i hay c3atro comerciales diferentes 3no de los c3ales
debe aparecer tres >eces mientras G3e cada 3no de los otros debe aparecer 3na sola >eA.
a. rK($0 maneras b. rK%&0 maneras c. rK"$0 maneras
(. 1etermine el nEmero de maneras en las G3e 3n fabricante p3ede seleccionar dos de las
G3ince 3bicaciones para 3n almac/n. rK"0' maneras
!. 7na caja de "$ bateras recar8ables contiene 3na defect3osa Fde c3antas maneras 3n
inspector p3ede seleccionar tres de las bateras y a. obtener la defect3osa b. no obtener la
defect3osa. a. rK'' maneras b. rK"&' maneras
#. 0l departamento de s3ministros tiene ocho diferentes motores el/ctricos y cinco
diferentes interr3ptores de arranG3e. F1e c3antas maneras p3eden seleccionarse dos
motores y dos conm3tadores para 3n experimento de 3na antena de rastreoH rK$!0
maneras
"0. A los participantes de 3na con>encin se les ofrecen & recorridos por da para >isitar
l38ares de inter/s d3rante los tres das de d3racin del e>ento. F 0n c3antas formas p3ede
3na persona acomodarse para hacer al83no de ellosH rK"! formas
"". 7n determinado Aapato se fabrica en ' estilos diferentes y en 4 colores distintos para
cada 3no. *i la Aapatera desea mostrar a s3 clientela pares de Aapatos en todos los estilos y
colores Fc3=ntos pares distintos deber=n colocar en el aparadorH rK$0
"$. 7n est3diante de primer aOo debe tomar 3n de ciencia 3no de h3manidades y otro de
matem=ticas. *i p3ede esco8er entre c3alG3iera de & c3rsos de ciencias 4 de h3manidades y
4 de matem=ticas Fc3=ntas maneras tiene de seleccionar las materiasH
rK#& maneras
"%. 7n 3rbanista de 3na n3e>a s3bdi>isin ofrece a los clientes prospectos para la compra
de 3na casa la posibilidad de seleccionar c3alG3iera de 4 diseOos diferentes tres sistemas
de calefaccin cochera con p3ertas o sin ellas y patio o prtico Fc3=ntos planes distintos
est=n disponibles para el compradorH rK 4! planes
"4. *i 3na pr3eba de seleccin mEltiple consta de ' pre83ntas cada 3na con 4 posibles
resp3estas de las c3ales solo 3na es correcta a. Fen c3antas formas diferentes p3ede 3n
est3diante esco8er 3na resp3esta para cada pre83ntaH b. Fen c3antas formas p3ede 3n
est3diante esco8er 3na alternati>a para cada pre83nta y tener todas las resp3estas
incorrectasH a. rK "0$4 b. rK$4%
"'. 7n testi8o de 3n accidente de tr=nsito en el G3e el ca3sante h3y le indica al polica G3e
el nEmero de matrc3la del a3tom>il tena las letras 17) se83idas por tres d8itos el
primero de los c3ales era 3n cinco. * el testi8o no p3ede recordar los otros dos d8itos pero
est= se83ro de G3e los tres eran diferentes enc3entre el nEmero m=ximo de re8istros de
a3tom>il G3e debe >erificar la polica. rK($ re8istros
"&. a; F1e c3antas maneras p3eden formarse & personas para s3bir a 3n a3tobEsH b.si tres
de ellas insisten en se83irse 3na a la otra Fen c3antas formas es esto posibleHc.*i dos
personas se rehEsan a se83irse 3na a la otraH
a. rK($0 b. rK"44 c. rK4!0 maneras
"(. a; Fc3=ntos nEmeros de tres d8itos p3eden formarse con los d8itos 0 " $ % 4 ' y & si
cada 3no solo p3ede 3sarse solo 3na >eAH b; Fc3=ntos de estos nEmeros son nonesH c;
Fc3=ntos son mayores G3e %%0H a. rK"!0 b. rK(' c. rK"0' nEmeros
"!. F0n c3antas formas p3eden sentarse en 3na lnea 4 niOos y ' niOas si deben colocarse
alternadamenteH rK$!!0 formas
"#. C3atro matrimonios compraron ! l38ares para 3n concierto. F0n c3antas formas
diferentes p3eden sentarse a. sin restriccionesH b. si se sientan por parejasH c. si todos los
hombres se sientan j3ntos a la iAG3ierda de todas las m3jeresH
a. rK40%$0 b. rK%!4 c. rK'(&
$0. FC3=ntos menEs G3e consisten de sopa emparedado postre y 3n refresco se p3ede
ofrecer si se p3ede seleccionar entre 4 sopas diferentes % clases de emparedados ' postres y
4 refrescosH rK$40 menEs
$". F0n c3antas formas p3eden llenarse las ' posiciones iniciales de 3n eG3ipo de baloncesto
con ! j38adores G3e p3eden oc3par c3alG3iera de ellasH rK&($0 formas
'#$!0
$$. *e sacan tres boletos de la lotera de 3n 8r3po de 40 para el primero se83ndo y tercer
premios. 0nc3entre el nEmero de p3ntos m3estrales en para otor8arlos si cada
conc3rsante conser>a solo 3n boleto. rK'#$!0 p3ntos
$%. F0n c3antas formas p3eden plantarse a lo lar8o de la lnea di>isoria de 3na propiedad
% robles 4 pinos y $ arces si no se distin83e entre los =rboles de la misma claseH
rK"$&0 formas
$4. N3e>e personas salen de >iaje para esG3iar en tres >ehc3los c3yas capacidades son de $
4 y ' pasajeros respecti>amente. F0n c3=ntas formas es posible transportar a las #
personas hasta el alber83e con todos los >ehc3losH rK44"0 formas
$'. FC3=ntas formas hay de seleccionar a % candidatos de 3n total de ! reci/n 8rad3ados y
con las mismas capacidades para oc3par >acantes en 3na firma contableH
-K'&$""0 formas
$&. 0n 3n est3dio G3e realiAaron en california el decano 6ester BresloQ y el doctor 5ames
0nstrom de la *chool of 23blic )ealth de la 7ni>ersity of California en los An8eles se
concl3y G3e al se83ir ( sencillas re8las de sal3d la >ida de 3n hombre p3ede alar8arse en
promedio "" aOos y la de las m3jeres siete. 0stas ( re8las son4 no f3mar hacer ejercicio
re83larmente tomar alcohol solo en forma moderada dormir siete 3 ocho horas conser>ar
3n peso apropiado desay3nar y no comer entre alimentos. F0n c3antas formas p3ede 3na
persona adoptar cinco de estas re8las a. si act3almente las >iola todasH b. si n3nca toma
bebidas alcohlicas y siempre desay3naH a. rK$" formas
b.rK"0 formas
$(. 7n dispositi>o Biomec=nico para emer8encias m/dicas p3ede operar 0 " o $ >eces por
noche. +race 3n dia8rama de =rbol para demostrar G3e existen "0 maneras diferentes en
las G3e p3ede operar para 3n total de & >eces en c3atro noches.
.". 9otacin factorial.
Notacin Factorial
En algunos problemas de matemticas se nos presentan multiplicaciones de nmeros
naturales sucesivos tal como: 4 x 3 x 2 x 1 = 24; 3 x 2 x 1 = 6; 2 x 1 = 2.
Para abreviar estas expresiones, se usa una notacin especial llamada notacin
factorial y nos denota las multiplicaciones sucesivas de n hasta l y se define como:
4 x 3 x 2 x 1 = 4! Se lee"cuatro factorial
3 x 2 x 1 = 3! Se lee "tres factorial
En trminos generales:
n(n-1)(n-2)...x 2 x 1 = n! Se lee "n factorial
Propiedades:
a) para n natural
n! = n(n-1)!
E5emplo@ 7! = 7 x 6! = 7 x 6 x 5 x 4!
b) 0! = 1
E5emplos@
1) 5! = 5 x 4 x 3 x 2 x 1 = 120
2) 4! 3! = (24)(6) = 144
3)
4)
5)
Cuando n es demasiado grande se suele utilizar la frmula de Stirling:
E5emplo@
Determinar 50! por Stirling:
)ttp$IIJJJ.universidada!ierta.edu.m*I&erEstIM7PIMETBDB&
@<;687FTET7TEPB&IP'eItemad<..)tm
FBT76ESF O76TB2E7#
El factorial de un n5mero es el producto de los enteros positivos desde uno )asta n, se emplea con
muc)a frecuencia ' se denota por sm!olo nl ue se lee ,n factorial- por otra parte se define el
cero factorial como$
."." Permutacin.
20-.7+ACION0* :1I*+IN,7IB60* C CI-C76A-0*;
8na permutacin es una forma en la ue pueden presentarse los o!jetos o eventos, ' en la ue el
orden de aparicin es mu' importante^ por ejemplo, cuatro euipos deportivos (7, +, 6 ' D)
jugar"n en un torneo. Primero jugar"n 7 contra + ' 6 contra D. #os ganadores de cada juego
jugar"n entre s para definir as el primero ' segundo lugar. #os perdedores de los primeros
juegos definir"n en un juego uin tendr" el tercer lugar. 7l analizar esta situacin se o!serva ue
para o!tener el primer lugar es necesario ganar en el primer juego ' ganar en el segundo (TT). El
segundo lugar se logra si gana en el primer juego ' pierde en el segundo (TP).
El tercer lugar se o!tiene si pierde en el primer juego ' gana en el segundo (PT). 7 pesar de ue
los euipos en segundo ' tercer lugar )a'an ganado un juego ' perdido otro, el orden en ue lo
)a'an )ec)o marca la diferencia (TPLILPT).
#a frmula general de las permutaciones es la siguiente$
Permutaciones de n !
n objetos = nPr = ----------
tomados de r en r (n - r)!
n es el n5mero total de o!jetos o eventos
r es el n5mero de o!jetos ue se desea considerar (n puede ser cualuier valor entero positivo, r
puede ser cualuier valor entero positivo, r puede ser cualuier valor entero positivo desde .
)asta n)
#a frmula anterior ' otras similares se aplican en los ejemplos ue se muestran a continuacin$
2erm3tar al83nos objetos de todos diferentes
El n5mero de formas diferentes en ue pueden ordenarse n o!jetos diferentes cuando se toman
algunos de estos (r), es el n5mero de permutaciones, tal como se ejemplifica a continuacin$
050.26O. &e sacan dos !oletos de la lotera, entre <; posi!les, para el primero ' segundo
premio. Encuntrese el n5mero de puntos muestrales en el espacio (&(.
*O67CION El n5mero total de puntos muestrales es$
20!
20P2 = ------- = (20)(19) =380
18!
2erm3tar todos los objetos de todos diferentes
El n5mero de formas diferentes en ue pueden ordenarse n o!jetos diferentes cuando se toman de
uno en uno es el factorial de n (nl), tal como se presenta a continuacin. B!serve de nl crece
r"pidamente, por ejemplo, si n es igual a .?, su factorial es . 3;/ 0/1 30\ ;;;
050.26O a6u"ntos arreglos diferentes son posi!les para sentar a 0 personas alrededor de una
mesa%
*O67CION 0l L /<;.
#as permutaciones ue se dan al acomodar o!jetos en un crculo se llaman permutaciones
circulares. Dos de stas no se consideran diferentes a menos ue a los o!jetos correspondientes al
avanzar en el sentido de las manecillas del reloj.
2erm3tar n objetos distintos a8re8ados en 3n crc3lo
El n5mero de permutaciones de n o!jetos distintos agregados en un crculo es (nQ.)l
050.26O &i 1 personas juegan al !ridge, no se tiene una nueva permutacin si todas se
mueven una posicin en esa direccin. 7l considerar una persona en un lugar fijo ' acomodar las
otras tres acu"ntos acomodos distintos )a!r"n para el juego de !ridge%
*O67CION #os acomodos distintos para el juego de !ridge son$ (1 Q .)l L 0.
Dasta a)ora se )an considerado permutaciones de o!jetos diferentes. Esto es, todos los o!jetos
eran distintos o totalmente distingui!les.
2erm3tar al83nos objetos de al83nos repetidos
El n5mero de permutaciones diferentes de n o!jetos de los cuales n. son de un tipo, n< son de un
segundo tipo, ... , nG de un GQsimo tipo, es$
nl
QQQQQQQQQQQQQQQQQ
n.l n<l ... nGl
050.26OaEn cu"ntas formas diferentes pueden acomodarse tres focos rojos, dos amarillos '
dos azules en un "r!ol de navidd con > recept"culos %
*O67CION El n5mero de arreglos diferentes es
9!
-------- = 1260
3! 4! 2!
2erm3tar todos los objetos de al83nos repetidos
El n5mero de formas diferentes en ue pueden ordenarse n., n<, ... ^ ' nn o!jetos iguales entre
s, cuando se toman de uno por uno, es el factorial de (n. R n< R ... R nn), entre el producto de
los factoriales de n., n<, ... , ' nn. Es decir,
(n. R n< R ... R nn)l
QQQQQQQQQQQQQQQQQQQQQ
n.l _ n<l _ ... _ nnl
050.26O aEn cu"ntas formas diferentes pueden / cientficos acomodarse en una )a!itacin
triple ' dos )a!itaciones do!les en un )otel%
*O67CION El n5mero total de particiones posi!les sera$
7!
Formas = ---------- = 210.
3! 2! 2!
2erm3taciones con reemplaAo
En todos los ejemplos anteriores, el n5mero de o!jetos esta!an perfectamente definido. &in
em!argo, es frecuente ue el n5mero de o!jetos sea limitado, pero ue el n5mero de veces ue se
presenten sea infinito, por ejemplo, cuando los o!jetos seleccionados pueden ser elegidos de
nuevo.
#a diferencia entre una situacin ' otra se conoce como reemplazo ' se presenta en el siguiente
ejemplo$
050.26O #os resultados posi!les de un juego son perder o ganar. si se juegan cuatro juegos,
acu"les son los resultados posi!les%
*O67CION 6ada uno de los cuatro juegos puede terminar en cualuiera de los resultados
posi!les. Esto se muestra gr"ficamente a continuacin$
El n5mero de formas diferentes en ue puedan aparecer n o!jetos diferentes, en m intentos, con
reemplazo, es$ (n__m). En este caso, <__1 L .0 formas diferentes.
6omprue!e ue si n L 3 ' m L ?, el n5mero de formas diferentes ser" <13^ ' ue si nL? ' mL3, el
n5mero de formas diferentes ser" .<?.
PE2M8T76EBFE&.
2ara entender lo G3e son las perm3taciones es necesario definir lo G3e es 3na combinacin
y lo G3e es 3na perm3tacin para establecer s3 diferencia y de esta manera entender
claramente c3ando es posible 3tiliAar 3na combinacin y c3ando 3tiliAar 3na perm3tacin
al momento de G3erer c3antificar los elementos de al8En e>ento.
PE2M8T76ESF$
Es todo arreglo de elementos en donde nos interesa el lugar o posicin ue ocupa cada uno de los
elementos ue constitu'en dic)o arreglo.
PE2M8T76EBFE& 6BF 2EPETE6EBF.

En los casos anteriores se 4an obtenido permutaciones en donde todos los elementos
utili1ados para 4acer los arre*los son diferentes. : continuacin se obtendr una frmula (ue
nos permite obtener las permutaciones de n ob5etos/ cuando entre esos ob5etos 4ay al*unos (ue
son i*uales.

E5emplo@
6bten*a todas las permutaciones posibles a obtener con las letras de la palabra 6S6.
Solucin@

Para obtener la frmula/ es necesario primero suponer (ue todas las letras de la palabra
6S6 son diferentes y para diferenciarlas pondremos subndices a las letras 6/ por lo (ue
(uedara/ 61S6/ y las permutaciones a obtener seran@

"P" F "M F &

definiendo las permutaciones tenemos (ue estas seran/

61S6/ 6S61/ S616/ S661/ 616S/ 661S

NPero realmente podemos 4acer diferentes a las letras 6O/ eso no es posible/ lue*o
entonces Ncuntos arre*los reales se tienenO

Como@
:rre*los reales
61S6 F 6S61 6S6
S616 F S661 S66
616SF 661S 66S


Entonces se o!serva ue en realidad slo es posi!le o!tener tres permutaciones con las letras de
la pala!ra B&B de!ido a ue las letras B son idnticas, apero u es lo ue nos )izo pensar en
seis arreglos en lugar de tres%, el cam!io ue )icimos entre las letras B cuando las consideramos
diferentes, cuando en realidad son iguales.

Para o!tener los arreglos reales es necesario partir de la siguiente e*presin$


0l nEmero de arre8los reales K No. de perm3taciones considerando a todos los objetos como diferentes
6os cambios entre objetos i83ales


0l nEmero de arre8los reales K %R S $R K % x $R S $R K %


2or tanto la frm3la a 3tiliAar seraL

9 ) 9....... ) 9 )
9 n
) ........- ) - nP)
/
/
< .
< .


1onde4

n2x
"
x
$
...... x
P
K NEmero total de perm3taciones G3e es posible obtener con n objetos entre
los G3e hay 3na cantidad x
"
de objetos de cierto tipo 3na cantidad x
$
de objetos de 3n
se83ndo tipo...... y 3na cantidad x
P
de objetos del tipo P.

n K x
"
T x
$
T ...... T x
P

0jemplos4

.) .) Obten8a todas las seOales posibles G3e se p3eden diseOar con seis banderines
dos de los c3ales son rojos tres son >erdes y 3no morado.

&olucin$

n K & banderines
x
"
K $ banderines rojos
x
$
K % banderines >erdes
x
%
K " bandern morado


&
2
$

"
K &R S $R%R"R K &0 seOales diferentes


<) <) a.FC3=ntas cla>es de acceso a 3na comp3tadora ser= posible diseOar con los
nEmeros """$%%%%H b.Fc3=ntas de las cla>es anteriores empieAan por 3n
nEmero 3no se83ido de 3n dosH c. Fc3=ntas de las cla>es del inciso a empieAan por
el nEmero dos y terminan por el nEmero tresH

*ol3cin4

a. n K ! nEmeros
x
"
K % nEmeros 3no
x
$
K " nEmero dos
x
%
K 4 nEmeros c3atro

!
2
%

"

4
K !R S %R"R4R K $!0 cla>es de acceso


b. n K & :se excl3ye 3n nEmero 3no y 3n dos;
x
"
K $ nEmeros 3no
x
$
K 4 nEmeros tres
" x " x
&
2
$

4
K " x " x &R S $R4R K "' cla>es de acceso

El primer n5mero uno nos indica el n5mero de maneras como es posi!le colocar en la primera
posicin de la clave de acceso un n5mero uno, de!ido a ue todos los n5meros uno son iguales,
entonces tenemos una sola manera de seleccionar un n5mero uno para la primera posicin, el
siguiente n5mero uno nos indica el n5mero de maneras como se colocara en la segunda posicin
el n5mero dos ' la e*presin siguiente nos indica todos los arreglos posi!les ue es posi!le
diseHar con los n5meros restantes.

c. n K & :se excl3ye 3n nEmero dos y 3n tres;
x
"
K % nEmeros 3no
x
$
K % nEmeros tres

" x
&
2
%

%
x" K " x &R S %R%R K $0 cla>es de acceso

0l nEmero 3no inicial nos indica G3e existe 3na sola manera de seleccionar el nEmero dos
G3e >a en la primera posicin del arre8lo mientras G3e el nEmero 3no final nos indica G3e
hay 3na sola manera de seleccionar el nEmero tres G3e >a al final del arre8lo aEn y c3ando
haya c3atro nEmeros tres como estos son i83ales al diseOar 3na perm3tacin es indistinto
c3=l nEmero tres se pon8a ya G3e siempre se tendr= el mismo arre8lo y la expresin
intermedia nos indica todos los arre8los posibles a realiAar con los nEmeros restantes.

3) 3) F1e c3=ntas maneras es posible plantar en 3na lnea di>isoria de 3n terreno dos
no8ales c3atro manAanos y tres cir3elosH

*ol3cin4

n K # =rboles
x
"
K $ no8ales
x
$
K 4 manAanos
x
%
K % cir3elos


#
2
$

%
K #R S $R4R%R K "$&0 maneras de plantar los =rboles

1) 1) *i 3n eG3ipo de fEtbol soccer femenil participa en "$ j3e8os en 3na temporada
Fc3=ntas maneras hay de G3e entre esos doce j3e8os en G3e participa obten8a (
>ictorias % empates y $ j3e8os perdidosH

*ol3cin4

n K "$ j3e8os
x
"
K ( >ictorias
x
$
K % empates
x
%
K $ j3e8os perdidos

"$
2
(

$
K "$R S (R%R$R K (#$0 maneras de G3e en la temporada este eG3ipo lo8re
siete >ictorias tres empates y dos j3e8os perdidos.
.".# Combinaciones.
6BM+EF76ESF$
Es todo arreglo de elementos en donde no nos interesa el lugar o posicin ue ocupa cada uno de
los elementos ue constitu'en dic)o arreglo.
#ombinaciones:

Para estudiar este pro!lema, dmonos una coleccin de n o!jetos. Entonces si tomamos r
elementos sin importar el orden en ue los tomemos, decimos ue )emos realizado una
com!inacin de r elementos de los n disponi!les. El n5mero posi!le de com!inaciones de r
elementos de n disponi!les lo denotaremos por$
n6r
!eorema$
Diptesis$ E*isten n elementos en un conjunto de los cuales se toman r.
6onclusin$ El n5mero de posi!les com!inaciones es$
n6rLnlI(rl_(nQr)l)

%emostracin
&a!emos ue si tomamos r elementos de una coleccin de n, si nos fijamos del ordenen
ue lo tomamos, tenemos nlI(nQr)l, pero a la vez, si consideramos ue en una com!inacin no
importa el orden. &a!emos ue para colocar r elementos en r posiciones )a' rl formas de )acerlo,
as ue para cada una de las nlI(nQr)l formas en ue se pueden tomar los elementos )a' ue uitar
rl, tenemos ue precisamente )a' nlI(rl_(nQr)l) distintas com!inaciones de r elementos de n
posi!les.
8na com!inacin es una forma en la ue pueden presentarse los o!jetos o eventos, ' en la ue el
orden de aparicin no importa^ por ejemplo, la multiplicacin de los dgitos <, ? ' \ puede
)acerse de muc)as formas diferentes, por ejemplo, <_?_\ o <_\_?, pero en todos los casos el
resultado ser" el mismo.
#a frmula general de las com!inaciones es la siguiente$
Combinaciones de n!
n objetos = nCr= -------------
tomados de r en r r! * (n - r)!
n es el n5mero total de o!jetos o eventos
r es el n5mero de o!jetos ue se desea considerar (n puede ser cualuier valor entero positivo, r
puede ser cualuier valor entero positivo, r puede ser cualuier valor entero positivo desde .
)asta n)
B!serve ue, para cualuier pareja de n5meros enteros positivos n ' r, e*ceptuando rL., el
n5mero de permutaciones es ma'or ue el de com!inaciones. Por ejemplo, si nL/ ' rL1, /P1 L
\1; ' /61 L 3?.
050.26O En un grupo )a' ? personas, las ue pueden identificarse con las letras 7, +, 6, D '
E. De ellas se van a seleccionar 3 para una misin especial. aDe cu"ntas formas diferentes se
pueden seleccionar las 3 personas%
*O67CION B!serve ue la misin formada por las personas 7, + ' 6 se considera igual a la
misin integrada por las personas +, 6 ' 7 (o 67+, 6+7, etc.), por lo ue en este caso puede
aplicarse la frmula para calcular el n5mero de las com!inaciones posi!les de un total de ?
elementos, tomados de 3 en 3, el cual est" dado por$
5!
5C3 = --------------- = 10
3! * (5 - 3)!
#a misin especial puede uedar integrada por las personas$ 7+6, 7+D, 7+E, 76D, 76E,
7DE, +6D, +6E, +DE ' 6DE, es decir, .; formas diferentes.
050.26O 8na preseleccin de fut!ol est" formada por <? jugadores. aDe cu"ntas formas
diferentes puede el entrenador integrar un euipo de .. jugadores%
*O67CION El n5mero de com!inaciones posi!les de un total de <? jugadores, tomados de ..
en .., est" dado por$
25!
25C11 = ------------------
11! * (25 - 11)!
1.551121 E25
= ---------------------------
39 916 800 * 8.717829 E10
= 4 457 400
050.26O En un ejrcito )a' <; ;;; soldados, ' de ellos se van a seleccionar .;; para una
misin especial. aDe cu"ntas formas diferentes se pueden seleccionar los .;; soldados%
*O67CIONEl n5mero de com!inaciones posi!les de un total de <; ;;; soldados, tomados de
.;; en .;;, est" dado por$
(20 000)!
20 000C100 = -----------------------
100! * (20 000 - 100)!
20 000 * 19 999 * ... * 19 901 * 19 900!
= ------------------------------------------
100! * 19 900!
20 000 * 19 999 * ... * 19 901
= -------------------------------- (Vase la nota)
100!
(2.0000*10 E4)*(1.9999*10 E4)*(...)*(1.9901*10 E4)
= -------------------------------------------------
100!
(2.0000*1.9999*...*1.9901)*(10 E400)
= -------------------------------------
9.3326*10 E157
(9.8931*10 E29)*(10E 157*10 E243)
= --------------------------------
9.3326*10 E157
9.8931*10 E29*10 E243
= ---------------------------
9.3326
= 1.0601*10 E272
NO+A4 #a multiplicacin directa de todos los valores del n5mero e*cede la capacidad de una
calculadora com5n, e incluso la de una computadora, pero esto puede evitarse si se reducen los
valores numricos, aplicando las reglas de los e*ponentes$ por ejemplo, a__1 L (a__<)_(a__<) L
a__(<R<).
050.26OEncuntrese el n5mero de comits ue pueden formarse con cuatro umicos ' tres
fsicos ' ue comprendan dos umicos ' un fsico.
*O67CION El n5mero de formas de seleccionar < umicos de 1 posi!les es$
4!
2C4 = ------- = 6.
2! 2!
El n5mero de formas de seleccionar . fsico de tres posi!les es$
3!
1C3 = ------- = 3
1! 2!
7l emplear el principio multiplicativo, con n.L0 ' n<L3, se forman
n1n2 = (6)(3) = 18
comits con < umicos ' . fsico. 1l
.".$ Teorema del )inomio.
El teorema del binomio, o 5inomio de 6e7ton por haber sido ste quien propuso el
mtodo general para su desarrollo, es un binomio elevado a una potencia n, que en
su caso ms simple es un n#mero natural.
En trminos generales, el teorema del binomio establece que para a,bR y nN, se
tiene que(
%ara el caso concreto de este hiperte&to, se cambiar la notacin y se utili"ar la
propiedad de conmutatividad de los n#meros reales(
'i se desea ver la demostracin de este teorema, en la pgina +/ del libro 8lgebra
superior8 de ,rdenas, $luis, 9aggi y :oms (editado por :rillas en );;<), aparece
una.
4ttp@AABBB.ua(.m;AmatematicasAestadisticasA;tra.4tml
E, TE62E%: DE, )!96%!6
El teorema del binomio, descubierto hacia 1664 -1665, fue comunicado por primera vez
en dos cartas dirigidas en 1676 a Henry Oldenburg (hacia 1615-1677), secretario de la
Royal Society que favoreca los intercambios de correspondencia entre los cientficos
de su poca. En la primera carta, fechada el 13 de junio de 1676, en respuesta a una
peticin de Leibniz que quera conocer los trabajos de matemticos ingleses sobre
series infinitas, Newton presenta el enunciado de su teorema y un ejemplo que lo
ilustra, y menciona ejemplos conocidos en los cuales se aplica el teorema. Leibniz
responde, en una carta fechada el 17 de agosto del mismo ao, que est en posesin
de un mtodo general que le permite obtener diferentes resultados sobre las
cuadraturas, las series, etc., y menciona algunos de sus resultados. nteresado por las
investigaciones de Leibniz, Newton le responde tambin con una carta fechada el 24 de
octubre en la que explica en detalle cmo ha descubierto la serie binmica.
El descubrimiento de la generalizacin de la serie binmica es un resultado importante
de por s; sin embargo, a partir de este descubrimiento Newton tuvo la intuicin de que
se poda operar con series infinitas de la misma manera que con expresiones
polinmicas finitas. El anlisis mediante las series infinitas pareca posible, porque
ahora resultaban ser una forma equivalente para expresar las funciones que
representaban.
FeJton no pu!lic nunca el teorema del !inomio. #o )izo [allis por primera vez en .0\? en su
Algebra- atri!u'endo a FeJton este descu!rimiento.

Como sabemos de los temas de factorizacin, anteriores podemos desarrollar
fcilmente polinomios de la forma a
2
+ 2ab + b
2
o a
3
+ 3a
2
b +3ab
2
+ b
3
, sin embargo el
realizar operaciones con potencias de mayor grado resulta tedioso, a continuacin
presentamos algunos de ellos.


(a + b)
1
= a + b

(a + b)
2
= a
2
+ 2ab + b
2


(a + b)
3
= a
3
+ 3a
2
b +3ab
2
+ b
3


(a + b)
4
= a
4
+ 4a
3
b + 6a
2
b
2
+ 4ab
3
+ b
4

(a +b)
5
= a
5
+ 5a
4
b +10a
3
b
2
10a
2
b
3
+ 5ab
4
+ b
5

debido a lo tedioso de estos clculos se hace necesario el uso de alguna expresin que
nos permita adquirir los binomios de mayor potencia. La expresin que se muestra a
continuacin es conocido como el teorema de Newton, permite desarrollar los clculos
anteriores y de mayor grado:
Donde


Es la combinatoria, se lee, de n elementos tomados r,
donde n!=1234...(n-1) n conocido como factorial de n y 0!=0, 1!=1

Ejemplos:




pero podemos ver que:
con esta igualdad es f"cil de calcular e*presiones mas grandes con menos operaciones, por
ejemplo$

Vemos que:

Entonces :

Un caso particular del binomio de Newton es el siguiente:



Ejemplos de la forma a
n
Q !
n
:
Con n F C

Con n K "
Con n K $
Ejemplos de la forma a
n
Q !
n
:
)ttp$IIdieumsn).f!.umic).m*ImatematicasIale3.)tm
.# Probabilidad con t.cnicas de conteo.
.#.1 :plicacin del concepto clsico de probabilidad.
.#. E5ercicios de permutacin.
a" Permutaciones lineales!
Permutaciones de diferentes objetos tomados todos a la vez. El total de permutaciones de un conjunto de
objetos tomados todos a la vez, se obtiene razonando en forma similar del principio fundamental de
contar.
NPn = n!
Ej.- TR
3 x 2 x 1 = 6 nPn = n! ........ 3 x 2 x 1 = 6
Ej .- Cuantas palabras de cinco letras se pueden formar con la palabra libro aplique permutaciones.
5P5 = 5! = 5 x 4 x 3 x 2 x 1 = 120
b" Permutaciones de objetos diferentes tomados parte al vez o de r en r!
Una permutacin de "n objetos diferentes tomados de "r en "r es tambien una ordenacin de "r entre
los "n " objetos.
NPr = n!
(n-r)!
Ej.- Cuantas palabras de tres letras se pueden formar con las letras de la palabra libro.
N = 5 5P3 = 5! = 5! = 5 x 4 x 3 x 2 x 1 = 60
R = 3 (5-3)! 2! 2 x 1
Ej.- Cuantos nmeros de dos dgitos se pueden formar con los dgitos 4,6,9 y cuales son, sin repetirse los
dgitos?
N = 3 3P2 = 3! = 3! = 3 x 2 x 1 = 6 46, 49, 64, 69, 94, 96.
R = 2 (3-2)! 1! 2!
Ej.- Del grupo de 5G de contabilidad de 47 alumnos , se quiere escoger un presidente, secretario, y
tesorero. Cuantas maneras se puede ordenar?
N = 47 41P3 = 47! = 47! = 47 x 46 x 45 x 44! = 97290
R = 3 (47-3)! 44! 44!
c" Permutaciones formado de grupos
De los que n1 son iguales, n2 son iguales, n3 son iguales, etc. Tomados todos a la vez.
. n! .
n1!n2!n3!
Ej.- El 25 de diciembre se quiere hacer una reparticin de regalos que consiste en cuatro bicis iguales,
tres pelotas iguales, dos muecas iguales, de cuantas maneras se pueden repartir estos regalos?
9! = 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 9 x 4 x 7 x 5 = 1260
4! 3! 2! 4 x 3 x 2 x 1 x 3 x 2 x 1 x 2 x 1
Ej,- Cuantas palabras se puede formar con la palabra TENNESSE
8! = 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 8 x 7 x 6 x 5 = 1680
1! 3! 2! 2! 1 x 1 x 3 x 2 x 1 x2 x 1 x 2 x 1
d"Permutaci#n cclica o alrededor de!
Una permutacin cclica o alrededor de es una ordenacin de "n objetos de un circulo o cualquier otra
curva simple cerrada en donde siempre uno de los objetos tiene una posicin fija y se define por la
siguiente expresin: P = (n-1)!
Ej.- Se quieren acomodar alrededor de una mesa Carlos, Petra, Juana y Maria, de cuantas maneras se
pueden acomodar? Demustralo.
P = (n-1)! C C C C C C
P = (4-1)!
P = 3! M P J P M J P M J M P J
P = 6 J M P J P M
Ej.- Se tienen 2 libros de legislacin fiscal, 3 de mate y 6 de contabilidad (todos diferentes) de cuantas
maneras se pueden acomodar en un estante si:
a) no se impone ninguna restriccin
11P11 = 11! = 11 x 10 x 9 x 8! ... = 39916800
b) solamente los libros de mate deben ir juntos y los de mate deben ir intercambiados
9P9 x 3P3 = 9! x 3! = (9 x 8 x 7 x 6!.) (3 x 2 x 1) = (362880) (6) = 2177280
c) los libros de legislacin deben ocupar los extremos.
9P9 x 2P2 = 9! x 2! = (9 x 8 x 7 x 6!.) (2 x 1) = (362880) (2) = 725760
http://html.rincondelvago.com/probabilidad_8.html
.#." E5ercicios de combinaciones.
Una combinacin de un numero de objetos diferentes tomados de "r en "r es una seleccin de
"r de los "n objetos de un conjunto sin considerar el orden de los objetos.
nCr = n! .
r! (n-r)!
Ej. Se desean formar equipos de dos personas para la exposicin de un proyecto de un total de
cuatro estudiantes Gabriel, Melchor, Wendy y Vernica, de cuantas maneras se pueden formar
y comprobar si:
a) se pide una ordenacin
nPr = n! . n = 4 4P2 = 4! = 4! = 4 x 3 x 2 x 1 = 12
(n-r)! r = 2 (4-2)! 2! 2 x 1
GM
GW
GV
MG
MW
MV
WG
WM
WV
VG
VM
VW
b)se pide una seleccin
nCr = n! n = 4 4C2 = 4! = 4! = 4 x 3 x 2 x 1 = 6
r!(n-r)! r = 2 2! (4-2)! 2!(2!) 2 x 1 x 2 x 1
GM
GW
GV
WV
MW
MV
Ej.- Se requiere formar un comit representativo que lo conforman un presidente, secretario y
un tesorero de un total de 15 personas De cuantas maneras se puede seleccionar estas tres
personas para ocupar estos puestos?
n = 15 r = 4
nCr = n! . = 15! = 15! = 15 x 14 x 13 x 12!... = 2730 = 455
r! (n-r)! 3!(15-3)! 3!(2!) 3 x 2 x 1 x 12! 6
Ej. Se quiere formar un comit de cuatro hombres, tres mujeres m dos nios y dos nias de un
total de 8 hombres , cinco mujeres, cuatro nios, y tres nias, de cuantas maneras se puede
escoger si:
a) no hay ninguna condicin
b) dos hombres y una mujer debe de pertenecer al comit.
c) cuatro hombres no deben de pertenecer al comit.
nCr = n! .
r! (n-r)!
a) 8C4 = 8! = 8! = 8 x 7 x 6 x 5 x 4!... = 1680 = 70
4!(8-4)! 4!(4!) 4 x 3 x 2 x 1 x 4! 24
5C3 = 5! = 5! = 5 x 4 x 3!... = 20 = 10
3!(5-3)! 3!(2!) 3 x 2 x 1 x 2 x 1 2
4C2 = 4! = 4! = 4 x 3 x 2 x 1 = 12 = 6
2!(4-2)! 2!(2!) 2 x 1 x 2 x 1 2
3C2 = 3! = 3! = 3 x 2 x 1 = 3 = 3
2!(3-2)! 2!(1!) 2 x 1 x 1 x 1 1
70 x 10 x 6 x 3 = 12600
b) 6C2 = 6! = 6! = 6 x 5 x 4! . = 30 = 15
2!(6-2)! 2!(4!) 2 x 1 x 4! 2
4C2 = 4! = 4! = 4 x 3 x 2 x 1 . = 12 = 6
2!(4-2)! 2!(2!) 2 x 1 x 2 x 1 2
4C2 = 4! = 4! = 4 x 3 x 2 x 1 . = 12 = 6
2!(4-2)! 2!(2!) 2 x 1 x 2 x 1 2
3C2 = 3! = 3! = 3 x 2 x 1 = 6 = 3
2!(3-2)! 2!(1!) 2 x 1 x 1 x 1 2
15 x 6 x 6 x 3 = 1620
d)4C4 = 4! = 4! = 4 x 3 x 2 x 1 = 24 = 1
4!(4-4)! 4!(0!) 4 x 3 x 2 x 1 24
5C3 = 5! = 5! = 5 x 4 x 3 x 2 x 1 = 20 = 10
3!(5-3)! 3!(2!) 3 x 2 x 1 x 2 x 1 2
4C2 = 4! = 4! = 4 x 3 x 2 x 1 = 12 = 6
2!(4-2)! 2!(2!) 2 x 1 x 2 x 1 2
3C2 = 3! = 3! = 3 x 2 x 1 = 6 = 3
2!(3-2)! 2!(1!) 2 x 1 x 1 x 1 2
1 x 10 x 6 x 3 = 180
Ej.- Se lanza una moneda tres veces, cual es la probabilidad de que es esos tres lanzamientos
caiga:
a) exactamente un sello
b) tres guilas
c) por lo menos un sello
d) dos guilas
1
2
3
4
5
6
7
8
1
A
A
A
S
S
S
S
A
2
A
A
S
A
S
S
A
S
3
A
S
A
A
S
A
S
S
P(A) = h / N
x x = 1/8 Espacio muestra o todos los resultados
posibles
a) P(exacto un sello) = 3/8
b) P(tres guilas) = 1/8
c) P(por lo menos un sello) = 7/8
d) P(dos guilas) = 3/8
e) P(cuatro sellos) = 0/8
Ej.- En una caja que contiene pelotas: ocho rojas, diez blancas, doce azul, 15 amarilla, 25
naranja, se hace una sola extraccin, cual es la probabilidad de que en esa extraccin se
saque:
a) una pelota amarilla
b) una roja
c) una azul o amarilla o naranja
d) no blanca, no amarilla
total 70 pelotas
a) P(extraer una pelota amarilla) =15 / 70
b) P(una pelota roja) = 8 / 70
c) P(una azul o amarilla o naranja) = 8 / 70
d) P(no blanca, no amarilla) = 45 / 70
Sucesos Dependientes e ndependientes
Si E1 y E2 son dos sucesos, la probabilidad de que ocurra E2, dado que ha ocurrido e1, se
representa por P{E2 / E1} o P{E2 dado E1} y a esto se le llama probabilidad condicional de E2
dado que E1 ha ocurrido.
Si la ocurrencia o no ocurrencia de E1 no afecta a la probabilidad de ocurrencia de E2 ,
entonces P{E2 / E1} = P{E2} y se dice que E1 y E2 son sucesos independientes; sino ocurre
esto, es decir la ocurrencia E1 afecta ala ocurrencia de E2 se dice que son dependientes.
Sucesos dependientes:
P{E1E2} = P{E1} P{E2 /E1}
P{E1E2E3} = P{E1} P{E2/E1} P{E3/E1E2}
Sucesos independientes
P{E1E2} = P{E1} P{E2}
P{E1E2E3} = P{E1} P{E2} P{E3}
Ej. Cual es la probabilidad de que caiga sello en el 15avo lanzamiento y caiga sello en el 16avo
lanzamiento de una moneda bien construida.
E1 = caiga sello en el 15avo lanzamiento P{E1} =1/2
E2 = caiga sello en el 2 lanzamiento P{E2} = 1/2
P{E1E2} = P{E1} P{E2}
= (1/2) (1/2)
= 1/4
Ej. Si la probabilidad de que Escamilla escriba 30 aos un 75% cul es la probabilidad de que
ambos vivan 30 aos?
E1 = Escamilla viva 30 aos P{E1} = 80% / 100% = 4 / 5
E2 = Peimbert viva 30 aos P{E2} = 75% / 100% = 3/4
P{E1E2} = P{E1} P{E2/E1}
=(4 / 5) (3 / 4)
=12 / 20
= 60%
Ej. De una caja que contiene tres billetes de a 100 y dos de 50 se extraen dos billetes Cul es
la probabilidad de que en la primera extraccin sea un billete de a cien y que en la segunda
extraccin sea un billete de a 100 si las extracciones se hacen con:
a) un remplazamiento
b) sin remplazamiento
Sucesos mutuamente excluyentes
Dos o mas sucesos se dicen excluyentes si la ocurrencia de uno o cualquiera de ellos
imposibilita la ocurrencia de los otros . As si E1 y E2 son mutuamente excluyentes entonces la
probabilidad de suceso uno por el suceso dos es igual a cero. P{E1+E2}=0
Si E1 mas E2 representa el suceso de que ocurra E1 o E2 o ambos, entonces, la probabilidad
de:
sucesos no mutuamente excluyentes
P{E1+E2}=P{E1} + P{E2} - P{E1E2}
Sucesos mutuamente excluyentes
P{E1+E2}=P{E1} + P{E2}
Ej.- Se hace una extraccin de una baraja de 52 cartas cual es la probabilidad de que esn esa
extraccin sea un as o un rey?
E1 = extraccin de as = 1/13
E2 = extraccin de un rey = 1/13
P{E1+E2}=P{E1} + P{E2}
1/13 + 1/13
2/13
Ej.- se hace una extraccin de una baraja de 52 cartascul es la probabilidadde que en esa
extraccin sea un as o una espada?
E1 = extraccin de as = 1/13
E2 = extraccin de espada = 13/52 =
P{E1+E2}=P{E1} + P{E2} - P{E1E2}
= 1/13 + - 1/52
= 4/52 + 13/52 - 1/52
= 16/52 = 4/13
Ej. Cual es la probabilidad de que en dos lanzamientos de un dado aparezca al menos un 4?
E1 = que salga un cuatro = 1/6
E2 = que salga un cuatro = 1/6
P{E1+E2}=P{E1} + P{E2}
1/6 + 1/6
= 2/6 = 1/3
http://html.rincondelvago.com/probabilidad_8.html
.#.# :;iomas.
ABIO.A*
El trmino a*ioma, originariamente signific dignidad^ ' por derivacin se )a llamado a*ioma a
lo ue es digno de ser estimado, credo ' valorado. En su acepcin m"s cl"sica el voca!lo a*ioma
euivale al de principio ue, por su dignidad misma, es decir, por ocupar cierto lugar en un
sistema de proposiciones, de!e estimarse como verdadero.
Para 7ristteles los a*iomas son principios evidentes ue constitu'en el funcionamiento de toda
ciencia. En suma, 7ristteles define el a*ioma como una proposicin ue se impone
inmediatamente al espritu ' ue es indispensa!le, a diferencia de la tesis, ue no puede
demostrarse ' ue no es indispensa!le. En tal caso los a*iomas son proposiciones irreducti!les,
principios generales a los ue se reducen todas las dem"s proposiciones ' en los cuales stas se
apo'an necesariamente.
El a*ioma posee, por as decirlo, un imperativo ue o!liga al asentimiento una vez ue )a sido
enunciado ' entendido. #os a*iomas pueden ser llamados tam!in nociones comunes como los
enunciados del tipo siguiente$ (dos cosas iguales a una tercera son iguales entre s(, ' (el todo es
ma'or ue la parte(.
7l no lograrse demostrar esos a*iomas se tendi cada vez m"s a definir los a*iomas mediante las
dos notas 'a antes apuntadas$ indemostra!ilidad ' evidencia. #as proposiciones ue podan ser
demostradas ' no eran evidentes se llamaron teoremas. 4 las ue no podan ser demostradas ni
eran evidentes por s mismas reci!ieron el nom!re de postulados.
Esta terminologa tradicional )a e*perimentado grandes modificaciones. En efecto, est" !asada
en gran parte en una concepcin del a*ioma como proposicin (evidente( ', por lo tanto, est"
teHida de cierto (intuicionismo( (en sentido sicolgico) ue no todos los autores admiten.
&e )a impuesto el cam!io en la terminologa desde el momento en ue se )a rec)azado ue los
a*iomas fuesen nociones comunes ' en ue se )a visto ue pueden elegirse diversos postulados,
cada uno de los cuales da origen a un sistema deductivo diferente. Esto )a producido un primer
efecto$ atenuar ' )asta !orrar por entero la distincin entre a*ioma ' postulado.
7 estos cam!ios )an contri!uido so!re todo la matem"tica ' la metalgica contempor"neas. Estas
distinguen entre a*iomas ' teoremas. #os primeros son enunciados primitivos (a veces llamados
tam!in postulados) aceptados como verdaderos sin pro!ar su validez^ los segundos son
enunciados cu'a validez se somete a prue!a.
7*iomas ' teoremas son, por lo tanto, elementos integrantes de todo sistema deductivo.
8sualmente la definicin del concepto de teorema reuiere el uso del concepto de a*ioma (as
como el uso de los conceptos de regla de inferencia ' de prue!a) mientras ue el concepto de
a*ioma es definido por enumeracin.
Podemos manifestar ue )a )a!ido dos distintas orientaciones en la concepcin de los a*iomas.
8na de estas orientaciones destaca la intuitividad ' autoevidencia de los a*iomas^ la otra destaca
su formalidad e inclusive se resiste a adscri!ir a ning5n a*ioma el predicado (es verdadero(. Esta
5ltima orientacin, llamada formalista, es la ue m"s se )a impuesto )o' da.
Axiomas y teoremas.
Teniendo en cuenta las operaciones para )acer conjuntos nuevos, )a' algunos )ec)os
fundamentales respecto a la pro!a!ilidad ue se cumplen siempre$
.. P(7) ma'or o igual a ;
<. P(&) L .
3. P(7 +) L P(7) R P(+) si 7 ' + son e*clu'entes.
De estas tres propiedades, los matem"ticos deducen un montn de reglas 5tiles para calcular
pro!a!ilidades en situaciones m"s complicadas. 7 este tipo de proposiciones de las ue se
deducen otras, se les llama a*iomas ' los tres de arri!a son los a*iomas de la pro!a!ilidad.
7lgunas de las frmulas m"s 5tiles, deducidas de los a*iomas, son las siguientes.
P( vaco ) L ;
P(7V) L .Q P(7)
P(7 Q +) L P(7) Q P(7 ' +)
&i 7 est" contenido en + entonces P(7) menor o igual a P(+)
P(7) menor o igual a .
P(7 +) L P(7) R P(+) Q P(7 ' +).
#a deduccin de estas le'es a partir de los tres a*iomas es un ejercicio de ingenio matem"tico al
ue valdra la pena asomarse, pero en el ue no tenemos intencin de meternos de lleno. 4a ue
desde el punto de vista de este curso, lo interesante es aplicarlas.
2especto a la tercera de la reglas, note !ien ue la resta de conjuntos se define as$ jj7 Q +VV es la
coleccin de elementos de 7 ue no est"n en +. De tal suerte ue P(7 Q +) de!e contemplar slo
a elementos de 7 ' por eso es ue a P(7) no le restamos P(+) sino solamente P(7 ' +).
Btro comentario lo merece la 5ltima regla$ P(7 +) L P(7) R P(+) Q P(7 ' +). Es preciso restar
P(7 ' +) 'a ue as no lo )iciramos, se estara tomando en cuenta dos veces a los elementos
comunes a 7 ' a +.
.#.$ Teoremas.
+0O-0.A ". *i es 3n e>ento n3lo o >aco entonces la probabilidad de G3e oc3rra debe
ser cero.

:
p:;K0

10.O*+-ACIUN4
*i s3mamos a 3n e>ento A c3alG3iera como y A son dos e>entos m3t3amente
excl3yentes entonces p:A;Kp:A; Tp:;Kp:A;. 6JJ1


+0O-0.A $. 6a probabilidad del complemento de A A
c
debe ser p:A
c
;K " N p:A;





10.O*+-ACIUN4
*i el espacio m3estral se di>ide en dos e>entos m3t3amente excl3si>os A y A
c
l3e8o
KAA
c
por tanto p:;Kp:A; T p:A
c
; y como en el axioma dos se afirma G3e p:;K" por
tanto p:A
c
;K " I p:A; .6JJ1
+0O-0.A %. *i 3n e>ento A B entonces la p:A; p:B;.

:
A
c

:
)P:
)



10.O*+-ACIUN4
*i separamos el e>ento B en dos e>entos m3t3amente excl3yentes A y B V A :B menos A;
por tanto BKA:B V A; y p:B;Kp:A; Tp:B V A; l3e8o entonces si p:B V A;0 entonces se
c3mple G3e p:A;p:B;. 6JJ1
+0O-0.A 4. 6a p: A V B ;K p:A; N p:AB;



10.O*+-ACIUN4 *i A y B son dos e>entos c3alG3iera entonces el e>ento A se p3ede
separar en dos e>entos m3t3amente excl3yentes :A V B; y AB por tanto AK:A V
B;:AB; l3e8o p:A;Kp:A V B; T p:AB; entonces p:A V B; K p:A; N p:AB;. 6JJ1
+0O-0.A '. 2ara dos e>entos A y B p:AB;Kp:A; T p:B; N p:AB;.




A B
AVB
AB

A B
AB

10.O*+-ACIUN4
*i AB K :A V B; B donde :A V B; y B son e>entos m3t3amente excl3yentes por lo G3e
p:A B; K p:A V B; T p:B; y del teorema anterior tomamos G3e p:A V B; K p:A; N p:AB;
por tanto p:AB; K p:A; T p:B; N p:AB;. 6JJ1
CO-O6A-IO4
2ara tres e>entos A B y C p:ABC; K p:A; T p:B; T p:C; N p:AB; N p:AC; N :BC;
T p:ABC;.

.$ Probabilidad condicional.
2robabilidad condicionada
Mediante un espacio pro!a!ilstico damos una formulacin matem"tica a un fenmeno aleatorio
ue estemos o!servando. Parece por tanto razona!le ue si o!servamos algo ue aporte
informacin a nuestro fenmeno aleatorio, sta de!a alterar el espacio pro!a!ilstico de partida.
Por ejemplo, la e*traccin de una !ola de una urna con tres !olas !lancas ' dos negras, puede
formalizarse con un espacio pro!a!ilstico en el ue los sucesos elementales sean las cinco !olas
' donde la pro!a!ilidad sea uniforme so!re estos cinco sucesos elementales, es decir, igual a .I?.
A
B
C

AB
B A
&i e*traemos una !ola de la urna, es decir, si o!servamos el suceso 7 !ola negra, ' no la
devolvemos a la urna, es razona!le ue el espacio pro!a!ilstico cam!ie en el sentido no solo de
ue a)ora 'a )a!r" 5nicamente cuatro sucesos elementales, sino ue adem"s la funcin de
pro!a!ilidad de!er" cam!iar en orden a recoger la informacin ue la o!servacin del suceso 7
nos proporcion.
Es decir, en el nuevo espacio pro!a!ilstico de!er" )a!larse de pro!a!ilidad condicionada al
suceso 7, de forma ue se recojan )ec)os tan evidentes como ue a)ora la pro!a!ilidad
(condicionada) de o!tener negra se )a!r" reducido ' )a!r" aumentado la de !lanca.
#as propiedades vistas en el captulo anterior para las distri!uciones (le frecuencias
condicionadas llevan a la siguiente definicin.
Definicin:
1ado 3n espacio probabilstico :WA2; y 3n s3ceso B A tal G3e 2:B; X 0 llamaremos
probabilidad condicionada del s3ceso A respecto al B a4
7 partir de esta definicin podemos deducir ue
P( 7 + ) L P(7I+) q P(+)
' como los sucesos 7 ' + pueden intercam!iarse en la e*presin anterior, ser"$
P(7 +) L P(7I+)qP(+) L P(+I7)qP(7)
por lo ue tenemos una e*presin m"s para calcular la pro!a!ilidad condicionada
6onsideremos la siguiente situacin. &e tienen tres urnas similares^ por fuera son idnticas. &e
sa!e ue
en la urna . )a' 3 !olas !lancas ' .> azules,
en la urna < )a' <; !olas !lancas ' < azules,
en la urna 3 )a' .. !olas !lancas ' .. azules.
&e va a sacar una !ola de una de las urnas. Puede ser azul o !lanca. a6u"l es la pro!a!ilidad de
ue sea !lanca%
Da' cuatro posi!les soluciones$
.. #a pro!a!ilidad de una !lanca es 3 I <<. Esto es porue si se escoge la urna ., )a' 3 de <<
!olas ue son !lancas. Esta respuesta nos deja pensando en ue es mu' ar!itrario decir
ue la urna escogida es la .. &i la urna escogida fuese la . esta sera la respuesta correcta.
<. De manera similar, podemos pensar ue la urna escogida es la < ' entonces la
pro!a!ilidad de una !ola !lanca es <; I <<.
3. 6laro ue, tam!in, la urna escogida puede ser la 3 ' entonces la pro!a!ilidad de !lanca
es .. I <<.
1. 6omo no se sa!e cual es la urna escogida ' las tres urnas tienen el mismo n5mero de
!olas, la pro!a!ilidad se calcula como si fuese una gran urna con 00 !olas de las cuales 3
R <; R .. son !lancas ', as, la pro!a!ilidad es 31 I 00
a6u"l es la respuesta correcta% o a)a!r" otra ue sea la respuesta correcta%
8na cosa es clara^ si podemos suponer ue la urna escogida es la ., la respuesta correcta es la
primera. #o mismo se puede decir de la segunda ' la tercera. #a cuarta es un pouito m"s
atrevida ' uiz" sea correcta. Por lo pronto vamos a darle un nom!re a las tres primeras$ les
llamamos pro!a!ilidad condicional.
7 la primera la llamamos jjpro!a!ilidad condicional de !lanca dado ue la urna es la .VV.
7 la segunda, la llamamos de manera similar condicional de !lanca dado ue la urna es la
<.
7 la tercera se le da un nom!re an"logo :a6u"l nom!re%=.
Oormalmente, definimos la pro!a!ilidad condicional de la siguiente manera$
P( 7 A + ) L :P( 7 ' + )= I :P( + )=
El sm!olo P( 7 A + ) lo leemos como pro!a!ilidad de 7 dado +. #o interpretamos como
la pro!a!ilidad de ue, sa!iendo ue 'a sucedi +, adem"s suceda 7. En el ejemplo de las
urnas 7 sera el evento jjla !ola es !lancaVV^ + sera la urna correspondiente.
6omo lo ue est" a!ajo en el ue!rado es la pro!a!ilidad de lo dado, la frmula no es
simtrica en 7 ' +. &i los intercam!iamos, da otro n5mero. Esto se ve en el ejemplo 'a
ue no es lo mismo ue nos informen cual es el n5mero de la urna escogida a ue nos
digan ue la !ola fue !lanca ' nos pregunten cu"l es la urna.
Esta frmula no tiene sentido matem"tico si P(+) L ;. En tal caso decimos ue la
pro!a!ilidad condicional no est" definida. 6laro ue eso est" !ien porue no puede )a!er
sucedido algo ue es imposi!le.
Ojese ue esta frmula se usar" cuando )a'a una manera f"cil de calcular las pro!a!ilidades no
condicionales ' la condicional sea difcil. Eso no fue el caso con el color de la !ola ' las urnas.
Para ejemplificar el tipo de situacin en ue nos sirve la frmula descrita, considere este
pro!lema.
050.26O &e tiran dos dados ' se sa!e ue el primero no tiene el n5mero ?. a6u"l es la
pro!a!ilidad de ue la suma de los dados sea \%
*O67CION Para resolver, llamemos
+ el evento$ jjel primer dado no es ?VV.
7 el evento$ jjla suma de los dados es \VV.
6on los datos se ve ue$
P(+) L 3; I 30. Porue de las 30 parejas posi!les, 0 tienen ? en el primer dado.
P(7 ' +) L 1 I 30. Porue slo se o!tiene \, con las parejas (<,0), (3,?), (1,1) ' (0,<) :#a
pareja (?,3) s suma oc)o pero tiene un ? en el primer dado=.
', usando la frmula,
P(7A+) L 1 I 3;.
En ese ejemplo se ven tres cosas$
.. #a pro!a!ilidad condicional nos permite medir la informacin. En los ejemplos vimos
como cam!ia la pro!a!ilidad de 7, antes de conocer nada$ P(7) ' despus de conocer la
ocurrencia de el evento +$ P(7 A +).
<. En un e*tremo est" el cam!io enorme ue corresponde a ue 7 ' + sean e*clu'entes
(ajenos). En este caso la pro!a!ilidad podra llegar incluso a ser cero.
3. En el otro e*tremo est"n los eventos en los ue sucede ue P(7 A +) L P(7). Esto uiere
decir ue la informacin de ue + ocurri no cam!ia la pro!a!ilidad de 7 ' decimos ue
7 ' + son independientes.
Esta 5ltima caracterstica, la independencia, juega un papel mu' importante en la pro!a!ilidad '
merece una atencin m"s detallada. Por el momento de!emos esta!lecer una definicin$
7 ' + son eventos independientes si ' slo si P(7 ' +) L P(7) P(+)
En forma euivalente decimos$ 7 ' + son eventos independientes si ' slo si P(7 A +) L P(7).
#a euivalencia se sigue de una sustitucin alge!raica mu' sencilla.
#a consecuencia de ue esta sea una definicin es ue$
para compro!ar la independencia de dos eventos es preciso )acer ver ue P(7 ' +) L P(7)P(+).
Es importante remarcar la diferencia de concepto entre eventos independientes ' eventos
e*clu'entes o ajenos. En nuestro ejemplo se ve claramente ue am!os conceptos son antitticos.
El )ec)o de ue dos eventos se e*clu'an casi implica ue no son independientes. #a e*cepcin se
da en el caso degenerado de ue alguno de ellos (o los dos), sea imposi!le. En el )a!la cotidiana,
a veces, se confunden estos conceptos.
Fote ue si 7 es imposi!le^ P(7) L ;. 7dem"s jj7 ' +VV tam!in es imposi!le ' se tiene P(7 ' +)
L P(7)P(+) 'a ue am!os lados de la igualdad valen cero . Pero ste es el 5nico caso en ue dos
eventos son ajenos e independientes a la vez^ en trminos geomtricos la idea de independencia
se asemeja a la perpendicularidad ' la de jjajenosVV al paralelismo.
AN0BO M"s so!re independencia.
2especto a la independencia de dos eventos, )a' algunas cosas mu' elementales ue agregar a la
definicin ue )icimos en notas pasadas.
.. #a independencia de dos eventos 7 ' +, uiere decir ue el sa!er ue 7 sucedi no
modifica la pro!a!ilidad de ue + tam!in )a'a sucedido. 6omo consecuencia sa!er ue
7 no sucedi tampoco puede afectar a la pro!a!ilidad de +.
Podemos poner esto diciendo ue
&i 7 ' + son independientes, tam!in lo son las tres siguientes pares$ 7V ' + ^ 7 ' +V ^ 7V
' +V (estamos usando el apstrofe V para denotar complemento)
<. 6uando se tienen tres eventos, se puede presentar una situacin mu' curiosa. Puede pasar
ue
o 7 ' + sean independientes '
o 7 ' 6 sean independientes '
o + ' 6 tam!in sean independientes.
Pero 7,+ ' 6 FB sean independientes.
Esta situacin curiosa se descri!e diciendo ue no !asta ue varios eventos sean
independientes a pares, para ue sean independientes.
El ejemplo cl"sico es el de un e*perimento aleatorio con cuatro posi!les resultados
igualmente pro!a!les$ ., <, 3 ' 1 .
o &i el resultado es ., 7 gana ' nadie m"s.
o &i el resultado es <, + gana ' nadie m"s.
o &i el resultado es 3, 6 gana ' nadie m"s, pero
o &i el resultado es 1, los tres 7, + ' 6 ganan.
8sted puede calcular las pro!a!ilidades para darse cuenta ue$
o P(7 ' +) L P(7) P(+)
o P(7 ' 6) L P(7) P(6)
o P(+ ' 6) L P(+) P(6)
pero P(7 ' + ' 6) no es igual a P(7) P(+) P(6).
3. 8na nota final de un estilo menos matem"tico. #a pala!ra independencia se utiliza en
otros conte*tos para denotar un sin n5nmero de conceptos diferentes.
#os ejemplos m"s comunes son en poltica, en )istoria, en derec)o. En la ciencia se )a!la
de varia!les independientes ' el significado es diferente ue el ue usamos au. 75n en
otras ramas de la matem"tica se usa la pala!ra independencia para denotar a otros
conceptos. 6uando ueremos distinguir la definicin tcnica ue usamos en la
pro!a!ilidad de otras nociones le ponemos un apellido a la independencia ' decimos
independencia estoc"stica.
Es conveniente recordar ue cuando e*iste duda si dos eventos son independientes o no,
la 5nica forma de zanjar la cuestin es viendo si P(7 ' +) es igual o diferente al resultado
de multiplicar P(7) P(+). Faturalmente ue si la independencia de dos eventos est" en
duda, el c"lculo de P(7 ' +) no se puede )acer simplemente multiplicando P(7) P(+) sino
ue se de!e justificar de alguna otra manera.
.$.1Dependiente.
Probabilidades ba5o condiciones de dependencia estadstica.

La dependencia estadstica existe cuando la probabilidad de que se presente algn suceso depende o se
ve afectada por la presentacin de algn otro evento. Los tipos de probabilidad bajo condiciones de
dependencia estadstica son:

Condicional.
Conjunta.
Marginal.



Probabilidad condicional bajo dependencia estadstica.

P(B/A) = P(BA) / P(A)



Probabilidades conjuntas bajo condiciones de dependencia estadstica.

P(BA) = P(B/A) x P(A)

O

P(BA) = P(A/B) x P(B)



Probabilidades marginales bajo condiciones de dependencia estadstica.

Las probabilidades marginales bajo dependencia estadstica se calculan mediante la suma de las
probabilidades de todos los eventos conjuntos en los que se presenta el evento sencillo.
.$.!ndependiente.
Probabilidades ba5o condiciones de independencia estadstica.
Cuando se presentan dos eventos, el resultado del primero puede tener un efecto en el resultado del
segundo, o puede no tenerlo. Esto es, los eventos pueden ser dependientes o independientes. Existen
tres tipos de probabilidades que se presentan bajo independencia estadstica:
Marginal.
Conjunta.
Condicional.
Probabilidades marginales bajo independencia estadstica.
Una probabilidad marginal o incondicional es la probabilidad simple de presentacin de un evento.
Probabilidades conjuntas bajo condiciones de independencia estadstica.
La probabilidad de dos o ms eventos independientes que se presentan juntos o en sucesin es el
producto de sus probabilidades marginales:
P (AB) = P(A) X P(B)
Un rbol de probabilidad muestra los resultados posibles y su respectiva probabilidad.
Probabilidades condicionales bajo independencia estadstica.
Simblicamente, la probabilidad condicional se escribe:
P(B/A)

Y se lee "la probabilidad de que se presente el evento B, dado que el evento A se ha presentado".
La probabilidad condicional es la probabilidad de que un segundo evento (B) se presente, si un primer
evento (A) ya ha sucedido.
Para eventos estadsticamente independientes, la probabilidad condicional de que suceda el evento B
dado que el evento A se ha presentado, es simplemente la probabilidad del evento B:
P(B/A) = P(B)
SUE!E"#$%:
Una buena verificacin de los clculos para obtener la probabilidad conjunta consiste en recordar que
para cada intento, el total de probabilidades resultantes debe sumar 1.
Independencia de s3cesos
E*isten situaciones en las ue la informacin suministrada por el acaecimiento de un suceso + no
altera para nada el c"lculo de la pro!a!ilidad de otro suceso 7. &on auellas en las ue el suceso
7 es independiente de +. Es decir, cuando
P(7I+) L P(7).
6omo entonces, por la 5ltima e*presin de la pro!a!ilidad condicionada, es
', por tanto, se podra decir ue tam!in + lo es de 7, )a!laremos de s$cesos independientes
cuando esta situacin ocurra. #a definicin formal ue se da a continuacin implica estas dos
situaciones.
Definicin:
1os s3cesos A y B de 3n mismo espacio probabilstico :W A 2; se dicen independientes
c3ando
2: A B ; K 2:A; Y 2:B;
.& ,ey multiplicativa.
.&.1Clculo de probabilidad de eventos.
%ara calcular la probabilidad de eventos es necesario que stos se comporten de una maner
ms o menos estable. %recisamente, se echa mano de la regularidad estadstica, que es
la propiedad de los fenmenos aleatorios, y que consiste en que al aumentar el n#mero de
repeticiones de un e&perimento en condiciones prcticamente constantes, la frecuencia
relativa de ocurrencia para cada evento tiende a un valor fi!o.
'in embargo, al momento de definir la probabilidad de un evento podemos tomar en cuenta
los siguientes criterios(
). $a probabilidad subjetiva de un evento se la asigna la persona que hace el
estudio, y depende del conocimiento que esta persona tenga sobre el tema.
%recisamente por su carcter de sub!etividad no se considera con valide" cientfica,
aunque en la vida diaria es de las ms com#nes que se utili"an al no apoyarse ms
que en el sentido com#n y los conocimientos previos, y no en resultados estadsticos.
<. $a probabilidad frecuencial de un evento es el valor fi!o al que tienden las
frecuencias relativas de ocurrencia del evento de acuerdo a la regularidad estadstica.
Esta definicin sera la ms real, pero proporciona probabilidades apro&imadas, es
decir, proporciona estimaciones y no valores reales. *dems, los resultados son a
posteriori, pues se necesita reali"ar el e&perimento para poder obtenerlo. (%ara ver
un e!emplo ha" click aqu .)
+. $a probabilidad clsica de un evento E, que denotaremos por P(E), se define
como el n#mero de eventos elementales que componen al evento E, entre el n#mero
de eventos elementales que componen el espacio muestral(
Es la definicin ms utili"ada porque supone de antemano, y se necesita como
requisito indispensable, que todos los eventos elementales tienen la misma
probabilidad de ocurrir.
http(==777.uaq.m&=matematicas=estadisticas=&u0.html
.&.Con5untos.
.&."Problemas de eventos independientes.
Eventos $ndependientes@ Dos o ms eventos son independientes cuando la ocurrencia o no<
ocurrencia de un evento no tiene efecto sobre la probabilidad de ocurrencia del otro evento >o
eventos?. Un caso tpico de eventos independiente es el muestreo con reposicin/ es decir/ una
ve1 tomada la muestra se re*resa de nuevo a la poblacin donde se obtuvo.
E,emplo: lanzar al aire dos veces una moneda son eventos independientes por que el resultado del
primer evento no afecta sobre las probabilidades efectivas de que ocurra cara o sello, en el segundo
lanzamiento.
http://html.rincondelvago.com/probabilidades_1.html
.&.#Eventos dependientes.
Eventos dependientes@ Dos o ms eventos sern dependientes cuando la ocurrencia o no<
ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del otro >o otros?. Cuando tenemos
este caso/ empleamos entonces/ el concepto de probabilidad condicional para denominar la
probabilidad del evento relacionado. ,a e;presin P>:Q)? indica la probabilidad de ocurrencia del
evento : s el evento ) ya ocurri. Se debe tener claro (ue :Q) no es una fraccin.
P(A|B) = P(A y B)/P(B) o P(B|A) = P(A y B)/P(A)
http://html.rincondelvago.com/probabilidades_1.html
0?0N+O* IN1020N1I0N+0*
&uponemos ue se sa!e ue la pro!a!ilidad de 7 dada la de + es igual a la pro!a!ilidad de 7. amu se podra
concluir respecto a los eventos de 7 ' +% aEl )ec)o de sa!er ue el evento ! a ocurrido, afecta de alg5n modo la
pro!a!ilidad de 7%. #a situacin anterior conduce a la necesidad de definir otro tipo de eventos$ &i 7 ' + son
eventos independientes, entonces P (7 +)L P(7).
Definicin$ 7 ' + son eventos independientes si ' solo s
Teorema .$ si 7 ' + son eventos independientes &26L(Emage<.gif( [EDTDL0; DEETDTL<.X'
&26L(Emage3.gif( [EDTDL0; DEETDTL<.X
, entonces
Ftese ue la definicin de eventos independientes se aplica a todos los eventos sean o no sus pro!a!ilidades iguales
a cero. Fo sera as si )u!iramos ocupado el teorema . para la definicin de eventos independientes.
&i escoge una familia del conjunto de todas las ue tiene < niHos a6u"l es la pro!a!ilidad de ue am!os sean varones
si se sa!e ue por lo menos ue )a' un varn en esa familia. &ea &Lb(m,m),Q(m,f).(f,m),(f,f)c el espacio muestra,
donde la primera letra de cualuier pareja ordenada indica el se*o del primognito ' la segunda el se*o del segundo.
&upondremos ue los cuatro puntos son igualmente pro!a!les (esta suposicin no es correcta para determinadas
razones pero es acepta!le).
7)ora !ien, si se sa!e ue por lo menos uno de los )ijos es varn a6u"l es el nuevo espacio muestral% De los tres
punto de ese espacio a 6u"ntos representan familias en las ue am!os )ijos son varones%. Entonces la pro!a!ilidad
reuerida es .I3.
Demostracin$ de la teora de conjuntos sa!emos ue &26L(Emage1.gif( [EDTDL>/ DEETDTL<.X(verifiue esto
con un diagrama de Penn). Del teorema anterior, tenemos &26L(Emage?.gif( [EDTDL.;? DEETDTL<?X. Por
tanto,
&26L(Emage0.gif( [EDTDL.1. DEETDTL<?X
&26L(Emage/.gif( [EDTDL<;1 DEETDTL.<;X
7s, &26L(Emage\.gif( [EDTDL.0 DEETDTL<.X' &26L(Emage>.gif( [EDTDL.0 DEETDTL.>Xson eventos
independientes.
4ttp@AABBB.escolar.comAarticle<p4p<sidF1".4tml
.&.$Dia*ramas de rbol.
Un diagrama de arbol es un dibujo que se usa para enumerar todos los resultados posibles de una serie
de experimentos en donde cada experimento puede suceder en un numero finito de maneras. La
construccion de diagramas de arbol se ilustra en los siguientes ejemplos.
Diagramas de rbol
06 7*O 10 1IA,-A.A* 10 A-BO6 2A-A 06 CA6C76O 10 6A 2-OBABI6I1A1
Muc)os pro!lemas so!re pro!a!ilidades se pueden representar con diagramas de "r!ol. En tales casos se pueden
utilizar con facilidad las reglas de la multiplicacin ' la adicin para ilustrar la solucin de pro!lemas so!re
pro!a!ilidades.
&e )a e*trado dos fic)as de pocGer de una caja ue contiene una fic)a roja, otra !lanca ' otra verde. El diagrama de
"r!ol ue representa este e*perimento en la primera figura muestra la segundad ' la primera seleccin. En cada
e*traccin se selecciona una fic)a ' no se reemplaza.
Despus de ue se )a di!ujado e identificado el "r!ol, es necesario ue se asigne pro!a!ilidades a cada rama. &i se
supone ue es igualmente pro!a!le ue se e*traiga cualuier fic)a en cualuier seleccin, es posi!le asignar una
pro!a!ilidad a cada segmento de cada rama de "r!ol como se muestra en la segunda figura. Ftese ue un conjunto
de ramas ue nacen de un punto com5n tiene una pro!a!ilidad total igual a uno. En este diagrama en particular )a'
cuatro de tales conjuntos de segmentos de famas. El diagrama de "r!ol muestra seis resultados distintos. #e'endo
)acia a!ajo la rama indica el resultado (2,+)^la dos (<), (2,P)^ etc. 6ada resultado el esta representado por una rama
ue nace en un punto inicial com5n ' termina en los puntos e*tremos de la derec)a.
#a pro!a!ilidad asociada con el resultado (2,+) P(fic)a roja en la primera e*traccin ' !lanca en la segunda), se
encuentra multiplicando P(2 en la primera seleccin)_P(+ en la segunda seleccin 2 en la primera). Estas son las
dos pro!a!ilidades .I3 ' r indicadas en los dos segmentos de la rama uno en la figura dos. El r es la pro!a!ilidad
condicional reuerida por la regla de la multiplicacin. En consecuencia de!e ncmultiplicarse a loa largo de las
ramas.
7lgunos eventos est"n constituidos por mas de un resultado del e*perimento. Por ejemplo supngase ue se )a
pedido la pro!a!ilidad de ue sean seleccionadas una fic)a roja ' otra !lanca. &e o!serva ue )a' dos resultados ue
satisfacen dos eventos, la rama uno ' la tres con (o( se utiliza la regla de la adicin . puesto ue las ramas de un
diagrama representan eventos mutuamente e*clu'entes, se tiene ue $
P(2 ' una +)L &26L(Emage..gif( [EDTDL<<. DEETDTL1?X
http://www.escolar.com/article-php-sid=13.html
.3 Eventos !ndependientes.
.3.1:plicacin de teoremas.
.3.2e*la de )ayes.
+eorema de Bayes
El siguiente teorema es un resultado con una gran carga filosfica detr"s, el cual mide el cam!io
ue se va produciendo en las pro!a!ilidades de los sucesos a medida ue vamos )aciendo
o!servaciones. Paradgicamente a su importancia, su demostracin no es m"s ue la aplicacin
de la definicin de pro!a!ilidad condicionada seguida de la aplicacin del teorema de la
pro!a!ilidad total.
Teorema
*ea 3n espacio probabilstico :W A 2; y ZA
n
[ A 3na particin de s3cesos de W y B A
3n s3ceso con probabilidad positi>a. 0ntonces para todo s3ceso A
i
es
Este teorema tiene una interpretacin intuitiva mu' interesante. &i las cosas ue pueden ocurrir
las tenemos clasificadas en los sucesos 7
i
de los cuales conocemos sus pro!a!ilidaes P(7
i
),
denominadas a priori, ' se o!serva un suceso +, la frmula de +a'es nos da las pro!a!ilidades a
posteriori de los sucesos 7Z&8+ZEZ su!X, ajustadas o modificadas por +.
Ejemplo
*3pon8amos G3e tenemos 3na 3rna delante de nosotros de la c3al solo conocemos G3e o es
la 3rna A
"
con % bolas blancas y " ne8ra o es la 3rna A
$
con % bolas ne8ras y " blanca.
6on o!jeto de o!tener m"s informacin acerca de cual urna tenemos delante, realizamos un
e*perimento consistente en e*traer una !ola de la urna desconocida. &i suponemos ue la !ola
e*traida result !lanca .: ' a priori ninguna de las dos urnas es m"s verosmil ue la otra, P(7
.
)
L P(7
<
) L .I<, entonces la frmula de +a'es nos dice ue las pro!a!ilidades a posteriori de cada
urna son
P(7
.
I.:) L3I1 ' P(7
<
I.:) L.I1
)a!iendo alterado de esta forma nuestra creencia so!re la urna ue tenemos delante$ 7ntes
creamos ue eran euipro!a!les ' a)ora creemos ue es tres veces m"s pro!a!le ue la urna
desconocida sea la 7
.
.
Pero, au ocurrir" si e*traemos otra !ola%. #gicamente, en la frmula de +a'es de!eremos
tomar a)ora como pro!a!ilidades a priori las calculadas, 3I1 ' .I1, pues stas son nuestras
creencias so!re la composicin de la urna, antes de volver a realizar el e*perimento.
&i suponemos ue la !ola no fue reemplazada (se deja para el lector el caso de reemplazamiento),
' sale una !ola negra <*, la frmula de +a'es nos devolver a la incertidum!re inicial, 'a ue
sera
P(7
.
I<*) L.I< ' P(7
<
I<*) L.I<
&i )u!iera salido !lanca, la frmula de +a'es, al igual ue la lgica, tam!in sera conclu'ente,
P(7
.
I<:) L. ' P(7
<
I<:) L;
#a utilizacin de la frmula de +a'es, es decir, la utilizacin de distri!uciones de pro!a!ilidad a
posteriori como modelos en la estimacin de par"metros, al recoger sta tanto la informacin
muestral, P(+I7
i
), como la informacin a priori so!re ellos, P(7
i
), constitu'e una filosofa
inferencial en gran desarrollo en los 5ltimos aHos, la cual, no o!stante, tiene el inconveniente (o
seg5n ellos la ventaja) de depender de la informacin a priori, la cual en muc)as ocasiones es
su!jetiva ' por tanto, pudiendo ser diferente de un investigador a otro.
+0O-0.A 10 BAC0*
*ea 3n espacio m3estral G3e est= formado por los e>entos A
"
A
$
A
%
.....A
n
m3t3amente
excl3yentes l3e8o
K A
"
A
$
A
%
.....A
n



7
.
7
<
7
3
7
1
7
n

B

63e8o si oc3rre 3n e>ento B definido en obser>amos G3eL
B K B K :A
"
A
$
A
%
.....A
n
;B K
:A
"
B;:A
$
B;:A
%
B;.....:A
n
B;
1onde cada 3no de los e>entos A
i
B son e>entos m3t3amente excl3yentes por lo G3e
p:B; K p:A
"
B; T p:A
$
B; T p:A
%
B; T......T p:A
n
B;
y como la p:A
i
B; K p:A
i
;p:B|A
i
; o sea G3e la probabilidad de G3e oc3rra el e>ento Ai y
el e>ento B es i83al al teorema de la m3ltiplicacin para probabilidad condicional l3e8oL
p:B; K p:A
"
;p:B|A
"
; T p:A
$
;p:B|A
$
; T p:A
%
;p:B|A
%
; T p:A
n
;p:B|A
n
;
*i deseamos calc3lar la probabilidad de G3e oc3rra 3n e>ento A
i
dado G3e B ya oc3rri
entoncesL

; A : ( p ; An ( p .... ; A : ( p ; A ( p ; A : ( p ; A ( p
; Ai : ( p ; Ai ( p
; : ( p
; : Ai ( p
; : < Ai ( P
n
+ + +

< < . .
6a expresin anterior es el teorema de Bayes G3e como se obser>a es 3na simple
probabilidad condicional.
+0O-0.A 10 BAC0*
&i s sa!e ue una urna amarilla se contiene tres !olas negras una !lanca, ' ue una urna roja contiene dos !olas
!lancas ' dos negras. &e tira un dado con la condicin de ue s el n5mero resultante es divisi!le por tres, se elige la
urna amarilla^ ' en cualuier otro caso se elige la urna roja.
De la urna elegida se saca una !ola al azar. &i la !ola es negra, a6u"l es la pro!a!ilidad de ue )a'a sido sacada de la
urna amarilla%. 8n diagrama de "r!ol nos puede a'udar a la solucin de este pro!lema.
#a pro!a!ilidad de escoger la urna amarilla es .I3 ' la pro!a!ilidad de sacar una !ola negra, considerando ue se
escogi la urna amarilla, es s .
Por tanto, la pro!a!ilidad de escoger una !ola negra de la urna amarilla es .I3 ( s)L.I1.
De modo semejante, se pude ver ue la pro!a!ilidad de sacar una !ola !lanca de la urna amarilla es .I.<, la
pro!a!ilidad de sacar una !ola negra de la urna roja es .I3, ' la pro!a!ilidad de sacar una !ola !lanca de la urna roja
es .I3.asuman ., las cuatro pro!a!ilidades%.
.3."Conocer teoremas y reali1ar e5ercicios.
2-OB60.A. En una etapa de la produccin de un artculo se aplica soldadura ' para eso se
usan tres diferentes ro!ots. #a pro!a!ilidad de ue la soldadura sea defectuosa vara para cada
uno de los tres, as como la proporcin de artculos ue cada uno procesa, de acuerdo a la
siguiente ta!la.
4obo$ )rob defec$ )rob #roces
, 0002 1&5
6 0005 425
7 0001 405
Tenemos un par de preguntas$
6u"l es la proporcin glo!al de defectos producida por las tres m"uinas
&i tomo un artculo al azar ' resulta con defectos en la soldadura, cu"l es la pro!a!ilidad
de ue )a'a sido soldado por el ro!ot 6.
*O67CION
:I;
#a primera pregunta nos va a llevar a lo ue se conoce con el nom!re de frmula de la
pro!a!ilidad total.
mueremos conocer la proporcin glo!al de defectos de los tres ro!ots. Despus de refle*ionar un
momento se ve ue si todas las soldaduras las pusiera el ro!ot 6, )a!ra pocos defectos, seran
;.;;. o ;..@. En cam!io, si todas las pone el +, ksera un desastrel, tendramos cinco veces m"s$
;.;;? o ;.?@. De modo ue en nuestra respuesta de!emos tener en cuenta las diferentes
proporciones de lo mauinado en cada ro!ot.
Fuestra idea es empezar por descomponer el evento jjdefectuosoVV en jjviene del ro!ot 7 ' es
defectuosoVV o jjviene del ro!ot + ' es defectuosoVV o jjviene del ro!ot 6 ' es defectuosoVV. En
sm!olos tendremos
P(d) L P(7 ' d) R P(+ ' d) R P(6 ' d)

P(d) L P(7) P( dA7) R P(+) P( dA+) R P(6) P( dA6)


7ntes de ponerle n5meros ' resolver nuestro pro!lema fijmonos en la frmula o!tenida.
.. Da' tres eventos 7, + ' 6 ue
o son ajenos '
o cu!ren todo el espacio muestral.
<. 6onocemos las pro!a!ilidades de cada uno de ellos.
3. 7dem"s, conocemos las pro!a!ilidades condicionales de otro evento dado cada uno de
ellos.
#a frmula de arri!a se llama frmula de la pro!a!ilidad total.
#lenando con nuestros n5meros, tenemos ue
P(d) L (;..\)(;.;;<) R (;.1<)(;.;;?) R (;.1;)(;.;;.)
o sea ue P(d) L ;.;;<\0 casi 3 piezas por cada mil.
Es !ueno comparar este resultado con los porcentajes de soldaduras defectuosas de cada ro!ot
por separado. Podemos ver ue el resultado se encuentra entre todas ellas ' se encuentra
relativamente cerca de los porcentajes de los ro!ots m"s utilizados (el + ' el 6). Esto es mu'
razona!le.
:II;
#a segunda pregunta es, a la vez m"s simple ' m"s complicada. Fos va a llevar a lo ue se
conoce con el nom!re de teorema de +a'es.
#a pro!a!ilidad ue !uscamos es una condicional pero al revs de las ue tenemos. +uscamos
P( 6 A d)
para calcularla usamos la definicin de pro!a!ilidad condicional$
P( 6 A d) L :P(6 ' d)= I :P( d )=
El numerador (lo de arri!a) lo calculamos con
P( 6 ' d ) L P(6) P(dA6)
' el denominador lo calculamos con la frmula de pro!a!ilidad total
P(d) L P(7) P( dA7) R P(+) P( dA+) R P(6) P( dA6)
juntando las dos tenemos la frmula de +a'es$
P( 6Ad) L :P(6) P(dA6)= I :P(7) P( dA7) R P(+) P( dA+) R P(6) P( dA6)=
7plic"ndola a nuestro caso tenemos
P(6Ad) L :(;.1;)(;.;;.)=I:(;..\)(;.;;<) R (;.1<)(;.;;?) R (;.1;)(;.;;.)=
o sea
P(6Ad) L :;.;;;1=I:;.;;<\0= L ;..3>>
casi .1@.
B sea ue si tomamos una pieza al azar, la pro!a!ilidad de ue )a'a sido soldada por el ro!ot 6
es alta, 1;@. Pero, como ese ro!ot produce slo . de cada mil soldaduras defectuosas, al sa!er
ue la pieza seleccionada es defectuosa, la pro!a!ilidad de ue provenga del ro!ot 6 disminu'e a
solamente .1@. Esto uiere decir ue, en este caso el sa!er ue la soldadura es defectuosa, nos
provee con una gran cantidad de informacin.
&i analiz"ramos, usando de nuevo la frmula de +a'es las pro!a!ilidades de los ro!ots 7 ' +,
tendramos
P(+Ad) L ;./313 ' P(7Ad) L ;..<?>
6omparadas con las pro!a!ilidades de cada m"uina sin sa!er ue la pieza es defectuosa vemos
un gran incremento en la pro!a!ilidad de +.
&i, por el contrario la pieza no )u!iese tenido defectos de soldadura, el mismo teorema de +a'es
nos dara ()aga 8d. las cuentas ' kfjese ue no me )a'a euivocado 'ol)$
P(7Ano d) L ;..\;< P(+Ano d) L ;.1.>. ' P(6Ano d) L ;.1;;/
#as pro!a!ilidades no son idnticas a las pro!a!ilidades no condicionales, pero la diferencia es
mu' peueHa.
Para apreciar mejor el cam!io, pongamos en una sola ta!la las pro!a!ilidades iniciales ' las
condicionales o!tenidas !ajo el conocimiento de la soldadura de la pieza.
4obo$ )() )( *d) )( *no d)
, 01& 0125' 01&02
6 042 07343 041'1
7 040 013'' 04007
Es tan grande el *ito de los tres ro!ots en el soldado correcto ue el sa!er ue la pieza no tiene
defectos, pr"cticamente no altera las pro!a!ilidades de produccin en uno u otro.
Por el contrario, el ro!ot 6 es tan !ueno, comparado con el + ue, al sa!er ue la pieza es
defectuosa, las pro!a!ilidades cam!ian dram"ticamente.
En este ejemplo el c"lculo de pro!a!ilidades condicionales nos cuantifica algo ue el sentido
com5n nos dice de otra forma. Fote ue la frmula de +a'es nos sirvi para pasar de las
pro!a!ilidades no condicionales a las condicionales.
Otro ejemplo del 3so del teorema de Bayes
Btro ejemplo cl"sico del uso del teorema de +a'es es un pro!lema de oro ' plata. Da' tres !olsas
ue tienen, cada una dos monedas. #as de la primera son de oro, las de la segunda son de plata '
las de la tercera son una de plata ' otra de oro. &e escoge una !olsa al azar ' de ella una moneda
tam!in al azar. &i la moneda es de oro, acu"l es la pro!a!ilidad de ue la otra moneda en la
!olsa sea de oro tam!in%
Primero notemos ue la segunda !olsa no pudo )a!er sido elegida (porue no tiene monedas de
oro), slo pudo )a!er sido seleccionada la primera o la tercera. &i la !olsa elegida )u!iese sido la
tercera, el evento cu'a pro!a!ilidad nos interesa no se realiza. De modo ue el evento ue nos
interesa es euivalente a ue se )a'a elegido la primera !olsa.
8na vez esta!lecido lo anterior, apliuemos el teorema de +a'es para calcular
P(E A 7u) L :P(E)P(7u A E)= I :P(E)P(7u A E) R P(EE)P(7u A EE) R P(EEE)P(7u A EEE)=
#as pro!a!ilidades ue entran al lado derec)o de la igualdad las sacamos, inmediatamente, de las
condiciones del pro!lema ' despus de )acer cuentas tenemos$
P(EA7u) L < I 3
Este pro!lema es cl"sico porue e*iste una jjsolucinVV a la ue muc)as personas llegan ' es falsa.
El argumento es el siguiente. 6omo todas las !olsas son igualmente posi!les, ' el )ec)o de ue la
primer moneda e*trada sea de oro, nos indica ue no se trata de la segunda !olsa. 6onclumos
ue las dos !olsas restantes tienen igual pro!a!ilidad ', por tanto, la pro!a!ilidad de ue la otra
moneda sea de oro es .I<.
&i 8d. piensa de acuerdo a este razonamiento (kerrneol), es mu' difcil ue encuentre en u se
euivoca.
#o ue est" mal es ue lo ue averiguamos, al sa!er ue la moneda e*trada es de oro, es algo
m"s ue el rec)azo de la segunda !olsa. &i slo nos dijeran ue la !olsa escogida al azar no fue la
segunda, sin informarnos del metal de la moneda sacada, todava tendramos incertidum!re
respecto a la primer moneda^ todava podramos apostar a si sta es de oro o de plata. 7l decirnos
ue la moneda fue de oro, estamos aprendiendo algo m"s, ' eso ec)a por tierra el argumento de
jjigual pro!a!ilidad para las dos !olsas restantesVV.
#o interesante del pro!lema es ue, si nos )u!ieran dic)o ue la moneda sacada fu de plata,
aplicando la frmula de +a'es, llegamos a la conclusin de ue la pro!a!ilidad de ue la otra
moneda sea tam!in de plata es <I3 :kDaga 8d. las cuentasl=.
Es decir, si vamos a apostar al metal de la otra moneda, nos conviene apostar por el metal de la
primera.
Este ejemplo nos lleva a refle*ionar so!re el uso adecuado de la informacin contenida en jjlo
dadoVV en el c"lculo de la pro!a!ilidad condicional.
.3.#2esolver problemas (ue apli(uen el teorema.
0jemplos4
.. .. +res m=G3inas denominadas A B y C prod3cen 3n 4%\ $&\ y %"\ de la
prod3ccin total de 3na empresa respecti>amente se ha detectado G3e 3n !\ $\ y
".&\ del prod3cto man3fact3rado por estas m=G3inas es defect3oso a. *e selecciona
3n prod3cto al aAar y se enc3entra G3e es defect3oso Fc3=l es la probabilidad de G3e
el prod3cto haya sido fabricado en la m=G3ina BH b. *i el prod3cto seleccionado
res3lta G3e no es defect3oso Fc3=l es la probabilidad de G3e haya sido fabricado en
la m=G3ina CH
*ol3cin4
2ara resol>er este problema nos ay3daremos con 3n dia8rama de =rbolL

!\ 1
4%\ A
#$\ N1
$&\ B $\ 1
#!\ N1

%"\ C ".&\ 1

#!.4\ N1

a. a. 1efiniremos los e>entosL
1 K e>ento de G3e el prod3cto seleccionado sea defect3oso :e>ento G3e condiciona;
A K e>ento de G3e el prod3cto sea fabricado en la m=G3ina A
B K e>ento de G3e el prod3cto sea fabricado por la m=G3ina B
C K e>ento de G3e el prod3cto sea fabricado por la m=G3ina C

2:B|1; K p:B1;Sp:1; K p:B;p:1|B;Sp:A;p:1|A; T p:B;p:1|B; T
p:C;p:1|C;
2:B|1; K :0.$&]0.0$;S:0.4%]0.0! T 0.$&]0.0$ T 0.%"]0.0"&;
K 0.00'$S0.044'&
K0.""&&#(

!. !. N1 K e>ento de G3e el prod3cto seleccionado no sea defect3oso :e>ento G3e
condiciona;
A K e>ento de G3e el prod3cto sea fabricado en la m=G3ina A
B K e>ento de G3e el prod3cto sea fabricado por la m=G3ina B
C K e>ento de G3e el prod3cto sea fabricado por la m=G3ina C

2:C|N1;Kp:CN1;Sp:N1;Kp:C;p:N1|C;Sp:A;p:N1|A; T p:B;p:N1|B; T
p:C;p:N1|C;
K 0.%"]0.#!4S:0.4%]0.#$ T 0.$&]0.#! T 0.%"]0.#!4;
K 0.%0'04S0.#''44
K0.%"#$(
<. <. 7na empresa recibe >isitantes en s3s instalaciones y los hospeda en c3alG3iera de
tres hoteles de la ci3dadL 2alacio del *ol *icomoros o <iesta Inn en 3na proporcin
de "!.'\ %$\ y 4#.'\ respecti>amente de los c3ales se ha tenido informacin de
G3e se les ha dado 3n mal ser>icio en 3n $.!\ "\ y 4\ respecti>amente a. *i se
selecciona a 3n >isitante al aAar Fc3=l es la probabilidad de G3e no se le haya dado
3n mal ser>icioHb. *i se selecciona a 3n >isitante al aAar y se enc3entra G3e el no se
G3ej del ser>icio prestado Fc3=l es la probabilidad de G3e se haya hospedado en el
2alacio del *olH c. *i el >isitante seleccionado se G3ej del ser>icio prestado Fc3=l es
la probabilidad de G3e se haya hospedado en e hotel <iesta InnH
3. 3. *ol3cin4 )aciendo 3so de 3n dia8rama de =rbolL
$.!\ J

"!.'\ 2*
#(.$\NJ
".0\ J
%$\ *
##.0\ NJ

4.0\ J
4#.'\ <I
#&.0\ NJ

a. a. NJ K e>ento de G3e 3n >isitante no se G3eje del ser>icio
2* K e>ento de G3e 3n >isitante haya sido hospedado en el hotel 2alacio del *ol
* K e>ento de G3e 3n >isitante haya sido hospedado en el hotel *icmoro
<I K e>ento de G3e 3n >isitante haya sido hospedado en el hotel <iesta Inn

2:NJ; K p:2*;p:NJ|2*; T p:*;p:NJ|*; T p:<I;p:NJ|<I; K
K 0."!']0.#($ T 0.%$]0.## T 0.4#']0.#&
K 0."(#!$ T 0.%"&! T 0.4('$
K 0.#("!$
!. !. NJ K e>ento de G3e 3n >isitante no se G3eje del ser>icio
2* K e>ento de G3e 3n >isitante haya sido hospedado en el hotel 2alacio del *ol
* K e>ento de G3e 3n >isitante haya sido hospedado en el hotel *icomoro
<I K e>ento de G3e 3n >isitante haya sido hospedado en el hotel <iesta Inn

2:2*|NJ;Kp:2*NJ;Sp:NJ;
K:0."!']0.#($;S:0."!']0.#($T0.%$]0.##T0.4#']0.#&;K
K 0."(#!$S:0."(#!$ T 0.%"&! T 0.4('$;
K 0."(#!$S0.#("!$
K 0."!'0%4$
c. c. J K e>ento de G3e 3n >isitante se G3eje del ser>icio
<I K e>ento de G3e 3n >isitante haya sido hospedado en el hotel <iesta Inn
2:<I|J; K p:<IJ;Sp:J;
K 0.4#']0.04S:0."!']0.0$! T 0.%$]0.0" T 0.4#']0.04;
K0.0"#!S: 0.00'"! T 0.00%$ T 0.0"#!;
K 0.0"#!S0.0$!"!
K 0.(0$&
Unidad ". +unciones y distribuciones muestrales.
".1 +uncin de probabilidad.
<3ncin de 2robabilidad f(x)
6onsideremos una v.a. discreta `, ue toma los valores *
.
, *
<
, ..., *
n
. &upongamos ue
conocemos la pro!a!ilidad de ue la varia!le ` tome dic)os valores, es decir, se conoce ue
p(`L*
.
) L p
.
, p(`L*
<
) L p
<
, p(`L*
3
) L p
3
, ..., p(`L*
.
) L p
n
,
en general p(`L*
i
) L p
i

#a funcin de pro!a!ilidad f(); de la v.a. ` es la funcin ue asigna a cada valor *
i
de la
varia!le su correspondiente pro!a!ilidad p
i
.
#a representacin gr"fica m"s usual de la funcin de pro!a!ilidad es un diagrama de !arras no
acumulativo.
<7NCION 10 2-OBABI6I1A1.
&i tomamos como varia!le aleatoria el resultado (suma) de lanzar dos dados, desde el punto de
vista de la pro!a!ilidad, el n5mero resultante nos interesa antes de ue realicemos el
e*perimento. 6onocido el resultado, 'a no es interesante (al menos, no para la pro!a!ilidad). #a
imagen de esta varia!le aleatoria es & L b <, 3, 1, ?, 0, /, \, >, .;, .., .< c. #lamando ` al
resultado del e*perimento, podemos contemplar el evento de ue ` sea igual a *, donde * es
cualuier elemento de &. 6laro ue nos resultar" mu' interesante sa!er cosas como P(` L *) para
los diferentes valores de * en &^ por ejemplo, P(` L 0) L ?I30 :esto se lee$ jjla pro!a!ilidad de
ue ` sea igual a seis es un se*toVV=. aPuede 8d. mostrar ue P(` L \) L ?I30 %
&iguiendo con el ejemplo de los dos dados, el lanzar dados para ver ue n5mero cae no es mu'
apasionante ue digamos, acompaHemos los dados con un ta!lero de oca o de serpientes '
escaleras o de turista o de !acGgamon o alg5n otro juego interesante. 4a puestos a jugar turista o
monopolio, es natural ue nos interesen otro tipo de eventos. Podramos estar interesados en
sa!er
si el resultado es menor ue \$ P(` Z \) L <.I30 aPuede 8d. ver por u%^
ue el resultado sea desde 1 )asta menos ue >$ P(3 Z ` Z >) L <3I30 aPor u%^
tam!in podemos estar interesados en ue ` sea distinta de /$ P(` distinto de /) L . Q P(`
L /) L . Q .I0 L ?I0.
Faturalmente esta notacin se e*tiende de manera natural a todo tipo de intervalos '
desigualdades.
2egresando a donde est"!amos,
7 la funcin$ f(*) L P(` L *) se le llama funcin de pro!a!ilidad de `.
Esta funcin es una funcin ordinaria de las ue estudiamos en los cursos de matem"ticas^ no
tiene nada de aleatorio. Dic)o de otra forma, una vez determinados los valores de las
pro!a!ilidades, la funcin de pro!a!ilidad es una funcin com5n ' corriente, tiene su dominio, su
contradominio, su gr"fica, puede ser infectiva, etc.
Da' algunos )ec)os importantes respecto a esta funcin$
.. Para una varia!le aleatoria discreta los valores posi!les son los 5nicos para los cuales esta
pro!a!ilidad es diferente de cero. Dic)o de otra forma, no nos )ace daHo ampliar el
dominio de la funcin de pro!a!ilidad a todos los reales, pero va a valer cero casi siempre
e*cepto en un conjunto discreto de puntos.
<. El valor de la funcin de pro!a!ilidad depende esencialmente de la varia!le aleatoria a la
ue nos referimos, cuando no sea claro a cu"l varia!le nos referimos, es conveniente
poner el sm!olo de la varia!le como su!ndice para la funcin$ f`(*).
Esta costum!re puede causar estragos en la comprensin de los novatos, est 8d.
prevenido. amu uerr" decir f4(J)%
3. #a gr"fica de una funcin como sta se presenta en el pizarrn.
2egresando al ejemplo de los dados, cam!iemos el turista por otro juego. En este juego
8d. gana si el resultado es par ' pierde si es nn^ la cantidad ue pierde o gana ser" el
do!le del resultado. 7ui, su ganancia (positiva si 8d. gana, negativa si pierde) es una
varia!le aleatoria 4, su imagen es & L bQ<<, Q.\, Q.1, Q.;, Q0, 1, \, .<, .0, <;, <1c XPuede
8d. terminar la ta!la de la funcin de pro!a!ilidad de 4%$
8 -22 -1& -14 -10 -6 4 & 12 16
20 24
f(/)

8na vez ue )a'a llenado la ta!la anterior, calcule la pro!a!ilidad de ue gane 8d. m"s
de \ pesos^ la pro!a!ilidad de ue pierda m"s de .; pesos^ la pro!a!ilidad de ue su
ganancia est entre Q.; ' R.0 inclusive^ la pro!a!ilidad de ue su ganancia o prdida
e*ceda a > pesos.
8na funcin de pro!a!ilidad de una varia!le aleatoria discreta, para ser correcta, de!e
satisfacer dos propiedades (p. 1\ de su te*to)$
o f(*) de!e ser siempre ma'or o igual a ;
o la suma de f(*) para todos los valores de * de!e dar .
".1.1 0ariables aleatorias discretas.
0:2!:),E :,E:T62!: D!SC69T!9U: 6 D!SC2ET:.
Se dice que una $ariable aleatoria %iscreta o %iscontinua X, tiene un conjunto definido de valores posibles x1,x2,x3,...xn con
probabilidades respectivas p1,p2,p3,...pn., Es decir que slo puede tomar ciertos valores dentro de un campo de variacin dado.
Como X ha de tomar uno de los valores de este conjunto, entonces p1 + p2 +.+ pn=1.
En general, una variable aleatoria discreta X representa los resultados de un espacio muestral en forma tal que por P(X = x)se
entender la probabilidad de que X tome el valor de x. De esta forma, al considerar los valores de una variable aleatoria es posible
desarrollar una funcin matemtica que asigne una probabilidad a cada realizacin x de la variable aleatoria X. Esta funcin recibe
el nombre de funci#n de la probabilidad!
&jemplo.- Sea el experimento aleatorio consistente en lanzar una moneda al aire. Los sucesos elementales del experimento, <<que
salga cara>>, <<que salga cruz>>, no vienen representados por los nmeros, por lo que casa suceso elemental se le hace
corresponder un nmero real. As al suceso elemental <<que salga cara>> se le hace corresponder el nmero "1 y al suceso
elemental <<que salga cruz>> se le hace corresponder el nmero "2.
La variable aleatoria ser: X = (1,2).
Se trata de una variable aleatoria discontinua o discreta, ya que nicamente puede adoptar los valores 1 y 2.
&ariable aleatoria discreta"
Es la ue solo puede tomar determinados valores.
#a varia!le aleatoria n5mero de caras en el lanzamiento de tres monedas slo puede tomar los
valores ;, ., < ' 3. (Es discreta).
#a varia!le aleatoria suma de las caras superiores en el lanzamiento de dos dados puede tomar
solamente los valores <, 3, 1, ?, 0, /, \, >, .;, .. ' .<. (Es tam!in discreta)
'uncin de probabilidad de una v"a" discreta"
Es la aplicacin ue asocia a cada valor * de la v.a. ` su pro!a!ilidad p.
#os valores ue toma una v.a. discreta ` ' sus correspondientes pro!a!ilidades suelen disponerse
en una ta!la con dos filas o dos columnas llamada ta!la de distri!ucin de pro!a!ilidad$
0
n 3 < .
* * ) )
) (
i
) 0 P
n
p p p p
3 < .
En toda funcin de pro!a!ilidad se verifica ue
.
3 < .
+ + + +
n
p p p p
Ejemplo$ #a v.a. ,n5mero de caras en el lanzamiento de tres monedas- tiene la siguiente funcin
de pro!a!ilidad$
Ft de caras ; . < 3
f(*)L
) (
i
) 0 P
\
.

\
3

\
3

\
.
'uncin de distribucin de una v"a" discreta"
&ea ` una v.a. cu'os valores suponemos ordenados de menor a ma'or.
&e llama funcin de distri!ucin de la varia!le ` a la funcin ue asocia a cada valor de la v.a. la
pro!a!ilidad acumulada )asta ese valor, es decir,
) ( ) ( ) 0 p ) =
(edia, varianza desviacin t)pica de una variable aleatoria discreta"
&e llama de una v.a. discreta `, ue toma los valores n
) ) ) ) ........ , ,
3 < . con pro!a!ilidades
n
p p p p .. .......... , ,
3 < .
al valor de la siguiente e*presin$

i i
p ) .
#a varianza viene dada por la siguiente frmula$


< < <
.
i i
p )
, !ien

i i
p ) . ) (
< <

#a desviacin tpica es la raiz cuadrada de la varianza.
Ejercicio.
#a distri!ucin de pro!a!ilidad de una v.a. ` viene dada por la siguiente ta!la$
)
i
? 1 3 < .
p
i
;,. ;,3 ;,< ;,3
a6u"nto vale p(`L3)
6alcula la media ' la varianza.
ol$ci%n3
#a suma de todas las pro!a!ilidades es ., por tanto,
. 3 , ; < , ; ) 3 ( 3 , ; . , ; + + + + 0 p
luego p(`L3)L;,.
Oormamos la siguiente ta!la$
i
)
i
p
i i
p ) .
i i
p ) .
<
.
<
3
1
?
;,.
;,3
;,.
;,<
;,3
;,.
;,0
;,3
;,\
.,?
;,.
.,<
;,>
3,<
/,?

+ + + + 3 , 3 ? , . \ , ; 3 , ; 0 , ; . , ; .
i i
p )

;. , < ) 3 , 3 ( > , .< .


< < < <

i i
p )
2ar=metros de 3na ?ariable Aleatoria 1iscreta
Tanto la varianza como la desviacin tpica son medidas de dispersin, de tal manera ue cuanto
menores son estos dos par"metros m"s agrupados se encuentran los valores de la distri!ucin
entorno a los valores centrales. Por contra, para valores grandes de la varianza o la desviacin
tpica los datos de la distri!ucin se encuentran mu' dispersos.
1efinicin de ?ariable Aleatoria 1iscreta.
P72E7+#E 7#E7TB2E7.
Orecuentemente el resultado de un e*perimento aleatorio se denota con un n5mero$
el resultado de lanzar un dado,
el n5mero de unidades defectuosas entre .; unidades seleccionadas,
el tiempo ue )a' ue esperar para ue se presente una falla en un circuito,
el n5mero de estaciones de una red de computadoras ue reuieren la atencin del
servidor de la red en un momento dado,
el n5mero de personas en una comunidad ue reuieren atencin mdica en un da
especificado,
el peso sumado de las personas ue est"n en un elevador en un momento determinado del
da,
la cantidad en dinero de lo transportado en un camin antes de ue sufra una
descompostura, etc.
7 un n5mero tal, le llamamos varia!le aleatoria. Ponga atencin al )ec)o de ue una varia!le
aleatoria no es una varia!le en el sentido usual. #as varia!les ue estamos acostum!rados a
manejar son, por ejemplo$ el peso de un co)ete ue va uemando el com!usti!le ue lo impulsa,
la distancia del piso a un o!jeto ue cae )acia l, la concentracin de una solucin dentro de un
tanue conforme pasa el tiempo, etc. En los ejemplos anteriores el valor de la varia!le puede
cam!iar con el tiempo, pero es predeci!le a partir de las le'es de la mec"nica, la umica, la
)idr"ulica o alguna otra ciencia. 6on una varia!le aleatoria la situacin es enteramente diferente.
El valor de una varia!le aleatoria no se puede conocer con e*actitud de antemano a la realizacin
del e*perimento. amu otros ejemplos de varia!les aleatorias se le ocurren adem"s de los
mencionados arri!a% 7l contestar esta pregunta tenga en cuenta ue el azar de!e jugar alg5n
papel en la medicin de la varia!le ' ue su valor no de!e ser predeci!le.
8na varia!le aleatoria presenta dos caractersticas importantes$
.. 8na coleccin (conjunto) de valores posi!les al ue llamamos imagen de la varia!le
aleatoria (antes lo llam"!amos espacio muestral).
<. 8na pro!a!ilidad asociada a los posi!les resultados la cual ueda e*presada mediante una
funcin de pro!a!ilidad.
#as varia!les aleatorias ue tienen un conjunto de posi!les valores discreto, se llaman
1I*C-0+A*. Estas varia!les son el resultado de contar . a6u"les de las varia!les aleatorias
mencionadas arri!a son discretas% 6iertamente el peso de las personas en el elevador no es
discreto, pero entre las otras acu"les son discretas%
".1. 0ariables aleatorias continuas.
1efinicin de >ariable aleatoria contn3a
?A-IAB60 A60A+O-IA.
<rec3entemente el res3ltado de 3n experimento aleatorio se denota con 3n nEmero4
el resultado de lanzar un dado,
el n5mero de unidades defectuosas entre .; unidades seleccionadas,
el tiempo ue )a' ue esperar para ue se presente una falla en un circuito,
el n5mero de estaciones de una red de computadoras ue reuieren la atencin del
servidor de la red en un momento dado,
el n5mero de personas en una comunidad ue reuieren atencin mdica en un da
especificado,
el peso sumado de las personas ue est"n en un elevador en un momento determinado del
da,
la cantidad en dinero de lo transportado en un camin antes de ue sufra una
descompostura, etc.
7 un n5mero tal, le llamamos varia!le aleatoria. Ponga atencin al )ec)o de ue una varia!le
aleatoria no es una varia!le en el sentido usual. #as varia!les ue estamos acostum!rados a
manejar son, por ejemplo$ el peso de un co)ete ue va uemando el com!usti!le ue lo impulsa,
la distancia del piso a un o!jeto ue cae )acia l, la concentracin de una solucin dentro de un
tanue conforme pasa el tiempo, etc. En los ejemplos anteriores el valor de la varia!le puede
cam!iar con el tiempo, pero es predeci!le a partir de las le'es de la mec"nica, la umica, la
)idr"ulica o alguna otra ciencia. 6on una varia!le aleatoria la situacin es enteramente diferente.
El valor de una varia!le aleatoria no se puede conocer con e*actitud de antemano a la realizacin
del e*perimento. amu otros ejemplos de varia!les aleatorias se le ocurren adem"s de los
mencionados arri!a% 7l contestar esta pregunta tenga en cuenta ue el azar de!e jugar alg5n
papel en la medicin de la varia!le ' ue su valor no de!e ser predeci!le.
8na varia!le aleatoria presenta dos caractersticas importantes$
.. 8na coleccin (conjunto) de valores posi!les al ue llamamos imagen de la varia!le
aleatoria (antes lo llam"!amos espacio muestral).
<. 8na pro!a!ilidad asociada a los posi!les resultados la cual ueda e*presada mediante una
funcin de pro!a!ilidad.
#as varia!les aleatorias cu'os valores posi!les se encuentran en cualuier parte de un intervalo,
se llaman CON+IN7A*. Estas varia!les son el resultado de medir.
&ariable aleatoria continua"
Es auella ue puede tomar infinitos valores dentro de un intervalo de la recta real. Por ejemplo,
la duracin de las !om!illas de una determinada marca ' modelo.
En el caso de varia!les aleatorias continuas no tiene sentido plantearse pro!a!ilidades de
resultados aislados, por ejemplo, pro!a!ilidad de ue una !om!illa dure .;; )oras, << minutos '
.0 segundos. #a pro!a!ilidad sera ;.
El inters de estas pro!a!ilidades est" en conocer la pro!a!ilidad correspondiente a un intervalo.
Dic)a pro!a!ilidad se conoce mediante una curva llamada funcin de densidad ' suponiendo ue
!ajo dic)a curva )a' un "rea de una unidad.
6onociendo esta curva, !asta calcular el "rea correspondiente para conocer la pro!a!ilidad de un
intervalo cualuiera.
#a funcin de densidad de una v.a. continua cumple las siguientes condiciones$
&lo puede tomar valores comprendidos entre ; ' .$
. ) ( ; ) f
El "rea encerrada !ajo la curva es igual a la unidad$
. ). (

+

d) ) f
.
Ejercicio3
&ea
[ ] 0 , ; con
.\
) ( )
)
) f
. 6omprue!a ue es una funcin de densidad ' calcula
) ? < ( ) p
&olucin$
Para ue sea funcin de densidad

0
;
.\
d)
)
tiene ue valer .. Peamos$
. ;
<
30
.\
.
< .\
.
.\
0
;
<
0
;

,
_


1
]
1

)
d)
)
.<
/
30
<.
<
1
<
<?
.\
.
< .\
.
.\
) ? < (
?
<
<
?
<

,
_


1
]
1

)
d)
)
) p
'uncin de distribucin"
6omo en el caso de la v.a. discreta, la funcin de distri!ucin proporciona la pro!a!ilidad
acumulada )asta un determinado valor de la varia!le, es decir,
) ( ) ( ) 0 p ) =
.
6umple las siguientes condiciones$
&u valor es cero para todos los puntos situados a la izuierda del menor valor de la
varia!le.
&u valor es . para todos los puntos situados a la derec)a del ma'or valor de la
varia!le.
(edia varianza de una v"a" continua"
E*iste cierta correspondencia entre la varia!le aleatoria discreta ' la continua$
Paria!le aleatoria discreta Paria!le aleatoria continua

i i
p ) .

b
a
d) ) f ) ). ( .


< < <

i i
p )


b
a
d) ) f )
< < <
) (
#o ue es pasa a ser

' lo ue es
i
p
pasa a ser
) () f
Ejercicio ,.
#a funcin de densidad de una v.a. continua viene definida por $

'

resto el en ;
. * ; si <
) (
)
) f
a) Dalla la funcin de distri!ucin.
!) 6alcula la media ' la varianza.
&olucin$
a) #a funcin de distri!ucin se o!tiene integrando la funcin de densidad, es decir,
7 la izuierda de ;, su valor ;.
7 la derec)a de ., su valor es .
Entre ; ' .$ ]
<
;
<
;
< ) ( ) ( ) ) )d) ) 0 p ) =
)
)

es decir,

'

>

<

. * para .
. * ; si *
; * si ;
) (
<
) =
!) 6"lculo de la media$
3
<
. < . ). ( .
.
;


d) ) ) d) ) f )
b
a

6"lculo de la varianza$
.\
.
>
1
. < . ) (
.
;
< < < <


d) ) ) d) ) f )
b
a

Ejercicio 4.
6alcula la media, la varianza ' la desviacin tpica de una v.a. ue tiene como funcin de
densidad$
[ ] ? , . con
<1
3
) (
+
)
)
) f
&olucin$
Media$


1
]
1

+ +
+

>
<>
<
3
3 <1
.
) 3 (
<1
.
<1
3
. ). ( .
?
.
< 3
?
.
<
) )
d) ) ) d)
)
) d) ) f )
b
a

Parianza$


,
_

+
,
_

+

?
.
<
< 3
?
.
<
< < < <
>
<>
) 3 (
<1
.
>
<>
<1
3
) ( d) ) ) d)
)
) d) ) f )
b
a

<\ , .
\.
.;1
>
<>
1 <1
.
<
?
.
3
1

,
_

1
]
1

+ )
)
.
Desviacin tpica$
.3 , . <\ , .
Ejercicio 5.
&ea [ ] ? , < con
30
.
) (
<

)
)
) f , una funcin de densidad.
a) 6alcula su funcin de distri!ucin.
!) 6alcula
) 1 3 ( ) p
.
&olucin$
a)
.;\
< 3
)
3
(
30
.
) . (
30
.
30
.
) ( ) (
3
<
3
<
<
<
<

1
]
1



) )
)
)
d) ) d)
)
) 0 p ) =
)
) )
&u valor es cero para todos los puntos situados a la izuierda de <
&u valor es . para todos los puntos situados a la derec)a de ?
!)
?1
./
3
3
30
.
3 30
.
) . (
30
.
30
.
) 1 3 (
1
3
3
1
3
3
1
3
<
1
3
<

1
]
1

1
]
1

,
_



) )
)
)
d) ) d)
)
) p
". Distribucin binomial.
1istrib3cin Binomial.
&e tiene un n5mero fijo de prue!as n. 6on las siguientes caractersticas$
6ada prue!a tiene slo dos posi!les resultados$ genricamente los llamamos *ito '
fracaso. #os denotamos con . (*ito) ' ; (fracaso).
El resultado de cada prue!a es independiente del resultado de las dem"s prue!as.
#a pro!a!ilidad de *ito no cam!ia de una prue!a a otra.
Fos interesa slo el n5mero total de *itos ` ' n el orden en ue )a'an ocurrido.
6uando se cumplen las condiciones anteriores ` tiene la distri!ucin !inomial con par"metros n
' p, donde n es el n5mero de intentos ' p la pro!a!ilidad de o!tener un *ito. #os valores
posi!les son desde cero )asta ene$ b ;, ., <, ... , n c. #a funcin de pro!a!ilidad es$
f(G) L P(`LG) L n6G pG(nQG), para G en b;,.,<,...,nc
donde me )e visto o!ligado por la tipografa, a usar el sm!olo poco usual n6G para denotar las
com!inaciones de G o!jetos tomados de un total de n$
n6G L :nl= I :Gl(nQG)l=
adem"s, la letra representa la pro!a!ilidad de fracaso L .Qp.
#a media de la !inomial es$ E(`) L np ' la varianza$ var(`) L np.
050.26O. #a pro!a!ilidad de ue una cierta clase de componente pase con *ito una
determinada prue!a de impacto es 3I1. Encuentre la pro!a!ilidad de ue e*actamente < de los 1
componentes ue se prue!an pasen la prue!a.
*O67CION &uponiendo ue las prue!as son independientes ' ue pL3I1 para cada una de ellas,
se o!tiene,
49 3:2
)(;=2) = ------- ----
29 29 4:4
2 7
= -----
12&
6on frecuencia el inters se centra en pro!lemas donde es necesario encontar P(` Z r) o P(a ZL `
ZL !). Por fortuna, se dispone de las sumas !inomiales +(r^n,p) ue se dan en el ane*o (Ta!la
7..) para n L .,<, ..., <;, ' valores seleccionados de p de ;.. a ;.>. En el siguiente Pro!lema se
ilustra el uso de la ta!la mencionada.
050.26O.aEn una familia de tres )ijos, cu"l es la pro!a!ilidad de ue a lo m"s < sean niHas%
*O67CION #a pro!a!ilidad de niHa es ;.?^ el se*o de cada )ijo es independiente del de los
dem"s^ nL3 ' pL;.?.
)(; <= 2) = )(;=0) + )(;=1) + )(;=2)
= 0125 + 3(0125) + 3(0125)
= 0&75
o b!en )(; <= 2) = 1 - )(;=3) = 1 - 0125 = 0&75
050.26O. &e e*traen 1 canicas 6BF 2EEMP#7YB de una urna ue tiene ? !lancas ' 3
negras. a6u"l es la pro!a!ilidad de ue salgan menos de < !lancas%
*O67CION 6omo la eleccin se )ace con reemplazo, se cumplen los reuisitos de un
e*perimento !inomial. ` es el n5mero de canicas !lancas, n L 1 ' p L ?I\ L ;.0<?. #a
pro!a!ilidad ue necesitamos es P(` Z <) ' sta es igual a$
)(; < 2) = )(;=0) + )(;=1)
= 03754 + (4)(0625)(0375)3
= 01516
050.26O. De un lote con .,;;; artculos de los cuales el .;@ son defectuosos, se escogen al
azar .;. a6u"l es la pro!a!ilidad de ue )a'a m"s de < defectuosos%
*O67CION 7unue el muestreo se )ace sin reemplazo, por la gran cantidad de artculos ue
)a' en el lote comparados con los ue se escogen, suponemos ue son v"lidos los supuestos del
modelo !inomial. ` es el n5mero de artculos defectuosos ' la pro!a!ilidad ue se nos pide es$
P(` X <).
6omo el c"lculo de las \ pro!a!ilidades necesarias es mu' latoso, notemos ue P(` X <) L . Q
P(` ZL <). 75n as, )agamos esta cuenta consultando la ta!la de la !inomial adecuada$ n L .;, p
L ;..;. #a ta!la dice ue P(` ZL <) L ;.><>\. Por tanto, la pro!a!ilidad !uscada es P(` X <) L
;.;/;< :Pea su ta!la ' descu!ra este valor=. 6laro ue tam!in tenemos la posi!ilidad de calcular
P(` ZL <) ' restarla de uno.
)(; <= 2) = )(;=0) + )(;=1) + )(;=2)
= (0')10 + (10)(01)(0')' + (45)
(01)2(0')&
= 0'2'&
F1nde se aplica el modelo binomialH4
#a distri!ucin !inomial tiene aplicaciones en muc)os campos cientficos. 8n ingeniero
industrial est" profundamente interesado en la (proporcin de defectuosos( en un proceso
industrial. 6on frecuencia el control de calidad ' los esuemas de muestreo para los procesos se
!asan en la distri!ucin !inomial. Esta se aplica en cualuier situacin del tipo industrial donde
el resultado de un proceso es dicotmico e independientes, ' la pro!a!ilidad de *ito, constante
de un instante a otro. #a distri!ucin !inomial tam!in se emplea e*tensamente en aplicaciones
mdicas ' militares. En am!os casos el resultado e*itoso o fallido es importante. Por ejemplo,
(curar( o (no curar( es importante en el tra!ajo farmacutico, mientras ue (dar en el !lanco( o
(errar( es a menudo la interpretacin del resultado al disparar un misil.
Par"metros de la Distri!ucin +inomial
Ouncin de Distri!ucin de la v.a. +inomial
siendo G el ma'or n5mero entero menor o igual a *
i
.
Esta funcin de distri!ucin proporciona, para cada n5mero real *
i
, la pro!a!ilidad de ue la
varia!le ` tome valores menores o iguales ue *
i
.
El c"lculo de las O(*) L p( ` *) puede resultar la!orioso, por ello se )an construido ta!las para
algunos valores de n ' p ue nos facilitan el tra!ajo.
&ea ` una varia!le aleatoria discreta correspondiente a una distri!ucin !inomial.
*+emplo ,
8na m"uina fa!rica una determinada pieza ' se sa!e ue produce un / por .;;; de piezas
defectuosas. Dallar la pro!a!ilidad de ue al e*aminar ?; piezas slo )a'a una defectuosa.
*ol3cin 4
&e trata de una distri!ucin !inomial de par"metros +(?;, ;V;;/) ' de!emos calcular la
pro!a!ilidad p(`L.).
*+emplo -
#a pro!a!ilidad de *ito de una determinada vacuna es ;,/<. 6alcula la pro!a!ilidad de a ue una
vez administrada a .? pacientes$
a) Finguno sufra la enfermedad
!) Todos sufran la enfermedad
c) Dos de ellos contraigan la enfermedad
*ol3cin 4
&e trata de una distri!ucin !inomial de par"metros +(.?, ;V/<)
*+emplo .
#a pro!a!ilidad de ue el car!urador de un coc)e salga de f"!rica defectuoso es del 1 por .;;.
Dallar $
a) El n5mero de car!uradores defectuosos esperados en un lote de .;;;
!) #a varianza ' la desviacin tpica.
*ol3cin 4
"..1 Conceptos de ensayos repetidos.
".. Conceptos de ensayos de )ernoulli.
0xperimento de Berno3lli
Es un e*perimento ue tiene las siguientes caractersticas$
.. En cada prue!a del e*perimento slo son posi!les dos resultados$ el suceso )a llamado 7
llamado *ito ' el suceso A llamado fracaso.
<. El resultado o!tenido en cada prue!a es independiente de los resultados anteriores.
3. #a pro!a!ilidad del suceso 7 es constante ' no vara de unas prue!as a otras.
#a distri!ucin de pro!a!ilidad de este e*perimento reci!e el nom!re de distri!ucin !inomial de
par"metros n ' p
n es el n5mero de prue!as del e*perimento ' p es la pro!a!ilidad del *ito.
&i representamos por ` la varia!le aleatoria !inomial ue representa el n5mero de *itos
o!tenidos en las n del e*perimento, podemos escri!ir$
p(o!tener r *itos )Lp(`Lr)L
r n r
p p
r
n

,
_

) . .(

Esta e*presin reci!e el nom!re de funcin de pro!a!ilidad de una distri!ucin !inomial o de
+ernoulli.
Dado ue en este tipo de e*periencias los c"lculos pueden ser la!oriosos, se )an construido unas
ta!las ue nos proporcionan la pro!a!ilidad de ue la varia!le ` tome distintos valores, seg5n los
distintos valores de n ' r.
,as variables aleatorias de )ernoulli y binomial. Si cada vez que se vaya a realizar
una experiencia aleatoria, fijamos nuestra atencin ante un suceso : , de probabilidad
no nula (p=p(:)), podemos definir trivialmente una variable aleatoria = / dicotmica,
tomando valores en {0,1}, que recibe el nombre de variable de )ernoulli de
parmetro p , )>p? :
cuya funcin de densidad se puede expresar en la forma:
Su valor medio y varianza son
Si realizamos n ensayos o repeticiones independientes, es decir, en idnticas
condiciones, y siempre centrados en el suceso :, la variable = que cuenta el nmero de
veces que ha tenido lugar el suceso : define el modelo binomial )>n/p?. Sus
funciones de densidad f y de distribucin + tienen la siguiente estructura:
A continuacin se presenta la representacin grfica de los 11 puntos del plano que
corresponden a la funcin de densidad del modelo binomial )>1C/C.1?:
Dado que = puede expresarse como suma de n variables de )ernoulli
independientes, las que estn asociadas a cada uno de las n repeticiones o ensayos de
la experiencia aleatoria:
el valor esperado y la varianza de esta variable pueden calcularse fcilmente:
Obsrvese en la grfica anterior que alrededor del valor 1, que corresponde al valor
medio de la variable en este caso particular, se concentra los valores de mxima
probabilidad de la variable.
)ttp$IIeQstadistica.!io.ucm.esImodddistri!uIdistri!u<.)tml
".." Smbolos de representacin
"." Distribucin 4iper*eom.trica.
1istrib3cin )iper8eom/trica.
6omo 'a vimos, cuando el e*perimento aleatorio en cuestin interviene el muestreo, la
distri!ucin de pro!a!ilidad !inomial proporciona una respuesta precisa slo si ocurre con
reemplazo, de modo ue la pro!a!ilidad de *ito en cualuier ensa'o permanece constante en
todo el e*perimento. De ordinario, sin em!argo, el muestreo se lleva a ca!o sin reemplazo,
muc)as veces por conveniencia$ se selecciona una unidad de una po!lacin ' se separa, otra '
otra. Este procedimiento es m"s f"cil u inspeccionar cada unidad, tomar nota de sus
caractersticas, regresarla a la po!lacin ' remezclarla antes de seleccionar la siguiente. 7 veces
es inevita!le el muestreo sin reemplazo. 6onsideremos casos en donde el muestreo destru'e la
unidad en cuestin, como es en las prue!as de !om!illas de destello, por ejemplo. En dic)as
circunstancia no se pueden devolver los artculos muestreados a la po!lacin, a5n cuando as lo
dese"ramos. #a distri!ucin de pro!a!ilidad )ipergeomtrica indica pro!a!ilidades asociadas con
valores posi!les de una varia!le aleatoria discreta, precisamente en situaciones en ue estos
valores se generan por muestreo sin reemplazo ' en los ue la pro!a!ilidad de *ito, por lo tanto,
cam!ia de un ensa'o al siguiente.
Por lo ue sus caractersticas principales de este modelo son$
&e tiene un grupo de F o!jetos de los cuales G son *itos ' el resto,(FQG), son fracasos.
&e seleccionan n de los F, &EF 2EEMP#7YB.
#a v.a. ` ue nos interesa es el n5mero total de *itos entre los n seleccionados ' n el
orden en ue salieron.
#a funcin de pro!a!ilidad est" dada por$
P(`L*) L :G6 * (FQG)6(nQ*)= I :F6n=^ para * en b;,.,...,nc
#a media es$
E(`) L nGIF ' la varianza$ var(`) L :FQn=I:FQ.= n (.QGIF) GIF
050.26O. 8na comisin de nL? miem!ros )a de formarse al azar de entre FL?; miem!ros de
un sindicato al azar en el ue &L1; tra!ajadores son electricistas. &i, como es costum!re, en
dic)as circunstancias se )ace sin reemplazo acu"les son las pro!a!ilidades para ue `L ;, ., <, 3,
1, ? miem!ros de la comisin sean electricistas %
*O67CION #as respuestas se encuentran r"pidamente por aplicacin sistem"tica de la frmula
)ipergeomtrica como lo muestra la siguiente ta!la.
1I*+-IB7CIUN )I20-,0O.^+-ICA.
6os experimentos G3e tienen este tipo de distrib3cin tienen las si83ientes caractersticas4
a) a) Al realiAar 3n experimento con este tipo de distrib3cin se esperan dos
tipos de res3ltados.
!) !) 6as probabilidades asociadas a cada 3no de los res3ltados no son
constantes.
c) c) Cada ensayo o repeticin del experimento no es independiente de los
dem=s.
d) d) 0l nEmero de repeticiones del experimento :n; es constante.


0jemplo4
0n 3na 3rna o recipiente hay 3n total de / objetos entre los c3ales hay 3na
cantidad a de objetos G3e son defect3osos si se seleccionan de esta 3rna n objetos
al aAar y sin reemplaAo Fc3=l es la probabilidad de obtener x objetos
defect3ososH
*ol3cin4

63e8oL



n *
) n a * ) a
C
C > C
; n - ) ( p


donde4
p:xn; K probabilidad de obtener x objetos defect3osos de entre n seleccionados

) n a * ) a
C > C
m3estras de n objetos en donde hay x G3e son defect3osos y n#x
b3enos


n *
C
todas las m3estras posibles de seleccionar de n objetos tomadas de
entre / objetos en total K espacio m3estral


Considerando G3e en la 3rna hay 3n total de "0 objetos % de los c3ales son
defect3osos si de seleccionan 4 objetos al aAar Fc3=l es la probabilidad de G3e $
sean defect3ososH

*ol3cin4

N K "0 objetos en total
a K % objetos defect3osos
n K 4 objetos seleccionados en m3estra
x K $ objetos defect3osos deseados en la m3estra




9 ;9 (
9
9 ;9 (
9
>
9 ;9 (
9
C
C > C
C
C > C
; n - ) ( p
1 1 .;
.;
< < /
/
< < 3
3
1 <
1 .;
< / < 3
1 .;
< 1 3 .; < 3




9 9
9
>
) ) )
) ) )
9 9
9 ) ) ) )
9 9
9 ) )
>
9 9
9 ) )
9 9
9
9 9
9
>
9 9
9
< <
1
/ \ > .;
0 / < 3
1 0
0 / \ > .;
< ?
? 0 /
< .
. < 3
1 0
.;
< ?
/
< .
3


donde4

/ \ > .;
0 / < 3
) ) )
) ) )

probabilidad asociada a cada m3estra de 4 objetos G3e se
seleccionaron con lo G3e se dem3estra G3e las probabilidades no son constantes

9 9
9
< <
1

formas o maneras de obtener $ objetos defect3osos entre los 4 seleccionados
K m3estras de 4 objetos entre los G3e $ son defect3osos


Como se obser>a en el desarrollo de la sol3cin del problema la pretensin es
demostrar G3e las probabilidades asociadas a cada 3no de los res3ltados no son
constantes.

63e8o la probabilidad de obtener $ objetos defect3osos entre los 4 seleccionados al aAar
sera4



3; ;
<;.0;
0;1\
1
<1
?;1;
<?<
< <
1
/ \ > .;
0 / < 3
. >
9 9
9
>
) ) )
) ) )



0jemplos4
.. 2ara e>itar G3e lo desc3bran en la ad3ana 3n >iajero ha colocado & tabletas de
narctico en 3na botella G3e contiene # pldoras de >itamina G3e son similares en
apariencia. *i el oficial de la ad3ana selecciona % tabletas aleatoriamente para
analiAarlas a; FC3=l es la probabilidad de G3e el >iajero sea arrestado por posesin
de narcticosH b; FC3=l es la probabilidad de G3e no sea arrestado por posesin de
narcticosH.

*ol3cin4
a; N K #T& K"' total de tabletas
a K & tabletas de narctico
n K % tabletas seleccionadas
x K 0 " $ o % tabletas de narctico K >ariable G3e nos indica el nEmero de tabletas de
narctico G3e se p3ede encontrar al seleccionar las % tabletas

p:>iajero sea arrestado por posesin de narcticos; K p:de G3e entre las % tabletas
seleccionadas haya " o m=s tabletas de narctico;


+ +
3 .?
; > 3 0
3 .?
. > < 0
3 .?
< > . 0
3 3 < .
C
C > C
C
C > C
C
C > C
; n ? tabletas % - ) ( p



\.?3\ ;
1??
3/.
1??
<; .3? <.0
1??
. <;
1??
> .?
1??
30 0
.
; ;( ( ; ;( ( ; ;( (

+ +
+ +

otra forma de resol>erL

p:el >iajero sea arrestado por posesin de narcticos; K " N p:de G3e entre las tabletas
seleccionadas no haya 3na sola de narctico;



3 .?
3 > ; 0
. 3 ; .
C
C > C
; n ? ) ( p


\.?3\? ; .\10.? ;
1??
\1 .
. . .
; ;( (

b; b; p:no sea arrestado por posesin de narcticos;



3 .?
3 > ; 0
3 ;
C
C > C
; n ? ) ( p


.\10.? ;
1??
\1 .
.
; ;( (



<. 1e 3n lote de "0 proyectiles 4 se seleccionan al aAar y se disparan. *i el lote contiene
% proyectiles defect3osos G3e no explotar=n Fc3=l es la probabilidad de G3e a; los 4
explotenH b; al menos $ no explotenH

*ol3cin4
a; N K "0 proyectiles en total
a K ( proyectiles G3e explotan
n K 4 proyectiles seleccionados
x K 0 " $ % o 4 proyectiles G3e explotan K >ariable G3e nos define el nEmero de
proyectiles G3e explotan entre la m3estra G3e se dispara


.000/ ;
<.;
3?
<.;
. 3?
1 1
1 .;
; 3 1 /
.
; ;( (
C
C > C
; n ? ) ( p

b; N K "0 proyectiles en total
a K % proyectiles G3e no explotan
n K 4 proyectiles seleccionados
x K 0 " $ o % proyectiles G3e no explotan

p:al menos $ no exploten; K p: $ o m=s proyectiles no exploten; K p:x K $ o %L nK4; K


333333 ;
<.;
/;
<.;
/ 03
<.;
/ . <. 3
1 .;
. / 3 3 < / < 3
.
; ;( ( ; ;( (
C
C > C C > C

+



3. a;FC3=l es la probabilidad de G3e 3na mesera se rehEse a ser>ir bebidas alcohlicas
Enicamente a dos menores de edad si >erifica aleatoriamente solo ' identificaciones
de entre # est3diantes de los c3ales 4 no tienen la edad s3ficienteH b; FCEal es la
probabilidad de G3e como m=ximo $ de las identificaciones perteneAcan a menores
de edadH
*ol3cin4

a; N K # total de est3diantes
a K 4 est3diantes menores de edad
n K ' identificaciones seleccionadas
x K >ariable G3e nos define el nEmero de identificaciones G3e pertenecen a personas
menores de edad
x K 0 " $ % o 4 identificaciones de personas menores de edad


<3\;>? ;
.<0
.; 3
? <
? >
3 ? < 1
.
; ;( (
C
C > C
; n - ) ( p

b; N K # total de est3diantes
a K 4 est3diantes menores de edad
n K ' identificaciones seleccionadas
x K >ariable G3e nos define el nEmero de identificaciones G3e pertenecen a personas
menores de edad
x K 0 " $ % o 4 identificaciones de personas menores de edad


+ +

+ +

.<0
.; 0 ? 1 . .
? < . ;
? >
3 ? < 1 1 ? . 1 ? ? ; 1
; ;( ( ; ;( ( ; ;( (
C
C > C C > C C > C
; n ? - - ) ( p



01<\0 ;
.<0
\.
.<0
0; <; .
.
+ +


4. 7na compaOa man3fact3rera 3tiliAa 3n esG3ema para la aceptacin de los artc3los
prod3cidos antes de ser embarcados. 0l plan es de dos etapas. *e preparan cajas de $' para
embarG3e y se selecciona 3na m3estra de % para >erificar si tienen al8En artc3lo
defect3oso. *i se enc3entra 3no la caja entera se re8resa para >erificarla al "00\. *i no se
enc3entra nin8En artc3lo defect3oso la caja se embarca. a;FC3=l es la probabilidad de G3e
se embarG3e 3na caja G3e tiene tres artc3los defect3ososH b;FC3=l es la probabilidad de
G3e 3na caja G3e contiene solo 3n artc3lo defect3oso se re8resa para >erificacinH
1I*+-IB7CIUN )I20-,0O.0+-ICA ,0N0-A6I@A1A.

Caractersticas4
a; a; Al realiAar 3n experimento con este tipo de distrib3cin se esperan m=s
de dos tipos de res3ltados.
b; b; 6as probabilidades asociadas a cada 3no de estos res3ltados no son
constantes.
c; c; 6os ensayos o repeticiones del experimento no son independientes entre
s.
d; d; 0l nEmero de repeticiones del experimento n es constante.

0ntonces en este caso se tienen m=s de dos tipos de objetos por lo G3e la frm3la
a 3tiliAar sera4



n *
y ) n b a * y b ) a
C
C > C > C
; n - y - ) ( p


donde4
N K x T y T A K total de objetos
a K total de objetos del primer tipo
b K total de objetos del se83ndo tipo
c K NIaIb K total de objetos del tercer tipo
n K objetos seleccionados en la m3estra
x K objetos del primer tipo en la m3estra
y K objetos del se83ndo tipo en la m3estra
A K nIxIy K objetos del tercer tipo en la m3estra

0jemplos4
".0n 3n lote de prod3ctos se tienen $0 prod3ctos sin defectos % con defectos menores y $
con defectos mayores se seleccionan al aAar ' prod3ctos de este lote determine la
probabilidad de G3e a; % de los prod3ctos seleccionados no ten8an defectos y " ten8a
defectos menores b; 4 de los prod3ctos seleccionados no ten8an defectos y " ten8a defectos
menores.

*ol3cin4
a;NK $0T%T$ K$' total de artc3los
aK$0 prod3ctos sin defectos
bK % prod3ctos con defectos menores
NIaIbK $ prod3ctos con defectos mayores
nK ' prod3ctos seleccionados en la m3estra
x K % prod3ctos sin defectos en la m3estra K >ariable G3e nos define el _ de prod3ctos sin
defectos en la m3estra
y K " prod3cto con defectos menores en la m3estra K >ariable G3e nos define el _ de
prod3ctos con defectos menores en la m3estra
A K nIxIy K 'I%I" K " prod3cto con defectos mayores en la m3estra K >ariable G3e nos define
el _ de prod3ctos con defectos mayores en la m3estra

.<\/1. ;
?3.3;
0\1;
?3.3;
< 3 ..1;
? . 3
? <?
. < . 3 3 <;
.
; ;( ;( (
C
C > C > C
; n - y - ) ( p


b;NK $'
aK$0 prod3ctos sin defectos
bK % prod3ctos con defectos menores
NIaIbK $ prod3ctos con defectos mayores
nK ' prod3ctos seleccionados en la m3estra
x K 4 prod3ctos sin defectos en la m3estra K >ariable G3e nos define el _ de prod3ctos sin
defectos en la m3estra
y K " prod3cto con defectos menores en la m3estra K >ariable G3e nos define el _ de
prod3ctos con defectos menores en la m3estra
A K nIxIy K 'I4I" K 0 prod3ctos con defectos mayores en la m3estra K >ariable G3e nos
define el _ de prod3ctos con defectos mayores en la m3estra



</3?/ ;
?3.3;
.1?3?
?3.3;
. 3 1\1?
? . 1
? <?
; < . 3 1 <;
.
; ;( ;( (
C
C > C > C
; n ? y - ) ( p




%.7n cl3b de est3diantes extranjeros tiene en s3s listas a $ canadienses % japoneses '
italianos y $ alemanes. *i se selecciona aleatoriamente 3n comit/ de 4 est3diantes enc3entre
la probabilidad de G3e4 a;est/n representadas todas las nacionalidades b;est/n
representadas todas las nacionalidades excepto la italiana.

*ol3cin4
a; N K "$ est3diantes
a K $ Canadienses
b K % 5aponeses
c K ' Italianos
NIaIbIc K $ Alemanes
n K 4 est3diantes seleccionados para formar comit/
x K " est3diante Canadiense en el comit/ seleccionado
y K " est3diante 5apon/s en el comit/ seleccionado
A K " est3diante Italiano en el comit/ seleccionado
nIxIyIA K " est3diante Alem=n en el comit/ seleccionado



.<.<.< ;
1>?
0;
1>?
< ? 3 <
1 . . .
1 .<
. < . ? . 3 . <
.
; ;( ;( ;( (
C
C > C > C > C
; n ? z - y - ) ( p



b; N K ( est3diantes G3itando a los Italianos
a K $ Canadienses
b K % 5aponeses
NIaIb K $ Alemanes
n K 4 est3diantes seleccionados para formar comit/
x K " o $ est3diantes Canadienses en el comit/ seleccionado
y K " o $ est3diantes 5aponeses en el comit/ seleccionado
nIxIyK " o $ est3diantes Alemanes en el comit/ seleccionado
p:est/n representadas todas las nacionalidades excepto la italiana;


+ +
+ +
1 /
. < . 3 < <
1 /
. < < 3 . <
1 /
< < . 3 . <
1 . < 1 < . 1 . .
C
C > C > C
C
C > C > C
C
C > C > C
; n - y - ) ( ; n - y - ) ( p ; n - y - ) ( p

1I*+-IB7CIUN )I20-,0O.0+-ICA
#a distri!ucin +inomial es importante en muestreos con reemplazo.
&upongamos ue ueremos conocer el u de elementos defectuosos presentes en una muestra de vnC elementos,
e*trados de una urna ue contiene v*C elementos de los cuales v1C est"n defectuosos. &i la e*traccin es con
reemplazo entonces la pro!a!ilidad de escoger ) elementos defectuosos tendr" un comportamiento +inomial, es
decir$
&in em!argo, lo correcto en un caso como el de inspeccin, sera )acer la seleccin sin reemplazo, en cu'o caso en la
.w. seleccin la pro!a!ilidad de ue salga defectuoso es 1'*, pero la segunda vez seria (1@,;'(*@,; 1'(*@,; si
antes sali defectuoso o no (u de casos favora!les I u de casos posi!les).
Q #os casos posi!les son .
Q En cuanto a los casos favora!les se de!e considerar lo siguiente$
#os ) *itos (defectuosos) pueden ser elegidos desde los 1 posi!les de formas diferentes ' cada forma de estas
es com!inada con las formas diferentes de escoger vn@)A elementos no defectuosos ue son$ .
En consecuencia ) *itos ' n@) fracasos pueden elegir de formas o maneras diferentes.
#uego, la pro!a!ilidad de escoger * elementos defectuosos en una muestra de n elementos sin reemplazo ser"$
la cual da lugar a la distri!ucin conocida como )yper8eom/trica.
Esperanza matem"tica de la D'pergeomtrica$
&upongamos ue n elementos de la muestra son seleccionados desde los * de la po!lacin manera secuencial. &i
definimos la P7$
Entonces, , nos seHala el u de elementos defectuosos de la muestra de n elementos.
#uego, ' como E:0i= L .. p(0iL.) R ; . p(0iL;) L p(0iL.) L 1'*, se tiene ue$
*` 0 a K n . (1/
El calculo de la Parianza es pro!lem"tico porue las `i no son independientes ' en consecuencia )a' ue considerar
indicadores no considerados )asta a)ora (6ovarianzas). El resultado es$
".".1 %uestra con reempla1o.
%uestreo con reempla1o@ Es aquel en que un elemento puede ser seleccionado ms de una vez en la
muestra para ello se extrae un elemento de la poblacin se observa y se devuelve a la poblacin, por lo
que de esta forma se pueden hacer infinitas extracciones de la poblacin aun siendo esta finita.
http://www.monografias.com/trabajos12/muestam/muestam.shtml
%uestreo con reempla1o@ procedimiento de muestreo en el que los elementos se regresan a la
poblacin despus de ser elegidos, de tal forma que algunos elementos de la poblacin pueden
aparecer en la muestra ms de una vez.
http://server2.southlink.com.ar/vap/inferencia.htm
".". %uestra sin reempla1o.
%uestreo sin reempla1o@ No se devuelve los elementos extrados a la poblacin hasta que no se hallan
extrados todos los elementos de la poblacin que conforman la muestra.
http://www.monografias.com/trabajos12/muestam/muestam.shtml
%uestreo sin reempla1o@ procedimiento de muestreo en el que los elementos no se regresan a
la poblacin despus de ser elegidos, de tal forma que ningn elemento de la poblacin puede
aparecer en la muestra ms de una vez.
http://server2.southlink.com.ar/vap/inferencia.htm
".# Distribucin de Poisson.
1istrib3cin 2oisson.
Este modelo se llama as para )onrar la memoria de otro gran pro!a!ilista ' matem"tico. #a v.a.
de Poisson se refiere a sucesos en un intervalo de tiempo o en una "rea especfica. El intervalo de
tiempo puede ser de cualuier duracin, un minuto, una )ora, un da, un aHo. 7lgunos ejemplos
de situaciones modeladas con el modelo de Poisson son$ el n5mero de fallas de una m"uina en
una semana, el n5mero juegos de alg5n deporte pospuestos por lluvia en una temporada.
6uando se trata de superficies, los ejemplos son$ el n5mero de ratas en un terreno, el n5mero de
errores de mecanografa por p"gina, el n5mero de defectos por centmetro cuadrado.
Para ue una v.a. sea de Poisson, se reuiere ue se satisfagan 3 )iptesis (ue suelen llamarse
tam!in postulados del proceso de Poisson). 8sted puede consultar estos postulados en la p"gina
.30 de su te*to.
En los pro!lemas ue resolvemos en este curso, el )ec)o de ue el modelo a utilizar sea el de
Poisson, forma parte del enunciado del pro!lema.
#a v.a. de Poisson tiene un solo par"metro ue es mu L lam!dat donde t es la longitud del
intervalo o la superficie de la regin ' lam!da es la tasa de ocurrencia de eventos por unidad de
medida.
#a imagen de la v.a. de Poisson es b;, ., <, . . . c es decir todos los enteros no negativos. #a
funcin de pro!a!ilidad esta dada por$
P(` L G) L e*p(Qx):x(G) I Gl=^ G L ;, ., <, . . .
#a media ' la varianza son$
E(`) L x, var(`) L x.
2-OB60.A. &i el promedio de llamadas por da )"!il (de oc)o )oras) ue se reci!en en un
!anco es >0. a6u"l es la pro!a!ilidad de ue en una )ora se reci!an e*actamente .1%
*O67CION 7u, x L .< '
P(` L .1) L e(Q.<):.<(.1) I .1l= L ;.;>;?
En la misma situacin a6u"l es la pro!a!ilidad de tener m"s de .0 llamadas en una )ora% 7)ora
ueremos$
P(` X .0) L . Q P(` ZL .0)
esta 5ltima pro!a!ilidad la leemos en la ta!la de Poisson ' tenemos$
P(` X .0) L . Q ;.\>\/ L ;..;.3
:2evise la ta!la ' aseg5rese ue la le !ien=
2-OB60.A. 8n mecangrafo comete, en promedio, < errores por p"gina. a6u"l es la
pro!a!ilidad de ue tenga m"s de <; errores en un documento de / p"ginas%
*O67CION 7u mu L .1 ue es el n5mero esperado de errores en el documento. #a
pro!a!ilidad !uscada, usando la ta!la es
P(` X <;) L . Q P(` ZL <;) L ;.;1/>
1I*+-IB7CIUN 10 2OI**ON.
Caractersticas4
0n este tipo de experimentos los /xitos b3scados son expresados por 3nidad de =rea
tiempo pieAa etc etc4
I _ de defectos de 3na tela por m
$
I _ de a>iones G3e aterriAan en 3n aerop3erto por da hora min3to etc etc.
I _ de bacterias por cm
$
de c3lti>o
I _ de llamadas telefnicas a 3n conm3tador por hora min3to etc etc.
I _ de lle8adas de embarcaciones a 3n p3erto por da mes etc etc.
2ara determinar la probabilidad de G3e oc3rran x /xitos por 3nidad de tiempo =rea o
prod3cto la frm3la a 3tiliAar sera4


9 )
; - ) ( p
)

donde4
p:x ; K probabilidad de G3e oc3rran x /xitos c3ando el nEmero promedio de oc3rrencia
de ellos es
K media o promedio de /xitos por 3nidad de tiempo =rea o prod3cto
K $.("!
x K >ariable G3e nos denota el nEmero de /xitos G3e se desea G3e oc3rra

)ay G3e hacer notar G3e en esta distrib3cin el nEmero de /xitos G3e oc3rren por 3nidad
de tiempo =rea o prod3cto es totalmente al aAar y G3e cada inter>alo de tiempo es
independiente de otro inter>alo dado as como cada =rea es independiente de otra =rea
dada y cada prod3cto es independiente de otro prod3cto dado.



0jemplos4
.. *i 3n banco recibe en promedio & cheG3es sin fondo por da Fc3=les son las
probabilidades de G3e reciba a; c3atro cheG3es sin fondo en 3n da dado b; "0
cheG3es sin fondos en c3alG3iera de dos das consec3ti>osH


*ol3cin4
a; a; x K >ariable G3e nos define el nEmero de cheG3es sin fondo G3e lle8an al
banco en 3n da c3alG3iera K 0 " $ % ..... etc etc.
K & cheG3es sin fondo por da
K $.("!


.33>< ;
<1
;;<1\ ; .<>0
1
/.\ < 0
0 1
0 1
.
; . ;( (
9
; . ( ; (
; - ) ( p



b;
xK >ariable G3e nos define el nEmero de cheG3es sin fondo G3e lle8an al banco en
dos das consec3ti>os K 0 " $ % ...... etc. etc.
K & x $ K "$ cheG3es sin fondo en promedio G3e lle8an al banco en dos das
consec3ti>os
Nota4 siempre debe de estar en f3ncin de x siempre o dicho de otra forma
debe bhablarc de lo mismo G3e x.


.;1>?3 ;
30<\\;;
;;;;;0.?. ; .; .>./301 0
.;
/.\ < .<
.< .;
.< .;
.
; . ;( . (
9
; . ( ; (
; - ) ( p


<. 0n la inspeccin de hojalata prod3cida por 3n proceso electroltico contin3o se
identifican 0.$ imperfecciones en promedio por min3to. 1etermine las
probabilidades de identificar a; 3na imperfeccin en % min3tos b; al menos dos
imperfecciones en ' min3tos c; c3ando m=s 3na imperfeccin en "' min3tos.
*ol3cin4
a; a; x K >ariable G3e nos define el nEmero de imperfecciones en la hojalata
por cada % min3tos K 0 " $ % .... etc. etc.
K 0.$ x % K0.& imperfecciones en promedio por cada % min3tos en la hojalata



3<>3;/ ;
.
?1\\1? ; 0 ;
.
/.\ < 0 ;
0 ; .
0 ; .
.
; . ;( . (
9
; . ( ; . (
; . - ) ( p
.


b; b; x K >ariable G3e nos define el nEmero de imperfecciones en la hojalata
por cada ' min3tos K 0 " $ % .... etc. etc.
K 0.$ x ' K" imperfeccin en promedio por cada ' min3tos en la hojalata

,
_

+

9
; . ;( (
9
; . ( ; (
; - - ) ( p ; .... etc - - - ) ( p
.
/.\ < .
;
/.\ < .
. . . ; . . 1 3 <
. . ;


K"I:0.%&(#"!T0.%&(#"!; K 0.$&4"&

c; c; x K >ariable G3e nos define el nEmero de imperfecciones en la hojalata
por cada "' min3tos K 0 " $ % ..... etc. etc.
K 0.$ x "' K % imperfecciones en promedio por cada "' min3tos en la hojalata


+ +

9
; . ( ; (
9
; . ( ; (
; - ) ( p ; - ) ( p ; - - ) ( p
.
/.\ < 3
;
/.\ < 3
3 . 3 ; 3 . ;
3 . 3 ;


K 0.04#!0$& T 0."4#40!
K 0."##$"0&
En estadstica la distrib3cin de 2oisson es una distri!ucin de pro!a!ilidad discreta con un
par"metro y Z ; cu'a funcin de masa para sucesos es
7u e significa el n5mero e ' )l significa el factorial de ).
#a distri!ucin de Poisson descri!e el n5mero de sucesos en una unidad de tiempo de un proceso
de Poisson. Muc)os fenmenos se modelan como un proceso de Poisson, por ejemplo las
llamadas en una empresa o los accidentes en una carrera.
El valor esperado ' la varianza de una varia!le aleatoria 0 de distri!ucin Poisson son
E:0= L B:0= L y
La Distribucin de Poisson se llama as en honor a Simen Dennis Poisson (1781-1840), francs que
desarroll esta distribucin basndose en estudios efectuados en la ltima parte de su vida.

La distribucin de Poisson se emplea para describir varios procesos, entre otros la distribucin de las
llamadas telefnicas que llagan a un conmutador, la demanda (necesidades) de servicios en una
institucin asistencial por parte de los pacientes, los arribos de los camiones y automviles a la caseta
de cobro y el nmero de accidentes en un cruce. Los ejemplos citados tienen un elemento en comn,
pueden ser descritos por una variable aleatoria discreta que asume valores enteros (0,1,2,3,4,5 y as
sucesivamente).

El nmero de enfermos que llegan a un consultorio en cierto intervalo de tiempo ser de 0,1,2,3,4,5 o
algn otro nmero entero. De manera anloga, si se cuenta el nmero de automviles que llegan a
una caseta de cobro durante un periodo de diez minutos, el nmero ser entero.

Caractersticas de los procesos que producen una distribucin de la probabilidad de Poisson.

El nmero de vehculos que pasan por una caseta de cobro en las horas de mayor trfico sirve como
ejemplo para mostrar las caractersticas de una distribucin de probabilidad de Poisson.

El promedio (media) de los arribos de vehculos por hora de gran trfico puede estimarse a partir de
los datos anteriores del trfico.

Si dividimos las horas de gran trfico en periodos (intervalos) de un segundo cada uno,
encontraremos que los siguientes enunciados son verdaderos:

a) La probabilidad de que exactamente un vehculo llegue por segundo a una caseta individual es un
nmero muy pequeo y es constante para que cada intervalo de un segundo.
b) La probabilidad de que dos o ms vehculos lleguen en un intervalo de un segundo es tan reducida
que podemos asignarle un valor cero.
c) El nmero de vehculos que llegan en determinado intervalo de un segundo es independiente del
momento en que el intervalo de un segundo ocurre durante la hora de gran trfico.
d) El nmero de llegadas en cualquier intervalo de un segundo no depende del nmero de arribos de
cualquier otro intervalo de un segundo.

Ahora bien, podemos generalizar partiendo de las cuatro condiciones que hemos descrito en este
ejemplo, si estas condiciones se cumplen nos apoyaremos en una distribucin de probabilidad de
Poisson para describirlos.

Clculo de probabilidades mediante la distribucin de Poisson.

La distribucin de Poisson, segn hemos sealado, se refiere a ciertos procesos que pueden ser
descritos con una variable aleatoria discreta. La letra X suele representar esa variable y puede
adems asumir valores enteros (0,1,2,3 etc..) . Utilizamos la letra X mayscula para representar la
variable aleatoria y la x minscula para designar un valor especfico que puede asumir la X
mayscula. La probabilidad de exactamente x ocurrencias en una distribucin de Poisson se calcula
mediante la frmula:

P(x) =
x
* e-

/ x!


x
= Lambda
(nmero medio de ocurrencias por intervalo de tiempo) elevada a la potencia x.

e-

= e= 2.71828 elevado a la potencia de lambda negativa.

x! = x factorial.

Ejemplo :
Supngase que estamos investigando la seguridad de un crucero muy peligroso. Los archivos de la
polica indican una media de cinco accidentes por mes en l. El nmero de accidentes est distribuido
conforme a la distribucin de Poisson, y la divisin de seguridad en carreteras quiere calcular la
probabilidad de exactamente 0,1,2,3 y 4 accidentes en un mes determinado.

Aplicando la frmula anterior:

P(0) = (5)
0
(e
-5)
/0! = 0.00674

P(1) = (5)
1
(e
-5)
/1! = 0.03370

P(2) = (5)
2
(e
-5)
/2! = 0.08425

P(3) = (5)
3
(e
-5)
/3! = 0.14042

P(4) = (5)
4
(e
-5)
/4! = 0.17552

Para saber cual es la probabilidad en 3 o menos, sumaremos las probabilidades de 0,1,2,3 lo que ser
igual a :
P(0) = 0.00674
P(1) = 0.03370
P(2) = 0.08425
P(3) = 0.14042
P(3 o menos) = 0.26511

Dado que la probabilidad de que haya 3 o menos accidentes es de 0.26511 entonces la probabilidad
de que ocurran ms de tres debe ser = 1 0.26511 = 0.73489.

La distribucin de Poisson como una aproximacin a la distribucin binomial.

Algunas veces, si se desea evitar el tedioso trabajo de calcular las distribuciones binomiales, se puede
usar a cambio la de Poisson, pero debe cumplir con ciertas condiciones como :

n=>20
p=<0.05

En los casos en que se satisfacen tales condiciones, podemos sustituir la media de la distribucin
binomial en lugar de la media de la distribucin de Poisson de modo que la frmula quedara as:

P(x) = (np)
X
* e
-np
/x!
Aproximacin de la binomial por la 2oisson.
8na aplicacin mu' importante de la pro!a!ilidad de Poisson se da para apro*imar la !inomial.
Esta apro*imacin funciona !ajo las siguientes circunstancias.
#a varia!le aleatoria ` cu'as pro!a!ilidades se uieren es !inomial.
#a n es mu' grande (n XL <;) '
#a p es mu' peueHa (p ZL ;.;?).
De modo ue, apro*imadamente np Z ?
En estas condiciones$
P(` L G) apro*imadamente es e*p(Qx):x(G) I Gl=
donde x L np
050.26O. En una cierta comunidad la pro!a!ilidad de ue una persona infectada por
neumona muera es ;.;;<. a6u"l es la pro!a!ilidad de ue mueran a lo m"s ? de las siguientes
<;;; personas infectadas%
*O67CION 7u se dan las condiciones para la apro*imacin$ nL <;;; ' p L ;.;;< de modo
ue mu L 1 ' la pro!a!ilidad pedida se o!tiene de la ta!la como
P(` XL ?) apro*imadamente es ;./\?.
050.26O. En situaciones de muestreo sin reemplazo en ue la muestra es un porcentaje
considera!le de la po!lacin. 6omo ejemplo, de un lote de 1; artculos se seleccionan al azar 1
para pro!arlos ' si fallan la prue!a m"s de < se rec)aza el lote completo. a6u"l es la pro!a!ilidad
de rec)azar un lote ue tenga \ defectuosos%
*O67CION Dado ue el muestreo se )ace sin reemplazo ' la fraccin de muestreo es grande
(.;@) tenemos una v.a. )ipergeomtrica. #os par"metros son$ FL1;, GL\, nL1, ` es el n5mero
de defectuosos en la muestra ' ueremos la pro!a!ilidad
P(` X <) L P(`L3) R P(`L1) L ./><I>.3>; R /;I>.3>; L ;.;<;1
sta es la pro!a!ilidad de rec)azar un lote con <?@ de defectuosos ' es mu' !aja. Para mejorar el
proceso de seleccin, los ingenieros deciden rec)azar el lote cuando )a'a < o m"s defectuosos.
a6u"l es la pro!a!ilidad de rec)azar un lote ue tenga \ defectuosos% #os par"metros
permanecen iguales lo ue cam!ia es la pro!a!ilidad, a)ora es
P(` XL <) L P(`L<) R P(`X<) L ;..?<; R ;.;<;1 L ;../<1
6on esta nueva poltica de rec)azar el lote cuando sean < o m"s, acu"l es la pro!a!ilidad de
rec)azar un lote con 0 defectuosos% #os par"metros son, a)ora, FL1;, GL0, nL1 ' ueremos la
pro!a!ilidad$
6on esta nueva poltica de rec)azar el lote cuando sean < o m"s, acu"l es la pro!a!ilidad de
rec)azar un lote con 0 defectuosos% #os par"metros son, a)ora, FL1;, GL0, nL1 ' ueremos la
pro!a!ilidad$
)(; = 10) = 1 - >)(;=0) + )(;=1)?
= 1 - >46376/ '13'0 + 35'04/ '13'0?
= 00''7
050.26O. En el saln de tercer aHo de una escuela )a' 3? alumnos, de los cuales .; son niHas
' <? niHos. &e nom!ra un comit de / alumnos ue represente al saln. #a seleccin se )ace al
azar. amu pro!a!ilidad )a' de ue en el comit )a'a ma'ora de niHas%
*O67CION En esta situacin se cumplen las )iptesis de una )ipergeomtrica. #os par"metros
son$ FL3?, GL.;, nL/, ` es el n5mero de niHas en el comit. #a pro!a!ilidad pedida es$
)(; = 3) = )(;=4) + )(;=5) + )(;=6) + )(;=7)
= 00&3'
".$ Esperan1a matemtica.
-alor esperado o esperanza matemtica
&ea 0 una v.a. discreta. &e denomina esperanAa matem=tica de 0 o >alor esperado, ' se denota
!ien o !ien , a la cantidad ue se e*presa como$
donde es el conjunto numera!le de ndices de los valores ue puede tomar la varia!le (por
ejemplo para un n5mero finito de valores de la v.a. o !ien para una
cantidad infinita n$merable de los mismos.
&i 0 es una v.a. contin$a, se define su esperanza a partir de la funcin de densidad como sigue$
6bservacin
2ecordamos ue si
' por tanto tiene sentido calcular su esperanza matem"tica$
Por las analogas e*istente entre la definicin de media aritmtica ' esperanza matem"tica, las
propiedades de linealidad de la primera se trasladan a la segunda, como es inmediato compro!ar$

)ttp$IIftp.medprev.uma.esIli!roInode0..)tm
En estadstica el valor esperado o esperan1a matemtica (o simplemente esperan1a) de una
variable aleatoria es la suma de la probabilidad de cada succeso multiplicado por su valor. Por
ejemplo en un juego de azar el valor esperado es el medio beneficio.
Si todos los succesos son de igual probabilidad la esperanza es la media aritmtica.
.efinicin
Para una variable aleatoria discreta con valores posibles y sus probabilidades dado de la
funcin de masa p(xi) la esperanza se calcula con
Para una variable aleatoria continua la esperanza se calcula mediante el integral de todos valores y
la funcin de densidad p(x):
Las esperanzas &['
(
] para ( = 0,1,2... se llaman momentos de orden (. Ms importante son los
momentos centrados &[(' - &['])
(
].
No todos variables aleatorias tienen un valor esperado (por ejemplo la distribucin de Cauchy).
El valor esperado es una funcin linear. Por eso
&[a' + b] = a&['] + b
)ttp$II.;;cia.comIenciclopediaIEsperanzadmatem@E.tica
".$.1 %edida de una variable aleatoria.
".$. 0alor esperado.
?alor esperado y momentos.
?A6O- 0*20-A1O
El valor promedio de una varia!le aleatoria despus de un n5mero grande e*perimentos, es su
valor esperado o esperanza matem"tica. la cu"l est" dado por$
E(`) L suma de * )asta `, * p(*)
la cu"l tiene las siguientes caractersticas^
Esta es un n5mero fijo
Es una propiedad de la distri!ucin de pro!a!ilidad
Puede no e*istir dependiendo de si la correspondiente suma no converge en un valor
finito.
050.26O &i la varia!le aleatoria ` representa la suma de las caras de dos dados cuando stos
se lanzan, demostrar ue el valor esperado de ` es siete
*O67CION
E(`) L suma de < )asta .< * p(*) L (<)(.I30) R (3)(<I30) R ... R (.<)(.I30) L /.
.O.0N+O*
#os momentos de una varia!le aleatoria ` son los valores esperados de ciertas funciones de `.
Estos forman una coleccin de medidas descriptivas ue pueden emplearse para caracterizar la
distri!ucin de pro!a!ilidad de ` ' especificarla si conocemos todos lo momentos de `.
#os momentos de ` generalmente se definen alrededor del cero o del valor esperado `.
El rQsimo mometo de ` alrededor del cero se define por$
xor L E(`r) L suma de *, *zr p(*)
por lo ue el primer momento alrededor del cero es la media o valor esperado, E(`.)LE(`)
El rQsimo mometo alrededor de la media de ` se define por$
x r L E(`Qx)zr L suma de *, (*Qx)zr p(*)
por lo ue el primer momento central de cualuier varia!le aleatoria es cero dado ue$
x. L E(`Qx) L E(`) Q x L ;
' el segundo momento central es$
x< L E(`Qx)z< L xo< Q x<
el cu"l tam!in se le conoce como varianza.
El tercer mometo central,
x3 L E(`Qx)z3 L xo3 Q3 x xo< R < x3
est" relacionado con la asimetra de la distri!ucin de pro!a!ilidad de `.
8na medida m"s apropiada de la asimetra, es el tercer momento estandarizado, dado por^
alfa3 L x3I(x<)z..?,
ue reci!e el nom!re de coeficiente de asimetra.
El cuarto momento central,
x1 L E(`Qx)z1 L xo1 Q 1 x xo3 R 0 xz< xo< Q 3 xz1,
es una medida de u tan puntiaguda es la distri!ucin de pro!a!ilidad ' reci!e el nom!re de
curtosis.
7l igual ue para el tercer momento, es preferi!le emplear el cuarto momento estandarizado,
alfa1 L x1Ix<z<.
#os momentos estandarizados tercero ' cuarto, tam!in se conocen como los factores de forma
primero ' segundo, respectivamente, de la distri!ucin de pro!a!ilidad de!ido a ue, en gran
medida, determinan la forma de la distri!ucin de pro!a!ilidad.
050.26O Dos vendedores de seguros de vida, 7 ' +, visitan de \ a .< clientes potenciales por
semana, respectivamente. &ean ` ' 4 dos varia!les aleatorias ue representen el n5mero de
seguros vendidos por 7 ' +. 6on !ase en una gran informacin pasada, las pro!a!ilidades para lo
valores de ` ' 4 son las siguientes$
x 0 1 2 3 4 5 6 7 &
#(x) 002 00' 021 02& 023 012 004 001 0
/ 0 1 2 3 4 5 6 7
& ' 10 11 12
#(/) 006 021 02& 024 013 005 002 001
0 0 0 0 0
6ompara ' contrastar las distri!uciones de pro!a!ilidad de ` ' 4 empleando sus medias,
varianzas ' factores de forma.
*O67CION
#os primeros cuatro momentos de ` alrededor del cero son$
@(;) = (0)(02) + (1)(00') + + (&)(0) = 31&
@A2(;) = (0):2(002) + (1):2(00') + + (&):2(0) = 1206
@A3(;) = (0):3(002) + (1):3(00') + + (&):3(0) = 5112
@A4(;) = (0):4(002) + (1):4(00') + + (&):4(0) = 235&6

Para calcular los primeros dos factores de forma reuerimos de las medias, ue a continuacin se
calculan$
@2(;) = @A2 - @:2
= 1206 - (31&):2
= 1'5

@3(;) = @A3 -3 @ @A2 + 2 @3
= 5112 - 3(31&)(1206) + 2(31&):3
= 03&25
@4(;) = @A4 - 4 @ @A3 + 6 @:2 @A2 - 3 @:4
= 235&6 - 4(31&)(5112) + 6(31&):2(1206) -
3(31&):4
= 10565
6alculando finalmente los factores de forma, tenemos$
alfa3(;) = @3/(@2):15
= 03&25 / (1'5):15
= 01405
alfa4(;) = @4/@2:2
= 10565 / (1'5):2
= 27&
7)ora para la varia!le 4 procedemos de la misma forma ' o!tenemos lo siguiente$
@(8) = 245 @A2(8) = &03
@A3(8) = 3125 @A4(8) = 13&5'
@2(8) = 203 @3(8) = 1641&
@4(8) = 134504
alfa3(;) =05676 alfa4(;) = 326
7 primera vista, parece e*istir mu' poca diferente entre las distri!uciones de ` ' 4 con respecto
a la media ' la varianza, pero la distri!ucin de 4 tiene un sesgo positivo m"s grande ue la de
`.
7dem"s, la distri!ucin de ` es platic5rtica (alfa1Z3), mientras ue la de 4 es leptoc5rtica
(alfa1X3).
".& Propiedades de la curva )inomial.
".&.1 Propiedades *eom.tricas.
".&. Parmetros.
".3 Distribucin normal.
1istrib3cin normal.
6a Normal 0st=ndar
El modelo normal est"ndar es el de una varia!le aleatoria continua cu'a imagen son todos los
n5meros reales.
#a densidad de la normal est"ndar es$
f(z) L (<_)Q.I<e*p(Qz< I <)
Esta funcin no tiene una integral elemental de modo ue se reuiere una ta!la especial para
conocer los valores de la pro!a!ilidad de una varia!le normal. #a ta!la da pro!a!ilidades para
O(t) L P(Y Z t)
#a varia!le aleatoria normal est"ndar tiene propiedades importantes$
#a pro!a!ilidad est" concentrada cerca de cero. &e puede ver, usando la ta!la, ue la
pro!a!ilidad de un intervalo cercano a cero es ma'or ue la de un intervalo del mismo
anc)o pero alejado de cero. En el saln )acemos varios ejercicios de c"lculo de
pro!a!ilidades ue nos convencen de este )ec)o.
#a pro!a!ilidad est" simtricamente distri!uida alrededor del cero. Daciendo cuentas con
la misma ta!la se ve ue la O(a) R O(Qa) L ., para cualuier valor de a. Esto nos lleva a
concluir la simetra de la distri!ucin.
Para algunos c"lculos de pro!a!ilidad de una normal es conveniente considerar el eje real
partido en cuatro pedazos,
.. antes de Qa,
<. entre Qa ' ;,
3. entre ; ' a,
1. despus de a.
#as pro!a!ilidades de (.) ' (1) son iguales^ las de (<) ' (1) son iguales^ las de (.) ' (<) sumadas
dan ;.?^ las de (3) ' (1) suman ;.?.
8se la ta!la para calcular$ P(Y Z ..1?), P(Y X Q;.><), P(Q;.?3 Z Y Z ..<3). En la tarea tiene 8d.
muc)os ejercicios m"s de c"lculo de diferentes pro!a!ilidades en el modelo normal.
Esta varia!le aleatoria, de!ido a la forma de la densidad, tiene un valor central (el cero) ue
jjatraeVV los valores. #a unidad de medida de esta varia!le es el uno.
7sos de la normal. 6a normal no est=ndar
En los casos en ue este modelo se usa, generalmente$
el valor central o promedio vale mu (distinto de cero)
la unidad de medida o desviacin est"ndar es sigma (distinta de uno).
Para calcular en este caso no est"ndar, es preciso )acer una transformacin ue se llama
estandarizacin. Esta estandarizacin es un codificacin de los valores.
#a frmula para estandarizar es$
Y L (` Q mu) I sigma
#a forma de usar esta codificacin la ejemplificamos a continuacin$
2-OB60.A 6alcular el valor apro*imado de f(1), para una nL\ ' pL;.?.
*O67CION
f(1) L p(3.? Z * Z 1.?) L p((3.?Qx)I{ZYZ L(p(Q.3?( font R.3?)L(.</3/( z {)L(p((3.?Q1)I<Zz
Esta distri!ucin es frecuentemente utilizada en las aplicaciones estadsticas. &u propio nom!re
indica su e*tendida utilizacin, justificada por la frecuencia o normalidad con la ue ciertos
fenmenos tienden a parecerse en su comportamiento a esta distri!ucin.
Muc)as varia!les aleatorias continuas presentan una funcin de densidad cu'a gr"fica tiene
forma de campana.
En otras ocasiones, al considerar distri!uciones !inomiales, tipo +(n,p), para un mismo valor de
p ' valores de n cada vez ma'ores, se ve ue sus polgonos de frecuencias se apro*iman a una
curva en (forma de campana(.
En resumen, la importancia de la distri!ucin normal se de!e principalmente a ue )a' muc)as
varia!les asociadas a fenmenos naturales ue siguen el modelo de la normal
Caracteres morfol%gicos de individuos (personas, animales, plantas,...) de una
especie, p.ejm. tallas, pesos, envergaduras, di"metros, permetros,...
Caracteres fisiol%gicos, por ejemplo$ efecto de una misma dosis de un f"rmaco, o
de una misma cantidad de a!ono.
Caracteres sociol%gicos, por ejemplo$ consumo de cierto producto por un mismo
grupo de individuos, puntuaciones de e*amen.
Caracteres psicol%gicos, por ejemplo$ cociente intelectual, grado de adaptacin a
un medio,...
Errores cometidos al medir ciertas magnitudes.
Balores estad"sticos muestrales, por ejemplo $ la media.
Ctras distrib$ciones como la !inomial o la de Poisson son apro*imaciones
normales, ...
4 en general cualuier caracterstica ue se o!tenga como suma de muc)os factores.
.. 1I*+-IB7CIUN NO-.A6.

Caractersticas4

a; a; 0s 8enerada por 3na >ariable de tipo contin3o denominada xL
I< x <
b; b; 6a f3ncin G3e nos define esta distrib3cin es4


< <
< <
<
.



' ; ) (
; - - ) ( f

I< x <

Al dar a la f3ncin los >alores de
$
y >alores a x obtendremos la
distrib3cin en c3estin la G3e tiene forma de campana por lo G3e tambi/n
se le conoce como campana de ,a3ss. )ay 3n nEmero infinito de f3nciones de
densidad Normal 3na para cada combinacin de y . 6a media mide la
3bicacin de la distrib3cin y la des>iacin est=ndar mide s3 dispersin.
c; 0s sim/trica con respecto a s3 eje >ertical.
d; 0s asinttica con respecto a s3 eje horiAontalL esto G3iere decir G3e jam=s >a a
tocar el eje de las eG3is.
e; 0l =rea total bajo la c3r>a es ".
f; * s3mamos a t se obser>ar= G3e aproximadamente el &!.$&\ de los
datos se enc3entran bajo la c3r>a si s3mamos a t $ el #'.44\ de los datos
estar= entre esos lmites y si s3mamos a t % entonces el ##.(4\ de los datos
caer= dentro de esos lmites. 0sta caracterstica es a la >eA 3na forma emprica y
r=pida de demostrar si los datos G3e se analiAan tienen 3na distrib3cin NormalL
ya G3e para trabajar los datos con esta distrib3cin debe >erificarse G3e
efecti>amente as se distrib3yen ya G3e de no hacerlo las decisiones G3e en 3n
momento dado se tomar=n de 3n an=lisis de los datos con la distrib3cin Normal
seran errneas.

FCmo se determinan probabilidades con la distrib3cin NormalH
1e ac3erdo a como se trataron las distrib3ciones de probabilidad contin3as en la
3nidad III lo m=s l8ico es G3e la f3ncin f:x
$
; se inte8re entre los lmites
de la >ariable xL esto es

<
b
a
d) ; - - ) ( f ; b ) a ( p
<


6a inte8ral anterior nos dara el =rea bajo la c3r>a de la f3ncin desde a hasta b
G3e corresponde o es i83al a la probabilidad b3scada.
1ebido a la dific3ltad G3e se presenta para inte8rar esta f3ncin cada >eA G3e sea
necesario lo G3e se hace es tipificar el >alor de la >ariable x esto es x se
transforma en 3n >alor de A de la si83iente manera4

valor
)
z


0ste >alor de A es b3scado en 3na tabla donde >ienen =reas asociadas a este >alor
y haciendo 3so de los >alores tab3lados se determina la probabilidad reG3erida.
6a tabla G3e es 3sada para calc3lar las probabilidades es la G3e nos d= el =rea
G3e se m3estra a contin3acin4










0jemplos4
; Y
.. .. 0l acero G3e se 3tiliAa para t3beras de a83a a men3do se rec3bre internamente con 3n mortero de cemento
para e>itar la corrosin. 0n 3n est3dio de los rec3brimientos de mortero de 3na t3bera empleada en 3n proyecto de
transmisin de a83a en California :+ransportation 0n8ineerin8 5o3rnal No>iembre de "#(#; se especific 3n
espesor de (S"& p3l8adas para el mortero. 7n 8ran nEmero de mediciones de espesor dieron 3na media de 0.&%'
p3l8adas y 3na des>iacin est=ndar de 0.0!$ p3l8adas. * las mediciones de espesor tenan 3na distrib3cin
Normal FG3/ porcentaje aproximado f3e inferior a (S"& de p3l8adaH

*ol3cin4
x K >ariable G3e nos define el espesor del mortero en p3l8adas
K 0.&%' p3l8adas
K 0.0!$ p3l8adas













1. < 1;\? <
;\< ;
03? ; 13/? ;
;\< ;
03? ; .0 /
. .
.
. .
.
. '
D


p:A K I$.4"; K 0.4#$

p:x < (S"& p3l8adas; K 0.'I p:A K I$.4"; K 0.'I0.4#$ K 0.00!

2or tanto 0.00! x "00\ K 0.!\ de los rec3brimientos de mortero tienen 3n espesor menor de (S"& p3l8adas

$. $. 7n t3bo fl3orescente est=ndar tiene 3na d3racin distrib3ida
Normalmente con 3na media de (000 horas y 3na des>iacin est=ndar de
"000 horas. 7n competidor ha in>entado 3n sistema de il3minacin
fl3orescente compacto G3e se p3ede insertar en los recept=c3los de l=mparas
incandescentes. 0l competidor ase83ra G3e el n3e>o t3bo compacto tiene 3na
d3racin distrib3ida Normalmente con 3na media de ('00 horas y 3na
des>iacin est=ndar de "$00 horas. a. FC3=l t3bo fl3orescente tiene mayor
probabilidad de tener 3na d3racin mayor de #000 horasH b. FC3=l t3bo
tiene mayor probabilidad de tener 3na d3racin de menos de '000 horasH

*ol3cin4
a; +3bo "
B
"
K >ariable G3e nos define la d3racin en horas de 3n t3bo fl3orescente
` L /I.0
L;.03?
Y
K (000 horas
K "000 horas



+3bo $
B
$
K >ariable G3e nos define la d3racin del t3bo fl3orescente del competidor
K ('00 horas
K "$00 horas










;; <
;;; .
;;; / ;;; >
.
.
-
- -
z

p:A
"
K $.00; K 0.4(($

p:x
"
> #000 horas; K 0.' N p:A
"
K $.00; K 0.' N 0.4(($ K 0.0$$!











<? .
<;; .
?;; / ;;; >
<
.
-
- -
z

p:A
$
K ".$'; K 0.%#44

p:x
$
> #000 horas; K 0.' N p:A
$
K ".$'; K 0.' N0.%#44 K 0."0'&

2or tanto el t3bo fl3orescente del competidor tiene 3na probabilidad mayor de
d3rar m=s de #000 horas.


b;


`L >;;; L/;;;
` L >;;;
L/?;;
` L ?;;;
L/;;;









;; <
;;; .
;;; / ;;; ?
.
.
-
- -
z

p:A
"
K I$.00; K 0.4(($

p:x
"
< '000 horas; K 0.' N p:A
"
K I$.00; K 0.' N 0.4(($ K 0.0$$!












;\ <
<;; .
?;; / ;;; ?
<
.
-
- -
z

p:A
$
K I$.0!; K 0.4!"$

p:x
$
< '000 horas; K 0.' N p:A
$
K I $.0!; K 0.' N 0.4!"$ K 0.0"!!

2or tanto el t3bo fl3orescente G3e tiene 3na mayor probabilidad de d3rar menos
de '000 horas es el del primer fabricante.


%. %. 6a distrib3cin de la demanda :en nEmero de 3nidades por 3nidad de
tiempo; de 3n prod3cto a men3do p3ede aproximarse con 3na distrib3cin
de probabilidad Normal. 2or ejemplo 3na compaOa de com3nicacin por
cable ha determinado G3e el nEmero de interr3ptores terminales de botn
solicitados diariamente tiene 3na distrib3cin Normal con 3na media de $00
y 3na des>iacin est=ndar de '0.
a; a; F0n G3/ porcentaje de los das la demanda ser= de menos de #0
interr3ptoresH
b; b; F0n G3/ porcentaje de los das la demanda estar= entre $$' y $('
interr3ptoresH
` L ?;;;
L /?;;
c; c; Con base en consideraciones de costos la compaOa ha
determinado G3e s3 mejor estrate8ia consiste en prod3cir 3na
cantidad de interr3ptores s3ficiente para atender plenamente la
demanda en #4\ de todos los das. FC3antos interr3ptores terminales
deber= prod3cir la compaOa cada daH

*ol3cin4
a; B K >ariable G3e nos indica el nEmero de interr3ptores demandados
por da a 3na compaOa de cable

K $00 interr3ptores por da
K '0 interr3ptores por da











<; <
?;
<;; >;
. z

p:A

K I $.$0; K 0.4!&"

p:x < #0; K 0.' N p:A K I$.$0; K 0.' N 0.4!&" K 0.0"%#
2or tanto 0.0"%# x "00\ K ".%#\ de los das se tendr= 3na demanda
menor de #0 interr3ptores.



b;










` L >; L <;;
L <;;
`. L <<?
`< L </?

?; ;
?;
<;; <<?
.
. z

p:A
"
K 0.'0; K 0."#"'




?; .
?;
<;; </?
<
. z

p:A
$
K ".'0; K 0.4%%$


p:$$' x $('; K p:A
$
; N p:A
"
; K 0.4%%$ N 0."#"' K 0.$4"(

2or tanto 0.$4"( x "00\ K $4."(\ de los das se tendr= 3na demanda
entre $$' y $(' interr3ptores.


c; c; 0n este caso se trata de determinar G3e >alor toma x c3ando se pretende
c3mplir con el #4\ de la demanda de todos los das.

2or tanto despejaremos de la frm3la de AL












)
D
L x K T A

x K T A:p K 0.44; K $00 T A:p K 0.44;:'0; K
K $00 T :".'';:'0; K $((.' $(! interr3ptores terminales por da

Fcmo se obtiene el >alor de AH

0n la tabla b3scamos la A G3e corresponde a 3na probabilidad de 0.44 y
nos damos c3enta de G3e no existe 3n >alor exacto de 0.44 por lo G3e
tomamos los >alores de =rea m=s cercanosL l3e8o

A:p K 0.4%#4; K ".'0L A:p K 0.440&; K ".&0

L <;;
` L a
Y
>1@
2or tanto si interpolamos encontramos G3e el >alor de z para 3na
probabilidad de 0.44 es de ".'' y es el >alor G3e se s3stit3ye en la
ec3acin.


FC3=l es la raAn de 3sar 3n =rea de 0.44 en l38ar de 3na de 0.#4 para
b3scar en la tabla el >alor de AH

0s m3y simple la tabla G3e estamos 3sando es 3na tabla G3e solo trabaja
con =reas G3e son definidas de la media hasta el >alor de x y x p3ede estar
tanto del lado derecho de la media como del lado iAG3ierdo de la media
es por esto G3e el =rea a 3tiliAar es de 0.44 G3e se enc3entra al lado
derecho de la media.
La Distribucin Normal o de Gauss-Laplace es la distribucin de probabilidad ms importante, pues muchos procesos de medicin
sin errores sistemticos se aproximan a ella.
La funcin de densidad de una distribucin normal es la siguiente:
1 1
f(x)= exp[ - (x - )2 ]
_____
o 2 2 o2
La funcin depende de dos parmetros, de la media (que es tambin la moda y la mediana) y de la desviacin tpica o . Cuando
una variable sigue esta funcin de densidad es N (, o).
Si la variable normal tiene media = 0 y desviacin tpica o = 1 se denomina "normal estndar" N(0,1)
Para transformar una variable aleatoria normal "x" en una variable normal estndar "z", se realiza mediante la expresin:
x-
z =
o
La distribucin normal tiene como coeficiente de apuntamiento el valor 3, el cual se toma de referencia para juzgar otras
distribuciones.
".3.1 Distribucin de la probabilidad continua.
".3. Ecuacin de la normal.
".3." 7rficas.
".3.# Tablas.
".3.$ :plicaciones
".' :pro;imacin de la binomial a la normal.
Aproximacin de la binomial a la normal.
8na aplicacin mu' importante de la distri!ucin normal se da para apro*imar la !inomial. Esta
apro*imacin ser" conveniente siempre ' cuando$
n QX infinito,
p QX ;.? aun cuando n sea peueHo,
p Z;.? ' np X ?,
p X ;.? ' n X ?.
En estas condiciones $
.. P(`LG) L p ( (GQ;.?Qnp)Iraiz(np) Z z Z (GR;.?Qnp)Iraiz(np))
<. P(`XLG) L p (z X (GQ;.?Qnp)Iraiz(np))
3. p(`ZLG) L p (z Z (GR;.?Qnp)Iraiz(np))
1. p(` Xn ) L P (Y X (GR;.?Qnp)Iraiz(np))
?. p(`Z li L(p( raiz(np)) (GQ;.?Qnp) (zX
2-OB60.A 8n fa!ricante sa!e por e*periencia ue 1@ de su producto es rec)azado por
defectos. 8n nuevo lote de \;; unidades se van a inspeccionar, a 6u"l es la pro!a!ilidad
apro*imada de ue menos de 3? unidades sean rec)azadas %
*O67CION
#(; < B ) = ) (C < (D-05-n#)/ra!E(n#F))
#(; < 35) = ) (C < (345-32)/554)
= ) (C < 045 )
= 06527
".8 6tras distribuciones muestrales.
".8.1 Distribucin T<student.
La Distribucin "t" de Student es una distribucin continua que se define por la siguiente expresin:
x
tn =
______
x2n /n
Correspondiendo x2n a la igualdad: x2n = x21 + x22 +...+ x2n, siendo "x" una variable aleatoria normal estndar y "n" los grados de
libertad.
La distribucin "t" de Student puede tomar valores negativos, pero, en general, slo interesa su magnitud y no su signo.
Es una distribucin simtrica y con mayor dispersin que la distribucin normal. No obstante, cuando "n" es igual o mayor que 100,
la distribucin "t" es igual a la normal.
Su media y su varianza son respectivamente:
- media: = 0
- varianza: o 2 = n / n+2, para n >> 2
Su funcin de densidad es:
1 ((n + 1 )/2) X2 -(n+1)/2
f(x) = 1 +
____ n
n (n/2)
Siendo la distribucin gamma, que es una distribucin particular de media y varianza iguales.
http://html.rincondelvago.com/estadistica_27.html
".8. Distribucin = cuadrada.
La distribucin x2 de Pearson es una distribucin continua, y representa la distribucin de una distancia. Se define la variable x2 con
"n" grados de libertad, de la siguiente manera:
X2 = Z12 + Z22 + .... + Zn2
Siendo Zi2 variables aleatorias normales (0,1) e independientes.
La variable aleatoria x2 no puede ser nunca negativa, debido a que es una suma de cuadrados.
Su media y su varianza son respectivamente:
- media: = n
- varianza: o2 = 2n
Es una distribucin asimtrica.
Su funcin de densidad es:
1
f(x)= x(n/2)-1 e-x/2 < x 0
2(n/2) (n/2)
http://html.rincondelvago.com/estadistica_27.html
".8." Distribucin +.
".8.# CPU..
Unidad #. Estadstica aplicada.
#.1 !nferencia estadstica.
#.1.1 Concepto.
La inferencia estadstica es el proceso de utilizar los resultados de una muestra para estimar o sacar
conclusiones en cuanto a las caractersticas o parmetros de la poblacin.
Desde un punto de vista prctico, es frecuentemente ms importante el poder inferir informacin sobre
una poblacin mediante muestras extradas de ella. Tales problemas son los tratados en la inferencia
estadstica, basndose en la teora del muestreo.
En la deduccin o inferencia estadstica se hacen generalizaciones con base en muestras y,
tradicionalmente, estas deducciones se han dividido en problemas de estimacion y y problemas de
prueba de hipotesis.
#.1. Estimacin.
EST!%:C!69
Asignacin de un valor numrico a un parmetro de una poblacin sobre la base de datos de
muestras.
#.1." Prueba de 4iptesis.
P2UE): DE -!P6TES!S
Aceptacin o rechazo de suposiciones concernientes a los parmetros o la forma de una
poblacin o poblaciones.
Los problemas de estimacin se encuentran en todas partes (en la ciencia, en los negocios y hasta en la
propia vida cotidiana). En la ciencia un ingeniero puede desear determinar la cantidad convertida de una
reaccin dada y en la vida cotidiana, quiz deseemos saber cunto tiempo nos tomar en promedio
vestirnos para asistir a clases.
Todos estos problemas son problemas de estimacin pero hubiesen sido demostraciones de hiptesis
si el ingeniero hubiera deseado verificar la cantidad convertidad de la reaccin con los datos obtenidos
por otro cientfico que indica que la cantidad convertida de la reaccin es de 500 gramos o si se hubiese
deseado verificar si en realidad slo se requieren de 10 minutos para vestirse para asistir a clases.
#.1.# %.todo clsico de estimacin >puntual?.
En esencia, la estimacin puntual se refiere a la eleccin de un estadstico, es decir una estimacin
puntual utiliza un solo valor de la muestra para estimar el parmetro de la poblacin implicada respecto al
cual tenemos alguna esperanza o seguridad de que est "razonablemente cerca" del parmetro que ha
de estimar.
Los mtodos de estimacin puntual pueden tener varias caractersticas estadsticas entre las que
sobresalen:
1. !nses*amiento .- Que el valor del parmetro coincida con el valor promedio del estimador. Esta
propiedad la tienen la mayora de los estimadores usados en la prctica.
2. Consistencia .- Que el valor de la muestra se acerque al valor del parmetro al aumentar el
tamao de la muestra.
3. Suficiencia .- Que el estimador use toda la informacin que la muestra contiene respecto al
parmetro de inters.
4. Eficiencia .- Que el estimador tenga menor variabilidad que otro posible.
Los estimadores puntuales ms comunes son:
La media de la muestra para estimar el valor promedio en la poblacin.
La proporcin en la muestra para estimar la proporcin en la poblacin.
La desviacin estndar de la muestra como estimacin de la desviacin estndar de la poblacin.
Es prctica comn hablar de 2 veces la desviacin estndar de un estimador como el error de
estimacin. Este error usualmente depende del tamao de la poblacin de donde se saca la muestra, sin
embargo esta dependencia es muy moderada para muestras pequeas en relacin al tamao de la
poblacin. Algo de esto ya lo experimentamos cuando hablamos de muestreo. Es costumbre no hacer
caso de esta correccin por poblacin finita.
La otra forma de estimar es ms realista en cierto sentido. Estimamos usando un intervalo. Analicemos
el siguiente ejemplo.
De 400 entrevistados 220 estan a favor. Qu tan probable es tener 220 o ms a favor cuando las
opiniones estan divididas igualmente entre a favor o en contra?
Resulta 2.28% o 2.56% dependiendo de la frmula usada. Pero si hubieran sido 1100 de 2000 la
probabilidad cambiara a cero (aun(ue la proporcin@ C de #CC sea la misma (ue 11CC de CCC). Si
hubieran sido 55 de 100 la proporcin permanece pero la probabilidad aumenta a 15.87%.
En estos ejemplos la estimacin puntual permanece igual, pero las probabilidades dan tantos tumbos que
concluimos que no es posible que reportemos slo la estimacin puntual, Hace falta mencionar el error
de estimacin! Una manera muy compacta de hacerlo es un intervalo de confian1a.
ste consta de dos valores que encierran al parmetro con una probabilidad preestablecida
arbitrariamente por nosostros. Lo comn es usar 90% 95% 99%. A esta probabilidad la llamamos
confianza.
#.1.$ Estimador !nses*ado.
#.1.& 0arian1a de un estimador puntual.
#. !ntervalos de confian1a.
*0+&(V'L/% D& ./0F*'02' P'(' V'(*'02'%
!eorema -"2"# ( )ntervalo de confianza para ) Si s
2
es el valor de la varianza de una muestra
aleatoria de tamao n tomada de una poblacin normal un intervalo de confianza del (1 - )100% para s
2

est dado por
1
.
Se pueden obtener lmites de confian1a del >1 < ?1CCR correspondientes para sacando las
races cuadradas de los lmites de confian1a para .
E5emplo
En 1& recorridos de prueba/ el consumo de *asolina de un motor e;perimental tuvo una
desviacin estndar de . *alones. Construya un intervalo de confian1a del 88R para /
midiendo la variable real del consumo de *asolina de este motor.
Solucin
Suponiendo (ue los datos observados pueden considerarse como una meustra aleatoria tomada
de una poblacin normal/ sustituimos n F 1& y s F ./ 5unto con /

.88$/1$ F #.&C1 y se obtiene


o bien
.1 S s est dado por
1.#8 S
S ".83
*0+&(V'L/% D& ./0F*'02' P'(' ('2/0&% D& D/% V'(*'02'%
!eorema -"3"# ( )ntervalo de confianza para ) Si s
2
1 y s
2
2 son los valores de las varianzas de
muestras aleatorias independientes de tamao n1 y n2 tomadas de dos poblaciones normales, un intervalo
de confianza del(1 - )100% para est dado por
1
.
Se pueden obtener lmites de confian1a del >1 < ?1CCR correspondientes de obteniendo las
races cuadradas de los lmites de confian1a de .
Con referencia al problema del estudio de los ci*arrillos/ obten*a un intervalo de confian1a del
8'R de .
Solucin
Del e5emplo referido se tienen n1 F 1C/ n F '/ s F C.$ y s F C.3 se tiene (ue +.C1/8/3 F &.3 y +.C1/3/8 F
$.&1. Por lo tanto/ la sustitucin en el intervalo de confian1a da como resultado
o bien
C.C3& S S .'&
Ta (ue el intervalo (ue se obtuvo en el e5emplo anterior incluye la posibilidad de (ue la ra1n sea
1/ a(u no 4ay evidencia real contraria a la suposicin de varian1a de poblacin i*uales.
#..1 Estimacin por intervalo.
Dada que no puede esperarse que las estimaciones puntuales realmente coincidan con las cantidades
que intentan estimar, algunas veces es preferible reemplazarlas con estimaciones por intervalos, esto
es, con intervalos en los cuales podemos esperar con un grado razonable de certeza que contengan al
parmetro en cuestin.
Una estimacin de intervalo de un parmetro es un intervalo de la forma < < , donde
y dependen del valor que tome el parmetro en una muestra dada y tambin en la
distribucin mustral de .
Por ejemplo, si se nos pidiera determinar el coeficiente intelectual en promedio de un grupo de
estudiantes muy grande, sobre la base de una muestra aleatoria < 117 sobre la base de la media de la
muestra = 113 as como informacin acerca de la distribucin muestral de .
Como diferentes muestras generalmente producirn valores diferentes de y, por consiguiente,
distintos valores de y . Por tanto, con base en la distribucin muestral de podemos afirmar,
con una probabilidad dada, si este intervalo contendr en realidad el parmetro que se supone estima. En
otras palabras, podemos utilizar la distribucin muestral de para elegir y tal para cualquier
probabilidad especificada 1 - , donde 0 < < 1.
P ( < < ) = 1 -
Lo siguiente se entiende de la siguiente manera, el intervalo < < , determinado en relacin
con una muestra en particular, recibe el nombre de intervalos de confian1a del ( 1 - )100%, la fraccin
1 - se conoce como coeficiente de confian1a o *rado de confian1a y los extremos y
reciben el nombre de lmites de confian1a inferior y superior.
Por ejemplo, cuando = 0.05 el grado de confianza es de 0.95 y obtenemos as un intervalo de
confianza de 95%.
Aclaremos ahora que los intervalos de confianza de parmetros dados no son nicos, como se muestran
en la siguiente seccin, en donde se demuestras que, con base en una sola muestra aleatoria, existen
numerosos intervalos de confianza de donde tienen el mismo grado de confianza. Una propiedad
deseable es hacer la longitud de un intervalo de confianza del 1 - )100% lo ms corta posible.
#.. ,mites de confian1a.
#.." !ntervalo de confian1a para medida con varian1a
conocida.
*0+&(V'L/% D& ./0F*'02' P'(' M&D*'% 1V'(*'02' ./0/.*D'4
Como es un estimador suficiente de la media de uma poblacin normal con la varianza conocida
, lo utilizaremos para obtener un intervalo de confianza de de una poblacin de este tipo.
Aqu se toman la media y la desviacin estndar de la poblacin, y slo se saca una conclusin acerca de
la media muestral. Lo que se necesita es tomar una *nica media muestral y estimar una media
poblacional desconocida (con el uso, de una poblacin o de la desviacin estndar muestral), con cierto
grado de confianza o probabilidad.
En una situacin real, la media de la poblacin es desconocida y es la cantidad que se debe estimar. La
desviacin estndar de la pobacin rara vez se conoce y suele estimarse con los resultados de la
muestra. Por tanto para obtener la estimacin del intervalo de confianza de la media cuando se
desconoce la varianza se tiene.
!eorema -","# Si es el valor de la media de una muestra aleatoria de tamao n tomada de una
poblacin normal con la varianza conocida , un intervalo de confianza del ( 1 - )100% para est
dado por
1
.
E5emplo
Si una muestra de tamao n = 20 tomada de una poblacin normal con la varianza = 225 tiene la
media = 64.3, construya un intervalo de confianza del 95 % de la media de la poblacin .
Curva normal para determinar el valor de K necesario para 8$R de confian1a
Solucin
Para = 0.05 tenemos que Z.025 = 1.96. Por consiguiente, el intervalo de confianza del 95 % para
aplicando el teorema 2.1 es
que se reduce a
57.7 < < 70.9
El intervalo obtenido en el ejemplo anterior es un intervalo de confian1a del 8$ R de la media de la
poblacin. Desde luego, la doble desigualdad 7.7 < < 70.9 debe ser verdadera o falsa, pero si
tuviramos que apostar, 95 a 5 seran posibilidades 5ustas de que es verdadera. Estas posibilidades
son justas porque el mtodo a travs del cual se obtuvo el intervalo funciona, por as decirlo, el 95 % del
tiempo.
El hecho de que los intervalos de confianza de parmetros dados no sean nicos, se observa sin
dificultad escribiendo el intervalo de confianza de 1 - )100% del teorema 2.1 como
o como el intervalo de confianza de un solo lado del 1 - )100%
Tambin pudimos haber basado el intervalo de confianza en, por ejemplo, la mediana de la muestra y no
en su media.
*0+&(V'L/% D& ./0F*'02' P'(' D*F&(&0.*' D& M&D*'% ./0 V'(*'02'
./0/.*D'
!eorema -"4"# ( )ntervalo de confianza para 1 + ,, 1 , conocidas). Si y son los valores de
las medias de muestras aleatorias independientes de tamao n1 y >n2 tomadas de poblaciones normales
con las varianzas conocidas 1
2
y 2
2
, un intervalo de confianza del (1 - )100% para 1 - 2 est dado por
1
.
:simismo/ en virtud del Teorema del ,mite Central/ este resultado puede usarse con muestras
aleatorias independientes de poblaciones no normales con las varian1as conocidas 1

/
siempre (ue n1 y n sean lo suficientemente frandes/ esto es/ cuando n1 y n sean mayores e
i*uales a "C.
E5emplo
Construya un intervalo de confian1a del 8#R de la diferencia real entre las duraciones en
promedio de dos tipos de focos el.ctricos/ dado (ue una muestra tomada al a1ar de #C focos de
un tipo dur en promedio #1' 4oras de uso continuo y $C focos de otra clase duraron en promedio
#C 4oras. ,:s desviaciones estndar de las poblaciones/ se*En se sabe/ son 1 F & y F .
Solucin
Para F C.C&/ tenemos (ue K.C" F 1.''. Por lo tanto/ el intervalo de confian1a del 8#R de 1 F & <
es
(ue se reduce a
&." S 1 < S $.3
Por lo tanto/ tenemos el 8#R de confian1a en (ue el intervalo de &." a $.3 contiena la diferencia
verdadera entre las duraciones en promedio de los dos tipos de focos el.ctricos. El 4ec4o de (ue
ambos lmites de confian1a sea positivos su*iere (ue/ en promedio/ el primer tipo de foco es
superior al del se*undo tipo.
#..# !ntervalo de confian1a para medida con varian1a
desconocida.
*0+&(V'L/% D& ./0F*'02' P'(' M&D*'% 1V'(*'02' D&%./0/.*D'4
Como ya se dijo, as como la media de la poblacin no suele ser conocida, tampoco es probable que la
desviacin estndar real de la poblacin sea conocida. Por tanto, se necesita obtener una estimacin
del intervalo de confianza de con el solo uso de los estadsticos muestrales y S.
La distribucin que se ha desarrollado para aplicarla a esta situacin es la distribucin t de Student
!eorema -"-"# Si y S son los valores de la media y la desviacin estndar de una muestra aleatoria de
tamao n tomada de una poblacin normal con la varianza desconocida , un intervalo de confianza del 1 -
)100% para est dado por
1
.
En la prctica con tal (ue el tamaIo de la muestra no sea demasiado pe(ueIo y la poblacin no
ten*a muc4o ses*amiento/ la distribucin t se puede usar para estimar la media de la poblacin
cuando no se conoce .
,os valores crticos de la distribucin t/ para los *rados apropiados de libertad/ se pueden obtener
con las tablas de distribucin t. El valor en la parte superior de cada columna de la tabla de t
indica el rea en una cola de la distribucin > cola superior o inferior?/ mientras (ue cada 4ilera
representa el valor particular de cada *rado de libertad.
Por e5emplo/ con # *rados de libertad/ si se desea 8$R de confian1a/ el valor apropiado de t se
encontrar del modo si*uiente >como se indica en la +i*?. El nivel de confian1a de 8$R indica (ue
4abra un rea de C.C$ en cada cola de la distribucin. Si se busca en la columna un rea de cola
superior de C.C$ y en la 4ilera correspondiente a # *rados de libertad/ se tiene como resultado
un valor de t de .C&"8/ (ue para conveniencia se redondea a .C&#.
Determinacin del valor crtico con la tabla t para un rea de .C$ en cada cola con # *rados de
libertad
Como la t es una distribucin sim.trica/ si el valor de la cola superior es de U .C&#/ el valor de la
cola inferior >C.C$ inferior? sera de <.C&#. Un valor de t de .C&# si*nifica (ue la probabilidad de
(ue t e;cedera de V .C&# es de C.C$ .$ R.
Distribucin estndar normal y distribucin t para $ *rados de libertad
E5emplo
Un fabricante de pinturas desea determinar el tiempo de secado en promedio de una nueva
pintura para interiores. Si en 1 reas de prueba de i*ula tamaIo el obtuvo un tiempo de secado
medio de &&." minutos y una desviacin estndar de '.# minutos/ teniendo 11 *rados de libertad
construya un intervalo de confian1a del 8$R para la media verdadera.
Solucin
:l sustituir F &&." s y t.C$ F .C1/ el intervalo de confian1a del 8$R para se convierte en
o simplemente
&1.C S 31.&
Esto si*nifica (ue podemos afirmar/ con un *rado de confian1a del 8$R (ue el intervalo de &1.C
minutos a 31.& minutos contiene el tiempo de secado promedio verdadero de la pintura.
El m.todo por medio del cual se construyen intervalos de confian1a en esta seccin consiste/
esencialmente/ en obtener una variable aleatoria adecuada cuyos valores est.n determinados por
los datos de una muestra y tambi.n por los parmetros de la poblacin/ no obstante (ue su
distribucin no impli(ue el parmetro (ue intentamos estimar. Este fue el caso/ por e5emplo/
cuando utili1amos la variable aleatoria / cuyos valores no pueden calcularse sin conocer /
pero cuya distribucin de muestras aletorias tomadas de poblaciones normales/ la distribucin
normal estndar/ no implica a . Pese a (ue este m.todo de obtencin de intervalos de confian1a/
al*unas veces denominado m.todo de pivotes/ se utili1a muy ampliamente/ e;isten m.todos ms
*enerales.
*0+&(V'L/% D& ./0F*'02' P'(' D*F&(&0.*' D& M&D*'% ./0 V'(*'02'
D&%./0/.*D'
El procedimiento de estimacin de la diferencia entre dos medias/ cuando se desconocen 1 y y
los tamaIos de las muestras son pe(ueIos/ no es directo a menos (ue las desviaciones estndar
desconocidas de las dos poblaciones normales sean i*uales. Si 1 F F / entonces tenemos lo
si*uiente.
!eorema -"5"# ( )ntervalo de confianza para 1 + ,, 1 , desconocidas). Si y son los valores
de las medias de muestras aleatorias independientes de tamao n1 y >n2 tomadas de poblaciones
normales con las varianzas conocidas pero iguales, un intervalo de confianza del (1 - )100% para 1 - 2
est dado por
1
.
E5emplo
Se 4a reali1ado un estudio para comparar el contenido de nicotina de dos marcas de ci*arrillos. 1C
ci*arrillos de la marca : tuvieron un contenido de nicotina en promedio de ".1 mili*ramos con una
desviacin estndar de C.$ mili*ramo/ mientrs (ue ' ci*arrillos de marca ) tuvieron un contenido
de nicotina en promedio de .3 mili*ramos con una desviacin estndar de C.3 mili*ramo.
Suponiendo (ue los dos con5untos de datos son muestras tomadas al a1ar de poblaciones
normales con varian1as i*uales/ construya un intervalo de confian1a del 8$R de la diferencia real
en el contenido promedio de nicotina de las dos marcas de ci*arrillos.
Solucin
2esumiremos los datos de la si*uiente manera@
.arca A .arca B
n
.
L .; n
<
L .;
L 3.. L <./
s
.
L ;.? s
<
L ;./
Para F C.C$ y n1 V n < F 1& *rados de libertad/ tnemos (ue t.C$ F .1C. El valor de Sp es
y/ por consi*uiente/ el intervalo de confian1a del 8$R para 1 < es
(ue se reduce
<C/C S 1 < S 1.CC
6bs.rvese (ue debido a (ue la diferencia real podra ser cero en el e5emplo anterior/ no podemos
concluir (ue e;iste una diferencia real en el contenido de nicotina de las dos marcas de
ci*arrillos.
#..$ !ntervalo de confian1a para proporciones.
*0+&(V'L/% D& ./0F*'02' P'(' -0' P(/P/(.*/0
E;isten muc4os problemas en los cuales debemos obtener proporciones/ probabilidades/
porcenta5es o ndices > o tasas?/ como la proporcin de unidades defectuosas en un car*amento
*rande de transistores/ la probabilidad de (ue un automvil detenido en una inspeccin tendr las
luces descompuestas/ o el ndice o tasa de mortalidad (ue provoca una enfermedad. En muc4os
de estos casos es ra1onable suponer (ue se muestrea una poblacin binomial .
!eorema -"."# ( )ntervalo de confianza de muestra grande para ). Un intervalo de confianza del (1 -
)100% para el parmetro binomial est dado por.
1
.
E5emplo
Se 4ace un estudio para determinar la proporcin de votantes de una comunidad cunatificable (ue
favorecen la construccin de una planta *eneradora de ener*a nuclear. Si se tiene (ue slo 1#C
de #CC votantes seleccionados al a1ar favorecen el proyecto/ obten*a un intervalo de confian1a
del 8$R de la proporcin de todos los votantes de esta comunidad (ue se e;presan a favor del
proyecto.
Solucin
:l sustituir F C."$ y K.C$ F 1.8& en el intervalo de confian1a de muestra *rande anterior
para / se obtiene
(ue se reduce a
C."C" S S C."83
*0+&(V'L/% D& ./0F*'02' P'(' -0' D*F&(&0.*' D& P(/P/(.*/0&%
+recuentemente sur*en problemas donde es deseable calcular la diferencia entre los parmetros
binomiales y sobre la base de muestras aleatorias independientes tomadas de dos
poblaciones binomiales.
!eorema -"6"# ( )ntervalo de confianza de muestra grande para + . Un intervalo de confianza
del (1 - )100% para - , la diferencia entre dos parmetros binomiales, est dada por.
1
.
donde '
E5emplo
Si se tiene (ue 1" de CC votantes del distrito : favorecen a un candidato dado para la eleccin
de la presidencia y 8C de 1$C votantes del distrito ) se e;presan a favor de este mismo candidato/
obten*a un intervalo de confian1a del 88R para < / la diferencia entre las proporciones
reales de votantes de los dos distritos favorables al candidato.
Curva normal para determinar el valor de K necesario para 88R de confian1a
Solucin
:l sustituir F C.&&/ F C.&C/ y K.CC$ F .$3$ en el intervalo de confian1a de muestra *rande
se obtiene
(ue se reduce a
<C.C3# S < S C.18#
Por lo tanto/ tenemos el 88R de confian1a de (ue el intervalo de <C.C3# a C.18# contiene la
diferencia entre las proprociones reales de votantes de los dos distritos (ue favorecen al
candidato. 6bs.rvese (ue esto incluye la posibilidad de (ue 4aya una diferencia cero entre las
dos proporciones.
#." Pruebas de 4iptesis.
Una 4iptesis estadistica es una afirmacin con respecto a alguna caracterstica desconocida de
una poblacin de inter*s. La esencia de probar una hiptesis estadstica es el decidir si la afirmacin
se encuentra apoyada por la evidencia experimental que se obtiene a travs de una muestra aleatoria.
La decisin acerca de si los datos muestrales apoyan estadsticamente la afirmacin se toma con base
en la probabilidad, y, si sta es mnima, entonces ser rechazada.
Si sobre la base de datos de muestra un ngeniero Qumico tiene que decidir si la duracin de la
reaccin tendra un tiempo de residencia promedio es cuando menos de 180 minutos y si basndose en
muestras un fabricante de productos farmacuticos tiene que decidir si el 90 % de todos los pacientes a
quienes se les d un nuevo medicamento se recuperarn de cierta enfermedad, estos problemas
pueden traducirse al lenguaje de las pruebas estadsticas de 4iptesis.
En el primer caso podramos decir que el ingeniero tiene que demostrar la hiptesis de que el
parmetro del tiempo de reaccin es cuando menos de 180 minutos y en el segundo caso podramos
sealar que el fabricante tiene que decidir si , el parmetro de una poblacin binomial es igual a 0.90.
./0.&P+/% D& L' +&/(*' D& P(-&,' D& 5*P/+&%*%
En esta unidad se enfocar un problema basado en un estudio de caso en una fbrica de llantas. En este
problema la fbrica de llantas tiene dos turnos de operarios, turno de da y turno mixto.Se selecciona una
muestra aleatoria de 100 llantas reproducidas por cada turno para ayudar al grente a sacar conclusiones
de la siguientes preguntas:
1. Es la duracin promedio de la llantas producidas en el turno de da igual a 25 000 kilmetros?
2. Es la duracin promedio de la llantas producidas en el turno mixto menor de 25 000 kilmetros?
3. Se revienta ms de un 8% de la llantas producidas por el turno de da antes de los 10 000
kilmetros?
Para poder contestar, se debe tomar una ecisin basada en la informacin de la muestra. En este
problema se abordar primero la pregunta si la duracin promedio de las llantas producidas por el turno
de da es igual a 25 000 kilmetros. El gerente puede sacar de dos conclusiones:
La duracin promedio de las llantas es 25 000 kilmetros
La duracin promedio de las llantas no es 25 000 kilmetros; es menor de 25 000 kilmetros o mayor de
25000 kilmetros. Si se llega a esta ltima conclusin, se tomar accin correctiva para determinar por
qu se producen llantas por abajo o por encima de los estndares.
Desde el punto de vista de pruebas de 4iptesis, estas dos conclusiones se representaran como sigue:
Ho >4iptesis nula?@ = 25 000 kilmetros
H1 >4iptesis alternativa?@ desigual a 25 000 kilmetros
La 4iptesis nula representa la conclusin que se sacara si el proceso funcionase correctamente. Es
anloga a la presuncin de inocencia hasta que se demuestre la culpabilidad segn el sistema legal
estadounidense. En el problema se supone que el proceso funciona correctamente ( = 25 000) salvo
que se encuentren pruebas de "culpabilidad", lo cual muestre que el proceso no funciona correctamente.
La 4iptesis alternativa, que suele ser opuesta a la 4iptesis nula, representa la conclusin a la que se
llegara si se encontrasen pruebas de culpabilidad. En el ejemplo el trmino "culpabilidad" se aplica, a
que la duracin promedio de la llantas sea diferente a 25 000 kilmetros, por tanto la 4iptesis
alternativa sera que la duracin de las llantas no es de 25 000 kilmetros.
Para comenzar a desarrollar el procedimiento para pruebas de hiptesis, se podra empezar por suponer
que la duracin promedio de las llantas es de 25 000 kilmetros. Si se toma una muestra y la media de la
muestra est -cerca de- 25 000 kilmetros, es razonable llegar a la conclsin de que la media verdadera
es en realidad de 25 000 kilmetros. Pero sin embargo la media de la muestra fuera diferente a 25 000
kilmetros, es razonable pensar que la media verdadera no es de 25 000 kilmetros. En vez de decir en
forma arbitraria "cerca de" o "diferente a" 25 000 kilmetros, la prueba de 4iptesis estadstica
cuantifica el proceso de toma de decisiones.
Para cada tipo de procedimiento de pruebas de hiptesis, se puede calcular una prueba estadstica
apropiada. Esta prueba estadstica mide el acercamiento del valor de la muestra (como un promedio) a la
4iptesis nula. La prueba estadstica o sigue una distribucin estadstica bien conocida (normal,t, etc.) o
se puede desarrollar una distribucin para la prueba estadsitca particular.
La distribucin apropiada de la prueba estadstica se divide en dos regiones: una re*in de rec4a1o y
una re*in de no rec4a1o. Si la prueba estadsitca cae en esta ltima regin, no se puede rechazar la
hiptesis nula y el gerente llegara a la conclusin de que el proceso funciona correctamente. Pero si la
prueba estadstica cae en la regin de rechazo, se rechazara la hiptesis nula y el gerente llegara a la
conclusin de que la media verdadera no era de 25 000 kilmetros.
2e*iones de rec4a1o y de no rec4a1o en pruebas de 4iptesis
Al tomar la decisin con respecto a la hiptesis nula, se debe determinar el valor crtico en la
distribucin estadstica que divide la regin de no rechazo (en la cual la hiptesis nula no se puede
rechazar) de la regin de rechazo. Ahora bien, el valor crtico depende del tamao de la regin de
rechazo. Como se ver en los siguientes subtemas, la decisin respecto al tamao de la regin de
rechazo, acarrea los riesgos detomar diferentes tipos de decisiones incorrectas.
&((/(&% 'LF' 3 ,&+'
Al utilizar una muestra para hacer inferencias en cuanto a la poblacin, el tomador de decisiones corre el
riesgo de que se llegue a una conclusin incorrecta. Existen dos tipos de errores que pueden ocurrir en el
procedimiento de prueba de hiptesis.
Al rechazo de la hiptesis nula -o cuando sta es verdadera se le conoce como error de tipo ! ;
la probabilidad de cometer un error de tipo se denota por medio de .
En el ejemplo de las llantas, este error ocurrira si se llegase a la conclusin (con base en los datos de la
muestra) de que la duracin promedio no era de 25 000 kilmetros cuando en realidad, era de 25 00
kilmetros.
El error tipo se llama tambin nivel de si*nificancia . Por tradicin, el estadstico controla el error
tipo al establecer el nivel de riesgo que est dispuesto a tolerar en trminos del rechazo de una hiptesis
nula verdadera. La seleccin del nivel particular de riesgo depende, por supuesto, de la importancia
(significacin) del problema. Una vez especficado el valor de , se conoce el valor de la regin de
rechazo porque es la probabilidad de recazo segn la 4iptesis nula. A partir de este hecho, se
pueden determinar los valores crticos, superior e inferior, que dividen las regiones de rechazo y de no
rechazo.
La aceptacin de la hiptesis nula cuando sta es falsa recibe el nombre de error de tipo !!; la
probabilidad de cometer un error de tipo se denota por medio de .
En el ejemplo de las llantas, el error tipo ocurrirra si se hubiera llegado a la conclusin de que el
proceso funciona correctamente (produce llantas con una duracin de 25 000 kilmetros) cuando, en
realidad, la duracin promedio de las llantas es diferente a 25 000 kilmetros.
Al contrario del error tipo que se establece a un valor especfico, el valor del error tipo depende
de la forma y modo enque la hiptesis nula no es verdadera. Por ejemplo, en el estudio de llantas se
argument (nuestra hiptesis nula) que la duracin promedio de llantas es de 25 000 kilmetros. Si, en la
prctica la duracin promedio real de las llantas fuera de slo de 10 000 kilmetros, entonces sera muy
pequea la posibilidad () de que, con base en las pruebas de la muestra, se llegase a la conclusin
errnea de que la duracin promedio de las llantas eran los hipotticos 25 000 kilmetros. Por otra parte,
si la duracin promedio real de las llantas fuera de 24 900 kilmetros (muy cercana a la hiptesis nula),
entonces sera muy grande la posibilidad () de que, con base en las pruebas de la muestra, se llegase a
la conclusin errnea de que la duracin promedio de las llantas eran los hipotticos 25 000
kilmetros.Los dos tipos de errores se pueden ilustrar en la siguiente figura.
El complemento (1 - ) del error tipo , que es la posibilidad de rechazar la hiptesis nula cuando es
falsa, se llama la potencia de una prueba estadstica . La potencia de la prueba es la medida de la
sensibilidad del procedimiento de pruebas de hiptesis, puesto que determina la posibilidad del rechazo
correcto de la hiptesis nula en diferentes circunstancias. En el ejemplo de las llantas, se podra calcular
la posibilidad de concluir que el proceso no funciona correctamente (rechazar la hiptesis nula) para
valores diferentes de la media verdadera (10 000, 20 000, 24 900 kilmetros).
Para un tamao dado de muestra, el tomador de decisiones debe equilibrar los dos tipos de errores. Si se
va a reducir , entonces se aumentar . Si se va a reducir , entonces se aumentar . Los valores
de y dependen de la importancia de cada riesgo en un problema particular. El riesgo en el caso
de la llantas implica tomar accin correctiva innecesaria. El riesgo implica no tomar accin correctiva
cuando el proceso de produccin de llantas no funciona correctamente. La importancia de y
depende de los costos inherentes en cada tipo de error. Por ejemplo, si fuera muy costoso tomar la ccin
correctiva (como cerrar la planta), entonces el riesgo sera el ms importante y, quiz, se podra
permitir un aumento de .
P'%/% D& L' P(-&,' D& 5*P/+&%*%
1. Expresar la hiptesis nula.
2. Expresar la hiptesis alternativa.
3. Especificar el nivel de significacin,.
4. Determinar el tamao de la muestra n.
5. Establecer los valores crticos que dividen las regiones de rechazo y de no rechazo.
6. Determinar la prueba estadstica.
7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.
8. Determinar si la prueba estadstica ha cado en la regin de rechazo o en la de no rechazo.
9. Determinar la decisin estadstica.
10. Expresar la decisin estadstica en trminos del problema
P(-&,'% D& 5*P/+&%*% P'(' -0' V'(*'02'
Cuando se analizan variables cuantitativas, a menudo es importante sacar conclusiones en cuanto a la
variabilidad as como al promedio de una caracterstica de inters. Por ejemplo, en el estudio de las
llantas, el gerente de la fbrica, probablemente se interesara en determinar si la variabilidad en la
duracin de las llantas est o no dentro de los lmites aceptables antes de concluir que el proceso
funciona en forma correcta. En este caso, lo que interesara sera llegar a conclusiones acerca de la
desviacin estndar o a la varian1a de la poblacin.
Si se intenta llegar a conclusiones en cuanto a la variabilidad de l apoblacin, primero se debe determinar
qu prueba estadstica se puede usar para representar la distribucin de la variabilidad en los datos de la
muestra. Si la variable (duracin del piso de las llantas) se supone que tiene distribucin normal,
entonces el estadstico (n-1)S
2
/
2
seguira la distribucin ji cuadrada (X
2
) con (n-1) grados de libertad.
Por tanto, el estadstico de laprueba para probar si la varianza de la poblacin es o no igual a un valor
especficado, es
en donde
n = tamao de la muestra.
S

= varianza de la muestra.

= varianza hipottica de la poblacin.


Prueba de una 4iptesis acerca de una varian1a poblacional@ pruebas de una cola y de dos colas.
Panel :/ prueba de dos colas. Panel )/ prueba de una cola. Panel C/ prueba de una cola.
S, como se ilustra en el panel : de la figura, la prueba de hiptesis es de dos colas,la regin de
rechazo est dividida entre las colas superior e inferior de la distribucin ji cuadrada. Pero, si la prueba
es de una cola,la regin de rechazo est, ya sea,en la cola superior (panel )) o en la cola inferior (panel
C) de la distribucin ji cuadrada, segn la direccin de la hipteis alternativa.
Al probar una hiptesis acerca de una varianza, se debe estar alerta a que se ha supuesto una poblacin
con distribucin normal. Desafortunadamente, esta prueba es sensible a desviaciones de esta
suposicin, por lo que si la poblacin no tiene distribucin normal, sobre todo para muestras de tamao
pequeo, la exactitud de la prueba se afectar de una manera muy seria.
P(-&,'% D& 5*P/+&%*% P'(' -0' ('2/0 D& V'(*'02'%
En una forma anloga a las ya descritas para las medias y proporciones, tambin interesa determinar si
las dos poblaciones tienen o no la misma variabilidad.
Para poder comparar la igualdad de las varianzas de dos poblaciones independientes, se ha ideado un
procedimiento estadstico basado en la ra1n de las dos varian1as muestrales. Si los datos de cada
poblacin se suponen distribuidos normalmente, entonces la razn S1

AS

sigue una distribucin llamada


distribucin +, que recibe el nombre en honor de 2. :. +is4er. El valor crtico de la distribucin F
depende de "dos" conjuntos de grados de libertad: los grados de libertad en el numerador y en el
denominador. El estadsitico de la prueba para probar la razn entre las dos varianzas sera
en donde
n1 = tamao de la muestra del grupo 1
n = tamao de la muestra del grupo 2
n1 - 1 = grados de libertad en el grupo 1
n - 1 = grados de libertad en el grupo 2
S1

= varianza de la muestra del grupo 1


S

= varianza de la muestra del grupo 2


Para probar la razn de las dos varianzas, se pueden emplear pruebas de una cola o de dos colas, como
se indica en la figura
Prueba de una 4iptesis acerca de dos varian1as poblacionales@ pruebas de una y de dos colas.
Panel :/ prueba de dos colas. Panel )/ prueba de una cola. Panel C/ prueba de una cola
Al probar la razn de dos varianzas de la poblacin, como ocurri en el caso de la varianza de una sola
poblacin, se debe estar alerta de que la prueba supone que cada una de las dos poblaciones tiene
distribucin normal. Desafortunadamente, esta prueba no es robusta para las desviaciones de esta
suposicin, sobre todo cuando los tamaos de las muestras en los dos grupos no son iguales. Por tanto,
si las poblaciones no estn ms o menos, normalmente distribuidas, se puede afectar de un modo muy
serio la exactitud, del procedimiento.
P(-&,'% D& ,/0D'D D& '6-%+&
En este subtema se examinar otra importante aplicacin de la prueba ji cuadrada, la de probar la
bondad de a5uste d un grupo de datos en una distribucin especfica de probabilidad. Al probar la
bondad de ajuste de un grupo de datos, se comparan las frecuencias reales en cada categora (o
intervalo de clase) con las frecuencias que, tericamente, se esperaran si los datos siguieran una
distribucin especfica de probabilidad. Al efectuar la prueba ji cuadrada para la bondad de ajuste, se
requieren varios pasos.
Primero, hay que establecer la hiptesis de la distribucin de probabilidad que se va a ajustar a los datos.
Segundo, una vez determinada la distribucin de probabilidad hipottica, los valores de cada parmetro
de la distribcuin (tal como la media), se deben poner como hiptesis o estimar con los datos reales. A
continuacin, se utiliza la distribucin de probabilidad hipottica especfica para determinar la probabilidad
y, luego, la frecuencia terica para cada categora o intervalo de clase.
Para terminar, se puede emplear el estadstico de la prueba ji cuadrada para probar si la distribucin
especfica tiene o no "un buen ajuste" con los datos.
La prueba ji cuadrada para determinar si los datos siguen una distribucin de probabilidad especfica, se
calcula con
en donde
.o = frecuencia observada
.i = frecuencia terica
K = nmero de categoras o clases que quedan despus de comprimir las clases
p = nmero de parmetros estimados con los datos
En este subtema se ha limitado el comentario a la prueba de ji cuadrada para la bondad de a5uste a la
distribucin de Poisson. Otras distribuciones de probabilidad bien conocidas, como la uniforme, binomial
y normal, tambin se pueden "ajustar" a los grupos de datos para determinar la bondad del ajuste. En
cada caso, los parmetros de las distribuciones en cuestin (como la media y la desviacin estndar) se
deben establecer por hiptesis o estimar con los datos, para poder determinar las frecuencias
esperadas.
#.".1 Prueba de 4iptesis para la media poblacional.
P(-&,'% D& 5*P/+&%*% P'(' -0' M&D*' ./0 V'(*'02' ./0/.*D' 3 D&%./0/.*D'
En la fbrica de llantas, las hiptesis nula y alternativa para el problema se plantearon de la siguiente
manera:
Ho: = 25 000
H1: desigual a 25 000
Si se considera la desviacin estndar de la llantas producidas en el turno de da, entonces, con base
en el Teorema del ,mite Central, la distribucin en el muestreo de la media seguira la distribucin
norma y la prueba estadstica que est basada en la diferencia entre la media de la muestra y la media
hipotica, se encontrara como sigue:
Si el tamao de la regin de rechazo se estableciera en 5%, entonces se podran determinar los
valores crticos de la distribucin normal. Dado que la regin de rechazo est dividida en las dos colas de
la distribucin, el 5% se divide en dos partes iguales de 2.5%.
Dado que ya se tiene la distribucin normal, los valores crticos se pueden expresar en unidades de
desviacin estndar. Una regin de rechazo de 0.25 en cada cola de la distribucin normal, da por
resultado un rea de 0.475 entre la media hipottica y el valor crtico. Si se busca esta rea en la
distribucin normal, se encuentra que los valores crticos que dividen las regiones de rechazo y de no
rechazo son +1.96 y -1.96, vea la siguiente figura.
Pruebas de 4iptesis en relacin con la media > conocida? con nivel de si*nificacin de $R
Por tanto, la regla para decisin sera:
Rechazar -o si Z > +1.96
o si Z < -1.96
de lo contrario, no rechazar -o
No obstante, en la mayor parte de los casos se desconoce la desviacin estndar de la poblacin. La
desviacin estndar se estima al calcular S, la desviacin estndar de la muestra. Si se supone que la
poblacin es normal, la distribucin en el muestreo de la media seguira una distribucin t con n<1 grados
de libertad. En la prctica se ha encontrado que siempre y cuando el tamao de la muestra no sea muy
pequeo y la poblacin no est muy sesgada, la distribucin t da una buena aproximacin a la
distribucin de muestra de la media. La prueba estadstica para determinar la diferencia entre la media
de la muestra y la media de la poblacin cuando se utiliza la desviacin estndar S de la muestra,
se expresa con:
Para una muestra de 100, si se selecciona un nivel de significacin de 0.05, los valores crticos de la
distribucin t con 100-1 = 99 grados de libertad se puede obtener como se indica en la tabla y en la
figura.
Determinacin del valor crtico con la tabla de t para una rea de .C$ en cada cola con 88 *rados
de libertad
Prueba de 4iptesis en relacin con la media > desconocida? con nivel de si*nificacn de $R
con 88 *rados de libertad
Como esta prueba es de dos colas, la regin de rechazo de .05 se vuelve a dividir en dos partes iguales
de .025. Con el uso de las tablas para t, los valores crticos son -1.984 y +1.984. La regla para decisin
es
Rechazar -o si t99 > +1.984
o si t99
de lo contrario, no rechazar -o
Volvamos con nuestro ejemplo de los nematicos, los resultados de la muestra para el turno de da
fueron 'da = 25 430 kilmetros, Sda = 4 000 kilmetros y nda = 100. Puesto que se est probando si la
media es diferente a 25 000 kilmetros, se tiene, con la ecuacin anterior
Dado que t88 F V1.C3$/ se ve (ue <1.8'# S V 1.C3$ S V1.8'#/ entonces no se rechaza -o
Por ello, la decisin es no rechazar la hiptesis nula Ho. La conclusin es que la duracin promedio de las
llantas es de 25 000 kilmetros. A fin de tener en cuenta la posibilidad de un error tipo , este enunciado
se puede redactar como "no hay pruebas de que la duracin promedio de las lantas sea diferente a 25
000 kilmetros en las llantas producidas en el turno de da"
#.". Prueba de 4iptesis para diferencias de medias.
P(-&,'% D& 5*P/+&%*% P'(' D*F&(&0.*'% D& M&D*'% ./0 V'(*'02'% ./0/.*D'% 3
D&%./0/.*D'%
El estadstico utilizado para determinar la diferencia entre las medias de poblacin se basa en la
diferencia entre las medias ( 1 - 2) de las muestras. Este estadstico 1 - 2, debido al Teorema
del ,mite Central, seguir la distribucin normal para una muestra de tamao lo bastante grande. La
prueba estadstica es
No obstante como ya se mencion, en la mayor parte de los casos no se conoce la desviacin estndar
de ninguna delas dos poblaciones s1, s). La nica informacin que suele estar disponible son las
medias muestrales y las desviaciones estndar muestrales ( 1, 2; S1/ S). Si se hacen suposiciones
de que cada poblacin tiene distribucin normal y que las varian1as de la poblacin son i*uales s1 =
s2 de la distribucin t con n1 + n2 - 2 grados de libertad, se puede utilizar para probar la diferencia entre
las medias de las dos poblaciones.
Si se utiliza una prueba de dos colas para determinar si hay o no alguna diferencia entre las medias,
entonces la hiptesis nula y alternativa sern
2e*iones de rec4a1o para la prueba de dos colas de la diferencia entre dos medias
Dado que se han supuesto varianzas iguales en las dos poblaciones, las varianzas de las dos muestras
(S1
2
, S2
2
) se pueden combinar para formar una estimacin (Sp
2
) de la varianza de la poblacin. El
estadstico de la prueba ser:
en donde
en donde
Sp

= varianza combinada de los dos grupos.


1 = media muestral de la poblacin 1.
S1

= varianza muestral de la poblacin 1.


n1 = tamao de la muestra de la poblacin 1.
2 = media muestral de la poblacin 2.
S

= varianza muestral de la poblacin 2.


n = tamao de la muestra para la poblacin 2.
Al hacer la prueba de la diferencia entre las mediaas, se han supuesto una distribucin normal e igualdad
de varianzas de las dos poblaciones. Se deben examinar las consecuencias, sobre la prueba t de las
variaciones de cada una de estas suposiciones. Con respecto a la suposicin de normalidad, la prueba t
es una prueba "robusta" porque no es sensible a pequeas desviaciones de la normalidad.
#."." Prueba de 4iptesis para proporciones.
P(-&,'% D& 5*P/+&%*% P'(' -0' P(/P/(.*/0 3 D*F&(&0.*' D& P(/P/(.*/0&%
En el subtema anterior se utilizaron procedimientos de pruebas de la hiptesis para medias. El concepto
de la prueba de hiptesis tambin se puede utilizar para probar hiptesis en relacin con datos
cualitativos. Por ejemplo, en el ejemplo de las llantas (otra vez), el gerente de la fbrica de llantas quera
determinar la proporcin de llantas que se reventaban antes de 10 000 kilmetros.
En nuestro ejemplo, el gerente quiere que la calidad de las llantas producidas sea lo bastante alta para
que muy pocas se revienten antes de los 10 000 kilmetros. Si ms de un 8% de las llantas se revientan
antes de los 10 000 kilmetros, se llegara a concluir que el proceso no funciona correctamente. La
hipteis nula y alternativa para este problema se pueden expresar como sigue:
-o: p .08 (funciona correctamente
-1: p > .08 (no funciona correctamente)
El nmero de xitos sigue un proceso binomial. No obstante, como ya se vio al esarrollar intervalos de
confianza, si el tamao de la muestra es lo bastante grande Wnp y n >1<p? $X, la distribucin normal da
una buena aproximacin a la distribucin binomial. La prueba estadstica se puede expresar en dos
formas, ya sea en trminos de la proprocin de xitos
en donde
p = proporcin de xitos de la hiptesis nula
o el nmero de xitos
Ambas formulas darn como resultado la misma respuesta exacta al problema.
Ahora se determinar si el proceso funciona correctamente para las llantas producidas en el turno de da.
Los resultados del turno de da indican que cinco llantas en una muestra de 100 se reventaron antes de
10 000 kilmetros. Para este problema, si se selecciona un nivel de significain de .05, las regiones de
rechazo y no rechazo se estableceran como se muetra en la figura
Prueba de 4iptesis de una cola para una proporcin con nivel de si*nificacin de $R
y la regla de decisin sera
Rechazar Ho si Z > + 1.654: de lo contrario no rechazar Ho.
Con los datos que se tienen
y entonces,
-1.107 < + 1.645; por tanto, no rec4a1ar -o.
La hiptesis nula no se rechazara porque la prueba estadstica no ha cado en la regin de rechazo. Se
llegara a la conclusin de que no hay pruebas de que ms del 8% de las lantas producidas en el turno de
da se revienten antes de los 10 000 kilmetros.
P(-&,' D& 5*P/+&%*% P'(' -0' D*F&(&0.*' D& P(/P/(.*/0&%
En lugar de preocuparse por las diferencias entre dos poblaciones en trminos de una variable
cuantitativa, el inters podra ser las diferencias en alguna caracterstica cualitativa. La prueba de la
diferencia entre dos proporciones basadas en muestras independientes, se puede efectuar con el uso de
dos mtodos diferentes, pero los resultados sern equivalente, aqu slo observaremos uno de ellos.
El primer mtodo de prueba de la diferencia entre dos proporciones implica el uso de la distribucin
normal. Esta prueba est basada en la diferecia entre las dos proporciones de la muestra a las cuales se
puede aproximar con una distribucin normal para muestras de tamao grande.
Para las dos poblaciones implicadas, interesa determinar si hay o no alguna diferencia en la proporcin
de xitos en los dos grupos (prueba de dos colas) o si un grupo tuvo una proporcin ma0or de */itos
que el otro grupo (prueba de una cola).
El estadsitico de la prueba sera
con
en donde
ps1 = proporcin muestral en la poblacin 1.
ps = proporcin muestral en la poblacin 2.
=1 = nmero de xios en la muestra 1.
= = nmero de xios en la muestra 2.
n1 = tamao de la muestra para la poblacin 1.
n = tamao de la muestra para la poblacin 2.
= estimacin combinada para la proporcin de la poblacin.
La estimacin de la proporcin de la poblacin que se utilizar, est basada en la hiptesis nula, Con la
hiptesis nula, se supone que las dos proporciones de la poblacin son iguales. Por tanto, se puede
obtener una estimacin total de la proporcin de la poblacin al combinar las dos proporciones de la
muestra. La estimacin es simplemente el nmero de xitos en las dos muestras combinadas (X1 +
X2) dividido entre el tamao total de la muestra (n1 + 2)
Unidad $. 2e*resin y correlacin.
$.1 !ntroduccin.
2e*resin
Relacin existente entre la media de una variable aleatoria y los valores de una o ms variables
independientes de los cuales depende.
Desde luego en algunos casos quiz no exista relacin en absoluto o slo una muy dbil, de manera que
tambin nos interesar la medicin del alcance o fuerza de la
Correlacin
La relacin (asociacin o interdependencia) de los valores de dos o ms variables cualitativas o
cuantitativas.
En resumen se puede decir lo siguiente el anlisis de regresin se utiliza en la prediccin 0 el
anlisis de correlacin1 por contraste con el de regresin1 se utiliza para medir la fuerza de la
asociacin entre las variables.
Covarian1a: Es una medida de asociacin que mide la relacin lineal entre las variables "x" e "y", y se define como:
_ _
Cov (x,y) = (1/n) * ((xi - x ) (yi - y))
En el caso de que los datos estn agrupados en clases, la frmula de la covarianza es la siguiente:
_ _
Cov (x,y) = ((xi - x) (yi - y) f(yi , xi ))
< Correlacin@ Es el resultado de dividir la covarianza por un trmino de sus mismas dimensiones, obteniendo el coeficiente de
correlacin (r). Sx y Sy, son las desviaciones tpicas de "x" e "y" respectivamente.
r = (Cov (x,y)) / (Sx * Sy)
Las propiedades del coeficiente de correlacin son las siguientes:
- Si multiplicamos "x" e "y". por constantes (aunque stas sean distintas), el coeficiente de correlacin no vara.
- Cuando no existe una relacin lineal exacta entre "x" e "y", el coeficiente de correlacin vara entre -1 y 1 (-1 <> r <> 1).
- Cuando no existe relacin lineal r = 0 (en este caso puede ocurrir que exista otro tipo de relacin no lineal).
- Si existe una relacin lineal, entonces r = 1 (correlacin lineal perfecta y directa) r = -1 (correlacin lineal perfecta e inversa).
Del simple anlisis grfico se obtiene una gran informacin:
- Caso A: la relacin es lineal, y adems es positiva o directa ya que la variable "y" aumenta proporcionalmente con "x". Existe
dispersin de los puntos, por lo que "r" no se acercar a la unidad.
- Caso B: Se observa que no existe ninguna relacin entre las variables. No hay variaciones sistemticas de una variable cuando
vara la otra.
- Caso C: Existe una relacin lineal, inversa o negativa. Los puntos estn concentrados, luego "r" estar prxima a "-1".
- Caso D: Existe una relacin no lineal.
http:22html.rincondelvago.com2estadistica345.html
$.1.1 7rficas de los datos.
$.1. 0ariables de re*resin independientes.
'0'L*%*% D& (&7(&%*/0 L*0&'L ./0 -0' V'(*',L& *0D&P&0D*&0+&
Las tcnicas de regresin permiten hacer predicciones sobre los valores de cierta variable 6
/dependiente",a partir de los de otra 7 /independiente" , entre las que intuimos que existe una relacin.
Para ilustrarlo mejor, retomemos uno de los ejemplos mencionados al principio de la unidad.
Si sobre un grupo de personas observamos los valores que toman las variables
no es necesario hacer grandes esfuerzos para intuir que la relacin que hay entre ambas es:
Obtener esta relacin es menos evidente cuando lo que medimos sobre el mismo grupo de personas es
La razn es que no es cierto que conocida la altura xi de un individuo,podamos determinar de modo
exacto su peso i (v.g. dos personas que miden 1,70 m pueden tener pesos de 60 y 65 kilos). Sin
embargo, alguna relacin entre ellas debe existir, pues parece mucho ms probable que un individuo de 2
m pese ms que otro que mida 1,20 m. Es ms, nos puede parecer ms o menos aproximada una
relacin entre ambas variables como la siguiente
A la deduccin, a partir de una serie de datos, de este tipo de relaciones entre variables, es lo que
denominamos re*resin.
+i*. #.1 Mediante las tcnicas de regresin de una variable 0 sobre una variable ', buscamos una
funcin que sea una buena aproximacin de una nube de puntos (xi,i), mediante una curva del tipo
. Para ello hemos de asegurarnos de que la diferencia entre los valores i e sea tan
pequea como sea posible.
Mediante las tcnicas de regresin inventamos una variable como funcin de otra variable ' (o
viceversa),
Esto es lo que denominamos relacin funcional. El criterio para construir , tal como citamos
anteriormente, es que la diferencia entre 0 e sea pequea.
El trmino que hemos denominado error debe ser tan pequeo como sea posible. El objetivo ser buscar
la funcin (tambin denominada modelo de re*resin) que lo minimice.
En un anlisis de regresin ( que incluye una variable independiente y una dependiente ), los valores
individuales se trazan en una grfica bidimensional llamada diagrama de dispersin. Cada valor se
traza en sus coordenadas = y T particulares, veamos un ejemplo graficando la siguiente tabla
Obser>acin +amaOo del lote Costo de constr3ccin
pies c3adrados miles de dlares
.
<
3
1
?
0
/
\
>
.;
..
.<
?
/
.;
.;
.<
<;
<<
.?
3;
1;
.<
.?
3..0
3<.1
1../
?;.<
10.<
?\.?
?>.3
1\.1
03./
\?.3
?3.1
?1.?
Costo de construccin y tamaIo del lote para una muestra aleatoria de 1 casas unifamiliares
+i*. #. Dia*rama de dispersin del tamaIo del lote en contra del costo de construccin
Un breve examn de la figura indica una clara relacin creciente entre el tamao = del lote y el costo T de
construccin. Conforme aumenta el tamao del lote, tambin se incrementa el costo de construccin. En
sintsis esto es lo que se estudiar en est unidad, la relacin que existe entre variables
$.1." 2e*resin lineal simple.
2e*resin simple
Cuando existe una dependencia causal entre dos variables, y se toman diversas observaciones, stas aparecen reflejadas en una
nube de puntos debido al componente aleatorio, a pesar de que pueda existir una fuerte dependencia entre ellas. El objetivo de la
regresin es obtener una recta (lnea de regresin, denominada as por Galton) hacia la que tienden los puntos de un diagrama de
dispersin, y va a definir la dependencia exacta entre las variables "x" e "y".
El modelo de la recta de regresin se ajusta a la expresin:
y = + * x +
Siendo " + * x" , la parte sistemtica o explicada y "" la parte aleatoria o impredecible o perturbacin, que engloba a todas las
variables no explcitas en el modelo, las cuales tienen relevancia sobre el resultado de "y". Los nmeros , se denominan
parmetros de la recta y definen completamente el modelo. "" recibe el nombre de coeficiente de regresin.
Para proceder a la estimacin de los parmetros y se parte de las siguientes hiptesis:
- Linealidad.
- Homocedasticidad de las perturbaciones, es decir su variabilidad se mantiene constante.
- ndependencia de las perturbaciones. Sus covarianzas deben ser nulas, para que haya ausencia de autocorrelacin.
- Normalidad. Las perturbaciones deben seguir el modelo de una distribucin normal (0, o).
Si de una poblacin se extrae una muestra, se tiene la siguiente relacin:

y = yi + ei

yi : valores medios de la variable dependiente correspondientes a los valores xi observados (valor previsto).
ei: errores o residuos debidos a los factores aleatorios de perturbacin. En Estadstica, residuo = valor observado - valor previsto.
Se cumple siempre que ei = 0
Para una funcin lineal:

y = 0 + 1 x
!ttp:""!tml.rincondelvago.com"estadistica)89.!tml
'0'L*%*% D& (&7(&%*/0 L*0&'L
6omo estudiantes de ingeniera muc)as veces (o casi siempre) encontamos ue e*iste una
relacin entre dos (o m"s) varia!les. Por ejemplo$ los pesos de )om!res adultos dependen en
cierto modo de sus alturas^ la velocidad de reaccin depende del tiempo de residencia (para los
umicos)^ las circunferencias de los crculos dependen de sus radios ' la presin de una masa
dada de gas depende de su temperatura ' volumen, ' as podemos citar muc)os ejemplos m"s.
Es por eso ue se desea frecuentemente e*presar esta relacin mediante una ecuacin matem"tica
ue ligue las varia!les. Por lo consiguiente !as"ndose en los datos muestrales, se desea estimar el
valor de una varia!le C correspondiente a un valor dado de una varia!le B. Esto puede
conseguirse estimando el valor de C de la curva de mnimos cuadrados (vista m"s adelante) ue
ajusta los datos muestrales. #a curva resultante se llama la curva de regresin de 7 sobre 0,
puesto ue 4 se estima a partir de `.
Nota.IEntiendase estimaci%n (como un c"lculo apro*imado !asado en o!servaciones '
razonamientos, pero cu'o resultado no podr" nunca ser e*acto(
1
(si no dejara de ser una
estimacin).
8egresin 9ineal :imple (8ecta de 8egresin)
El pro!lema de la regresi%n lineal simple entre dos varia!les 0 ' 7 se reduce a calcular la recta
de regresi%n ue mejor represente su distri!ucin conjunta. #os datos se presentan como una
matriz de dos columnas$
siendo :x
i
,
i
;, con iK " $ ... n, el iQsimo par o!servado.
&e pretende ajustar un modelo de la forma

i
Ka x
i
TbTe
i

!ajo las siguientes )iptesis$
.. #a varia!le resp$esta
i
depende de la varia!le e*plicativa x
i
de forma lineal (con
pendiente a ' ordenada en origen b), m"s un factor residual aleatorio e
i
.
<. #os residuos tienen distri!ucin normal de media 0 ' varianza desconocida.
3. Estos factores aleatorios son independientes entre s.
#os par"metros de la recta de regresin, a ' b, se calculan siguiendo el criterio de los mnimos
cuadrados, lo ue lleva a los siguientes resultados$
siendo
'
las medias de am!as varia!les estadsticas.
#a varianza residual es desconocida, siendo su estimador insesgado
Definiendo el coeficiente de correlacin como
,
ue slo toma valores en el intervalo `I" "a, nos da una idea de )asta u punto el ajuste lineal es
razona!le$
&i r es pr*imo a I"$ el ajuste es acepta!lemente !ueno, distri!u'ndose las o!servaciones
:x
i
,
i
; alrededor de una recta de pendiente negativa.
&i r es pr*imo a 0$ el ajuste no es acepta!le, indicando ue no e*iste relacin lineal entre
las varia!les.
&i r es pr*imo a T"$ el ajuste es acepta!lemente !ueno, distri!u'ndose las
o!servaciones :x
i
,
i
; alrededor de una recta de pendiente positiva.
El contraste de independencia entre las varia!les es m"s o!jetivo ue la simple o!servacin del
coeficiente de correlacin r. 7s se plantea compro!ar si los datos o!servados corro!oran o no la
)iptesis nula$
D
;
$ (la varia!le e*plicativa 0 no influ'e en la respuesta 7(.
frente a la alternativa$
D
.
$ (la varia!le e*plicativa 0 influ'e linealmente en la respuesta 7(.
Mediante el estadstico de contraste
ue se distri!u'e como una t
n#-
de &tudent, se puede contrastar la )iptesis nula D
;
al nivel de
significacin del ?@.
;aso
&e dispone de los datos de oc)o anestesias de diferente duracin, efectuadas con un anestsico vol"til ' del tiempo en
ue se resta!lece la conciencia suficiente como para contar )acia atr"s desde un n5mero determinado sin error$
Duracin
anestesia (min)
Duracin
despertar (min)
.?; .3
.</ .0
.0; <.
<.; <;
<?; .0
.3; .3
0; .<
?? .1
&e intenta pro!ar la )iptesis de ue la duracin del despertar no est" influida por la de la anestesia.
El coeficiente de correlacin para esta muestra es de ;.?0<<3., a medio camino entre el ; ' el ., no permitiendo dar
una respuesta segura so!re el contraste^ en cam!io, el estadstico < toma un valor de ..00?3., del ue se puede
deducir ue la )iptesis no puede rec)azarse al nivel del ?@^ en conclusin, no )a' indicios de ue la duracin del
despertar est linealmente relacionada con el tiempo de duracin de la anestesia. &i se )u!iese rec)azado la )iptesis
de independencia, se podran ajustar los datos a la recta de ecuacin
K 0.0% x T "".&$,
siendo x la duracin de la anestesia e la del despertar.
!egresin lineal simple
En un problema de regresin, los carcteres no son
considerados de la misma forma. Uno de ellos es el carcter ''a
explicar'', los otros son ''explicativos''. Vamos primero a
considerar el caso de dos carcteres, (explicativo) e (a
explicar). ''Explicar'' significa aqu expresar una dependencia
funcional de como funcin de , de manera tal de prever el
valor de conociendo el de . Si para todo individuo ,
, y si se observa un valor del carcter en un
nuevo individuo, daremos como prediccin del carcter
en este nuevo individuo. La situacin ideal donde no se
encuentra nunca en la prctica. Ms bien se buscar, en una
familia fija de funciones, aquella para la que los se encuentran
ms cerca de los . La cercana se mide en general por el
error cuadrtico medio:
(3.2)
Hablamos entonces de regresin en el sentido de los mnimos
cuadrados. Las diferencias entre los valores observados y los
valores que predice el modelo , se llaman los residuos. Si el
modelo se ajusta de manera tal que la serie de los residuos sea
centrada (de media nula), entonces el error cuadrtico es
la varianza de los residuos. La regresin lineal consiste en
buscar entre las funciones afines. La solucin se expresa de
manera simple a partir de las carctersticas de e .
Proposicin ".$ Sean e dos muestras observadas sobre
una misma poblacin de tamao . Denotemos por la
funcin de en definida por:
Si (el carcter no es constante), la funcin
admite un mnimo en:
y
El valor de este mnimo es:
Definicin ".& Llamamos recta de regresin lineal de sobre
a la recta de ecuacin .
Demostracin@ Si fijamos , es un polinomio de grado
en . El alcanza su mnimo para un tal que la derivada
se anule. Calculando:
Obtenemos por tanto . Substituimos este valor en
:
Esta funcin es un polinomio de grado en , que alcanza su
mnimo en el punto donde se anula su derivada. Obtenemos:
sea:
Pongamos:
y
Tenemos entonces para todo par :
El valor del mnimo es:




Como se esperaba, el error cuadrtico minimal es menor cuando
la correlacin es ms fuerte.
Es importante observar la diferencia de los roles que
desempean e . Geomtricamente, la recta de regresin
lineal de con respecto a minimiza la suma de las distancias
verticales de los puntos a la recta. La recta de regresin
lineal de con respecto a minimiza las distancias horizontales.
Las dos rectas se cortan en el centro de gravedad, , de la
nube de puntos. La separacin entre las dos rectas es mayor
cuando la correlacin es ms dbil.
La prediccin es la primera aplicacin de la regresin lineal. A
continuacin tenemos las estaturas en centmetros (muestra ) y
el peso en kilogramos ( ) de nios de aos.
Nio 1 2 3 4 5 6 7 8 9 10
Estatura 121 123 108 118 111 109 114 103 110 115
Peso 25 22 19 24 19 18 20 15 20 21
Las carctersticas numricas toman los siguientes valores:
7rfico 1#@ Estatura y peso de nios de 6 aos: recta de
regresin.
Hacer una regresin lineal quiere decir que se piensa que el
peso debe crecer, en general, proporcionalmente a la estatura.
La recta de regresin lineal constituye un modelo de prediccin.
Por ejemplo diremos que el peso promedio de un nio de 6 aos
que mide 120 centmetros ser de kg.
Evidentemente esta prediccin no es infalible. Ella slo da un
orden de magnitud. El valor observado ser probablemente
distinto y el error previsible ser del orden de kg.
Como segunda aplicacin se puede extender el ajuste por
cuantiles a familias de leyes invariantes por transformaciones
afines, como las leyes normales . Sea una muestra continua de
tamao para la cual queremos verificar si ella podra haber
salido de una ley normal , con parmetros y
desconocidos. Para , denotemos como siempre por
los estadgrafos de orden. Si la hiptesis de normalidad es
pertinente, entonces debe estar cerca del cuantil
de la ley . Recordemos que si una variable
aleatoria sigue la ley , entonces sigue la
ley . Esto es lo mismo que decir que para todo :
Denotemos por los valores de la funcin cuantil
de la ley en los puntos . Si la hiptesis de normalidad
se verifica, los puntos de coordenadas deberan estar
cercanos de la recta de ecuacin . Una regresin
lineal de las con respecto a las nos da a la vez una
estimacin de los valores de y , y una indicacin sobre la
calidad del ajuste (figura 15). Antes de que existieran los
programas de clculo, se venda papel ''gausso-aritmtico'',
graduado en las abscisas segn los cuantiles de la ley .
Bastaba poner en las ordenadas los valores de las para
trazar a mano la recta de regresin lineal, que lleva el nombre de
''recta de Henry'', por el nombre del coronel que invent este
mtodo en el siglo XX para estudiar el alcance de los caones.
7rfico 1$@ Estaturas de nios de 6 aos. Cuantiles de la
ley normal y estadgrafos de orden. Superposicin
de la recta de Henry.
El problema de la regresin es determinar en una familia de
funciones dada, cual es la funcin que minimiza el error
cuadrtico (3.2). Pero es frecuente que no haya una solucin
explcita. Para ciertas familias de funciones, se transforma el
problema de manera tal de llevarlo a una regresin lineal.
Presentamos aqu algunos casos frecuentes.
Familia Funciones Transformacin Forma afn
exponencial
potencia
inversa
logstica
Como ejemplo de aplicacin, vamos a tomar el problema del
ajuste por los cuantiles para la familia de leyes de Weibull, las
cuales se emplean frecuentemente para modelar tiempos de
sobrevida en medicina o tiempos de funcionamiento en fiabilidad.
La funcin cuantil de la ley de Weibull es:
Sea una muestra que queremos ajustar por una ley de Weibull
de parmetros y desconocidos. Para , el
estadgrafo de orden debe estar cerca del cuantil
.
o sea:
Pongamos y . Los puntos
deberan estar cerca de la recta de ecuacin
. Una regresin lineal nos dar no
solamente los valores para y , sino tambin una indicacin
sobre la calidad del ajuste. Antes de los programas de clculo,
exista tambin un ''papel Weibull'', graduado de manera tal que
se poda automatizar este caso particular de regresin no lineal.
$.1.# Coeficientes de re*resin.
$.1.$ ,neas de re*resin a5ustada.
$. Dia*rama de dispersin.
$..1 Tabla de datos.
$.. Construccin de dia*ramas.
$." Estimacin mediante la lnea de re*resin.
8egresin 9ineal :imple (8ecta de 8egresin)
El pro!lema de la regresi%n lineal simple entre dos varia!les 0 ' 7 se reduce a calcular la recta
de regresi%n ue mejor represente su distri!ucin conjunta. #os datos se presentan como una
matriz de dos columnas$
siendo :x
i
,
i
;, con iK " $ ... n, el iQsimo par o!servado.
&e pretende ajustar un modelo de la forma

i
Ka x
i
TbTe
i

!ajo las siguientes )iptesis$
1. #a varia!le resp$esta
i
depende de la varia!le e*plicativa x
i
de forma lineal (con
pendiente a ' ordenada en origen b), m"s un factor residual aleatorio e
i
.
?. #os residuos tienen distri!ucin normal de media 0 ' varianza desconocida.
0. Estos factores aleatorios son independientes entre s.
#os par"metros de la recta de regresin, a ' b, se calculan siguiendo el criterio de los mnimos
cuadrados, lo ue lleva a los siguientes resultados$
siendo
'
las medias de am!as varia!les estadsticas.
#a varianza residual es desconocida, siendo su estimador insesgado
Definiendo el coeficiente de correlacin como
,
ue slo toma valores en el intervalo `I" "a, nos da una idea de )asta u punto el ajuste lineal es
razona!le$
&i r es pr*imo a I"$ el ajuste es acepta!lemente !ueno, distri!u'ndose las o!servaciones
:x
i
,
i
; alrededor de una recta de pendiente negativa.
&i r es pr*imo a 0$ el ajuste no es acepta!le, indicando ue no e*iste relacin lineal entre
las varia!les.
&i r es pr*imo a T"$ el ajuste es acepta!lemente !ueno, distri!u'ndose las
o!servaciones :x
i
,
i
; alrededor de una recta de pendiente positiva.
El contraste de independencia entre las varia!les es m"s o!jetivo ue la simple o!servacin del
coeficiente de correlacin r. 7s se plantea compro!ar si los datos o!servados corro!oran o no la
)iptesis nula$
D
;
$ (la varia!le e*plicativa 0 no influ'e en la respuesta 7(.
frente a la alternativa$
D
.
$ (la varia!le e*plicativa 0 influ'e linealmente en la respuesta 7(.
Mediante el estadstico de contraste
ue se distri!u'e como una t
n#-
de &tudent, se puede contrastar la )iptesis nula D
;
al nivel de
significacin del ?@.
;aso
&e dispone de los datos de oc)o anestesias de diferente duracin, efectuadas con un anestsico vol"til ' del tiempo en
ue se resta!lece la conciencia suficiente como para contar )acia atr"s desde un n5mero determinado sin error$
Duracin
anestesia (min)
Duracin
despertar (min)
.?; .3
.</ .0
.0; <.
<.; <;
<?; .0
.3; .3
0; .<
?? .1
&e intenta pro!ar la )iptesis de ue la duracin del despertar no est" influida por la de la anestesia.
El coeficiente de correlacin para esta muestra es de ;.?0<<3., a medio camino entre el ; ' el ., no permitiendo dar
una respuesta segura so!re el contraste^ en cam!io, el estadstico < toma un valor de ..00?3., del ue se puede
deducir ue la )iptesis no puede rec)azarse al nivel del ?@^ en conclusin, no )a' indicios de ue la duracin del
despertar est linealmente relacionada con el tiempo de duracin de la anestesia. &i se )u!iese rec)azado la )iptesis
de independencia, se podran ajustar los datos a la recta de ecuacin
K 0.0% x T "".&$,
siendo x la duracin de la anestesia e la del despertar.
OB2M8#7& DE 2ET2E&EBF #EFE7# &EMP#E$
Prediccin en regresin lineal simple.
Como se coment anteriormente hay dos objetivos bsicos en el ajuste de un modelo
de regresin:
- Conocer la relacin existente entre la variable respuesta y las variables
regresoras. En el caso de la regresin lineal simple se estima la mejor recta de
regresin que relaciona la variable Y con la variable X y se cuantifica la
importancia de dicha relacin por medio del coeficiente de correlacin r.
- !tili"ar el modelo de regresin ajustado para #predecir$ el valor de la
variable respuesta Y cuando la variable regresora toma un valor determinado X
% xt.
En esta seccin se estudia este segundo objetivo. &sto es estimada la recta de
regresin 'cmo predecir el valor de Y sabiendo que la variable regresora toma el
valor X % xt( )nte esta pregunta se deben distinguir dos situaciones diferentes:
Estimar la media de la distribucin condicionada de Y/X % xt : E % mt.
*e quiere responder a preguntas del tipo: cul es el gasto medio en material
informtico de las empresas que tienen unos ingresos globales de 300 millones
anuales?.
Predecir el valor de la variable respuesta en un individuo de la poblacin en
estudio del que se sabe que X % x
t
. Esto es predecir un valor de la variable
condicionada +,-%x
t

*e quiere responder a preguntas del tipo: !a empresa "E#$ tiene unos ingresos
anuales de 300 millones% cul ser el gasto en material informtico de esta
empresa?.
$.".1 Ecuacin de la recta como a5uste de datos.
$.". %odelos.
M/D&L/% D& (&7(&%*/0 3 %-% -%/%
La naturaleza de la relacin entre las variables puede adoptar muchas formas, que van desde funciones
matemticas muy sencillas hasta las muy complicadas. La relacin ms simple consiste en una lnea
recta o relacin lineal.
El modelo para la lnea recta (lineal) se puede representar como:
Ci K 0 T "Bi T i
en donde:
C = intercepcin real con el eje T de la poblacin
1 = pendiente real de la poblacin
i = error aleatorio en T para la observacion i
En este modelo, la pendiente 1 de la recta representa el cambio unitario en T, T, por cambio unitario en
=, =, es decir, representa la cantidad de cambio T (positivo o negativo) para un cambio unitario
particular en =. Por otra parte, la intercepcin C con el eje T representa un factor constante que est
incluido en la ecuacin. Representa el valor de T cuando = es igual a cero. Adems, la ltima
componente, i, del modelo representa el error aleatorio en T por cada observacin que ocurre. Este
trmino se ha incluido slo porque el modelo estadstico es slo una aproximacin a la relacin exacta
entre las dos variables.
La distribucin de los valores = y T en el diagrama de dispersin influye en la seleccin del modelo
matemtico adecuado. Esto se observa claramente en la +i*. #.".
+i*. #.". Ejemplos de tipos de relaciones encontrados en los diagramas de dispersin.
Es claro, del panel : de la +i*. #.". que generalmente los valores de T se incrementan linealmente
conforme = crece.
El panel ) es un ejemplo de una relacin lineal negativa. Cuando = crece, se nota que los valores de T
decrecen. Un ejemplo de este tipo de relacin puede ser el precio de un de una computadora con
respecto a la cantidad de ventas.
El panel C muestra un grupo de datos en el cual hay poca o ninguna relacin entre = y T. Aparecen
valores altos y bajos de Y para cada valor de =. Como ejemplo se tiene el promedio de calificaciones y el
ndice de calificaciones.
Los datos del panel D muestran una relacin curvlinea positiva entre = y T. Los valores de T crecen
conforme = crece, pero este aumento va disminuyendo ms all de ciertos valores de =. Un ejemplo de
esto podran ser la edad y el costo de mantenimiento de una computadora. Conforme est se hace ms
vieja, el costo de mantenimiento puede aumentar con rapidez en un principio y, despus, se nivela
pasado cierto nmero de aos.
El panel E muestra una relacin parablica o en forma de U entre = y T. Conforme = crece, al principio T
decrece; pero, a medida que = contina creciendo, T no slo deja de crecer nino que, en realidad,
empieza a crecer despus de tomar su valor mnimo. Un ejemplo de este tipo podra ser el aumento de
errores por hora en una labor y el nmero de horas trabajadas. El nmero de errores por hora disminuira
conforme la persona adquiere ms prctica en la labor, pero luego, aumentara ms all de un cierto
punto debido a factores, como fatiga y aburrimiento.
Finalmente el panel + indica una relacin curvilnea, exponencial o negativa, entre = y T. En este caso, T
decrece con mucha rapidez segn = primero crece, pero luego decrece con mucha menos rapidez a
medida que = crece ms. Un ejemplo de esta relacin exponencial podra ser el valor de reventa de un
automvil y su edad. En el primer ao, el valor de reventa sufre un descenso muy fuerte en su precio
original; sin embargo, luego, el valor de reventa disminuye con mucha menos rapidez en los aos
siguientes.
Es una prctica comn de los ingenieros dibujar los pares de datos sobre varias clases de hojas para
grficas, con el fin de determinar si para una escala de transformacin adecuada los puntos caern cerca
de una lnea recta.
Resumiendo lo anterior se puede establecer entonces que los modelos de regresin ms usados en
aplicaciones ingenieriles son los siguientes:
0 8 b 9 m/ ................................ Regresin lineal
0 8 b 9 m ln/ ............................ Regresin logartmica
0 8 be
m/
o ln 0 8 ln b 9 m/ ....... Regresin lineal
0 8 b/
m
o ln 0 8 ln b 9 m ln/ ..... Regresin de potencia
Para cada uno de estos modelos generales, el modelo de regresin hallar una intercepcin (b C) y
una pendiente (m i) que corresponde al ajuste de los mnimos cuadrados de ese modelo.
$.# %.todos de mnimos cuadrados.
M&+/D/ D& M*0*M/% .-'D('D/%
Para proceder al mtodo de estimacin, debe notarse que existen varios mtodos, todos los cuales dan
resultados aceptables. Para nuestros propsitos ser suficiente discutir y emplear el m*todo de los
mnimos cuadrados. Con el uso de este mtodo se pueden obtener excelentes resultados. De hecho, si
se hace la suposicin comn de normalidad, el mtodo de los mnimos cuadrados es equivalente al de
mxima probabilidad (otro metdo de estimacin).
Cuando se haya decidido ajustar una lnea recta a un conjunto de datos dado, uno se enfrenta a un gran
problema, es decir, el de obtener la ecuacin de la recta particular que en algn sentido ofrezca el mejor
ajuste posible. Para mostrar lo que interviene en esto, consideremos los siguientes datos de muestra que
se obtuvieron en un estudio de la relacin que existe entre el nmero de aos que han estudiado alemn
los solicitantes de ciertos empleos de servicio en el extranjero, en la preparatoria o la universidad y las
calificaciones que obtuvieron en un examen del dominio de ese idioma.
NEmero de aOos
B
Calificaciones
en la pr3eba
C
3
1
1
<
?
3
1
?
3
<
?/
/\
/<
?\
\>
03
/3
\1
/?
1\
Si se trazan los puntos que corresponden a estas 10 parejas de valores como se muestra en la :igura,
se observa que, aunque no todos los puntos estn situados sobre la lnea recta, el modelo integral de la
relacin lo describe razonablemente bien la lnea.
Datos sobre el nEmero de aIos (ue se studi alemn y la calificacin obtenida en la prueba de
dominio del idioma
No existe desviacin aparente de la linealidad en el modelos de los puntos, de manera que nos sentimos
justificados al decidir que una lnea recta es una descripcin adecuada de la relacin subyacente.
Ahora debemos de obtener la ecuacin de la recta que en algn sentido proporcione el mejor ajuste a los
datos y que, se espera, ms adelante producir las predicciones posibles ms adecuadas de T para
valores dados de =. En trminos lgicos no existe lmite para el nmero de lneas rectas que se pueden
trazar en una hoja de papel, por ejemplo, el la figura anterior. Alunas rectas se ajustaran a los datos en
forma tan deficiente que las podremos considerar en forma seria, pero muchas otras se aproximaran
mucho y el problema consiste en determinar la lnea que Hme5orH se ajuste a los datos en algn sentido
bien definido. Si todos los puntos se situaran en realidad sobre una lnea recta no habra problema, pero
ste es un caso extremo que rara vez se encuentra en la prctica. En general, tenemos que estar
satisfechos con una recta que tenga ciertas propiedades deseables, sin llegar a la perfeccin.
El criterio que hoy en da se utiliza casi exclusivamente para definir un Hme5orH ajuste data de la primera
parte del siglo XX y de los trabajos del matemtico francs :drien ,e*endre. A ste se le denomina
m*todo de los mnimos cuadrados y requiere que la suma de las desviaciones /distancias" verticales
de los puntos a las rectas sea lo menor posible!
Para explicar por qu se hace esto, nos referiremos a la siguiente figura, donde se trazaran los puntos
correspondientes a los datos siguientes.
Po!lacin
B
Po!lacin
C
3
1
1
<
?
3
1
?
3
<
?/
/\
/<
?\
\>
03
/3
\1
/?
1\
Errores cometidos mediante el uso de la recta dada para HpredecirH los valores de y para ; F 1 y ;
F 8
y que ms o menos arbitrariamente se "ajusten" a una lnea recta; en realidad la lnea se traz pasando
por los puntos (1,8 y (9,4).
Si se hubiese utilizado esta lnea recta para predecir los valores de T para los valores de = dados, es
decir, si se hubiese marcado x = 1, x = 5 y x = 9 sobre la escala horizontal y se hubiese utilizado la recta
para leer los valores de T correspondientes, se habra obtenido 8,6 y 4. Los errores de estas
"predicciones" son 6-8 = 2, 5-5 = 1 y 7 - 4 = 3, y en la figura anterior son las distancias verticales de los
puntos a la recta.
La suma de estos errores es (-2) + (-1) + 3 = 0, pero esto no es indicativo de su tamao. Al elevar al
cuadrado los errores, se descubre que la suma de los cuadrados de los errores es (-2)
s
+ (-1)
2
+ 3
2
= 14.
Ahora ajustemos otra recta a los mismos puntos de datos como antes. Lo que se muestra en la
siguiente :igura realmente pasa por los puntos (1,5) y (9,6), y juzgando a simple vista, parece que
proporciona un ajuste mucho mejor que la recta de la figura siguiente.
Errores cometidos al utili1ar la se*unda recta para HpredecirH los valores de y para ; F 1/ ; F $ y ;
F 8
Como se puede verificar sin dificultad, los errores de las "prediciones", las diferencias entre los valores
observados de T y los valores correspondientes tomados de la recta son ahora 6 - 5 = 1, 5 - 5.5 = -0.5 y
7-6= 1.
La suma de estos errores es 1 + (-0.5) + 1 = 1.5, que es mayor que la suma que se obtuvo para los
errores cometifos con la recta de la figura anterior, pero repetimos esto no es indicativo de su tamao.
Por otra parte, la suma de los cuadrados de los errores es ahora 1
s
+ (-0.5)
2
+ 1
2
= 2.25 y esto es mucho
menor que el valor de 14 que se obtuvo anteriormente. En realidad, esto es indicativo del hecho de que la
recta de la figura pasada ofrece un menor ajuste que la recta de esta figura y se define la recta "que
mejor se ajusta" como aquella para la cual la suma de los cuadrados de los errores es lo menor posible.
A esta recta se le denomina recta de mnimos cuadrados
Ahora s entremos de lleno en el mtodo, para demostrar cmo se ajusta en realidad una recta de
mnimos cuadrados a un conjunto de datos en pareja, consideremos n parejas de nmeros (x1,1,
(x2,2,...., y (xn,n, que podran representar muchas cosas por ejemplo las alturas y pesos de n personas,
los coeficientes intelectuales de n madres e hijos, etc. Si escribimos la ecuacin de la recta como 1
a + bx, donde el simbolo se utiliza para hacer una distincin entre los valores observados de T y los
valores correspondientes de , el mtodos de los mnimos cuadrados requiere que se minimice la
suma de los cuadrados de los errores entre las T y las como se muestra en la Figura
2ecta de mnimos cuadrados
Esto requiere decir que debemos obtener los valores numricos de las constantes a y b que figuran en la
ecuacin 1 a + bx para lo cual
es lo menor posible.
&%+*M'D/(&% D& M*0*M/% .-'D('D/%
En la seccin anterior se utiliz una recta de mnimos cuadrados para predecir que una persona que ha
estudiado alemn por dos aos en la preparatoria obtendr una calificacin de 53.33 en la prueba de
dominio, pero aunque interpretemos la recta correctamente como una recta de regresin (es decir que se
traten las predicciones hechas a partir de ella como promedios o valores esperados), todava tienen que
responderse varias preguntas.
De que clidad son los valores que se obtuvieron para las cosnatntes a y b en la ecuacin
1 a + bx? Despus de todos, a = 31.53 y b= 10.90 son slo estimaciones basados en datos
de muestra, y si basamos el trabajo en una muestra de otros 10 solicitantes de los empleos de
servicio en el extranjero, el mtodo de los mnimos cuadrados nos llevar probablemente a
obtener diferentes valores de a y b.
De qu clidad es una estimacin del 53.33 de la calificacin promediod de personas que han
estudiado por dos aos alemn en la preparatoria?
En la primera de estas preguntas se dijo que a= 31.53 y b= 10.90 son ;solamente estimaciones
basadas en datos de muestra;, y esto implica la existencia de valores verdaderos correspondientes, por
lo general representados por y y se denominan coeficientes de regresin y, por tanto, de una recta
de regresin verdadera 1 + x. Para hacer la distincin entre a y b, y y , nos referimos a la
primera como coeficientes de regresin estimados
Para aclarar la idea de una recta de regresin verdadera 1 + x, considere la siguiente :igura,
que muestra las distribuciones de T para diferentes valores de =. En conexin con el ejemplo de el
subtema anterior, estas curvas representan las distribuciones de las calificaciones obtenidas en la prueba
de dominio de personas que han estudiado, respectivamente, uno, dos o tres aos de alemn en la
preparatoria. Para completar el esquema, podemos visualizar curvas similares correspondientes a todos
los otros valores de = dentro del intervalo de valores en consideracin.
En el anlisis de re*resin lineal se supone que las = son constantes conocidas y que para cada = la
variable aleatoria T tiene cierta distribucin con la media + x. En el anlisis de re*resin normal se
supone adems que estas distribuciones son normales con la misma desviacin estndar . En otras
palabras, las distribuciones que se ilustran en la Figura, y tambin las que se suman mentalmente, son
curvas normales con medias situadas sobre la recta 1 + x y la misma desviacin estndar .
Con base en estas suposiciones podemos hacer todo tipo de deducciones acerca de los coeficientes de
regresin + x. Todas ellas requieren que estimemos , la desviacin estndar comn de las
distribuciones y la estimacin que se utilizar para este fin se denomina error estndar de la estimacin
y se representa por medio de SYX y se define:
en donde
Yi = valor real de T para un =i dado
= valor predicho de T para un =i dado
El clculo del error estndar de la estimacin con ul uso de la ecuacin anterior requerira el clculo del
valor predicho de T por cada valor = en la muestra. Sin embargo, el clculo se simplificara, debido a la
siguiente identidad:
El error estndar de la estimacin SYX, se puede, por tanto, obtener con el uso de la siguiente frmula
para clculo:
&%+*M'.*/0 D& L' V'(*'02' D& &((/(&%
Consideremos la nube de puntos formadas por las n parejas de datos (xi,i). El centro de gravedad de
esta nube de puntos es , o bien podemos escribir simplemente si los datos no estn
ordenados en una tabla de doble entrada. Trasladamos los ejes 76 al nuevo centro de coordenadas
. Queda as dividida la nube de puntos en cuatro cuadrantes como se observa en la figura. Los
puntos que se encuentran en el primer y tercer cuadrante contribuyen positivamente al valor de , y
los que se encuentran en el segundo y el cuarto lo hacen negativamente.
+i*ura@ nterpretacin geomtrica de
De este modo:
Si hay mayora de puntos en el tercer y primer cuadrante, ocurrir que , lo que se
puede interpretar como que la variable 0 tiende a aumentar cuando lo hace ';
Si la mayora de puntos estn repartidos entre el segundo y cuarto cuadrante entonces
, es decir, las observaciones 0 tienen tendencia a disminuir cuando las de '
aumentan;
Si los puntos se reparten con igual intensidad alrededor de , entonces se tendr que
.
Por el momento no pretendemos encontrar relaciones tan complicadas entre variables, pues nos vamos a
limitar al caso de la re*resin lineal. Con este tipo de regresiones nos conformamos con encontrar
relaciones funcionales de tipo lineal, es decir, buscamos cantidades a y b tales que se pueda escribir
con el menor error posible entre e 0, o bien
de forma que sea una variable que toma valores prximos a cero.
Obsrvese que la relacin anterior explica cosas como que si ' vara en 1 unidad, vara la cantidad b.
Por tanto:
Si b>0, las dos variables aumentan o disminuyen a la vez;
Si b<0, cuando una variable aumenta, la otra disminuye.
Por tanto, en el caso de las variables peso y altura lo lgico ser encontrar que b>0.
El problema que se plantea es entonces el de cmo calcular las cantidades a y b a partir de un conjunto
de n observaciones
de forma que se minimice el error. Las etapas en que se divide el proceso que vamos a desarrollar son
de forma esquemtica, las que siguen:
1.
Dadas dos variables ', 0, sobre las que definimos
medimos el error que se comete al aproximar 0 mediante calculando la suma de las
diferencias entre los valores reales y los aproximados al cuadrado (para que sean positivas y no
se compensen los errores):
2.
Una aproximacin de 0, se define a partir de dos cantidades a y b. Vamos a
calcular aquellas que minimizan la funcin

3.
Posteriormente encontraremos frmulas para el clculo directo de a y b que sirvan para cualquier
problema.
2e*resin de 6 sobre 7
Para calcular la recta de regresin de 0 sobre ' nos basamos en la figura.
+i*ura@ Los errores a minimizar son las cantidades
Una vez que tenemos definido el error de aproximacin mediante la relacin anterior las cantidades que
lo minimizan se calculan derivando con respecto a ambas e igualando a cero /procedimiento de los
mnimos cuadrados":
<>Las relacines anteriores se denominan ecuaciones normales. La primera se escribe como
Sustituyendo se tiene que
Lo que nos da las relaciones buscadas:
La cantidad b se denomina coeficiente de regresi#n de 0sobre '.
2e*resin de 7 sobre 6
Las mismas conclusiones se sacan cuando intentamos hacer la regresin de ' sobre 0, pero atencin!:
Para calcular la recta de regresin de ' sobre 0 es totalmente incorrecto despejar de
Pues esto nos da la regresin de ' sobre , que no es lo que buscamos. La regresin de ' sobre 0 se
hace aproximando ' por , del modo
donde
pues de este modo se minimiza, en el sentido de los mnimos cuadrados, los errores entre las cantidades
xi y las
<i83ra4 #os errores a minimizar son las cantidades
E5emplo
En una muestra de 1.500 individuos se recogen datos sobre dos medidas antropomtricas ' e 0. Los
resultados se muestran resumidos en los siguientes estadsticos:
Obtener el modelo de regresin lineal que mejor aproxima 0 en funcin de '. Utilizando este modelo,
calcular de modo aproximado la cantidad 0 esperada cuando '=15.
Solucin@
Lo que se busca es la recta, , que mejor aproxima los valores de 0 (segn el criterio de
los mnimos cuadrados) en la nube de puntos que resulta de representar en un plano (',0) las 1.500
observaciones. Los coeficientes de esta recta son:
As, el modelo lineal consiste en:
Por tanto, si x=15, el modelo lineal predice un valor de 0 de:
En este punto hay que preguntarse si realmente esta prediccin puede considerarse fiable. Para dar una
respuesta, es necesario estudiar propiedades de la regresin lineal que estn a continuacin.
Propiedades de la re*resin lineal
Una vez que ya tenemos perfectamente definida , (o bien ) nos preguntamos las relaciones que hay
entre la media y la varianza de esta y la de 0 (o la de '). La respuesta nos la ofrece la siguiente
proposicin:
Proposicin
En los ajustes lineales se conservan las medias, es decir
En cuanto a la varianza, no necesariamente son las mismas para los verdaderos valores de las variables
' e 0 y sus aproximaciones y , pues slo se mantienen en un factor de r
2
, es decir,
Demostracin
Basta probar nuestra afirmacin para la variable 0, ya que para ' es totalmente anlogo:
donde se ha utilizado la magnitud que denominamos coeficiente de correlaci#n, r, y que ya definimos
anteriormente como
6bservacin
Como consecuencia de este resultado, podemos decir que la proporci#n de varianza explicada por la
regresi#n lineal es del .
Nos gustara tener que r=1, pues en ese caso ambas variables tendran la misma varianza, pero esto no
es cierto en general. Todo lo que se puede afirmar, como sabemos, es que
y por tanto
La cantidad que le falta a la varian1a de re*resin, , para llegar hasta la varianza total de 0, ,
es lo que se denomina varian1a residual, que no es ms que la varianza de , ya que
El tercer sumando se anula segn las ecuaciones normales expresadas.
Por ello
Obsrvese que entonces la bondad del ajuste es
Para el ajuste contrario se define el error como , y su varianza residual es tambin
proporcional a 1-r
2
:
y el coeficiente de determinacin (que sirve para determinar la bondad del ajuste de ' en funcin de 0)
vale:
lo que resumimos en la siguiente proposicin:
Proposicin
Para los ajustes de tipo lineal se tiene que los dos coeficientes de determinacin son iguales a r
2
, y por
tanto representan adems la proporcin de varianza explicada por la regresin lineal:
Por ello:
Si el ajuste es bueno (0 se puede calcular de modo bastante aproximado a partir de ' y
viceversa).
Si las variables ' e 0 no estn relacionadas (linealmente al menos), por tanto no tiene
sentido hacer un ajuste lineal. Sin embargo no es seguro que las dos variables no posean
ninguna relacin en el caso r=0, ya que si bien el ajuste lineal puede no ser procentente, tal vez
otro tipo de ajuste s lo sea.
E5emplo
De una muestra de ocho observaciones conjuntas de valores de dos variables ' e 0, se obtiene la
siguiente informacin:
Calcule:
1.
La recta de regresin de 0 sobre '. Explique el significado de los parmetros.
2.
El coeficiente de determinacin. Comente el resultado e indique el tanto por ciento de la variacin
de 0 que no est explicada por el modelo lineal de regresin.
3.
Si el modelo es adecuado, cul es la prediccin para x=4.
Solucin@
1.
En primer lugar calculamos las medias y las covarianza entre ambas variables:
Con estas cantidades podemos determinar los parmetros a y b de la recta. La pendiente de la
misma es b, y mide la variacin de 0cuando ' aumenta en una unidad:
Al ser esta cantidad negativa, tenemos que la pendiente de la recta es negativa, es decir, a
medida que ' aumenta, la tendencia es a la disminucin de 0. En cuanto al valor de la ordenada
en el origen, a, tenemos:
As, la recta de regresin de 0 como funcin de ' es:
2.
El grado de bondad del ajuste lo obtenemos a partir del coeficiente de determinacin:
Es decir, el modelo de regresin lineal explica el de la variabilidad de 0 en funcin de la de
'. Por tanto queda un de variabilidad no explicada.
3.
La prediccin que realiza el modelo lineal de regresin para x=4 es:
la cual hay que considerar con ciertas reservas, pues como hemos visto en el apartado
anterior,hay una razonable cantidad de variabilidad que no es explicada por el modelo.
E5emplo
En un grupo de 8 pacientes se miden las cantidades antropomtricas peso y edad, obtenindose los
siguientes resultados:
2esultado de las mediciones
edad .< \ .; .. / / .; .1
peso ?\ 1< ?. ?1 1; 3> 1> ?0
Existe una relacin lineal importante entre ambas variables? Calcular la recta de regresin de la edad en
funcin del peso y la del peso en funcin de la edad. Calcular la bondad del ajuste En qu medida, por
trmino medio, vara el peso cada ao? En cunto aumenta la edad por cada kilo de peso?
Solucin@
Para saber si existe una relacin lineal entre ambas variables se calcula el coeficiente de correlacin
lineal, que vale:
ya que
Por tanto el ajuste lineal es muy bueno. Se puede decir que el ngulo entre el vector formado por las
desviaciones del peso con respecto a su valor medio y el de la edad con respecto a su valor medio, ,
es:
es decir, entre esos vectores hay un buen grado de paralelismo (slo unos 19 grados de desviacin).
La recta de regresin del peso en funcin de la edad es
La recta de regresin de la edad como funcin del peso es
que como se puede comprobar, no resulta de despejar en la recta de regresin de 0 sobre '.
La bondad del ajuste es
por tanto podemos decir que el de la variabilidad del peso en funcin de la edad es explicada
mediante la recta de regresin correspondiente. Lo mismo podemos decir en cuanto a la variabilidad de la
edad en funcin del peso. Del mismo modo puede decirse que hay un de
varianza que no es explicada por las rectas de regresin. Por tanto la varianza residual de la regresin
del peso en funcin de la edad es
y la de la edad en funcin del peso:
Por ltimo la cantidad en que vara el peso de un paciente cada ao es, segn la recta de regresin del
peso en funcin de la edad, la pendiente de esta recta, es decir, b1=2,8367 Kg/ao. Cuando dos personas
difieren en peso, en promedio la diferencia de edad entre ambas se rige por la cantidad b2=0,3136
aos/Kg de diferencia.
$.#.1 Ecuaciones normales.
Como se requieren procesos de clculo o lgebra muy tediosa para determinar las expresiones de a y b
que minimizan esta suma, simplemente aseveramos el resultado de que estn dadas por las soluciones
de a y b del siguiente sistema de ecuaciones lineales:
En estas ecuaciones, llamadas ecuaciones normales de donde:
n = es el nmero de parejas de observaciones
x y = son las sumas de las = y T observadas
x
2
= es la suma de los cuadrados de las = T
y x = es la suma de los productos que se obtienen al multiplicar cada = por la T correspondiente.
Veamos un ejemplo para aplicar lo aprendido hasta ahora
Ajuste una recta de mnimos cuadrados a los datos de los siguientes datos, que pertenecen a los
nmeros de aos que han estudiado alemn en la escuela ciertos solicitantes de empleos de servicio en
el extranjero y las calificaciones que han obtenido en una prueba de dominio del idioma
Po!lacin
B
Po!lacin
C
3
1
1
<
?
?/
/\
/<
?\
\>
3
1
?
3
<
03
/3
\1
/?
1\
Solucin
Las sumas que se necesitan para hacer la sustitucin en las ecuaciones normales se obtienen al realizar
los clculos que se muestran en la tabla siguiente
(Existen muchas calculadores en las cuales se pueden acumular directamente las diversas sumas, de
manera que no se necesita cubrir todos los detalles. En realidad, las calculadoras arrojan los valores de a
y b casi directamente despues de registrar los datos y pulsar los botones correspondientes). Al sustituir
x = 35, = 697, x
2
= 133, x = 2 554 y n = 10 en las dos ecuaciones normales, se obtiene
698 = 10a + 35b
2 554 = 35a + 133b
y ahora se deben resolver estas dos ecuaciones lineales simultneas para determinar a y b. Existen
varias formas en las que se puede hacer esto ( la ms simple, quiz, es el mtodo de eliminacin).
Aplicando este mtodo, eliminaremos a al multiplicar las expresiones en ambos lados de la primera
ecuacin normal por 7, multiplicando las expresiones de ambos lados de la segunda ecuacin normal por
2 y despupes "restando iguales de iguales". Por tanto se obtiene
4879 = 70a + 245b
5108 = 70a + 266b
y por medio de la resta 229 = 21b. Por tanto, b = 229/21 = 1C.8C y si sustituimos este valor en la primera
de las dos ecuaciones originales, se obtiene 697 = 10a + 35(10.90), 697 = 10a + 381.5, 10a = 315.5 y por
ltimo a = 315.5/10 = "1.$$. Por tanto, la ecuacin de la recta de mnimos cuadrados es
= 31.55 + 10.90x
Como alternativa a este procedimiento podemos utilizar las formulas que siguen, que se obtienen cuando
se resuelven simblicamente las dos ecuaciones normales para determinar a y b:
Estas frmulas se pueden presentar en otras formas diversas. LA forma en que se dan aqu requiere de
monos divisores, y, por tanto, menos redondeo, pero apliquemos estas ecuaciones al ejemplo anterior
Solucin
Al sustituir n = 10 y las diversas sumas que se obtuvieron en la tabla anterior, se obtiene
y
La diferencia entre los valores de a que se obtienen por medio de los dos mtodos, 31.55 y 31.53, se
debe al redondeo.
Existe otra manera ms de determinar a y b que a menudo se utiliza por su comodidad. Primero se
calcula b usando la frmula anterior, y despus se sustituye su valor en la frmula que sigue:
que se obtuvo al resolver la primera ecuacin normal para determinar a. En relacin con el ejemplo
anterior donde se obtuvo b = 10.90, se obtendra de este modo
En la siguiente figura se muestra una impresin generada por computadora del problema de regresin
lineal anterior. Los valores que se obtuvieron de a y b son 31.533 y 10.905, que se dan en la columna con
el encabezado "COEFCENTE". Las diferencias entre los resultados obtenidos antes y la impresin se
deben al redondeo.
Cuando se ha determinado la ecuacin de una recta de mnimos cuadrados, se puede utilizar para hacer
predicciones
Utilice la recta de mnimos cuadrados 1 21!32 + 10!40x para determinar la calificacin de una
prueba de dominio de un solicitante que ha estudiado alemn dusrante dos aos.
Solucin
Al sustituir x = 2 en la ecuacin, se obtiene
= 31.53 + 10.90(2) = 53.33
y est es la mejor prediccin que se puede hacer en el sentido de los mnimos cuadrados.
Cuando hacemos una prediccin como sta, en realidad no podemos esperar que siempre obtengamos
la respuesta correcta ( de hecho,posiblemente no podamos estar correctos cuando la respuesta tenga
que ser nmero entero, como en el ejemplo y que la respuesta es 53.33). Por tanto, para hacer
predicciones significativas con base en rectas de mnimos cuadrados, debemos considerar a estas
predicciones como promedios o bien como esperanzas matemticas. nterpretando de esta manera, nos
referimos a rectas de mnimos cuadrados que nos permiten leer, o calcular valores esperados de T en
relacin con valores dados de = como lneas de re*resin. Mejor an, nos referimos a estas lneas
como lneas de re*resin estimadas, debido a que los valores de a y b se determinan sobre la base de
datos de muestra.
$.#. Estimacin de los coeficientes de re*resin.
$.$ Error estndar de estimacin.
$.& Coeficientes de determinacin y correlacin.
./&F*.*&0+& D& D&+&(M*0'.*/0
A fin de poder determinar qu tan bien predice la variable independiente a la variable
dependiente en el modelo estadstico, se necesita desarrollar varias medidas de
variacin. La primera medida, la variacin total , es una medida de la variacin de los
valores de T en torno a su media, T. En un problema de regresin, la variacin total en
T, la variable dependiente, se puede dividir en variacin e;plicada, o sea, la que es
atribuible a la relacin entre = y T y la variacin no e;plicada, atribuible a factores que
no sean la relacin entre = y T. Estas diferentes medidas de la variacin se pueden ver
en el siguiente esquema.
%edidas de variacin en re*resin
La variacin explicada representa la diferencia entre (el valor promedio de Y) y (el
valor de T que se predicir con la relacin de regresin). La variacin no explicada
representa la parte de la variacin en T que no se explica con la regresin y est
basada en la diferencia entre Ti (el valor real de T) y (el valor predicho de Y para
una X dada). Estas medias de variacin se pueden representar como sigue:
0ariacin total F variacin e;plicada V variacin no e;plicada
de modo que
variacin e;plicada F variacin total < variacin no e;plicada
Ahora, el coeficiente de determinacin r
2
, se puede definir como
es decir, el coeficiente de determinacin mide la proporcin de variacin que se
explica con la variable independiente para el modelo de regresin.
./&F*.*&0+& D& ./((&L'.*/0
Hasta ahora en esta unidad, se ha tratado de la prediccn de la variable dependiente T con base en la
variable independiente =. Adems, como se ha mencionado, la correlacin mide el grado de asociaci#n
entre las dos variables. En la +i*. #.#. se ilustran tres tipos diferentes de asociacin entre variables:
correlacin ne*ativa perfecta, la correlacin positiva perfecta y la no correlacin.
+i*. #.#.Tipos de asociacin entre variables
La fuerza de una relacin entre dos variables se suele medir con el coeficiente p de correlacin cuyos
valores van desde -1 para la correlacin ne*ativa perfecta hasta +1 para la correlacin positiva
perfecta.
El panel : de la +i*. #.#. ilustra una re*resin lineal ne*ativa perfecta, entre = y T. Por tanto, hay una
relacin perfecta uno a uno entre = y T, de modo que T disminuir en una forma perfectamente
predecible segn aumenta =. El panel ), ilustra un ejemplo en el cual no hay relacin entre = y T. Segn
aumenta = no hay cambio en T, de modo que no hay asociacin entre el valor de = y el valor de T. Por el
contrario, el panel C ilustra una correlacin positiva perfecta entre = y T. En este caso, T aumenta en una
forma perfectamente predecible segn aumenta =.
Para problemas orientados a la regresin, el coeficiente de correlacin (r) de la muestra, se puede
obtener de un modo fcil con la siguiente ecuacin como sigue:
de modo
En la regresin lineal simple, r toma el signo de b1. Si b1 es positivo, r es positivo. Si b1 es negativo r es
negativo. Si b1 es cero, r es cero.
Hasta ahora se ha interpretado el coeficiente de correlacin, desde el punto de vista de su regresin.
Como se menciono al principio de la unidad, la regresin y la correlacin son dos tcnicas separadas: la
regresin se ocupa de la prediccin y la correlacin, de la asociacin. Para muchas aplicaciones, al
investigador slo le interesa medir la asociaicin y la covarianza entre las variables y no usar una variable
para predecir otra. La formula anterior es muy apropiada cuando se hace el anlisis de correlacin junto
con la regresin. Pero, si slo se efecta el anlsis de correlacin en un grupo de datos, el coeficiente r
de correlacin de la muestra se puede calcular directamente con el uso de la siguiente formula:
o como alternativa
Veamos ahora un ejemplo, en el que se tabulan las pulsaciones contra la temperatura
:p3lsacionesSmin3to;
B
:dCent8rados;
C
.;;
\;
..?
??
..;
\?
/?
.<?
0?
>;
1;
3\.?
3>.?
30.?
1.
3>.?
3/.?
1.
3\
3\
Se pueden representar cada par de valores en un diagrama de coordenadas, obteniendo as un diagrama
de dispersin o nube de puntos. La observacin de este diagrama da una idea de la tendencia creciente
o decreciente de la nube.
Observamos en la figura que cuando las pulsaciones aumentan, la temperatura tiende a aumentar. Ahora
hay que cuantificar esta relacin. Para ello se dibuja sobre el diagrama el punto correspondiente a las p/m
y temperatura medias. Es el "centro de gravedad" de la nube de puntos, y por l pasan dos ejes que
dividen la nube en cuatro cuadrantes que denominaremos , , , y V. Cuando la nube de puntos se
concentra en los cuadrantes y , la nube es creciente
Definimos ahora un ndice que se comporte de forma diferente en los cuadrantes y que en los
cuadrantes y V. Para ello se define el producto:
para cada paciente. Este producto es positivo en los cuadrantes y , y negativo en los cuadrantes y
V. Sumando todos los productos y dividiendo por el nmero total de individuos obtenemos la covarianza
/p":
A partir de la covarianza, dividindola por el producto de las desviaciones tpicas de las dos variables,
obtenemos el coeficiente de correlacin de Pearson, representado por la letra r:
Este coeficiente toma valores de -1 a 1. En el ejemplo, su valor es de 0,89. A
continuacin es necesario estudiar la significacin estadstica del coeficiente de
correlacin. Para ello se obtiene su error estndar:
Cuando el valor de r hallado supere a este valor multiplicado por la t de Student con n+,
grados de libertad, diremos que el coeficiente de correlacin es significativo.
Al calcular el intervalo de confianza del coeficiente de correlacin se presenta un
problema. Este intervalo no es simtrico; un coeficiente de 0,8, por ejemplo, tendra un
lmite superior ms cercano por la derecha que por la izquierda. Por ello se realiza la
transformaci#n de .is5er! Cualquier coeficiente r puede ser transformado en un
coeficiente z mediante la expresin:
Siendo Ln el logaritmo neperiano. La transformada z sigue una distribucin normal. El
error estndar de z tiene por valor:
Para calcular el intervalo de confianza del coeficiente de correlacin deberemos, por
tanto: transformar el r hallado en la muestra en un valor z mediante una tabla de
conversin; calcular el error estndar de z6 multiplicarlo por 1,96 o 2,6 segn el nivel de
significacin deseado; sumar y restar a cada lado de z6 y, por ltimo, deshacer la
transformacin inicial, mediante la misma tabla de conversin.
En resumen se puede decir que coeficiente de correlacin es el porcentaje de la
suma de cuadrados del modelo respecto a la suma de cuadrados de la variable
dependiente.
El valor mximo para r
2
es 1, ya que lo ms que puede valer es cien por ciento. Este
valor mximo se dara solamente en la situacin en que el pronstico mediante el
modelo lineal fuera perfecto.
An en este caso cabra preguntarnos si el hecho de que el modelo result perfecto
para las zonas "dato", significa que lo ser para la zona "nueva"?; pero esta pregunta se
sale de nuestro alcance.
El valor ms pequeo posible para r
2
es 0. Esta situacin se presentar en el otro caso
extremo en el que el modelo es totalmente intil.
Las situaciones reales se presentan en medio de estos dos extremos. Usualmente r
2

toma valores entre 0 y 1. Un valor ms cercano a 1 quiere decir que el modelo es mejor.
No se puede establecer, en forma general, un buen valor para el porcentaje
representado por r
2
. El porcentaje ser bueno o malo dependiendo del nmero de datos
con los que se hizo la regresin y del nmero de variables independientes usadas. Es
preciso realizar una prueba de hiptesis para saber si el valor de r
2
es realmente distinto
de cero.
Esto se hace, tradicionalmente, usando una estadstica F que es una ligera
modificacin de r
2
. El resumen de esa prueba es el valor de una probabilidad, si esta es
pequea (usualmente pequea quiere decir menor 7ue 0!03) se dice que el modelo es
adecuado.
Otra forma de anlisis bivariado es la correlacin y regresin de variables numricas y discretas. El
concepto de correlacin y regresin se basa en el grado de relacin que poseen dos variables numricas
entre si.
El coeficiente de correlacin permite predecir si entre dos variables existe o no una relacin o
dependencia matemtica.
Supongamos que queremos estudiar la correlacin existente entre peso y altura de un grupo de personas
tomadas al azar. Sometemos los datos recogidos de peso y altura al anlisis de correlacin y
encontramos el coeficiente de correlacin entre ambas, que se representa con la letra r. El r = 0.78. Esto
significa que a mayor altura correspondera mayor peso.
Los coeficientes de correlacin r siempre oscilan entre valores de 1 y 1. El valor cero 0 significa que no
existe correlacin entre ambas variables. Un valor positivo indica que a incrementos en la variable A se
producen incrementos proporcionales en B y un valor negativo indica lo contrario.
Podemos graficar la correlacin entre las dos variables a travs de una grfica de dos ejes (abscisas y
ordenadas) cartesianos.
En el siguiente grfico observamos la correlacin entre potencia de motor de un automvil y consumo en
Litros por cada 100 Km. El r = 0.87 (correlacin positiva). (SPSS). Evidentemente a mayor potencia se
observa mayor consumo de combustible. El valor de significacin para ese r es de una p < 0.01. Esto
quiere decir que la correlacin entre potencia y consumo no es aleatoria.
En el siguiente grfico encontramos la relacin existente entre peso del automvil en kg. y aceleracin 0 a
100 Km. / hora en segundos. El r = - 0.56 con una p < 0.05. Esto significa que existe una correlacin
negativa significativa, entre peso del auto y respuesta de la aceleracin. Automviles ms pesados
presentan una respuesta ms tarda y viceversa. (SPSS)
Para interpretar el coeficiente de correlacin, Colton a dado los siguientes lineamientos generales:
Valor de r de 0 a 0.25 implica que no existe correlacin entre ambas variables.
Valor de r de 0.25 a 0.50 implica una correlacin baja a moderada.
Valor de r de 0.50 a 0.75 implica correlacin moderada a buena.
Valor de r de 0.75 o mayor, implica una muy buena a excelente correlacin.
Estos rangos de valores se pueden extrapolar a correlaciones negativas tambin.
Se debe tener cuidado al analizar la correlacin entre dos variables, de que ambas varen juntas
permanentemente. Esto parece redundante, pero es importante. Por ejemplo, si correlacionamos edad y
altura. La altura ir aumentando con la edad hasta un determinado punto en donde ya no aumentar ms.
COEFCENTES DE CORRELACN.
Un coeficiente de correlacin expresa el grado de relacin entre variables. Su valor o
magnitud fluctua de +1 (perfecta correlacin positiva) a -1 (Perfecta correlacin
negativa). Si X e Y denotan las dos variables que se consideran, un diagrama de
dispersin muestra la localizacin de los puntos (X,Y) en un sistema de coordenadas
rectangulares. Si todos los puntos en este diagrama de dispersin parecen encontrarse
cerca de una recta, como en (a) y (b) la correlacin se dice lineal. Si Y tiende a
incrementarse cuando se incrementa X, como en (a) la correlacin se dice positiva o
correlacin directa. Si Y tiende a disminuir cuando se incrementa X, como en (b) la
correlacin se dice negativa o correlacin inversa.
Si todos los puntos parecen estar cerca de una curva, la correlacin se dice no lineal y
una ecuacin no lineal es la apropiada para la regresin o estimacin, una correlacin
no lineal puede ser a veces positiva o negativa. Si no hay ninguna relacin entre las
variables (c) se dice que no hay correlacin entre ellas, es decir no estan
correlacionadas.
Asi por
ejemplo, la correlacin que existe entre inteligencia y rendimiento es positiva, dado a
que los alumnos ms inteligentes tienden a obtener altos rendimientos acadmicos.
Es importante recordar que mientras mas fuerte sea la correlacin entre dos variables
mayor el poder predictivo existente entre ellas. El trmino "correlacin", se utiliza
cuando las variables involucradas en la relacin son de tipo interval(proporcional), es
decir cuantitativas en sentido estricto, pero adems la "correlacin", busca mediante la
medida de co-variacin de variables, predecir a prtir del conocimiento de una de ellas el
comportamiento de la otra variable. Ver Anexo, Tabla de nterpretacin de Coeficientes.
El que una correlacin sea estadsticamente significativa quiere decir que conocemos la
probabilidad de error cuando sabemos que X e Y correlacionan. Es decir, conocemos el
mrgen de error en el sentido de que la relacin entre X e Y se deba simplemente a una
casualidad o al azar y no a factores causales estructurales que asocian a las variables.
Cuando decimos que hay una correlacin estadsticamente significativa entre las
expectativas que el maestro se hace sobre el rendimiento del estudiante y el
rendimiento que este efectivamente logra(por ejemplo r=0.68) las implicaciones
educativas que se derivan son importantes. El significado o valor pedaggico relevante
de este dato comienza por reconocer que: si el profesor tiene un nivel de expectativas
mas bien bajo sobre lo que su grupo escolar puede lograr en su aprendizaje, los
resultados del proceso de enseanza-aprendizaje tenderan a mostrar resultados bajos.
Para seleccionar adecuadamente el coeficiente de correlacin a calcular, es preciso
considerar la escala en la que se ha medido cada variable.
La siguiente tabla es una gua para seleccionar el coeficiente apropiado, segun las
variables que intervienen.
Para ver el grfico seleccione la opcin Bajar trabajo del men superior

La seleccin del coeficiente se puede hacer formulando las siguientes preguntas:
1. Son las dos variables de tipo categrico?. Si la respuesta es afirmativa pero
hay mas de dos categoras en la expresin de cada variable, no se puede
calcular coeficiente de correlacin. Se aplica Chi-cuadrado. Si las variables son
ambas categricas y dicotmicas, se aplica el coeficiente O (Phi). Si una es
dicotmica y la otra es ordinal se aplica correlacin biserial por rangos. Si una es
dicotmica y la otra est medida en una escala de intervalo se aplica la
correlacin punto biserial
2. Son las variables ordinales? si la respuesta es afirmativa, corresponde aplicar
la correlacin por rangos de Spearman. Si una variable es ordinal y la otra
dicotmica, se aplica correlacin biserial por rangos. Si una es ordinal y la otra
intervalar, se aplica correlacin por rangos de Spearman.
3. Se encuentran las dos variables medidas en una escala de intervalo?. Si tal es
el caso se aplica el coeficiente de correlacin de Pearson. Si una variable es de
intervalo y la otra ordinal se aplica correlacin por rangos de Spearman
Ejercicios.
Para los siguientes pares de variables escoja el tipo de coeficiente de correlacin que
usara:
a) El sexo de las personas vs si son religiosas o no lo son
b) El estado civil soltero o casado vs su estrato socio-econmico
c) El coeficiente intelectual vs rendimiento acadmico calificado en notas de 1 a 10
d) El coeficiente intelectual vs interes por el conocimiento evaluado con B,A,R,D
http://www.monografias.com/trabajos16/manual-estadistica/manual-estadistica.shtml
$.&.1 Coeficiente de determinacin de la muestra.
$.&. Coeficiente de correlacin de la muestra.
Coeficiente de correlacin
Una vez observado que en una variable bidimensional existe una cierta dependencia
entre las dos caractersticas o variables que la forman (nube de puntos y covarianza),
podemos precisar el grado de dicha dependencia.
- Si los puntos de la nube estuvieran todos sobre la recta de regresin se dira que
existe una dependencia funcional. De su estudio se encargan las funciones.
- Si los puntos no estn todos sobre la recta de regresin se dice que entre las variables
hay una cierta correlacin lineal. Este es el caso que nos ocupa. Para cuantificar el
grado de dicha correlacin se usa el:
Coeficiente de correlacin de Pearson. Si le llamamos r, su valor es:
Puede observarse que el si*no del coeficiente de correlacin es el mismo (ue el de
la covarian1a y puede deducirse que el valor del mismo esta comprendico
entre <1 y 1.
En la escena siguiente se puede observar la escena del e5ercicio #, donde se ha
aadido el valor del coeficiente de correlacin.
Se pueden deducir las siguientes conclusiones relativas al coeficiente de correlacin
(r):
- Su signo es el mismo de la covarianza, luego si r es positivo la dependencia es
directa y si es ne*ativo inversa.
- Si r se acerca a <1 o a V1/ la dependencia es fuerte y por tanto las
predicciones que se realicen a partir de la recta de regresin sern bastante
fiables.
- Si r se acerca a C la dependencia es d.bil y por tanto las predicciones que
se realicen a partir de la recta de regresin sern poco fiables.

Ejercicio 5.- Calcular el coeficiente de correlacin para la variable talla - peso y deducir
del valor del mismo el tipo de dependencia y la fiabilidad de las predicciones. (Sol: r =
0,90)
Correlacin por rangos
Correlacin por rangos
Hay varios modos de determinar la magnitud de un coeficiente de correlacin. El ms
sencillo es el coeficiente de correlaci#n por rangos, cuyo smbolo es p, (la letra griega
rho).
El primer paso para obtener p es ordenar a los sujetos por sus rendimientos en cada
uno de los tests analizados. Luego se comparan los rangos y de esta comparacin se
deriva el valor de p.
Si hubiese correlacin positiva perfecta, no habr diferencia entre los dos conjuntos de
rangos.
En cambio si la correlacin fuese algo menos que perfecta, las diferencias entre los
rangos no sera 0, en modo alguno. Cuanto mayores sean las disparidades de los
rangos, menor ser la relacin positiva entre los dos conjuntos de puntuaciones. Por lo
tanto, la medida de las diferencias del rango proporciona, evidentemente un modo de
medir el coeficiente de correlacin. Cuanto mayor sea la medida, menor ser la
correlacin positiva.
Siendo + 100 la correlacin positiva mayor posible, para obtener el coeficiente de
correlacin restaremos de cien la media de las diferencias entre los rangos. Cunto
ms elevada sea la media de las diferencias entre los rangos, menor ser el coeficiente
de correlacin.
Frmula: la cuanta de la correlacin es menos la media de las diferencias entre los
rangos, o
P = - sumatoria D2
___________
N
Frmula derivada por lgica, que es de estructura muy semejante a la obtenida
matemticamente.
Por diversas razones matemticas, la verdadera frmula es:
P = -6sumatoriad2
________________
N(N2 - )
El mismo razonamiento sirve para la correlacin negativa por rangos.
Coeficiente de correlacin para datos nominales
Correlacin de producto-momento
El coeficiente de correlacin ms frecuentemente usado es el coeficiente de correlaci#n
producto+momento.
La frmula es: r =sumatoria xy
__________
Noxoy
X e y son las desviaciones de las puntuaciones individuales de las medias del grupo, ox
es la desviacin standard de las puntuaciones en el test x y oy la desviacin standard
de las puntuaciones en el test y.
Por regla general, se prefiere el coeficiente de correlacin por rangos cuando el nmero
de casos es pequeo (15 20) y cuando hay poca ligazn entre los rangos. En otros
casos, el coeficiente de correlacin de p-m resulta ms conveniente.
Un error lgico que frecuentemente se comete en la interpretacin del coeficiente de
correlacin es el argumento de causa y efecto. Se admite a menudo que si dos
variables estn muy correlacionadas, una es la causa de la otra. No obstante, la
correlacin elevada entre dos fenmenos indica simplemente que ambos son causados
por un tercer factor y no que un fenmeno cause o influencie el otro. En estadstica se
usa, a menudo el coeficiente de correlacin en problemas de los que se sabe que no
hay relacin causal entre los dos conjuntos de medida que se correlacionan.
Errores de medida
El error se debe a un instrumento de medida inexacto, a un mtodo imperfecto de
aplicar el instrumento, a nuestra manera inadecuada de leerlo o registrarlo o a cualquier
otro factor.
En la ciencia, por depender en gran parte del raciocinio de las mediciones, se tiene
mucho cuidado con los errores de medida y se ha aprendido mucho acerca de su
naturaleza, origen y control. En los casos que se ha sido incapaz de eliminarlos, se han
desarrollado tcnicas que permiten estimar el grado de error. Sabiendo la magnitud del
error se puede enunciar el grado de confianza en las conclusiones basadas en las
medidas. El estudio de los errores de medida es uno de los bsicos de la estadstica.
Fiabilidad
No existe un instrumento de medida absolutamente perfecto. Hasta el instrumento de
medida ms simple, la regla, no est libre de error. Algunos instrumentos de medida
nos dan errores mayores que otros.
La fiabilidad de un aparato de medida(incluido su mtodo de aplicacin) puede definirse
como el grado en 7ue medidas repetidas de la misma cantidad, con el mismo
instrumento de medida, dan las mismas lecturas!
La fiabilidad medida por correlacin: el coeficiente de correlacin nos da un ndice
num8rico 7ue expresa el grado de fiabilidad de una prueba! Cuando se usa con este fin,
el coeficiente de correlacin recibe el nombre de coeficiente de fiabilidad!
Veracidad de las formas comparables: La mayora de las pruebas psicolgicas constan
de gran nmero de elementos, problemas y preguntas. La correlacin de las dos formas
comparables nos dara la fiabilidad de una y otra forma.
El mtodo de las formas comparables evita el problema de la memoria y quizs el de
fastidio, pero deja intacto el del tiempo. Las dos formas se aplican en tiempos
diferentes, y durante el intervalo pueden suceder muchas cosas que dificultan la
interpretacin de la correlacin entre las dos formas comparables.
Fiabilidad compartida: la base del mtodo de fiabilidad bipartida es idntica a la del de
formas comparables. Este mtodo suele llamarse del " coeficiente de pares-impares y
cuenta con dos ventajas: primera, las dos subpruebas(pares y nones) se hacen a la
vez, en las mismas condiciones de motivacin, idnticas condiciones de examen y con
el mismo grado de atencin. Segunda, por haber divido la prueba de pares-impares,
hemos garantizado la comparabilidad de formas, no slo en cuanto al contenido, sino
tambin en cuanto al contenido, sino tambin en cuanto al modo de administracin.
Estos y otros mtodos pueden proporcionarnos una valiosa informacin sobre la utilidad
de una prueba como instrumento de medida. Sin embargo, saber que una prueba es
fiable no basta para permitirnos apreciar su valor como instrumento de medicin Puede
ser muy fiable y por el contrario, constituir un mal instrumento de medida, por carecer
de validez.
Validez
Los trminos de "fiabilidad y "validez se usan indistintamente en el lenguaje vulgar. No
obstante, en la teora de la medicin, tienen un significado distinto. El estadstico
preocupado por el problema de la fiabilidad e un instrumento con lo que mide. Cuando
le interesa la cuestin de la validez, pregunta si el instrumento mide lo que l quiere
medir. Un instrumento puede hacer medidas acordes(puede tener fiabilidad), pero
acaso no mide lo que se quiere medir(acaso tiene poca validez). Pero a la mayora de
los tests que tratan de medir fenmenos ms complejos no se les adscribe la validez
con tanta facilidad. En primer lugar, la validez, lo mismo que la fiabilidad, no es asunto
de todo nada. Una prueba tiene grados de validez. El grado de validez de las preguntas
de clase slo estara influido por la comprensin por parte del alumno de los principios
psicolgicos. En este caso diramos que las preguntas tienen validez perfecta como
medida de la comprensin de principios psicolgicos; pero, ms probablemente, la
puntuacin en las preguntas es la resultante de la comprensin psicolgica, ms la
aptitud memorista. La prueba tiene alguna validez para la comprensin psicolgica y
alguna otra para la capacidad memorista, pero no es una prueba "pura de ninguna de
las dos. Como en la fiabilidad, necesitamos algn medio para expresar el grado de
validez de un instrumento de medida de un instrumento de medida y, de nuevo como en
aquella, el coeficiente de correlacin nos facilita ese medio.
La validez medida por correlacin: Es evidente que una prueba es vlida en el grado en
que sus medidas se correlacionan con lo que mide. Cuando se usa de este modo el
coeficiente de correlacin se llama coeficiente de validez!
El principio general para determinar la validez de una prueba es bastante simple,
correlacionamos sus puntuaciones con su criterio. La dificultad consiste en que,
frecuentemente, no podemos hallar un criterio con el que compararlas. Por ejemplo se
quiere medir la validez de una prueba de inteligencia. Se pude obtener las puntuaciones
del test con mucha facilidad, pero qu servir de criterio de "inteligencia Las
calificaciones escolares? El dinero ganado en la vida real? La originalidad y
creatividad? La primaca en cuestiones sociales? Personas diferentes sugeriran
distintos criterios y algunos de ellos plantearan, por s mismos, problemas e medida.
Se han hecho muchos intentos de resolver el problema del criterio. Entre las tcnicas
ms corrientes est el llamado m8todo del "grupo conocido9!
Grupos conocidos y validez: No hay puntuaciones-criterio de originalidad y creatividad
fcilmente disponibles.
Una prueba puede tener gran fiabilidad y poca validez, en el sentido que no mida lo que
intentbamos que midiese. En cambio, una prueba de mucha validez no puede tener
poca fiabilidad. Las pruebas poco fiables no pueden compararse consecuentemente
con n conjunto de puntuaciones-criterio, porque sus medidas son, en gran parte,
errneas y por consiguiente deben tener poca validez.
$.&." Error estndar del coeficiente de re*resin.
$.3 Problemas prcticos de a5uste de curvas.
)ttp$IIJJJ.aulafacil.comI6ursoEstadisticaI#eccQ1Qest.)tm
)ttp$IIJJJ.gestiopolis.comIrecursosIdocumentosIfulldocsIgerI)istograma.)tm
)ttp$IIciencias.!c.inter.eduIo)ernandIinternetIdrmg.;.;IestadisticaIgraficasItsld;...)tm
)ttp$IIt)ales.cica.esIrdI2ecursosIrd>>Ied>>Q;</\Q;.Iestddes1.)tml
)ttp$IIserver<.sout)linG.com.arIvapIdatos.)tm
)ttp$IIJJJ.liccom.edu.u'I!edeliaIcursosImetodosImaterialIestadisticaIvardcuanti.)tml
)ttp$II.1\.<.0..;.\3IestadisticaIgraficas.)tm
)ttp$IIJJJ.dosc)ivos.comI&tat.I&tat;.)tm
)ttp$IIJJJ.itc)i)ua)ua.edu.m*IacademicIindustrialIsa!aticoritaIinde*.)tml
)ttp$IIJJJ.ua.m*ImatematicasIestadisticasI*u1.)tml
)ttp$IIJJJ.itc)i)ua)ua.edu.m*IacademicIindustrialIsa!aticoritaIinde*.)tml
)ttp$IIserver<.sout)linG.com.arIvapIP2B+7+E#ED7D.)tm
)ttp$IIJJJ.itc)i)ua)ua.edu.m*IacademicIindustrialIsa!aticoritaIinde*.)tml
)ttp$II)tml.rincondelvago.comIvaria!lesQaleatorias.)tml
)ttp$IIpersonal?.iddeo.esIzttITemIt.\dvaria!ledaleatoriaddiscreta.)tm
)ttp$IIpersonal?.iddeo.esIzttITemIt.>ddistri!uciond!inomial.)tm
)ttp$IIJJJ.gestiopolis.comIrecursosIe*pertoIcatse*pIpagansIecoI11Idistripoisson.)tm
)ttp$IIes.JiGipedia.orgIJiGiIDistri!uci@63@+3ndPoisson
JJJ.itc)i)ua)ua.edu.m*IacademicIindustrialIsa!aticoritaIinde*.)tml
)ttp$IIstri*.ciens.ucv.veIKteorpro!IguiasteoricasIcap1Icap1.)tml
)ttp$IIJJJ.itc)i)ua)ua.edu.m*IacademicIindustrialIsa!aticoritaIinde*.)tml
)ttp$IIJJJ.mundofree.comIfsanc)ezfIpro!dest.)tm
)ttp$IIpersonal?.iddeo.esIzttITemIt<.ddistri!uciondnormal.)tm
)ttp$IIJJJ.itc)i)ua)ua.edu.m*IacademicIindustrialIsa!aticoritaIinde*.)tml
)ttp$IIes.geocities.comIriotortoIregrIregrdsimpleIregrdsimple.)tm

También podría gustarte