Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Estadstica descriptiva
Como inicio diremos que la estadstica es el estudio de los fenmenos aleatorios. Aleatorio
es lo mismo que al azar.
La estadstica descriptiva es aquella parte de la estadstica que nos proporciona una serie de
conceptos y de tcnicas orientadas a la reduccin de la informacin numrica. Se encarga de la
descripcin de ciertas caractersticas pertenecientes a la misma. En dnde se concentran los
datos, con qu dispersin.
Grfica. Representacin por medio de lneas, rectngulos (barras), puntos, en los ejes
coordenados. Como ejemplos considere los siguientes casos.
Ciruga de Casos
atendidos
Mano 160,000
Reparacin de desgarres 150,000
Remocin de tumores 100,000
Aumento de senos 75,000
Accidentes industriales 70,000
Prpados 57,000
Nariz 55,000
Eliminacin de 45,000
quemaduras
Reconstrucciones 45,000
Faciales 40,000
Una tabla que recoge informacin de una variable en funcin del tiempo se llama serie de
tiempo.
Pgina 1
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
La figura se puede representar por rectngulos, llamados diagrama de barras, de una serie
de tiempo, el ancho de la barra no tiene importancia, las barras no deben tocar una con otra.
Tambin se le llama diagrama de Pareto. Los nmeros de las hectreas habitadas se pueden
colocar por encima de cada barra, no siempre deben de ir.
Si las grficas antes presentadas suelen ser comunes, se puede emplear otro grfico
llamado pictograma, se emplea para representar datos en forma ntida para el pblico lector.
Encierra una dosis de originalidad y oficio del trabajo a presentar.
Existen otras formas de grficas, en las cuales se involucran dos o ms medidas, se pueden
hacer comparaciones, entre tipos de cosechas, el tiempo que se lleva efectuar una tarea, entre
otras.
La tabla que a continuacin se muestra, registra el tiempo en horas y minutos que debieron
trabajar los conductores de cinco ciudades para comprar comida chatarra, para una familia de
cinco miembros. Las cifras corresponden a los aos 2004 y 2006.
Las grficas pueden ser por trazo comparativo, ya sea por puntos unidos por una lnea
continua o por barras.
Diferente tipo de grafico, puede ser por barras en forma de complemento, incluyendo el total
producido por periodo o por medio de un porcentaje, este ltimo solo presentar barras de tamao
igual, al 100%. Se puede obtener con la aplicacin de la siguiente expresin:
Cprod
1= Cprod + Cprod
1
( 100 )
1 2
1
2=100
Pgina 2
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Otro forma es usando barras horizontales, en estas se comparan entre s varios datos, como
por ejemplo, el rea ocupada por los continentes alrededor del mundo, los tipos de alimentos del
cuadro bsico de nutricin.
Como se podr dar cuenta, slo hemos tratado grficas en las que se incluyen puntos unidos
por lneas, barras; pero presentamos otro tipo de grfico que es llamado diagrama de pastel
[queso, pie, pizza, circular].
Para construirlo, hacemos que el total de los encuestados por edad en este caso, equivale a
360
0.36
1000
360. As, 1000 encuestados corresponde a la operacin de: /preferencias de
equipo.
Existen ms tipos de grficos y cada usuario de la estadstica descriptiva puede elegir el que
ms le agrade, siempre y cuando los datos que se presentan sean claros y le den buena
informacin del estudio realizado.
Muestreo. La teora del muestreo estudia la relacin entre una poblacin y los datos
tomados de ella. Como dichos datos muestreados u obtenidos se pueden estimar magnitudes tales
como la media y la varianza [variancia], llamados comnmente parmetros de la poblacin. De
estos parmetros y de su conocimiento de las magnitudes (tamao) sobre la muestra se dice que
tenemos un estadstico o estadstica de la muestra.
1.2 Medidas de tendencia central. Media, mediana, moda, media geomtrica, media armnica
y media ponderada
Esta teora es tambin til para determinar si las diferencias observadas entre dos muestras
son debidas a variaciones fortuitas (en ocasiones) o si son realmente significativas.
Las medidas de tendencia central. Son valores numricos que representan la ubicacin
central de los datos; media [ x , , E(x)], mediana [Me], moda [Mo], cuartles [Qi], decles [Di],
Percentiles o Percentiles [Pi].
1 RECORD, deportivo, pp. 20, Paola Nez, Consulta a mil mayores, El tamao de la
muestra para elaborar el estudio de Mitofsky fue de mil mexicanos, mayores de 18 aos con
credencial para votar, y fue elaborada entre el 17 y el 22 de enero de 2008, con entrevistas
en viviendas particulares.
Pgina 3
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
La media aritmtica, o tambin conocida como media, es el valor esperado del conjunto de
medidas observadas en el estudio. Se define como:
xi
=E ( x )=x = i=1
n
Por ejemplo: Se han tomado diez medidas del largo de las puertas, para casa habitacin,
producidas en una carpintera. Las medidas fueron las siguientes:
1.55 1.53 1.58 1.54 1.60 1.62 1.61 1.52 1.50 1.51
Encuentre el valor promedio o media aritmtica de los datos y grafique los datos encontrando el
valor de la media en la grfica.
Considera ahora que se tienen ms lecturas de una observacin y que en ocasiones hay
datos que se repiten, esto debido a la casualidad; para ello se emplea la siguiente expresin:
( f i xi )
=E ( x )=x = i=1
n
LsLi
Ic=
Nc
Ic_intervalo de clase; Ls_lmite superior o dato mayor; Li_lmite inferior o dato menor; NC_nmero
de clases, un valor entre 5 y 20.
Ejemplo. Los datos siguientes representan el nmero de ciclos transcurridos hasta que se
presenta una falla en una prueba de piezas de aluminio sujetas a un esfuerzo alternamente
repetido de 21,000 psi, a 18 ciclos por segundo:
1115 1567 1223 1782 1055 798 1016 2100 910 1501
Pgina 4
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
1310 1883 375 1522 1764 1020 1102 1594 1730 1228
1540 1203 2265 1792 1330 865 1605 2023 1102 990
1502 1270 1910 1000 1608 2130 706 1315 1578 1468
1258 1015 1018 1820 1535 1421 2215 1269 758 1512
1315 845 1452 1940 1781 1109 785 1260 1416 1750
1085 1674 1890 1120 1750 1481 885 1888 1560 1642
Para ordenar los datos se requiere de los intervalos de clase, una vez obtenido el tamao del
intervalo se obtiene el nmero de frecuencias en cada clase. Para la parte de grficas se necesita
obtener un punto medio [o marca de clase] el cual ser el representante de cada clase y los datos
de observaciones pasan a segundo trmino.
Lsc + Lic
PM =
2
PM i f i
x = i=1
n
Modelo matemtico:
N
Me=Li+
( 2
f )
Ic
f med
Me_mediana, Li_lmite inferior donde est la mediana, N_nmero de datos, f med_frecuencia de la mediana, Ic_intervalo de
clase, f_suma de las frecuencias antes de la mediana.
Pgina 5
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
La moda de un conjunto de nmeros es el valor que ocurre con mayor frecuencia; es decir, el
valor ms frecuente. La moda no podr existir, e incluso no ser nica en el caso de existir 5.
La moda es la observacin que se presenta con mayor frecuencia en la muestra 6.
Modelo matemtico:
d1
Mo=Li+ ( )
d 1+ d 2
Ic
Mo_moda, Li_lmite inferior de la moda, d1_exceso de la frecuencia modal sobre la clase inferior, d2_exceso de la frecuencia
modal sobre la clase superior, Ic_intervalo de clase.
Cuando los datos se dividen en cuatro partes iguales, los puntos de divisin se conocen
como cuartles. El primer cuartl inferior, q 1, es el valor que tiene aproximadamente el 25% ( ) de
los datos u observaciones por debajo de l; el segundo cuartl se empata con el valor de la
mediana, pues en este se halla el 50% (2/4 ) de los datos. El 75% ( ) de los datos se
encuentran en el tercer cuartl, q 3, tambin nombrado cuartl superior. Al igual que en el caso de la
mediana, es posible que los cuartles no sean nicos7.
204 228 252 300 324 444 624 720 816 912 1176 1296 1392 1488 1512 2520 2856
3192 3528 3710
Pgina 6
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
N 2N 3N
q =L +
( 4
f )
I ; q =L +
( 4
f )
I ; q =L +
( 4
f )
I .
1 i c 2 i c 3 i c
fq 1
fq 2
fq 3
Los valores que dividen en diez partes iguales al conjunto de observaciones de denominan
decles, y se pueden obtener de la misma manera que los cuartles.
f
d =L +
( 10
)
I
i i c
fd i
Los valores que se obtienen de dividir en cien partes iguales a la coleccin de datos se
denominan percentiles.
f
p =L +
( 100
)
I
i i c
fp i
1.3 Medidas de dispersin. Amplitud, rango, desviacin media, desviacin estndar, varianza,
coeficiente de variacin
Medidas de dispersin. Valores numricos que indican que tan separados del centro estn
mis datos; varianza o variancia [s2 para pequeas muestras, 2 para grandes muestras]; Rango [R];
desviacin estndar [s, ], desviacin media [MD].
Las medidas de dispersin o variacin de datos nos da una idea de cuan tan espaciados se
encuentran stos. Entre estas medidas se encuentra la llamada Rango (traduccin: intervalo),
desviacin media, varianza o variancia y la desviacin estndar.
Rango. Es el largo que ocupa el conteo de datos u observaciones. El modelo matemtico es:
R=V M V m=V s V i
De los ejercicios que a continuacin se muestran obtenga el rango de cada uno de ellos.
Pgina 7
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
|x i x|
MD= i=1
n
x
xi_dato i-simo de la tabla, _el valor de la media, n_nmero de datos.
Ejercicio. Se han tomado las medidas de diez cables elctricos, para uso telefnico, para ser
instalado en cada aparato fabricado por la compaa ACME electrnicos, los cuales estn en
metros:
13.9 13.5 12.9 12.8 13.2 13.7 12.8 12.7 12.9 12.6
Varianza o variancia. Est definido como el promedio del cuadrado de las distancias entre
cada observacin y la media del conjunto de observaciones. Se denota como el modelo
matemtico siguiente:
( x i x )2
Var ( x )=s 2= 2= i=1
( n1 )
Ejemplo. Calcule la media y la varianza de las siguientes millas recorridas por galn de
combustible, obtenidas en 20 recorridos, en permetro citadino con un automvil de tamao
intermedio.
19.7 21.5 22.5 22.2 22.6 21.9 20.5 19.3 19.9 21.7 22.8 23.2 21.4 20.8 21.4 20.8 19.4
22.1 23.4 21.6 21.3 20.9
Para cuando se tienen los datos agrupados se considera el punto medio (PM) o marca de
clase, de cada intervalo en lugar de considerar las xi.
n
( PM i x )2 f i
2 i=1
s=
( n1 )
Medidas de tendencia central. La media se puede considerar tanto para muestras como para
poblaciones, del mismo modo, pero se puede denotar de forma diferente; la media muestral se
x
denota por y la media poblacional 8.
Pgina 8
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Pgina 9
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
2. Probabilidad
La probabilidad es un mecanismo por medio del cual pueden estudiar sucesos aleatorios,
cuando stos se comparan con fenmenos determinsticos.
A B = {x xA y xB}
A = Ac = A = {x x A}
Ejercicios:
1. Halla todos los subconjuntos que se pueden formar del conjunto T = {5, d, 8, 2, a, v, 3, k}.
Pgina 10
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Operaciones.
AB BCA MCB (M A) (C B)
4. Suponga que en una familia hay dos nios de diferente edad y que nos interesa el gnero
de stos nios. Se utiliza F para designar una nia y una M para indicar un nio y un par FM para
denotar que el nio con ms edad es del gnero femenino y el ms pequeo del gnero masculino.
Existen entonces puntos en el conjunto S de las observaciones posibles S = {FF, FM, MF,
MM}.
Sea A el conjunto de todas las posibilidades que no incluyen varones; B, el subconjunto que
contiene dos varones, y C el subconjunto que contiene al menos un varn. Liste los elementos de
A, B, C, A B, A C, A C, B C, B C, C B.
5. De una encuesta aplicada a 60 estudiantes que asisten a la universidad, 9 habitan fuera del
recinto universitario, 36 son estudiantes de licenciatura y 3 son estudiantes de licenciatura que
habitan fuera del recinto.
a) Encuentre el nmero de estudiantes, de licenciatura, que habitan fuera del recinto o que
satisfacen ambas caractersticas;
b) Encuentre el nmero de estudiantes de licenciatura y que habitan en el recinto;
c) Encuentre el nmero de estudiantes que ya tienen licenciatura y que habitan en el recinto.
Definicin. Un experimento es el proceso por medio del cual se obtiene una observacin.
Pgina 11
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Eventos de inters.
Seguro, aquel que incluye todos los resultados posibles;
Mutuamente excluyente o disjunto, si sus resultados no tienen nada en comn, con una
interseccin formal el conjunto es vaco.
Podemos ver que el espacio muestral S, asociado con el experimento del lanzamiento de un
dado, consta de seis puntos muestrales que corresponden a los eventos simples, E1, E2, E3, E4, E5,
E6.
ya que no se puede descartar a ningn entero como posible resultado del conteo de bacterias.
Cuando se realiza un experimento una sola vez, se puede observar uno y slo un evento
simple. Los eventos compuestos se pueden considerar como agrupaciones de puntos muestrales
como uniones de los conjuntos con puntos muestrales correspondientes a los eventos simples
apropiados.
Pgina 12
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Definicin (de frecuencia relativa). Si un experimento se repite n veces bajo las mismas
nB
condiciones y nB de los resultados son favorables a un atributo B, el lmite de n conforme n se
Definicin. Supngase que un espacio muestral S est asociado con un experimento. A cada
evento E definido en S, se le asigna un nmero, P(E), denominado probabilidad de E; de tal
manera que se cumplen los axiomas siguientes:
i) P(E) 0; La probabilidad del evento siempre es mayor o igual a cero.
ii) P(S) 1; La probabilidad del espacio es siempre equivalente a uno.
iii) Si E1, E2, E3,... forman una sucesin de eventos de S que se excluyen mutuamente,
P( E )
i 1
i
Obsrvese que la definicin solamente expresa cules son las propiedades que tiene que
cumplir una probabilidad, pero no expresa como asignar las probabilidades especficas a los
eventos.
Pgina 13
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Ejercicio. En toda el rea metropolitana los autos que circulan se encuentra que sus placas de
circulacin tienen tres letras y tres dgitos.
a) Cul es el nmero total, si ninguna letra de placas posible, puede usarse ms de una
ocasin?
b) Cul es el nmero total sin esta restriccin?
c) Cul es la probabilidad de que adquiera un auto con las placas 422THU?
Ejercicio. Considere que un auto llega a la interseccin del camino, puede dar vuelta a la
derecha a la izquierda o seguir de frente. Un experimento consiste en observar a dos vehculos al
pasar por dicha interseccin.
(a) Cuntos puntos muestrales hay en el espacio S? Obtenga una lista de ellos;
(b) Cul es la probabilidad de que un auto d la vuelta a la izquierda? Suponiendo que todos
los puntos muestrales son equiprobables10;
Ejercicio. Se selecciona una familia que posee dos automviles, y para el ms nuevo y el
ms viejo observamos si fue fabricado en los Estados Unidos, Europa o Asia.
(a) Cules son los posibles resultados de este experimento?
(b) Cules resultados estn contenidos en el evento de que un automvil sea Europeo y
otro Americano?
(c) Cules resultados estn contenidos en el evento de que por lo menos uno de los dos
automviles sea extranjero?
Pgina 14
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Una permutacin es un acomodo de datos en cada evento sin que se repita alguna de sus
formas.
Solucin:
n = 10 dgitos; r = tomados 4 a la vez;
r 10 ! 10 9 8 7 6 !
Pn= = =( 10 ) ( 9 ) ( 8 ) ( 7 )=5040
6! 6!
n
n!
N=
n1 ! n2 ! nk !
; en donde n i=n
i=1
Solucin:
N = 20; n1 = 6; n2 = 4; n3 = 5; n4 = 5.
Pgina 15
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
13
16 ! 2.092278989 10
N= = =30270240
2! 4 ! 5 ! 5 ! 691200
De aqu que
30270240
p ( A )= =0.00309
9777287520
n!
()
Cnr = n =
r ( nr ) ! r !
Ejercicios.
2.4 Sea A y B dos eventos cualquiera de S. Emplese un diagrama de Venn para demostrar
que P(A B) = P(A) P(A B).
2.5 Una familia tiene tres hijos. Determinar todas las posibles permutaciones, con respecto al
gnero de los hijos. Bajo suposiciones adecuadas, cul es la probabilidad de que, exactamente,
dos de los hijos sean del mismo gnero?, Cul es la probabilidad de tener un varn y dos
mujeres?, Cul es la probabilidad de tener hijos del mismo gnero?
2.8 Una agencia automotriz recibe un embarque de 20 automviles nuevos. Entre stos, dos
tienen defectos. La agencia decide seleccionar, aleatoriamente, dos automviles de entre los 20 y
aceptar el embarque s ninguno de los dos vehculos seleccionados tiene defectos. Cul es la
probabilidad de aceptar el embarque?
Pgina 16
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
2.13
Supngase que se va a seleccionar una muestra aleatoria de tamao dos de un lote de 100, y que
se sabe 98 de los 100 artculos se encuentran en buen estado. La muestra se toma de manera tal
que el primer artculo se observa y se regresa antes de seleccionar el segundo artculo. Cul es la
probabilidad de seleccionar,
(a) Dos piezas sin defecto. R: 0.96 96%
(b) A lo ms una con defecto. R: 0.98 98%
(c) Dos con defecto. R: 0.1 * 10-3.
2.18 Una aerolnea tiene seis vuelos diarios de Nueva York a California y siete vuelos de
California a Hawi. Si los vuelos se hacen en das separados, cuntos diferentes arreglos de
vuelos puede ofrecer la aerolnea de Nueva York a Hawi?
2.19 Una operacin de montaje en una empresa manufacturera requiere tres pasos que se
pueden realizar en cualquier orden. De cuntas maneras se puede hacer el montaje?
2.21 Cierta marca de automviles tiene cinco modelos diferentes, con cuatro tipos de motores,
con dos tipos de transmisiones, y en ocho colores.
a) Cuntos coches tendra que adquirir un distribuidor si quiere un automvil por cada combinacin
modelo-motor-transmisin?
b) Cuntos coches tendra que tener en existencia un centro de distribucin si almacenara los
coches de todos los colores disponibles para cada combinacin de (a)?
Pgina 17
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
experimentos habra que hacer si quisiera incluir todas las posibles combinaciones de presin,
temperatura y tipos de catalizador?
2.28 Cinco empresas E1, E2, E3, E4, E5, hacen propuestas con respecto a tres contratos
separados, C1, C2 y C3. Una empresa slo puede obtener a lo ms un contrato. Los contratos son
completamente diferentes, de tal forma que la asignacin de C1 a E1 se debe diferenciar de la
asignacin de C2 a E1.
a) Cuntos puntos muestrales hay en total en este experimento que trata de la asignacin de los
contratos a las empresas?
b) Encuentre la probabilidad de que se le conceda un contrato a la empresa E3, bajo el supuesto de
que los puntos muestrales son equiprobables.
2.32 En 1976 la Junta de Asesores para las Relaciones Humanas de Gainsville, Florida,
formada por ocho personas, consider la denuncia de una mujer que se quej de discriminacin
por parte de una compaa local, por el hecho de ser mujer. La Junta, compuesta por cinco mujeres
y tres hombres, vot 5 a 3 en favor de la demandante, las cinco mujeres votaron a favor y los tres
hombres en contra. El abogado representante de la compaa apel la decisin de la Junta
alegando parcialidad de los miembros de sta de acuerdo con sus sexos. Si no hubiera parcialidad
por parte de la Junta, sera razonable concluir que cualquier grupo de cinco miembros de la Junta
votara a favor de la demandante con la misma probabilidad. Si esto fuera cierto, cul sera la
probabilidad de que el voto se dividiera d acuerdo con los sexos (las cinco mujeres a favor, los
tres hombres en contra)?
p ( A B)
p ( A|B )=
p (B )
Supngase que un experimento se repite una cantidad de veces, N, y que se obtienen como
resultados ambos eventos, A y B, A B, n11 veces; A y no B, A B, n21 veces; B y no A, A B,
n12 veces, y ni A ni B, A B, n21 veces. Estos resultados se representan en la siguiente tabla:
Pgina 18
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
A A
B n 11 n12
B n21 n22
p ( A B) p ( A B)
p ( B| A )= ; p ( A|B )= .
p ( A) p (B )
Definicin. Dos eventos A y B son independientes s P(A B) = P(A) P(B). Si esta ocurrencia
no se satisface, los eventos son dependientes. Ntese que la definicin es equivalente a expresar
que los eventos A y B son independientes s P(A B) = P(A) P(B A) = P(B).
Ejemplo: En una encuesta a 159 personas, se ha encontrado sus caractersticas con respecto
a su hbito de fumador y su sexo. Sea el espacio muestral, la poblacin de adultos de la encuesta,
que se divide en los siguientes eventos: fumador A1, no-fumador A2, hombre B1, mujer B2. Los
eventos en S pueden representarse como sigue:
B1 B2
A1 24 77
A2 19 39
Ntese que 24 de los 159 adultos son hombres que fuman, por lo que son poseedores de los
atributos A1 y B1. Supngase que se desea determinar la probabilidad de ocurrencia simultnea de
los eventos A1 y B2. Mediante el empleo de la interpretacin de frecuencia relativa puede
argumentarse que, dado que exactamente 77 de los 159 adultos poseen ambos, fumador y mujer,
la probabilidad es
77
0.4843
159
.
Esta ltima recibe el nombre de probabilidad conjunta, puesto que se insiste en la probabilidad
de resultados comunes a ambos eventos A1 y B2.
Pgina 19
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Supngase que ahora el inters recae en determinar la probabilidad Ai, sin considerar
cualquier otro evento Bj del espacio muestral S. Para especificar, supngase que se necesita la
probabilidad del evento A2. Haciendo uso de nuevo de la interpretacin de frecuencia relativa, el
nmero de personas no fumadoras A2, es 19 + 39; de esta manera se tiene
P ( A2 )
19 39 0.3648
159
Este tipo de probabilidad se conoce como probabilidad marginal porque para determinarla se
ignoran una o ms caractersticas del espacio muestral.
El argumento descansa sobre la interpretacin de frecuencia relativa. Sin embargo, una vez el
evento mujer ha ocurrido, ste reemplaza a S como espacio muestral de inters. Por lo tanto, la
probabilidad de tener fumador, A1, es el nmero de mujeres que fuman 77, entre el nmero total de
estas (77 + 39)
77
p ( A 1|B 2) = =0.6638
77+39
donde la barra vertical se lee dado que, y separa al evento A1, cuya probabilidad est condicionada
a la previa ocurrencia del evento B2. Esta recibe el nombre de probabilidad condicional de A1 dada
la ocurrencia B2.
Ejemplo: En cierta ciudad, 40% de los votantes son republicanos y 60% son demcratas; 70%
de los republicanos y 80% de los demcratas estn a favor de una emisin particular de bonos. Al
seleccionar al azar un votante de la ciudad, Cul es la probabilidad de que est a favor de la
emisin de los bonos?
Ejercicio: Una gran tienda de departamentos vende camisas deportivas en tres tallas
(pequea, mediana y grande) y tres modelos (a cuadros, estampadas y de franjas) y dos largos de
manga (corta y larga). Las siguientes tablas dan las proporciones de camisas vendidas que caen
en varias combinaciones de categoras.
Manga corta
Modelo
Talla Cuadros Estampada Franjas
Pequea 0.04 0.02 0.05
Mediana 0.08 0.07 0.12
Grande 0.03 0.07 0.08
Manga larga
Modelo
Talla Cuadros Estampada Franjas
Pequea 0.03 0.02 0.03
Mediana 0.10 0.05 0.07
Pgina 20
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
(a) Cul es la probabilidad de que la siguiente venta sea de una camisa mediana, de manga
larga y estampada?
(b) Cul es la probabilidad de que la siguiente venta sea de una camisa mediana y
estampada?
(c) Cul es la probabilidad de que la siguiente camisa vendida sea de manga corta? Y de
manga larga?
Ejercicio: Un cierto taller repara componentes de audio y video. Denotemos por A el evento de
que el siguiente componente llevado a reparacin sea un componente de audio, y B el evento que
el siguiente componente sea un reproductor de discos compactos (por ello B est contenido en A).
Supongamos que P(A) = 0.6 y P(B) = 0.05. Cul es la probabilidad P(BA).
k
p ( A )= p ( Bi ) p ( A|Bi )
i=1
Teorema.
Supngase que S = B1
B2 ... Bk, en donde P(Bi) > 0, i = 1, 2, ..., k, y Bi Bj = para i j. Entonces
Pgina 21
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
p ( B j ) p ( A|B j )
p ( B j| A ) = k
p ( Bi ) p ( A|Bi )
i=1
Ejercicio: Una persona posee dos automviles, un modelo compacto y uno estndar.
Aproximadamente utiliza el vehculo compacto para trasladarse a su trabajo las tres curtas partes
del tiempo y el restante usa el carro ms grande. Cuando emplea el carro compacto llega a su casa
a las 5:30 el 75% de las veces; si utiliza el carro de tamao estndar llega a la misma hora el 60%
de las veces (pero disfruta del aire acondicionado del auto ms grande). Si llega a su casa despus
de las 5:30, Cul es la probabilidad de que haya usado el auto compacto?
Ejercicio: Entre cinco aspirantes a puestos de ingeniero qumico en una empresa, a dos se les
considera excelentes, y a los dems se les considera buenos. Un gerente escoge al azar dos de
los cinco para la entrevista. Calcula la probabilidad de que el gerente escoja
(a) a los dos excelentes
(b) por lo menos a uno de los excelentes
(c) a los dos excelentes, dado que ya se sabe que uno de los dos seleccionados es
excelente.
Ejercicio: Una empresa produce resistencias y las vende como resistencias de 10 []. Sin
embargo, los Ohms reales de los resistores pueden variar. Se observa que 5% de los valores son
menores que 9.5 [] y 10% son mayores que 10.5 []. Si en determinado sistema se usan dos de
esas resistencias, seleccionadas al azar, calcular la probabilidad de que
(a) ambas tengan valores reales entre 9.5 y 10.5 [].
(b) al menos una tenga un valor real mayor que 10.5 [].
Ejemplo: Se han nominado a tres miembros de un club privado nacional para ocupar la
presidencia del mismo. La probabilidad de que se elija al seor Del Mazo es de 0.3; la de que se
haga lo propio con el seor Crdenas, de 0.5 y la de que gane el seor Castillo, de 0.2. En caso de
que se elija al seor Del Mazo la probabilidad de que la cuota de ingreso se incremente es de 0.8;
si se elige al seor Crdenas o al seor Castillo, las correspondientes probabilidades de que se
incremente la cuota son de 0.1 y 0.4. Cul es la probabilidad de que haya un incremento en la
cuota de membreca?
Si alguien considera entrar al club pero retrasa su decisin por varias semanas slo para
encontrarse con que las cuotas de entrada han aumentado, cul es la probabilidad de que se
haya elegido al seor Castillo como presidente del club?
Probabilidad a priori.
Pgina 22
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
estas probabilidades reflejan el juicio o grado de creencia del investigador con respecto a la
ocurrencia, antes que estos se presenten se conocen como probabilidades a priori.
Probabilidad a posteriori.
Pgina 23
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
3. Variables aleatorias
Variable aleatoria
El concepto de variable aleatoria proporciona un medio para relacionar cualquier resultado
con una medida cuantitativa.
Definicin. Sea S un espacio muestral sobre el cual se encuentra definida una funcin de
probabilidad. Sea X una funcin de valor real definida sobre S, de manera que transforme los
resultados de S en puntos sobre la recta de los reales. Se dice entonces que X es una variable
aleatoria.
Se dice que X es aleatoria porque involucra la probabilidad de los resultados del espacio
muestral, y X es una funcin definida sobre el espacio muestral, de manera que transforma todos
los posibles resultados del espacio muestral en cantidades numricas.
Definicin. Se dice que una variable aleatoria es discreta si el nmero de valores se puede
tomar es contable (ya sea finito o infinito), y stos pueden arreglarse en una secuencia que
corresponde con los nmeros enteros positivos.
Definicin. Se dice que una variable aleatoria es continua si sus valores consisten en uno o
ms intervalos de la recta de los reales.
Los experimentos se conciben de manera que los resultados del espacio muestral son
cualitativos o cuantitativos. Puede ser til la cuantificacin de los resultados cualitativos de un
espacio muestral y, mediante el empleo de medidas numricas, estudiar su comportamiento
aleatorio. El concepto de variable aleatoria proporciona un medio para relacionar cualquier
resultado con una medida cuantitativa.
Definicin. Las variables aleatorias (x1, x2,, xn) constituyen una muestra aleatoria de
tamao n, s
a) las xi son variables aleatorias independientes;
b) todas las xi tienen la misma distribucin de probabilidad.
Una variable aleatoria discreta representa los resultados de un espacio muestral en forma tal
que por P(X = x) se entender la probabilidad de que X tome el valor de x. Esta funcin recibe el
nombre de funcin de probabilidad de la variable aleatoria X.
Pgina 24
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Definicin. Sea X una variable aleatoria discreta. Se llamar a P(x) = P(X = x), funcin de
probabilidad de la variable aleatoria X, si satisface las siguientes propiedades
1. p(x) 0 para todos los valores x de X;
2. x p(x) = 1
Ejemplo. Se tiene una parte de un circuito elctrico con dos relevadores numerados, 1 y 2,
que trabajan en paralelo. La corriente pasa cuando el cerrar un interruptor, cierra cualquiera de los
dos relevadores o los dos. La probabilidad de que cierre un relevador en forma correcta es 0.8, y
es la misma para ambos. Sea Ei, el evento en el que el relevador i cierra en forma correcta el
interruptor. Ahora bien, X puede tener slo tres posibles valores, ya que el nmero de relevadores
que cierran puede ser 0, 1 y 2. Calcular las probabilidades de estos valores de x.
Definicin. Se dice que una variable aleatoria X es continua si puede tomar el nmero infinito
de valores posibles asociados con intervalos de nmeros reales, y hay una funcin f(x), llamada
funcin de densidad de probabilidad, tal que
Ejemplo. Supngase que hemos llevado a cabo un experimento con el objeto de medir la
vida til de 50 bacterias de un determinado tipo, seleccionadas de entre una mayor poblacin. El
comportamiento de su vida til sigue la funcin de densidad de probabilidad de la forma
{
x
1 ( 2)
e cuando x >0
f ( x )= 2
0 en otro caso
a) Calcular la probabilidad de que la vida til de una bacteria determinada de ste tipo sea menor
de 200 o mayor de 400 horas.
b) Ahora queremos saber la probabilidad de que una bacteria de este tipo dure ms de 300 horas
dado que ya ha estado en uso durante ms de 200 horas.
Definicin. La funcin de distribucin de una variable aleatoria X se define como F(b) = P(X
= x).
Pgina 25
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
{
x
1 ( 2)
e cuando x >0
f ( x )= 2
0 en otro caso
x
b x
e2
F ( b )=P ( X b )= dx=e 2
0
2
Cuandob > 0;
Ejercicio. Un vendedor de petrleo difano tiene un tanque de 200 galones lleno al principio de
cada semana. Sus demandas semanales tienen un comportamiento de frecuencia relativa que
aumenta constantemente hasta llegar a 100 galones, y a continuacin permanece igual entre 100 y
200 galones. Si x representa la demanda semanal en cientos de galones, suponer que las
frecuencias relativas de la demanda se modelan en forma adecuada mediante:
0 x0
x 0 x 1
f (x )
1 1 x 2
2
0 x2
Calcular F(b) para esta variable aleatoria. Usar F(b) para calcular la probabilidad de que la
demanda sea mayor a 150 galones en determinada semana.
Pgina 26
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Definicin. Sea X una variable aleatoria. El n-simo momento de X alrededor de cero se define
por:
' n=E ( x n )= x n p ( x ) si x es variable discreta
x
Este valor, n, alrededor de cero es conocida como la media o valor esperado de la variable
aleatoria. La media de una variable aleatoria se considera como una cantidad numrica alrededor
de la cual los valores de la variable aleatoria tienden a agruparse. Por lo tanto, la media es una
medida de tendencia central.
Pgina 27
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
n n
n=E ( x ) = ( x ) p ( x )
x
n n
n=E ( x ) = ( x ) f ( x ) dx
n i
i ()
( x ) = (1 ) r i x ni
Ya que la esperanza de una suma es igual a la suma de las esperanzas. Para el tercer
momento:
3 = 3 32 + 23
3
3= 3
Estandarizando el tercer momento queda:
( 2)2
Pgina 28
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Es
una medida de qu tan puntiaguda es la distribucin de probabilidad y recibe el nombre de curtosis.
Es posible estandarizarlo y queda como:
4
4= 2
2
Como vimos, el valor esperado, esperanza o media , de una variable aleatoria discreta X
que tiene una funcin p(x) de probabilidad est dada por:
E ( x )= x i p ( x i )= ' 1=
i=0
= 2= E [ ( x )2 ]
Ejercicios.
3.2.11 Un taller de servicio para automviles que se especializa en afinaciones sabe que el
45% de stas se efecta en vehculos de cuatro cilindros, el 40% en autos de seis cilindros y el
15% en coches de ocho cilindros. Sea X el nmero de cilindros del siguiente automvil que llega a
servicio de afinacin.
(a) Cul es la distribucin de probabilidad de la variable X?
(b) Trace una grfica de la distribucin de probabilidades de X.
3.2.13 Un negocio de computadoras que atiende pedidos por correo tiene seis lneas
telefnicas. Asignamos a Y el nmero de lneas en uso a las 12 horas, obteniendo una distribucin
de probabilidad como sigue
Y 0 1 2 3 4 5 6
p(Y) 0.10 0.15 0.20 0.25 0.20 0.06 0.04
Pgina 29
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
3.2.15 Muchos fabricantes tienen programas de control de calidad que incluyen la inspeccin
de materiales recibidos para corroborar que no hay defectos. Suponga que el fabricante de
computadoras recibe tarjetas de computadora en lotes de cinco, se seleccionan dos tarjetas de
cada lote para inspeccionarlas. Podemos representar posibles resultados del proceso de seleccin
por pares. Como ejemplo, el par (2, 3) representa la seleccin de las tarjetas 2 y 3 para
inspeccionarse.
b) Suponga que las tarjetas 1 y 2 son las nicas defectuosas de un lote de cinco. Se van a
escoger dos tarjetas al azar. Defina a X como el nmero de tarjetas defectuosas observando
entre las inspeccionadas. Encuentre la distribucin de probabilidad de X
3.2.17 El voltaje de una batera nueva puede ser aceptable (A) o no aceptable (NA). Cierta
linterna de mano necesita dos bateras, as que stas han de seleccionarse y probarse
independientemente hasta encontrar dos aceptables. Supongamos que el 80% de todas las
bateras tiene voltaje aceptable y denotemos por Y el nmero de bateras que deben ser probadas.
a) Cul es la probabilidad de que haya dos aceptables en la primera seleccin?
Pgina 30
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
La variable aleatoria ms sencilla es aquella que toma slo un nmero finito de valores
posibles, cada uno con la misma probabilidad. Con frecuencia, el inters recae en una variable
1
.
n
aleatoria x que toma los valores numricos x1, x2,, xn; con la misma probabilidad
Definicin. Una variable aleatoria x es una variable aleatoria discreta uniforme si cada uno
de los n valores que estn en el intervalo de sta, x1, x2,, xn; tiene la misma probabilidad.
1
p( x)
n
Entonces
Supngase que x es una variable aleatoria discreta uniforme sobre los enteros consecutivos
a, a + 1, a + 2,, b; con a b.
E ( x)
b a
2
La media de la distribucin uniforme discreta es:
Var ( x) 2
b a 1 2 1
12
La varianza de la distribucin uniforme discreta es:
Ejemplo. La probabilidad de que el primer dgito del nmero de serie de una pieza sea uno
de los nmeros desde cero hasta nueve, es la misma. Si se toma una pieza al azar de un lote muy
grande, y x es el primer dgito del nmero de serie, entonces x tiene una distribucin discreta
uniforme con una probabilidad de 0.1, para cada valor de R = {0, 1, 2,, 9}.
Pgina 31
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Ejemplo. El sistema de comunicacin por voz de una empresa tiene 48 lneas externas. En
un determinado momento, se observa el sistema y algunas lneas estn ocupadas. Sea x la
variable aleatoria que denota el nmero de lneas en uso. Entonces x puede tomar cualquier valor
entero de cero a 48. Supngase que el nmero de lneas de voz que estn ocupadas en un
determinado momento, es una variable aleatoria discreta uniforme x.
( 0+ 48 )
Entonces la esperanza es E ( X )= =24
2
( 480+1 )2
y la varianza es Var ( x )= =200 .
12
Definicin. Sea x una variable aleatoria que representa el nmero de xitos en n ensayos y
p la probabilidad de xito con cualquiera de stos. Se dice entonces que x tiene una distribucin
binomial son funcin de probabilidad.
n! x nx
P ( x , n , p )= p ( 1p )
( nx ) ! x !
x = 0, 1, 2,..., n.
El nombre de distribucin binomial proviene del hecho de que los valores de p(x; n, p) para x =
0, 1, 2,..., n; son los trminos sucesivos de la expansin binomial de [(1 p) + p] n.
Condiciones para su uso:
1. En una observacin hay exactamente dos resultados posibles, uno de ellos se llama xito y
el otro fracaso.
2. Hay n observaciones, donde n es un mismo entero positivo establecido de antemano, por lo
tanto se consideran poblaciones infinitas.
3. Las observaciones son independientes entre s.
4. La probabilidad de xito se denomina o denota con la letra p, y el fracaso con una q [q = 1
p], para todas las ejecuciones o mediciones es la misma.
Pgina 32
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
12 p
3= 1/ 2
El tercer momento estandarizado ser [ np (1 p ) ]
[ 16 p( 1 p)]
El cuarto momento estandarizado ser 4=3+
np ( 1 p )
tx x x n x tp n
m x ( t )=E ( e )= C n p ( 1 p ) =[ ( 1 p ) +e ]
x
Ejemplo. Una mquina para llenar cajas no llena por completo una proporcin p de ellas. Si se
seleccionan al azar 25 cajas de las producidas por esa mquina, calcular la probabilidad de que no
haya ms de dos cajas incompletas cuando:
(a) p = 0.1;
(b) p = 0.2.
Pueden determinarse las probabilidades individuales mediante el empleo de esta tabla puesto
que la variable aleatoria binomial tiene un valor entero, y la propiedad P(x; n, p) = F(x; n, p) F(x
1; n, p), se verifica.
Ejemplo. Una compaa de exploracin petrolera va a perforar diez pozos y cada uno de ellos
tiene una probabilidad de 0.1 de producir petrleo en forma comercial. A la compaa le cuesta
$10,000 dlares perforar cada pozo. Un pozo comercial saca petrleo por valor de $500,000
dlares.
Pgina 33
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
(a) Calcula la ganancia que espera obtener la compaa por diez pozos.
(b) Calcula la desviacin estndar de las ganancias de la firma.
Ejemplo. Sea un lote grande de fusibles con 10% de defectuosos. Si se extraen al azar cuatro
fusibles del lote, calcular la probabilidad de que slo un fusible est defectuoso. Calcular la
probabilidad de que por lo menos un fusible en la muestra salga defectuoso.
Ejercicio. En relacin al ejemplo de los fusibles, supngase que los cuatro fusibles que se
extraen del lote se envan a un cliente antes de probarlos, con garanta. Supngase tambin que
el costo de hacer efectiva la garanta est dada por C = 3y2, donde y es el nmero de piezas
defectuosas en el envo de cuatro. Calcule el costo esperado de reparacin.
para n = 1, 2,...
Debido a la independencia entre los intentos. A esta frmula se le conoce como distribucin
geomtrica de probabilidad.
Pgina 34
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
1
La media de una variable aleatoria geomtrica es:
E ( x )=
p
1 p
Var ( x )=
La varianza de una variable aleatoria geomtrica es: p2
t
pe
La funcin generadora de momentos queda como:
mx ( t )=
1 (1 p ) et
Ejemplo. Una empresa de reclutamiento encuentra que el 30% de los aspirantes para
determinado puesto en la industria tiene conocimientos avanzados de programacin. Se entrevista
a los aspirantes uno a uno, para lo cual se seleccionan al azar de entre el grupo. Calcular la
probabilidad de que el primer aspirante con conocimientos avanzados de programacin sea el
quinto entrevistado.
La distribucin binomial negativa se emplea para modelar una gran variedad de fenmenos,
como por ejemplo, de defectos por metro cuadrado de telas, hasta de individuos en una poblacin
de insectos despus de muchas generaciones.
Pgina 35
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
( )
p ( x ; r , p )= x 1 p r ( 1 p )
r 1
xr
r
La media de una variable aleatoria binomial negativa es:
E ( x )=
p
r ( 1 p )
La varianza de una variable aleatoria binomial negativa es:
Var ( x )=
p2
Ejemplo. Un estudio geolgico indica que un pozo exploratorio debera dar petrleo con una
probabilidad de 20%.
(a) Cul es la probabilidad de que el tercer descubrimiento ocurra en la quinta
perforacin?
(b) Determine la media y la varianza del nmero de pozos que hay que perforar si la
compaa quiere establecer tres pozos con produccin petrolera.
Pgina 36
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
La probabilidad de que ocurra una variable aleatoria de Poisson x sea menor o igual a un
valor de x se denomina por la funcin de distribucin acumulativa
e i
p ( X=x )=F ( x ; ) =
i i!
1
3=
El tercer momento estandarizado es:
1
El cuarto momento estandarizado es:
4=3+
m x (t)=e [ e 1]
t
Pgina 37
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Ejemplo. El gerente de una planta industrial planea comprar una mquina nueva de cada
uno de los tipos, A y B. Para cada da de funcionamiento, el nmero de reparaciones X que
necesita la mquina A es una variable aleatoria de Poisson cuyo promedio es 0.01t, siendo t el
tiempo, en horas de funcionamiento diario. El nmero de reparaciones Y para la mquina B es una
variable de Poisson cuyo promedio es 0.12t. El costo diario de operacin es de A, cA(t) = 10t + 30x2;
y para B es cB(t) = 8t + 30y2. Suponer que las reparaciones toman un tiempo tan pequeo que se
puede hacer caso omiso de l, y que se limpian las mquinas durante la noche y, por lo tanto,
trabajan como si fueran nuevas al inicio de cada da. Cul de las mquinas da el costo mnimo
esperado, si un da consiste en
(a) diez horas;
(b) en veinte horas.
Definicin. Sea N el nmero de objetos en una poblacin finita, de manera que k de stos
es de un tipo y N k de otro. Si se seleccionan una muestra aleatoria de la poblacin constituida
por n objetos de la probabilidad de que x sea de un tipo exactamente y n x sea del otro; est
dada por la funcin de probabilidad hipergeomtrica:
p ( x ; N , n ,k )=
( x )( nx )
k Nk
( Nn )
x = 0, 1, 2,..., n x k; n k N k; N, n, k .
Pgina 38
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
nk
La esperanza o media queda definida por:
E ( x )=
N
k
La varianza es
Var ( x )=np(1 p) ( Nn
N 1 ) con
p=
N
4=
( N1 ) N 2
( N2 )( N3 ) nk ( N k ) ( Nn ) [ N
k
( )
N ( N +1 )6 n ( Nn ) +3 2 ( N k ) [ N ( n2 )N n +6 n ( Nn ) ]
2 2
Ejemplo. La compaa repara las impresoras defectuosas a un costo de $500.00 MN, cada
una. Encuentre la media y la varianza del costo total de reparacin.
Ejemplo. Una corporacin muestrea, sin reemplazo a tres empresas para adquirir ciertos
suministros. La muestra se selecciona de un conjunto de seis empresas, de las cuales cuatro son
locales y dos no lo son. Sea y el nmero de empresas forneas entre las tres escogidas.
(a) Obtenga P(y = 1);
(b) Obtenga P(y 1);
(c) Obtenga P(y 1).
Ejercicio. Suponga que un radiorreceptor contenga seis transistores, de los cuales dos son
defectuosos. Se quitan y se prueban tres escogidos al azar. Sea y el nmero de defectuosos
encontrados, en donde y = 0, 1 2. Encuentre la distribucin de probabilidad para y. Exprese sus
resultados grficamente como un histograma de probabilidades.
Pgina 39
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Una distribucin de probabilidad conjunta para mltiples variables discretas que es de gran
utilidad, es una extensin de la binomial. El experimento aleatorio que genera la distribucin de
probabilidad consiste en una serie de ensayos independientes. Sin embargo, los resultados de
cada ensayo pueden clasificarse en una de p clases.
Las variables aleatorias X1, X2,, Xk que denotan el nmero de ensayos que caen en la
clase 1, en la clase 2, , en la clase k, respectivamente; tienen una distribucin Multinomial con
una funcin de probabilidad conjunta
n!
p ( X 1=x 1 , X 2=x 2 , , X k =x k )= p x p x p xk
1 2 k
x1 ! x 2 ! x k ! 1 2
Para x1 + x2 ++ xk = n y p1 + p2 ++ pk = 1.
Ejemplo. De los 20 bits recibidos por un aparato electrnico, cul es la probabilidad de que
la calidad de 14 sea excelente [E]; de 3, buena [B]; de 2, aceptable [A] y de 1, pobre [P]?
Supngase que las clasificaciones de cada uno de los bits son eventos independientes y que las
probabilidades de E, B A y P son 0.6, 0.3, 0.08 y 0.02, respectivamente.
Si se utiliza la independencia, se tiene que la probabilidad de esta secuencia es
Es evidente que todas las secuencias que estn formadas por el mismo nmero de letras E, B, A y
P tienen la misma probabilidad. En consecuencia, la probabilidad pedida puede hallarse el
multiplicar 0.2708 x 10-10 por el nmero de secuencias con 14 letras E, tres letras B, dos letras A y
una letra P.
La probabilidad pedida es
Pgina 40
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
20 !
p ( X 1=14, X 2=3, X 3 =2, X 4 =1 )= ( 0.2708 1010 )=0.0063
14 ! 3 ! 2! 1 !
Ejercicio. Se inspecciona una muestra de cuatro hornos electrnicos que se cayeron al ser
embarcados, y se les clasifica de acuerdo con el tipo de defectos que presentan: grandes, menores
o ninguno. En el pasado, 60% de los hornos que se cayeron tuvieron un defecto grande; 30% un
defecto menor, y 10% ningn defecto. Suponga que los defectos en los cuatro hornos se presentan
de manera independiente.
(a) Cul es la probabilidad de que, de los cuatro hornos que forman la muestra, dos tengan
defecto grande y dos uno menor?
(b) Cul es la probabilidad de que ningn horno tenga un defecto?
5. Distribuciones de probabilidad continuas especiales
Distribucin uniforme. Suponga que ocurre un evento en que una variable aleatoria toma
valores de un intervalo finito, de manera que se encuentran distribuidos sobre el intervalo.
{
1
f x ; a , b = ba
( )
0
Pgina 41
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
a+b
La esperanza de la distribucin es:
E ( x )=
2
( ba )2
La varianza de la distribucin es: Var ( x )=
12
{
0
x
(xa)
p ( X=x )=F ( x ; a , b ) =(ba) dt =
1
a (ba)
1
Ejemplo. Para calcular por triangulacin el alcance de una fuente acstica, se debe medir
con exactitud el tiempo en el cual llega el frente de onda esfrico a un censor de repeticin. Segn
el artculo de Perruzzi y Hilliard, Journal of the Acoustical Society of America, 75(1), 1984, pp. 197-
201; se pueden modelar los errores de medicin como si tuvieran distribuciones uniformes.
Suponga que los errores de medicin estn distribuidos uniformemente de 0.05 a 0.05 [s].
(a) Calcula la probabilidad de que determinada medicin del tiempo de llegada tenga un error
de menos de 0.01 [s].
(b) Calcula el promedio y la varianza de tales errores de medicin.
Pgina 42
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
El modelo exponencial
Condiciones para su uso
1. La obtencin de la distribucin de X depende de la hiptesis de que el nmero de
fallas sigue un proceso de Poisson.
2. El nmero de fallas depende de la longitud del intervalo y no de la posicin.
x
Modelo matemtico: f ( x ; )= e
1
La esperanza de la funcin de distribucin es:
E ( x )=
1
Var ( x )=
La varianza de la funcin de distribucin es: 2
Ejemplo. El tiempo de vida de los reguladores de voltaje de los automviles tiene una
distribucin exponencial con tiempo de vida medio de seis aos. Una persona compra un automvil
que tiene una antigedad de seis aos, con un regulador en funcionamiento y planea tenerlo por
espacio de seis aos.
(a) Cul es la probabilidad de que el regulador de voltaje falle en el lapso de seis aos?
(b) Si el regulador falla despus de tres aos de haber efectuado la compra del auto, se
reemplaza. Cul es el tiempo promedio que transcurrir hasta que el regulador vuelva a
fallar?
Ejemplo. Una refinadora de azcar tiene tres plantas de proceso y todas reciben azcar
morena en general. La cantidad de azcar que puede procesar una planta en un da se puede
representar mediante una funcin exponencial con un promedio de 4 [Ton] (mediciones en
toneladas), para cada una de las plantas. Si las plantas trabajan en forma independiente, calcular
la probabilidad de que procesen ms de cuatro toneladas en un da determinado.
{
x
e
x 0
f ( x ; )=
0 en lodemas
Ejemplo. En una zona de los EUA se pueden modelar las magnitudes de los terremotos
mediante una distribucin exponencial cuyo promedio es 2.4 en la escala de Richter. Obtn la
probabilidad de que el siguiente temblor que se presente en esa zona sea
(a) mayor que 3.0 grados;
Pgina 43
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
El modelo Gamma
Modelo matemtico:
( r )= x r1 ex dx
0
para r > 0.
Propiedades:
(n + 1) = n! n > 0 y entero;
(n + 1) = n (n) n > 0;
(1/2) = .
(r) = (r 1) (r 1) = (r 1)!
r x r1 ex
Modelo probabilstico: f ( x ; ,r )= x > 0.
( r)
r
La esperanza de la funcin de distribucin es:
E ( x )=
r
Var ( x )=
La varianza de la funcin de distribucin es: 2
Ejemplo. El tiempo que transcurre entre los problemas que se presentan en un proceso de
una lnea de produccin tiene una distribucin exponencial con una media de 30 das.
(a) Cul es el tiempo esperado para que se presente el cuarto problema?
(b) Cul es la probabilidad de que el tiempo necesario para que se presente el cuarto
problema sea mayor a 120 das?
Ejemplo. Las llamadas a un sistema telefnico siguen una distribucin de Poisson con media
de cinco llamadas por minuto.
(a) Cul es el nombre de la distribucin, y qu valores tienen los parmetros de sta: para el
tiempo transcurrido hasta que se recibe la dcima llamada?
(b) Cul es el tiempo promedio que transcurre hasta que se recibe la dcima llamada?
(c) Cul es el tiempo promedio entre la novena y la dcima llamada?
Pgina 44
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
(n 1) s 2
2
poblacin normal con varianza 2, el estadstico tiene una distribucin muestral que es
una distribucin Chi-cuadrado con n 1 grados de libertad y se denota por 2.
El estadstico Chi-cuadrado, tambin se puede dar con una de las siguientes expresiones:
SS ( xx )
2= =
2 2
2
2 ( x )
SS es la suma de los cuadrados x n
n es el tamao de la muestra
Ejemplo. Suponga que los tiempos requeridos por cierto autobs para alcanzar uno de sus
destinos en una ciudad forman una distribucin normal con una desviacin estndar de = 1 [min].
Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza
muestral sea mayor que 2, esto es, encuentre p(s2 > 2).
Ejercicio. Los tiempos de llegada diaria de cierto tren a uno de sus destinos, se distribuye
normalmente, una muestra de 12 tiempo de llegada indican s = 1.789[min]. Construye un intervalo
del 99% de confianza para una varianza de la poblacin de horas de llegada.
Ejercicio. Se sabe que los pesos de ciertas especies de peces se distribuyen normalmente
con una desviacin estndar de 2 [gr], si se toma una muestra de 12 peces de las especies
referidas, encuentre la probabilidad de que la varianza de la muestra sea menor que 8.
Pgina 45
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Ejercicio. Una muestra de 13 latas de sopa producida por la compaa ACME, produjo los
siguientes pesos netos, medidos en onzas;
11.9 12.2 11.6 12.1 12.1 11.8 11.9 11.8 12.0 12.3 11.8 12.1
12.0 12.1
Si se supone que los pesos netos se distribuyen normalmente, construya intervalos del 95%
de confianza para la varianza y la desviacin estndar de la poblacin de pesos netos de todas las
latas de sopa producidas.
Ejercicio. La concentracin de colorante artificial comestible en seis lotes dio los registros
siguientes: 0.010 0.013 0.018 0.024 0.015 0.013. Se supone que tales concentraciones se
distribuyen normalmente, construya un intervalo de 95% de confianza para su varianza en la
poblacin de los lotes.
Esta distribucin tiene una forma de campana (por ello se le llama campana de Gauss) y es
simtrica con respecto de su media [localizada en la parte central de la curva]. El rea bajo la curva
representa el 100% de la probabilidad, as la probabilidad de que una variable tenga un valor entre
dos puntos es igual al rea bajo la curva entre estos dos puntos.
Modelo matemtico:
2
e
( ( x )
2
2 )
f ( x ; , )=
2
Pgina 46
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Ejemplo. La resistencia a la traccin de un papel est modelada por una distribucin normal
con media = 35 [lb/plg2], y desviacin estndar = 2 [lb/plg2].
(a) Cul es la probabilidad de que la resistencia de una muestra sea menor que 40 [lb/plg 2]?
(b) Si las especificaciones requieren que la resistencia sea mayor que 30 [lb/plg 2] qu
proporcin de las muestras ser desechada?
Ejemplo. Una operacin de maquinado produce ejes de acero cuyos dimetros estn
distribuidos normalmente con un promedio de 1.005 [plg] y desviacin estndar de 0.01 [plg]. Las
especificaciones piden dimetros que queden en el intervalo de 1.0 0.02 [plg]. Qu porcentaje
de la produccin no cumplir las especificaciones?
Ejemplo. Un tipo de capacitor tiene resistencias que varan de acuerdo a una distribucin
normal con promedio de 800 [meg-ohm] y desviacin estndar de 200 [meg-ohm] (vase W.
Nelson, Industrial Quality Control, 1967, pp. 261 a 268). Una determinada aplicacin especfica
capacitares cuyas resistencias queden entre 900 y 1000 [meg-ohm].
(a) Qu proporcin de estos capacitares cumplirn con la especificacin?
(b) Si se escogen dos capacitares de un lote de ese tipo, cul es la probabilidad de que ambos
satisfagan la especificacin?
Ejemplo. Las ausencias por enfermedad de los empleados de una empresa en un mes
tienen una distribucin normal aproximada, con promedio de 200 [h] y varianza de 400 [h].
(a) Calcula la probabilidad de que el mes prximo el ausentismo total por enfermedad sea menor
que 150 [h].
(b) Para planear el programa del mes prximo, cunto tiempo debe suponer darse al ausentismo
por enfermedad, si aquella cantidad slo se debe superar con una probabilidad de tan slo
0.1?
Ejercicio. El pago por hora para los trabajadores de cierta planta automotriz se distribuye
normalmente con una media de 12.5 [dlares] y una desviacin estndar de 0.95; si de esta fbrica
se elige una muestra aleatoria de 100 trabajadores, encuentre la probabilidad de que la media del
pago por hora
(a) sea menor que 12.6 [dlares].
(b) est entre 12.45 y 12.65 [dlares].
(c) supere los 12.3 [dlares].
Recordatorio histrico.
En 1908, W. Gosset, un dirigente judo de una planta cervecera, public un artculo de
investigacin relativo a la ecuacin para la distribucin de probabilidad de t, como los empleados
de la planta cervecera no tenan permitido publicar los resultados de sus investigaciones, Gosset
public sus resultados firmndolos bajo el nombre de Student; desde entonces, la distribucin
muestral del estadstico t se le conoce como la distribucin t de Student.
Pgina 47
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Ejercicio. Una fbrica de conservas de carne acaba de instalar una nueva mquina de
llenado, una muestra al azar de 20 botes llenos da un peso promedio de 16.05 [oz] con una
desviacin estndar de 1.5 [oz].
(a) Haga una estimacin de intervalo para el peso medio verdadero con 1 = 0.95.
(b) Si el contenido neto de cada bote supone que es de 16 [oz] ha sido ajustada
aproximadamente la mquina?
Pgina 48
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Definicin. Se dice que una variable x continua tiene una distribucin gamma si la funcin de
densidad de la probabilidad de x es:
{
x
1 1
x e x 0
f ( x ; , )= ( )
0 de otro modo
E ( x )= ; Var ( x )= 2
x
y 1 e y
F ( x ; )= dy x> 0
0 ( )
Recibe el nombre de funcin gamma incompleta (en ocasiones a esta expresin se le escribe sin el
denominador ( ) del integrando).
La funcin gamma incompleta tambin se le puede utilizar para calcular probabilidades en las que
aparezcan distribuciones gamma que no son estndar.
La distribucin Weibull. La familia de distribuciones Weibull fue introducida por el fsico sueco
Waloddi Weibull en 1939; su artculo A Statistical Distribution Function of Wide Applicability, J.
Applied Mechanics, vol. 18, pp. 293 297, analiza varias aplicaciones.
Pgina 49
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
{
x
1 ( )
x e x0
f ( x ; , )=
0 x< 0
{( ) [ ( )] }
2
1 2 1
( )
E ( x )= 1+ ; Var ( x )= 2 1+ 1+
{
0 x <0
F ( x ; , ) = x
1e
() x0
Ejemplo. Sea x la resistencia final a la tensin a 200F de un tipo de acero que presenta
fragilidad al frio a bajas temperaturas. Suponga que x tiene una distribucin de probabilidad Weibull
con parmetros = 20 y = 100. Entonces
20
P ( 98 x 102 )=F (102 ; 20, 100 )F ( 98 ; 20, 100 )=e(0.98 ) e(1.02) =0.51290.2262=0.2867
Ejercicio. La duracin z en cientos de horas de cierto tipo de tubos al vaco tiene una
distribucin Weibull con parmetros = 2 y = 3. Calcule lo siguiente
(a) Esperanza y varianza;
(b) P(z 6);
(c) P(1.5 z 6).
Ejercicio. Sea x el tiempo (en semanas) del envo de un producto defectuoso hasta que el
cliente regresa el producto. Suponga que el tiempo mnimo de devolucin es = 3.5 y que el
exceso x 3.5 sobre el mnimo tiene una distribucin Weibull con parmetros = 2 y = 1.5.
(a) Cul es la funcin de distribucin acumulada de x?;
Pgina 50
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Pgina 51
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
La distribucin lognormal.
Definicin. Se dice que una variable aleatoria x no negativa tiene una distribucin de
probabilidad lognormal si la variable aleatoria y=ln x tiene una distribucin normal. La funcin
de distribucin de probabilidad resultante de una variable aleatoria lognormal cuando ln(x) esta
normalmente distribuida con parmetros y es
{
2
[ ln x ]
1 ( 2 2)
e x0
f ( x ; , )= x 2
0 x< 0
+ 2
2 2
( e 1 )
2 2 +
E ( x )=e ; Var ( x )=e
La Figura, ilustra las graficas de la distribucin de probabilidad lognormal; aun cuando la curva
normal sea simtrica, una curva lognormal tiene sesgo positivo.
Debido a que ln (x) tiene una distribucin normal, la funcin de distribucin acumulada de x
se puede expresar en trminos de la funcin de distribucin acumulada ( z) de una variable
aleatoria normal estndar z, para x > 0
ln x ln x
F ( x ; , ) =P ( X x )=P [ ln X ln x ] =P Z ( ) (
=
)
Ejemplo. Sea x la potencia mediana horaria (en decibeles) de seales de radio recibidas y
transmitidas entre dos ciudades. Los autores del artculo Families of Distributions for Hourly
Median Power and Instantaneus Power of Recieved Radio Signals, J. Research National Bureau of
Standars, 1963, vol. 67D, pp. 753 762, expresan que la distribucin lognormal proporciona un
modelo razonable de probabilidad para X. Si los valores de parmetro son = 3.5 y = 1.2,
entonces
Pgina 52
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
P ( X 68 ) = ( ln 683.5
1.2 )=0.7257
Ejercicio. Una justificacin terica, basada en el mecanismo de falla de cierto material, sirve
de fundamento a la suposicin de que la resistencia a la ductilidad x de un material tiene una
distribucin lognormal. Suponga que los parmetros son = 5 y = 0.1.
(a) Calcule la esperanza y varianza de x;
(b) Calcule P(x > 120);
(c) Calcule P(110 x 130);
(d) Cul es el valor de la mediana de la resistencia a la ductilidad?
Ejercicio. El artculo The Statistics of Phytotoxic Air Pollutants, J. Royal Stat. Soc. 1989, pp.
183 198, sugiere la distribucin lognormal como un modelo para la concentracin de SO 2 sobre
cierto bosque. Suponga que los valores de parmetro son = 1.9 y = 0.9.
(a) Cules son el valor medio y la desviacin estndar de la concentracin?
(b) Cul es la probabilidad de que la concentracin sea a lo sumo 10?;
(c) Y que este entre 5 y 10?
Pgina 53
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
6. Estimacin
El propsito principal de la toma de una muestra aleatoria es obtener informacin sobre los
parmetros no conocidos de la poblacin. Por ejemplo, suponga que se desea obtener una
conclusin sobre el uso de transporte pblico hacia el plantel Iztapalapa de la UACM. Sea p el
valor no conocido de la preferencia del uso de cierta ruta. Resulta poco prctico encuestar a los
estudiantes, acadmicos y personal administrativo que acuden a esta casa de estudios para
determinar el valor de p. Para hacer una inferencia con respecto a la proporcin verdadera p, un
procedimiento ms razonable consiste en seleccionar una muestra aleatoria y utilizar la proporcin
observada p de personas en la muestra que prefieren transportarse en la ruta 14.
Puesto que la estadstica es una variable aleatoria, sta tiene una distribucin de
probabilidad. Se conoce como distribucin de muestreo a la distribucin de probabilidad de una
estadstica.
Pgina 54
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Suponga que una persona dispara al blanco un solo tiro y que ste da en el centro, lo
considerara un buen tirador?, sostendra el blanco?
En otras
palabras, nos gustara que la media o valor esperado de la
distribucin de las estimaciones fuera igual al parmetro
estimado, es decir, E() = . Los estimadores puntuales que
satisfacen esta propiedad se denominan insesgados. La
distribucin muestral para un estimador puntual sesgado
positivamente, para la cual E() > , se presenta en la
figura 2.
Se deseara que el estimador tuviera el tipo de distribucin indicado en la figura 3.b, ya que
una menor varianza garantiza que en el muestreo repetitivo una mayor fraccin de valores de 2
queda cerca de . Se desea que Var() sea mnima.
Pgina 55
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Definicin. El cuadrado medio del error de un estimador puntual se define como el valor
esperado de ( )2.
Aunque lo insesgado es muchas veces una propiedad deseada para un estimador puntual,
no todos los estimadores son insesgados.
Se pueden establecer dos comentarios finales con respecto a los estimadores puntuales de
la tabla 1. Primero, los valores esperados y las varianzas dados en la tabla son vlidos
independientemente de la forma de las funciones de densidad de probabilidad de las poblaciones.
Segundo, los cuatro estimadores tendrn distribuciones de probabilidad que son aproximadamente
normales para muestras grandes.
Intervalos de confianza
Pgina 56
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Un estimador por intervalo es una regla que especifica el mtodo que utiliza las mediciones
de la muestra para calcular dos nmeros que forman los extremos del intervalo. En el proceso ideal
sera conveniente que el intervalo tuviera dos propiedades. Primero que el intervalo contenga al
parmetro objeto . Segundo, que el intervalo sea relativamente estrecho.
x z
n
x
; z ; z=
x
x
x
; x=
N n
n N 1
N tamao de la poblacin; n tamao de la muestra, (intervalo menor al de la poblacin).
Ejemplo. 500 latas tienen un peso promedio de 5.02 [kg] y una desviacin estndar de 0.3
[kg]. Hay la probabilidad de que una muestra al azar de 100 latas, elegidas al azar de este grupo
tenga un peso total comprendido entre 496 [kg] y 500 [kg]. Para la distribucin muestral de medias
se tiene:
x = 5.02 [kg], = 0.3 [kg], n = 100 latas
x=
0.3 500100
100 5001
=0.03 ( 0.8953 )=0.0269
496 500
1= =4.96 1= =5.00
100 100
}
4.965.02
z= =2.2305 p z =0.0129
z=
0.0269
5.005.02
0.0269
=0.7435 p
( 1)
( z 2 )=0.2296 }
p ( z1 ) p ( z2 ) =0.2167
Pgina 57
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
{ }
x
p z z z = p z z =1
{ 2 2 } 2
2
x
Pgina 58
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
{ ( )
p x z
2
x
x + z
2 x
( )}
=1
corresponde al porcentaje 2 .
Para muestras tomadas de una poblacin normal, o para muestras de tamao n 30, sin
importar la forma que tenga la poblacin, el intervalo de confianza dado por la ecuacin de la
definicin que proporciona buenos resultados. Sin embargo, para muestras pequeas tomadas de
poblaciones que no son normales, no es posible esperar que el nivel de confianza 1 sea
exacto.
Ejemplo A. Un artculo publicado en el Journal of Heat Transfer (Trans. ASME, Sec. C, 96,
1974, pg. 59) describe un nuevo mtodo para medir la conductividad trmica del hierro Armco. Al
utilizar una temperatura de 100 [F] y una potencia de entrada de 550 [W], se obtienen las diez
mediciones siguientes de conductividad trmica (en Btu/hr-ft-F):
41.60 41.48 42.34 41.95 41.86 42.18 41.72 42.26 41.81 42.04
Una estacin puntual de la conductividad trmica promedio a 100 [F] y 550 [W] es la media
x
muestral o = 41.924 (Btu/hr-ft-F).
x ,
n
El error estndar de la media muestral es y dado que es desconocido, puede
reemplazarse por la desviacin estndar muestral s = 0.284 para obtener el error estndar
s 0.284
x 0.0898,
x n 10
estimado de como
Note que el error estndar es alrededor de 0.2% de la media muestral, lo que implica que se
ha obtenido una estimacin puntual relativamente precisa de la conductividad trmica.
Pgina 59
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
conductividad trmica est distribuida de manera normal, entonces se puede emplear la ecuacin
arriba mencionada para la construccin del intervalo de confianza. Un intervalo del 95% implica
que 1 = 0.95, de modo que = 0.05. De tablas de distribucin normal tenemos que: z /2 = 1.96
x z x z
2 n 2 n
(1.96)(0.3) (1.96)(0.3)
41.924 41.924
10 10
41.738 42.110
Ejercicio. Un fabricante produce anillos para los pistones de un motor de automvil. Se sabe
que el dimetro del anillo est distribuido aproximadamente de manera normal, y que tiene una
desviacin estndar = 0.001 [mm]. Una muestra aleatoria de 15 anillos tiene un dimetro
x
promedio de = 74.036 [mm].
(a) Construya un intervalo de confianza del 99% para el dimetro promedio del anillo.
(b) Construya un lmite inferior de confianza del 95% para el dimetro promedio del anillo.
Ejercicio. Se sabe que la duracin, en horas, de un foco de 75 [watts] tiene una distribucin
aproximadamente normal, con una desviacin estndar de = 25 [h]. Se toma una muestra
x
aleatoria de 20 focos, la cual resulta tener una duracin promedio de = 1014 [h].
(a) Construya un intervalo de confianza del 95% para la duracin promedio.
(b) Construya un intervalo de confianza inferior del 95% para la duracin promedio.
Puesto que la longitud del intervalo de confianza mide la precisin de una estimacin se
observa entonces que la precisin est inversamente relacionada con el nivel de confianza. Tal
como se mostr, es deseable obtener un intervalo de confianza que sea suficientemente pequeo
para fines de toma de decisiones, y que tambin tenga una confianza adecuada. Una manera de
alcanzar esto es mediante la seleccin de una muestra de tamao n suficientemente grande como
para obtener de ella un intervalo de confianza que me de certidumbre en mi anlisis de muestras.
x
Definicin. Si se utiliza como estimacin de , entonces puede tenerse una confianza del
x
100(1 ) por ciento de que el error E = no sea mayor que una cantidad especfica E
cuando el tamao de la muestra sea
2
z
n 2
x
Pgina 60
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Ejercicio. Del ejercicio de la duracin de los focos. Supngase que se desea una confianza
de 95% en el que el error en la estimacin de la duracin promedio sea menor que 5 horas. Qu
tamao de muestra debe utilizarse?
Ejercicio. Del mimo caso de la duracin de los focos. Supngase que se desea el ancho
total del intervalo de confianza bilateral sea de seis horas, con una confianza de 95%. Qu
tamao de muestra debe utilizarse para este fin?
x1 y x 2
Sean n1 y n2 el nmero de observaciones tomadas de las poblaciones. Si son las
x1 y x 2
medias muestrales, la estadstica es un estimador puntual de 1 2. La variable
aleatoria
z
x1 x 2 1 2
12 22
n1 n2
Donde z/2 es el punto crtico superior que corresponde al porcentaje /2 de la distribucin normal
estndar.
Pgina 61
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
supone que las desviaciones estndar de las resistencias a la tensin son conocidas. Los datos
obtenidos aparecen en la tabla.
Si 1 y 2 denotan los promedios verdaderos de las resistencias a la tensin para las dos
clases de largueros, entonces puede encontrarse un intervalo de confianza del 90% para la
diferencia de las medias 1 y 2 de la siguiente manera:
12 1.5 2 12 1.5 2
87.6 74.5 (1.645) 1 2 87.6 74.5 (1.645)
10 12 10 12
12.22 1 2 13.98 [kg/mm 2 ]
El intervalo de confianza no incluye al cero, lo que implica que la resistencia promedio del
aluminio de clase 1 es mayor que la de clase 2. De hecho, puede afirmarse que se tiene una
confianza del 90% de la resistencia promedio a la tensin del aluminio de clase 1 es mayor al del
aluminio de clase 2.
Ejercicio. Se utilizan dos mquinas para llenar botellas de plstico con detergente para
mquinas lavatrastos. Se sabe que las desviaciones estndar del volumen de llenado son 1 = 0.10
[oz] y 2 = 0.15 [oz] de liquido, respectivamente. Se toman dos muestras aleatorias, n 1 = 12 y n2 =
x1 30.87 y x2 30.68
10 botellas. Los volmenes promedio de llenado son [oz] de liquido.
(a) Construya un intervalo de confianza bilateral del 90% para la diferencia entre las medias del
volumen de llenado.
(b) Construya un intervalo de confianza bilateral del 95% para la diferencia entre las medias del
volumen de llenado. Compare el ancho de este intervalo con el ancho obtenido en el inciso (a).
(c) Construya un intervalo de confianza superior del 95% para la diferencia de medias del volumen
de llenado.
Se desea encontrar un intervalo de confianza para la media de una distribucin, pero que la
varianza no es conocida. De manera especfica, supngase que se tiene una muestra aleatoria de
Pgina 62
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
x
tamao n, y que y s2 son la media y varianza muestrales, respectivamente. Una posibilidad
sera reemplazar en las frmulas del intervalo de confianza para con varianza conocida con el
valor calculado de la desviacin estndar muestral s. Si el tamao de la muestra n, es
relativamente grande, entonces ste es un procedimiento aceptable. En consecuencia, a menudo
los intervalos de confianza anteriores reciben el nombre de intervalos de confianza para muestras
grandes, debido a que son aproximadamente vlidos incluso si las varianzas no conocidas de la
poblacin se reemplazan con las varianzas muestrales correspondientes.
Ejemplo. Un artculo en el journal of Testing and Evaluation (Vol. 10, No. 4, 1982, pg. 133)
presenta las siguientes 20 mediciones del tiempo de combustin residual (en segundos) de
especmenes tratados de ropa de dormir para nios.
9.85 9.93 9.75 9.77 9.67 9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88 9.95 9.93 9.92 9.89 9.95
Se desea encontrar un intervalo de confianza del 95% para el tiempo de combustin residual
promedio. Supngase que el tiempo de combustin residual sigue una distribucin normal.
Solucin. E(x) = 9.8525; Var(x) = 0.0093039; s = 0.0964569
De tablas t0.025, 19 = 2.093. Los lmites de confianza sern:
0.0964569 0.0964569
9.8525 2.093 9.8525 2.093
20 20
9.8074 9.8976
Ejercicio. Un ingeniero civil hace pruebas con la resistencia a la compresin del concreto.
Para ello examina 12 bloques (del mismo tamao) y obtiene los siguientes datos:
2216 2225 2318 2237 2301 2255 2249 2281 2275 2204 2263 2295
Pgina 63
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
(a) Construya un intervalo de confianza bilateral del 95% para la resistencia promedio.
(b) Construya un intervalo de confianza inferior del 95% para la resistencia promedio.
Pgina 64
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
1 1 1 1
x1 x 2 t t S p 1 2 x1 x 2 t t S p 1
n1 n 2 n1 n2
Ejemplo. La pintura para autopista se surte en dos colores: blanco y amarillo. El inters se
centra en el tiempo de secado de la pintura; se sospecha que la pintura de color amarillo se seca
ms rpidamente que la blanca. Se obtienen mediciones de ambos tipos de pintura. Los tiempos
de secado (en minutos son los siguientes:
Pgina 65
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
(a) Encuentre un intervalo de confianza del 95% para la diferencia entre los tiempos de
secado promedio, suponiendo que las desviaciones estndar de stos son iguales.
Suponga que el tiempo de secado est distribuido de manera normal.
(b) Existe alguna evidencia que indique que la pintura amarilla se seca ms rpidamente
que la blanca?
Pgina 66
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
7. Prueba de hiptesis.
Una hiptesis estadstica es una afirmacin con respecto a alguna caracterstica desconocida
de una poblacin de inters. En forma general, la afirmacin involucra ya sea algn parmetro o
alguna forma funcional no conocida de la distribucin de inters, a partir de la cual se obtiene una
muestra aleatoria. La decisin se toma en base a la probabilidad, y si sta es mnima, entonces
ser rechazada. [Canavos. Pg. 303]
La hiptesis que especifica un valor particular para el parmetro que se estudia se llama
hiptesis nula [Ho]. Esta hiptesis representa normalmente el procedimiento de operacin
acostumbrado de un sistema de especificaciones conocidas.
La hiptesis que especifica a aquellos valores del parmetro que representan un cambio
importante del procedimiento normal de operacin, o de las especificaciones conocidas, se llama
hiptesis alternativa [H1 o Ha].
3. Suponer que los resultados se deben exclusivamente a la casualidad. Esta suposicin es llamada
hiptesis nula.
Pgina 67
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
4. Utilizar una distribucin muestral terica basada en la hiptesis nula para determinar los datos de
una muestra, tan slo por medio de la casualidad.
5. Si la probabilidad de obtener los datos de una muestra, tan slo por medio de la casualidad es
menor que algn pequeo porcentaje predeterminado (por lo comn 5% y 1%), los
resultados sern significativos, puede rechazarse la Ho y considerar confirmada la teora.
Ejemplo. Una empresa en construccin proporciona guantes a sus empleados con una vida
til de 90 das. La empresa aceptar guantes nuevos si stos duran 120 das o ms, con un nivel
de significacin de 5%, para una muestra de 36 guantes y una desviacin estndar de 18 das.
Ejercicio. La duracin de una muestra de 100 tubos flourecentes es de1570 [h], con una
desviacin estndar de 120 [h]. Si es la duracin media de todos los tubos producidos por la
compaa, comprobar la hiptesis de que = 1600 [h] contra la hiptesis 1600 [h], con un nivel
de significacin de 0.05.
NOTA: Tiene que ser utilizado un ensayo bilateral (dos colas), puesto que si = 1600 [h]
incluye valores mayores y menores de 1600 [h].
Diseo I Diseo II
n1 = 40 n2 = 40
x1 = 28.9 x2 = 32.6
s21 = 15.1 s22 = 15.8
Hay evidencia suficiente para pensar que los diseos difieren con respecto a la cantidad promedio
de luz que se recibe? Usar = 0.05.
Parecen diferir los suelos con respecto a la resistencia promedio al cortante en el nivel de
significacin de 1%?
Ejercicio. La Comisin de caza y pesca del estado de Florida, EUA, llev a cabo un estudio
para establecer las cantidades de residuos qumicos que se encontraron en el tejido cerebral de
pelcanos color caf. Para el DDT, muestras de 10 y 13 animales dieron los resultados siguientes,
en partes por milln.
Pgina 68
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Jvenes Adultos
n1 = 10 n2 = 13
x1 = 0.041 x2 = 0.026
s1 = 0.017 s2 = 0.016
Probar la hiptesis de que no hay diferencia entre el promedio de DDT encontrado en los jvenes y
adultos comparndola con la alternativa de que los jvenes tienen mayor cantidad. Usar = 0.05.
(Esta prueba tiene repercusiones importantes acerca de la acumulacin de DDT a lo largo del
tiempo).
Ejercicio. Seis cohetes, cuyo alcance nominal es de 2500 [m], se almacenaron algn tiempo y
despus se probaron. Los alcances en las pruebas fueron 2490, 2510, 2360, 2410, 2300 y 2400
[m]. Otros grupos de seis cohetes, del mismo tipo, se almacenaron el mismo tiempo, pero en forma
distinta. Los alcances de esos seis fueron 2410, 2500, 2360, 2290, 2310 y 2340 [m]. Producen los
mtodos de almacenamiento alcances apreciablemente distintos? Usar = 0.05, y suponer que las
medidas de alcance estn distribuidas en forma aproximadamente normal con la misma varianza
para cada forma de almacenamiento.
Pgina 69
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Definicin. Una hiptesis estadstica es una proporcin sobre los parmetros de una o ms
poblaciones.
H 0 : 50[cm / s] H 0 : 50[cm / s]
o
H 1 : 50[cm / s] H 1 : 50[cm / s]
Es importante que se recuerde que las hiptesis siempre son proporciones sobre la
poblacin o distribucin bajo estudio, no proporciones sobre la muestra.
Del caso expuesto anteriormente. Supngase que se realiza una prueba sobre una muestra
x
de 10 experimentos, y se observa cul es la rapidez de combustin promedio . La media
muestral es un estimador de la media verdadera de la poblacin . Un valor de la media muestral
Pgina 70
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
x
que est prximo al valor hipottico = 50 [cm/s] es
una evidencia de que el verdadero valor de la media es
realmente 50 [cm/s]; esto es, tal evidencia apoya la
hiptesis nula H0. Por otra parte, una media muestral muy
diferente de 50 [cm/s] constituye una evidencia que apoya
la hiptesis alternativa H1.
x
Si esta ente [48.5 y 51.5] entonces es aceptada
x
la hiptesis nula, si el valor de cae fuera de este intervalo entonces se acepta la hiptesis
alternativa.
Ejercicio. Para determinar si las soldaduras en tubos de una planta de energa nuclear
cumplen con las especificaciones, se selecciona una muestra al azar de 15 soldaduras, y se
realizan pruebas en cada soldadura de la muestra, dando como resultado una media de 103.8
[lb/plg2] y una desviacin estndar de 3.6[lb/plg 2]. La resistencia de la soldadura se mide como la
fuerza requerida para romper la soldadura. Suponga que en las especificaciones se establece que
la resistencia media de soldaduras debe rebasar 100 [lb/plg 2]; el equipo de inspeccin determina
probar:
H 0 : 100
H a : 100
Las muestras cumplen con lo requerido? Para ello utilice un nivel de significancia de 1%.
Ejercicio. Muchas edificaciones antiguas, tiene sistemas elctricos que utilizan fusibles en
lugar de cortacircuitos. Un fabricante de fusibles de 40[A] desea asegurarse de que la media de
corriente a la que se queman los fusibles es en realidad 40[A] o mayor. Se toma una muestra del
amperaje en 50 domicilios cercanos al lugar, obteniendo una media de 36[A] y una desviacin
estndar de 7.8 [A]. Pruebe la hiptesis de que los fusibles fabricados puedan durar sin problemas
hasta resistir los 40[A] en la lnea elctrica domestica. Utilice un nivel de significancia de 1%.
Ejercicio. El voltaje de salida en cierto circuito elctrico debe ser igual a 130, segn se
especifica. Una muestra de 20 lecturas independientes para este circuito dio una media muestral
de 120.4 y una desviacin estndar de 3.4. Pruebe la hiptesis de que el voltaje de salida promedio
en 130 frente a la hiptesis alternativa de que es menor a 130. Utilice un nivel de significacin de
5%.
Definicin. El error tipo I se define como el rechazo de la hiptesis nula H0 cuando sta es
verdadera.
Definicin. El error tipo II se define como la aceptacin de la hiptesis nula H0 cuando sta
es falsa.
Pgina 71
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
En lugar de pedir procedimientos libres de error, debemos buscar procedimientos para los
que no sea posible que ocurra ningn tipo de error. Esto es, un procedimiento es aquel para el que
la probabilidad de cometer cualquier tipo de error es pequea. La eleccin de un valor particular de
corte de la regin de rechazo fija las probabilidades de errores tipo I y tipo II. Estas probabilidades
de error se denominan con las letras y , respectivamente. Debido a que H0 especifica un valor
nico del parmetro, hay un solo valor de . Sin embargo, hay un valor diferente de por cada
valor del parmetro consistente con Ha.
Ejemplo. El calor emanado, en caloras por gramo, de una mezcla de cemento tiene una
distribucin aproximadamente normal. Se piensa que la media es 100 y que la desviacin estndar
es 2. Se desea probar H0: = 100 contra Ha: 100, con una muestra de 9 observaciones. Si se
x
define el caso de aceptacin como 98.5 101.5, encuentre la probabilidad del error tipo I.
x x
Solucin. = P( < 98.5 = 100) + P( > 101.5 = 100)
98.5 100 101.5 100
z1 2.25 z 2 2.25
2 2
9 9
Esto me indica que el 2.44% de las muestras aleatorias conducirn al rechazo de la hiptesis
H0: = 100, cuando la verdadera cantidad de calor emanado es en realidad 100 caloras por
gramo.
Para calcular se debe tener una hiptesis alternativa especfica; esto es, debe tenerse en
cuenta un valor particular de .
Ejercicio. Un fabricante de fibras textiles est investigando una nueva fibra para tapicera, la
cual tiene una elongacin media por hilo de 12[kg] con una desviacin estndar de 0.5 [kg]. La
compaa desea probar la hiptesis H0: = 12, contra la hiptesis H1: < 12, utilizando para ello
una muestra aleatoria de cuatro experimentos. Cul es la probabilidad del error tipo I si la regin
x
crtica est definida como < 11.5 [kg]?
Pgina 72
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
normal, con desviacin estndar 0.25 [V]. El fabricante desea probar H0: = 5 [V] contra la
hiptesis H1: 5 [V], utilizando para ello 8 muestras.
x
(a) La regin aceptada es 4.85 5.15. Encuentre el valor de .
(b) Encuentre la potencia de la prueba para detectar el verdadero voltaje de salida promedio,
que es 5.1 [V].
Supngase que se tienen dos poblaciones de inters. La primera tiene una media
1 12 2
desconocida y varianza conocida , mientras que la segunda tiene una media desconocida
22
y varianza conocida . El inters recae en probar la hiptesis de que las dos medias
1 2
poblacionales y son iguales. Supngase que las dos poblaciones son normales, y que si no
lo son se aplican condiciones del teorema del limite central.
Considrese primero las hiptesis alternativas bilaterales H0: 1 = 2 contra la hiptesis H1:
1 2.
x1 x 2
z0
12 22
n1 n2
Si la hiptesis nula es verdadera, el estadstico de prueba tiene la
distribucin normal estndar. Por consiguiente, el procedimiento para probar la hiptesis nula es
calcular el valor numrico del estadstico de prueba z 0 de la ecuacin anterior y rechazar la
hiptesis nula si z0 > z/2 o z0 < z/2.
Pgina 73
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
conclusiones puede llegar el diseador del producto sobre la eficacia del nuevo ingrediente,
utilizando = 0.05?
02
n 1 s 2
02
prueba .
2 02
Donde s2 es la varianza muestral. Ahora, si H0: = es verdadera, el estadstico de
2
0
prueba sigue una distribucin Ji cuadrado con n 1 grados de libertad. Por consiguiente se
02 2 0 02
2
2 / 2, n 1 2 / 2, n 1
Donde y son los puntos que corresponden a los porcentajes 100/2
inferior y superior de la distribucin Ji cuadrado con n 1 grados de libertad, respectivamente.
02 02
H0: 2 = H0: 2 =
2
0 02
H1: 2 > H1: 2 <
Se rechaza si Se rechaza si
2
0
2
/ 2 , n 1 02 2 / 2, n 1
> <
Pgina 74
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca
Ejemplo. Considere el caso de la mquina de llenado de las botellas. Al tomar una muestra
de 20 botellas se obtiene una varianza muestral para el volumen de llenado de s 2 = 0.0153 (onzas
de fluido)2. Si la varianza de volumen de llenado es mayor que 0.01 (onzas de fluido) 2, entonces
existe una proporcin inaceptable de botellas que sern llenadas con una cantidad menor de
lquido. Existe evidencia en los datos muestrales que siguieran que el fabricante tiene un
problema con el llenado de las botellas? Utilcese = 0.05.
Pgina 75