Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Probabilidades y Estadstica
ii
ndice
1 INTRODUCCIN A LA ESTADSTICA.......................................................................................................1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 1.11 1.12 1.13 2 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2 3.3 3.4 3.5 3.6 4 4.1 4.2 4.3 4.4 4.5 5 5.1 5.2 5.3 5.4 6 6.1 6.2 6.3 6.4 DEFINICIN DE ESTADSTICA. ...................................................................................................................1 DIVISIN DE MTODOS ESTADSTICOS......................................................................................................1 MEDIDAS USADAS EN LA ESTADSTICA DESCRIPTIVA ..................................................................................1 MEDIDAS USADAS EN ESTADSTICA INDUCTIVA: .........................................................................................2 MEDIDAS USADAS EN MTODOS COMPLEJOS ............................................................................................2 PASOS PARA SEGUIR EN UN MTODO ESTADSTICO ...................................................................................2 MTODOS DE RECOLECCIN DE DATOS ...................................................................................................2 POBLACIN Y MUESTRA ...........................................................................................................................2 DISTRIBUCIN DE FRECUENCIAS ..............................................................................................................3 GRFICAS DE FRECUENCIAS ....................................................................................................................5 ESTADSTICOS IMPORTANTES ...................................................................................................................6 RELACIN ENTRE LA MEDIA, MEDIANA Y MODO EN UN POLGONO DE FRECUENCIAS ...................................8 EJERCICIOS ............................................................................................................................................9 DEFINICIONES. ......................................................................................................................................10 PRINCIPIO DE ENUMERACIN O CONTEO. ...............................................................................................12 PRINCIPIO DE ADICIN ...........................................................................................................................13 PROBABILIDAD DE UN EVENTO ...............................................................................................................15 TEOREMA DE PROBABILIDAD COMPLETA (TEOREMA ADITIVO):.................................................................16 TEOREMA DE PROBABILIDAD COMPUESTA (TEOREMA DE MULTIPLICACIN)..............................................16 PROBABILIDAD CONDICIONAL .................................................................................................................17 TEOREMA DE BAYES ..............................................................................................................................18 EJERCICIOS ..........................................................................................................................................19 DEFINICIONES VARIAS............................................................................................................................21 FUNCIN DE DISTRIBUCIN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA. ..........................22 DISTRIBUCIN ACUMULATIVA DE UNA VARIABLE ALEATORIA DISCRETA ....................................................22 FUNCIN O DISTRIBUCIN DE PROBABILIDAD DE UNA VARIABLE...............................................................23 DISTRIBUCIN ACUMULATIVA DE UNA VARIABLE ALEATORIA CONTINUA....................................................24 EJERCICIOS. .........................................................................................................................................24 DEFINICIONES VARIAS. ..........................................................................................................................26 PROPIEDADES O LEYES DE LA ESPERANZA MATEMTICA.........................................................................27 VARIANZA DE UNA VARIABLE ALEATORIA.................................................................................................27 TEOREMA DE CHEBYSHEV. ....................................................................................................................28 EJERCICIOS. .........................................................................................................................................29 DISTRIBUCIN BINOMIAL........................................................................................................................31 DISTRIBUCIN DE POISSON ....................................................................................................................32 DISTRIBUCIN NORMAL .........................................................................................................................33 EJERCICIOS ..........................................................................................................................................35 TEORA DEL MUESTREO .........................................................................................................................38 DISTRIBUCIN MUESTRAL DE MEDIA ARITMTICA....................................................................................42 DISTRIBUCIN MUESTRAL DE MEDIA ARITMTICA CON DOS MUESTRAS ...................................................42 DISTRIBUCIN MUESTRAL 2 / CHI 2 / JI 2 ................................................................................................43 Ing Luis Castellanos (Versin 1.20)
ESPERANZA MATEMTICA....................................................................................................................26
DISTRIBUCIONES DE PROBABILIDAD..................................................................................................31
UNEFA. Probabilidades y Estadstica. 6.5 6.6 6.7 7 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 8 8.1 8.2 8.3 8.4 8.5 9 9.1 9.2 9.3 10 11 11.1 11.2 11.3 11.4 11.5
iii
DISTRIBUCIN T DE STUDENT ..............................................................................................................43 DISTRIBUCIN F (DE FISCHER)...............................................................................................................45 EJERCICIOS ..........................................................................................................................................46 GENERALIDADES. ..................................................................................................................................47 ESTIMACIN PUNTUAL O LOCAL .............................................................................................................47 ESTIMACIN POR INTERVALOS ...............................................................................................................48 ERROR MUESTRAL ................................................................................................................................48 ESTIMACIN DE LA MEDIA ......................................................................................................................49 CMO SE CALCULA EL TAMAO DE UNA MUESTRA?...............................................................................50 LMITE DE TOLERANCIA ..........................................................................................................................51 DISTINCIN ENTRE LMITES DE CONFIANZA Y LMITES DE TOLERANCIA .....................................................52 ESTIMACIN DE LA VARIANZA .................................................................................................................52 EJERCICIOS ..........................................................................................................................................52 HIPTESIS ESTADSTICA ........................................................................................................................54 HIPTESIS NULA (H0) ............................................................................................................................54 PRUEBA DE HIPTESIS ESTADSTICA ......................................................................................................54 PRUEBA DE MEDIAS Y VARIANZAS ..........................................................................................................57 EJERCICIOS ..........................................................................................................................................59 ANLISIS DE REGRESIN PARA DOS VARIABLES.......................................................................................61 ANLISIS DE CORRELACIN PARA DOS VARIABLES ...................................................................................64 EJERCICIOS ..........................................................................................................................................66 BIBLIOGRAFA......................................................................................................................................68 ANEXOS.................................................................................................................................................69 REAS BAJO LA CURVA NORMAL ............................................................................................................69 VALORES CRTICOS DE LA DISTRIBUCIN 2............................................................................................70 VALORES CRTICOS DE LA DISTRIBUCIN T .............................................................................................71 SUMAS DE DISTRIBUCIN BINOMIAL .......................................................................................................72 FACTORES DE TOLERANCIA PARA DISTRIBUCIONES NORMALES ...............................................................73
luiscastellanos@yahoo.com
1 Introduccin a la Estadstica
1.1 Definicin de Estadstica. Tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivos, cuya medicin requiere una masa de observaciones de otros fenmenos (Conrado Gini) Ciencia que trata de la recoleccin, clasificacin y presentacin de los hechos sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de un fenmeno (G. Vany Yule) Basa sus leyes, no en el estudio de una observacin aislada o individual, sino en el estudio de un gran nmero de observaciones. Dato Estadstico: aquel que mide un fenmeno colectivo (Tasa de Mortalidad de Venezuela en ltimos 10 aos, Produccin de Petrleo en Venezuela durante los ltimos 5 aos, etc.). 1.2 Divisin de Mtodos Estadsticos. Mtodos Descriptivos (o Estadstica Descriptiva): resumen o condensan todos los datos de una serie de valores para describir determinados aspectos de la serie. Mtodos Inductivos (o Estadstica Inferencial): tratan de estimar las caractersticas del universo estadstico o poblacin total a travs del estudio de una parte de ese universo. Mtodos Simples: se refieren al estudio de una sola caracterstica o variable. Mtodos Complejos: se refieren al estudio de dos o ms caractersticas o variables, determinando la relacin entre ellas. 1.3 Medidas usadas en la Estadstica Descriptiva Razones, tasas y porcentajes Distribucin de frecuencias Medidas de Tendencia Central (Media, Mediana, Modo)
Ing Luis Castellanos (Versin 1.20)
1.4
Medidas de Dispersin (Desviacin cuartel, quintil, decil, percentil) Momentos, Asimetra, Kurtosis
1.5
1.6
Pasos para seguir en un Mtodo Estadstico Formulacin del Problema Desarrollo del Mtodo de Recoleccin de Datos Recoleccin de Datos Clasificacin de Datos Anlisis Estadstico Presentacin de Resultados Interpretacin de los Resultados
1.7
Mtodos de Recoleccin de Datos Entrevista Personal Cuestionario Observacin Directa Experimentos Estadsticos
1.8
Poblacin y Muestra Poblacin: conjunto de individuos, objetos o cosas que se van a analizar. Es el Universo Estadstico. Es el TODO. Puede ser:
Ing Luis Castellanos (Versin 1.20)
o Finita: se pueden contar todos sus elementos o Infinita: el nmero de elementos es ilimitado. Muestra: parte representativa de la poblacin. Puede ser: o Probabilstica: sus elementos tienen una probabilidad conocida y no nula de ser seleccionados usando un mtodo de seleccin aleatorio. o No Probabilstica: sus elementos son escogidos de acuerdo al criterio del investigador y no al azar. Estudio Poblacional: anlisis deductivo. Lo que es vlido para el todo, es vlido para uno. Estudio Muestral: anlisis deductivo. Lo que es vlido para uno, podra ser vlido para el todo. 1.9 Distribucin de Frecuencias Componentes: o Intervalo Total (o Rango): diferencia entre Lmite Superior y el Lmite Inferior. (IT) o Clases: fraccionamiento de la amplitud total o Rango. o Intervalo de Clase: diferencia entre los Lmites Inferior y Superior de una Clase. (IC) o Punto Medio del Intervalo de Clase. (xi) o Frecuencia de Clase: nmero de casos en que la variable est comprendida entre los lmites de una clase. (fi) Organizacin: o Determinar el Intervalo Total IT = LS - LI o Determinar el nmero de Clases (se recomiendan entre 3 y 25) o Determinar el Intervalo de Clase IC = IT N Clases
IC = IT 1 + 3,322 x log n
(Ecuacin de Sturges)
o Determinar Lmites de Clase, de acuerdo a los IC definidos. Series Discretas 10 19 20 29 30 39 Series Continuas 10 19,99 20 29,99 30 39,99
o Determinar las frecuencias: registrar el nmero de datos u ocurrencias en cada clase. Ejemplo: o Agrupar en Distribucin de Frecuencias las notas obtenidas por la Seccin J en Matemtica II: 16, 8, 6, 10, 12, 10, 10, 10, 11, 7, 10, 8, 14, 10, 11, 11, 8, 17, 8, 6, 10, 2, 10. Se recomienda primero ordenar los datos: 2, 6, 6, 7, 8, 8, 8, 8, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 11, 12, 14, 16, 17. n=3 IT = LS - LI IT = 17 2 IT = 15
IC = IT 15 IC = I C = 2,72 I C = 3 1 + 3,322 x log n 1 + 3,322 x log 23
Sin embargo, se recomienda tomar IC = 4, para que se incluya en el Lmite Inferior de la primera clase, el nmero menor, y en el Lmite Superior de la ltima clase, el nmero mayor.
Clases 25 69 10 13 14 17 Punto Medio 3,5 7,5 11,5 15,5 Frecuencia 1 7 12 3 Frecuencia Acumulada 1 8 20 23
1.10 Grficas de Frecuencias Polgono de Frecuencias: diagrama de lneas que representa los puntos medios y sus respectivas frecuencias de una distribucin.
Polgono de Frecuencias
Frecuencias 15 10 5 0 2-5 6-9 10 - 13 Clases 14 - 17
Histograma de Frecuencias: serie de rectngulos paralelos, cuya base representa el Intervalo de Clase y su altura la magnitud de la frecuencia de la clase respectiva.
Histograma de Frecuencias
Frecuencias 15 10 5 0 2-5 6-9 10 - 13 Clases 14 - 17
Histograma de Frecuencias Acumuladas: serie de rectngulos paralelos, cuya base representa el Intervalo de Clase y su altura la magnitud de la frecuencia acumulada.
1.11 Estadsticos Importantes Estadstico: Medida que se calcula para describir la caracterstica de una sola muestra (, s, s2, p). Media Aritmtica:
x =
i=1
f i .x
n
i=1
Media Geomtrica:
i =1
f i . log x i n
G = 10
Desviacin Estndar:
s =
(x
i =1
A mayor desviacin, mayor dispersin. En una Distribucin Normal (ver Unidad correspondiente), el porcentaje de los datos muestrales se agrupan de acuerdo a la siguiente proporcin: o s 68,27% (Zona Normal) o 2 s 95,45% o 3 s 99,73%
Mo= Li +
Ic
Mediana: valor que divide una distribucin de tal manera que quede a cada lado un nmero igual de trminos.
f
i=1
Md = Li + 2
Ejemplo:
f ant fi Ic
o Aadimos unas columnas a la tabla del Ejercicio del Ejemplo anterior, para facilitar los clculos.
Clases 25 69 10 13 14 17 Totales xi 3,5 7,5 11,5 15,5 fi 1 7 12 3 23 facum 1 8 20 23 fi xi 3,50 52,50 138,00 46,50 240,50 fi log xi 0,54 6,13 12,73 3,57 22,97 (xi - )2 48,39 8,74 1,09 25,44 83,66
x =
i =1
f i .x i
n
x =
i=1
fi
f i . log x i n
n
240 , 50 x = 10 , 4565 23
G = 10
n
i =1
G = 10
22 , 97 23
G = 9 , 9689
s =
(x
i =1
s =
83 , 66 23
s = 1 , 9072
o s2 = ( 1,9072) 2 s2 = 3,6374
Mo= Li +
Ic Mo= 10+
3 4 Mo= 11 ,20 7 +3
f
i=1
Md = Li + 2
f ant fi
23 7 2 Ic Md = 10+ 4 Md = 11 ,50 12
Simtrica
Asimtrica Positiva
Asimtrica Negativa
Leptokrtica
Mesokrtica
Platikrtica
1.13 Ejercicios Sean las medidas de peso de un grupo de personas: 56, 55, 40, 47, 73, 75, 81, 60, 65, 53, 52, 43, 56, 69, 67, 55, 52, 43, 52, 56, 69, 56. Con los datos agrupados halle: Media, Media Geomtrica, Mediana, Modo, Desviacin Estndar, Varianza Grafique Polgono de Frecuencias, Histograma de Frecuencias e Histograma de Frecuencias Acumuladas Determine si la grfica es Simtrica o Asimtrica (Positiva o Negativa)
10
2 Teoremas de Probabilidades.
2.1 Definiciones. Tipos de Modelos: o Determinsticos (Ej. v =
d ) t
Experimento Aleatorio: registra los resultados al azar, que ocurren en un estudio planificado o en una investigacin cientfica. Ej.: lanzar una moneda. Datos Iniciales: informacin registrada en la forma en que se recoge, ya sean cuentas o mediciones. Ej.: cara, sello, cara, cara. Cualquier recoleccin de informacin debe tener un propsito especfico y ser seguido por acciones. Sugerencias para la Recoleccin de Datos: o Registrar claramente el origen de los datos o Registrar para usar los datos fcilmente o Si se van a registrar datos de manera continua, se pueden preparar y usar formatos para ello
Conjunto: agrupacin de elementos que comparten una propiedad comn. Espacio Muestral: conjunto de todos los resultados posibles de un experimento aleatorio (s). o Cada resultado se llama elemento, o miembro del Espacio Muestral, o Punto Muestral. o El Espacio Muestral puede ser Finito o Infinito.
11
o Ciudades con ms de 1 milln de Habitantes o Puntos (x,y) dentro de un crculo de radio 2 y centro en el origen
Ejercicios: o Halle el Espacio Muestral al tirar un Dado. o Halle el Espacio Muestral al seleccionar 3 piezas al azar en un proceso de produccin. Cada pieza se inspecciona y clasifica como Defectuosa (D) o No Defectuosa (N).
Suceso o Evento: cualquier subconjunto del Espacio Muestral (A). o Ejemplo: Determine el evento al lanzar el dado y observar nmeros pares que salen. A = { 2, 4, 6 }
Evento Simple: contiene slo un elemento del Espacio Muestral. o Ejemplo: A = { t / t < 5 } del S = { t / t 0 } o (Donde t es la vida en aos de un componente electrnico. A es el evento de que falle antes del 5to ao).
Conjunto Vaco: subconjunto del Espacio Muestral que no contiene elementos (). Evento Compuesto: proviene de la unin de dos o ms eventos simples. o Ejemplo. Tomemos el evento de sacar corazn de un Mazo de Cartas.
mazo:
es Conjunto Vaco.
12
Repaso: o Interseccin (): evento que contiene todos los elementos comunes a A y a B (A B). o Unin (U): evento que contiene todos los elementos que pertenecen a A, a B, o a ambos. (A U B).
Complemento de un Evento A con respecto a S: es el conjunto de todos los elementos de S que no estn en A (A). o Ejemplo. Sea Q el evento de que una persona seleccionada al azar en un saln de clases fume. Entonces Q es el evento de que la persona No Fume.
2.2
Si una operacin se puede efectuar en n1 formas, y si para cada una de ellas se puede efectuar una segunda operacin en n2 formas, y si para cada una de las dos primeras se puede efectuar una tercera operacin en n3 formas, y as sucesivamente, entonces la secuencia de k operaciones se podr realizar en n1.n2.n3. nk formas.
n3
n2 n1
o Ejemplo: Cuntos almuerzos que contengan Sopa, Seco, Postre y Jugo, se pueden preparar si se puede escoger entre cuatro (04) sopas, tres (03) secos, cinco (05) postres y cuatro (04) jugos? k = 4.3.5.4. k = 240 almuerzos
13
2.3
Principio de Adicin T = n1 + n2
n1
n2
Frecuentemente nos interesamos en un Espacio Muestral que contenga como elementos a todos los rdenes o arreglos posibles de un grupo de objetos. o Permutaciones importa el orden o Combinaciones no importa el orden
Permutaciones de n elementos: o
n
P n = n!
n! ( n r )!
P c = ( n 1)!
n! n1! n2 ! n3!...nk !
n! r!( n r )!
Ing Luis Castellanos (Versin 1.20)
14
Ejemplos: o Consideremos las letras a, b, c. Cuntos objetos distintos se pueden obtener si las agrupamos en 3 letras?
3
P 3 = 3! 3 P 3 = 3.2.1 3 P 3 = 6
o Consideremos las letras a, b, c, d. Cuntos objetos distintos se pueden obtener, si las agrupamos en 2 letras?
4 P2=
o Consideremos a cuatro (4) jugadores de cartas. Cuntas formas distintas de ubicar a los jugadores se pueden obtener?
4
P c = ( 4 1)! 4 P c = 3! 4 P c = 3.2.1 4 P c = 6
o En cuntas formas diferentes pueden arreglarse 3 bombillos rojos, 4 bombillos amarillos y 2 bombillos azules en una extensin navidea de 9 bombillos?
9 Pk =
9! 9 P k = 1.260 3!4!2!
o De cuntas formas se pueden alojar 7 ingenieros en un cuarto triple y en dos cuartos dobles de un Hotel?
7 Pk =
7! 7 P k = 210 3!2!2!
8! 8 C 3 = 56 3!(8 3)!
15
25 C15 =
2.4
Probabilidad de un Evento La Probabilidad de cualquier evento A es la suma de los pesos de todos los puntos muestrales en A, con valor entre 0 y 1. o 0 p(A) 1
Un peso cercano a 0 indica que el evento tiene poca posibilidad de ocurrir, y un peso cercano a 1 indica que tiene mucha posibilidad de ocurrir. Otra definicin de Probabilidad: nmero que se le asigna a un evento que determinar las veces que el mismo puede ocurrir.
P( A) = P ( A) =
n N A S
Si un evento puede ocurrir de a maneras, y deja de ocurrir de b maneras, siendo todos los casos posibles, P ( A) =
a a+b
p + q = 1 (probabilidad de ocurrencia + probabilidad de no ocurrencia) Ejemplo: o Probabilidad que al lanzar un dado salga un 2. S = { 1, 2, 3, 4, 5, 6 } ; A = { 2 }
1 5 p(2) = ; q(2) = 6 6
S = { cc, cs, ss, sc } ; A = { cs, sc }
p( A) =
2 1 ; p( A) = 4 2
o Si se sacan tres (3) cartas de un mazo de barajas espaolas, cul es la probabilidad que stas sean as, dos y tres? Primero se halla el nmero de maneras que pueden salir 3 cartas de 40:
Ing Luis Castellanos (Versin 1.20)
16
40 C 3 =
p( A) =
o Si se saca una carta de un mazo de barajas, cul es la probabilidad que la carta sea diamante? 2.5 S = { 52 } ; A = { 13 }
p( A) =
13 ; p( A) = 0,25 52
En dos eventos mutuamente excluyentes A y B, A tiene p1 probabilidades de ocurrir, y B tiene p2 probabilidades de ocurrir. La probabilidad de ocurrir A o B es igual a p1 + p2. o P(A U B) = P(A) + P(B) o P(A+B) = P(A) + P(B)
Ejemplo: Si tenemos en una caja 12 bolas blancas, 10 bolas azules y 8 bolas rojas, cul es la probabilidad de que al sacar una bola, sta sea blanca o roja? o o
P(b) =
P(b + r ) =
2.6
Teorema de Probabilidad Compuesta (Teorema de Multiplicacin) Si un evento A tiene p1 probabilidades de ocurrir y otro evento B tiene p2 probabilidades de ocurrir, simultneamente o despus de A, entonces la probabilidad de ocurrir A y B es igual a p1. p2. o P(A B) = P(A). P(B) o P(AB) = P(A). P(B) Eventos Independientes
17
Eventos Independientes: ocurre un evento sin importar el resultado del evento anterior. Eventos Dependientes: la probabilidad de ocurrencia de un evento depende de la ocurrencia del evento anterior. Ejemplo: o Si tenemos en una caja 12 bolas blancas, 10 bolas azules, y 8 bolas rojas, cul es la probabilidad de que al realizar dos extracciones de la caja, la primera sea blanca y la segunda roja? o o
P(b) =
P (br ) =
2.7
Probabilidad Condicional Es la probabilidad de que ocurra un evento B cuando se conoce que ha ocurrido un evento A. P(B/A). o
P ( B / A) =
P( A B ) P( AB) = P( A) P( A)
Ejemplo: o Sea la probabilidad de que aumenten las ventas de carros el prximo mes p(A) = 0,40. Sea la probabilidad de que aumenten las ventas de repuestos el prximo mes p(R) = 0,50. Sea p(AR) = 0,10. Calcule la probabilidad que aumente A dado que aumentar R, y la probabilidad que aumente R dado que aument A.
P( A / R) =
P ( R / A) =
P( A / R) =
P ( R / A) =
P ( A / R) = 0,20
P ( A / R) = 0,25
18
2.8
Teorema de Bayes
Se emplea para conocer las probabilidades de causas que hayan actuado sobre sucesos ya constatados. Enunciado: si un suceso puede ser originado por varias causas, las cuales a priori son igualmente probables, la probabilidad de que el suceso sea debido a una determinada causa es igual a la probabilidad compuesta correspondiente a dicha causa, dividida entre la suma de las probabilidad compuestas, segn las cuales el suceso pudiere derivarse de todas y cada una de ellas. o
P( Ak / B) =
P( Ak ).P( B / Ak )
P( A )P( B / A )
i =1 i i
P( Bk / A) =
P( Bk ).P( A / Bk )
P( B )P( A / B )
i =1 i i
Ejemplo: o Se tienen 3 cajas: A1 5 bolas blancas + 2 bolas negras A2 6 bolas blancas + 5 bolas negras A3 8 bolas blancas + 3 bolas negras
o Se saca una bola blanca. Cul es la probabilidad de que sea de la primera caja?
p( A1 ) = p ( A2 ) = p( A3 ) =
1 = 0,3333 3
P( A1 / B) =
P( A1 ).P( B / A1 ) P( A1 ) P( B / A1 ) + P( A2 ) P( B / A2 ) + P( A3 ) P( B / A3 )
1 5 . 55 3 7 P( A1 / B) = P( A1 / B) = P( A1 / B) = 0,3595 1 5 1 6 1 8 153 . + . + . 3 7 3 11 3 11
19
2.9
Ejercicios Encuentre la Probabilidad de que en el lanzamiento sencillo de un dado, resulte un nmero menor a 4.
Las probabilidades de que un marido y su esposa estn vivos durante 20 aos a partir de ahora est dada por 0.8 y 0.9 respectivamente. Encuentre la posibilidad de que en 20 aos: o Ambos estn vivos o Ninguno est vivo o Al menos uno de ellos est vivo
Se saca al azar una carta de un mazo de 52 cartas. Encuentre la probabilidad de que la carta sea: o J de Corazones (J) o 3 de Trbol (3) 6 de Diamantes (6) o Un Corazn () o Cualquier carta que no sea Corazn. o Ni 4 ni Trbol ()
Se saca al azar una bola de una caja que contiene 6 bolas rojas, 4 blancas y 5 azules. Determine la probabilidad de que la bola sea: o Roja o Blanca o Azul o No Roja o Roja o Blanca
Un dado balanceado se lanza dos (2) veces. Encuentre la probabilidad de obtener 4, 5 6 en el primer lanzamiento, y 1, 2, 3 4 en el segundo lanzamiento.
Determine la Probabilidad de obtener 3 seis al lanzar 5 veces un dado balanceado Se sacan 2 cartas de un mazo de 52 cartas. Encuentre la probabilidad de que ambas cartas sean Ases. o Con reemplazo
Ing Luis Castellanos (Versin 1.20)
20
o Sin reemplazo
Sea un mazo de 52 cartas, y un jugador de Blackjack desea saber la probabilidad de tener Blackjack: o Con 2 cartas o Con 3 cartas o Con 4 cartas
De cuntas maneras se pueden ordenar 5 personas en una rueda de reconocimiento de testigos? De cuntas maneras se pueden sentar 10 personas en una banca, si slo hay 4 puestos disponibles? De cuntas maneras posibles se pueden sentar 7 personas alrededor de una mesa redonda, si o Se pueden sentar en cualquier lugar? o 2 personas en particular no se pueden sentar juntas?
De cuntas maneras se puede formar un comit de 5 personas a partir de un grupo de 9? Se va a formar un comit de 2 matemticos y 3 fsicos a partir de 5 matemticos y 7 fsicos. De cuntas maneras se puede hacer si o Se puede incluir cualquier matemticos y cualquier fsico? o Un fsico en particular debe estar en el comit? o Dos matemticos en particular no pueden pertenecer al comit?
Empleando Teorema de Bayes: o La Caja 1 tiene 3 metras rojas y 2 metras azules. La Caja 2 tiene 2 metras rojas y 8 metras azules. Se lanza una moneda balanceada. Si se obtiene cara, se saca una metra de la Caja 1. Si se obtiene sello, se saca una metra de la Caja 2. o Si no se revela si se obtiene Cara o Sello, pero se dice que se sac una metra roja, Cul es la probabilidad de que la metra haya sido sacada de la Caja1?
21
Algunas Clasificaciones: o Variables Cualitativas: miden cualidades (gnero, etc.) o Variables Cuantitativas: se miden a travs de cantidades cuantificables (estatura, peso, etc.) o Variables dependientes: aquella cuyo resultado es afectado por el efecto producido por otra variable o Variables Independientes: aquella cuyo valor no depende de otra variable.
Variable Aleatoria: es la funcin cuyo valor es un nmero real determinado por cada elemento en el Espacio Muestral. Se usa letra mayscula para representarla, y letra minscula para representar sus resultados.
Espacio Muestral Discreto: contiene una cantidad finita de posibilidades. Variable Aleatoria Discreta: variable aleatoria definida sobre un Espacio Muestral Discreto. Espacio Muestral Continuo: contiene una cantidad infinita de posibilidades. Variable Aleatoria Continua: variable aleatoria definida sobre un Espacio Muestral Continuo. Tambin se llama Funcin de Densidad. Generalmente las Variables Aleatorias Discretas representan datos contados, y las Continuas datos medidos (alturas, pesos, temperaturas, distancias). Ejemplo: o De una caja que contiene 4 bolas rojas y 3 blancas, se toman sucesivamente 2 bolas sin reemplazarlas. Los resultados posibles z los valores y de la Variable Aleatoria Z (N de bolas rojas) es: z RR RB BR BB 2 1 1 0
Ing Luis Castellanos (Versin 1.20)
Z = { 2, 1 , 1, 0 }
22
o Se conduce una investigacin para medir las distancias que recorre un vehculo con 5 litros de gasolina (W). 3.2 Funcin de Distribucin de Probabilidad de una Variable Aleatoria Discreta. La Funcin (x) es una funcin de probabilidad de la Variable Aleatoria X si, para cada x resultado posible: o (x) 0 o (x) = 1 o P(X = x) = (x)
Ejemplo: o Encuentre la distribucin de Probabilidad de la suma de los nmeros cuando se lanzan 2 dados. 2 dados pueden caer en 6x6 = 36 formas. 4 3/36 5 4/36 6 5/36 7 6/36 8 5/36 9 4/36 10 3/36 11 2/36 12 1/36
x (x)
2 1/36
3 2/36
(x) =
x 1 36 13 x 36
x7 x>7
3.3
f (t )
tx
o F(2) = (2) = 1/36 o F(3) = (2) + (3) = 3/36 o F(4) = (2) + (3) + (4) = 3/36 o o F(12) = (2) + (3) + (4) + + (12) = 36/36
23
Histograma de Probabilidad
10
11
12
3.4
Funcin o Distribucin de Probabilidad de una Variable. La funcin (x) es una funcin de Probabilidad de la Variable Aleatoria Continua X (Funcin de Densidad), definida en R, si: o (x) 0; x R
f ( x)dx = 1
o P(a<X<b) =
f ( x)dx
a
24
x2 x3 dx = 3 9 1
=
1
8 1 + =1 9 9
x2 x3 dx = 3 9
=
0
1 9
3.5
F ( x) = P( X x) =
Ejemplo:
f (t )dt
x
t2 t3 o F ( x) = dt = 3 9 1
x
x 3+ 1 = 9
3.6
Ejercicios.
Se lanza una moneda dos veces. Halle la Funcin de Probabilidad y la Funcin de Densidad de X (N de Caras). Se lanza una moneda tres veces. Halle la Funcin de Probabilidad y la Funcin de Densidad de X (N de Caras). Una caja tiene 5 metras blancas y 3 metras negras. Si se sacan 2 metras al azar, sin reemplazo, y X indica el nmero de metras blancas, halle la Funcin de Probabilidad y la Funcin de Densidad de X.
Sea X una Variable Aleatoria que indica el nmero de Ases al retirar 4 cartas al azar de un mazo de 52 barajas. Halle la Funcin de Probabilidad y la Funcin de Densidad de X.
Halle la constante c de manera que la siguiente funcin sea una Funcin de Densidad:
Ing Luis Castellanos (Versin 1.20)
25
o (x) =
c x2 0
; ;
o Halle P(1<X<2)
Una Variable Aleatoria X tiene la siguiente Funcin de Densidad: o (x) = c x2 cx 0 o Halle c o Halle P(X>2) o Halle P( < X < 3/2 ) ; ; ; 0x2 2<x<3 en otro valor
La Funcin de Distribucin de una Variable Aleatoria X est dada por: o (x) = c x3 1 0 o Halle P(1<X<2) ; ; ; 0x<3 x3 x<0
o Si P(X=3) = 0, halle c
Sea X una Variable Aleatoria con Funcin de Densidad: o (x) = o Halle c o Halle P(1/2 < X < 3/2) cx 0 ; ; 0x2 en otro valor
26
4 Esperanza Matemtica
4.1 Definiciones Varias. El Valor Esperado, o la Esperanza Matemtica, de una Variable Aleatoria X, con una Funcin de Probabilidad (x) es: o E(X) = x (x) (X Discreta)
o E(X) =
xf ( x)dx
la
(X Continua)
Ejemplo: o Calcule Esperanza de los siguientes Experimentos Aleatorios: Dos monedas se lanzan 16 veces al aire, donde X es el nmero de caras por lanzamiento. X = { 0, 1, 2 }. Se obtienen 0, 1 y 2 caras, 4, 7 y 5 veces respectivamente.
4 7 5 E ( X ) = 0. + 1. + 2. E ( X ) = 1,06 16 16 16
Sea X la vida en horas de una vlvula electrnica. La Funcin de Densidad de Probabilidad es: (x) =
20.000 ; x3
0;
E(X) = 200
Sea X una variable aleatoria con distribucin de probabilidad (x). El valor esperado de la funcin g(X) es: o E[g(X)] = g(x) (x) (X Discreta)
27
o E[g(X)] =
g (x ) f ( x)dx
Esperanza X x (x) una
(X Continua)
Ejemplo: o Calcule la Sea de los siguientes con 2 0 Experimentos la siguiente 3 1/6 Aleatorios: variable 0 1/3 aleatoria 1 1/2 distribucin de probabilidad:
(x) =
(2 x 1) x 2 1 3 E (2 X 1) = dx = (2 x 3 x 2 )dx = 3 3 1 2 1
4.2
4.3
E [(X) g(X)] = E [(X)] E [g(X)] E [(X,Y) g(X,Y)] = E [(X,Y)] E [g(X,Y)] E (X,Y) = E (X) . E (Y)
Varianza de una Variable Aleatoria La varianza de una variable aleatoria X est dada por: o 2 = E (X2) - 2
Ejemplo:
28
o Calcule la varianza de X, donde X es el nmero de Ingenieros de Sistema en un comit de tres personas seleccionadas al azar entre un grupo de cuatro Ingenieros de Sistema y tres Ingenieros Mecnicos. f(x) = 7 3 4.4 E(X) = (0)(1/35)+(1)(12/35)+(2)(18/35)+(3)(4/35) E(X) = 1,7 E(X2) = (0)(1/35)+(1)(12/35)+(4)(18/35)+(9)(4/35) E(X2) = 24/7 4 x 3 3-x
Teorema de Chebyshev.
La varianza de una variable aleatoria indica acerca de la variabilidad de las observaciones con respecto a la media. Si una variable aleatoria tiene una varianza o desviacin estndar pequea, se puede esperar que la mayora de los valores estn agrupados alrededor de la media.
Por ello, la probabilidad de que una variable aleatoria tome un valor dentro de cierto intervalo, alrededor de la media, es mayor que para una variable similar con una desviacin estndar mayor.
Si se considera a la probabilidad en trminos de rea (bajo la curva), en una distribucin continua con una desviacin estndar pequea que tenga la mayor parte de su rea cercana a .
Un valor mayor de indica una mayor variabilidad, y por lo tanto se espera que el rea estar ms extendida.
29
El matemtico ruso Chebyshev descubri que hay una relacin entre la desviacin estndar y la fraccin del rea que se encuentra entre dos valores cualesquiera, simtricos con respecto a la media:
Teorema de Chebyshev: o La probabilidad de que cualquier variable aleatoria X caiga dentro de k desviaciones estndar de la media, es al menos (1 1/k2). o P ( - k < X < + k ) 1 - 1 / k2
Ejemplo: o Una variable aleatoria X tiene una media =8, una varianza
2=9,
4.5 Ejercicios.
una
distribucin
de
probabilidad
desconocida.
Encuentre P (-4 < X < 20). P (-4<X<20) = P ( 8 (4)(3) < X < 8 + (4)(3)) 1 - 1 / 42 P (-4 < X < 20) 15/16.
Se rifan 200 premios de Bs. 1.000, 20 premios de Bs. 2.000 y 5 premios de Bs. 5.000. Suponiendo que se elaboran y venden 10.000 tickets, cul es el precio justo por cada ticket (sin incluir ganancia)?
En un juego de apuesta, un hombre recibe Bs 5.000 si al tirar 3 monedas al aire se obtienen todas caras o todas sellos, y paga Bs. 3.000 si resultan 1 dos caras. Cul es la ganancia esperada?
Un hombre, al invertir en una mercanca, puede tener una ganancia de Bs. 3.000.000 en un ao con una probabilidad de 0,3, o puede perder Bs. 1.000.000 con una probabilidad de 0,7 en el mismo lapso. Cul es su Esperanza Matemtica?
Un hombre desea asegurar su vehculo en Bs. 20 millones. La Compaa de Seguros estima que una Prdida Total puede ocurrir con una probabilidad de 0,002; una prdida del 50% con una probabilidad de 0,01 y una prdida del 25% con una probabilidad de
30
0,1. Si se ignoran las dems prdidas parciales, que prima anual debe cobrar la aseguradora para tener una ganancia del 10%?
Suponga que X es una Variable Aleatoria con media igual a 100 y desviacin estndar igual a 5. o Halle la conclusin que se puede derivar de la Desigualdad de Chebyshev para k=2 y k=3 o Estime la posibilidad de que X se encuentre entre 100 20. o Encuentre un intervalo [a,b] alrededor de la media, para el cual la probabilidad de que X se encuentre en el intervalo sea por lo menos de 99%.
Sea X una variable aleatoria con media igual a 40 y desviacin estndar igual a 5. Use la Desigualdad de Chebyshev para encontrar un valor b para el cual P(40 b X 40 + b) 0,95.
Sea X una variable aleatoria continua con media igual a 80 y desviacin estndar desconocida. Use la desigualdad de Chebyshev para encontrar un valor de para el cual P(75 X 85) 0,95.
31
5 Distribuciones de Probabilidad
5.1 Distribucin Binomial. Es una Distribucin Discreta, llamada tambin Distribucin de Bernoulli. Sus frecuencias son proporcionales a los trminos del Binomio de Newton o Binomio de Pascal.
Propiedades: o El experimento consta de n intentos repetidos. o Cada intento tiene un resultado que puede ser xito o fracaso. o La probabilidad de un xito, indicado por p, permanece constante. o Las repeticiones del ensayo son independientes.
n x
px.qn-x; x = 0, 1, 2, , n
o En experimentos que pueden arrojar dos resultados posibles. Ejemplo: o La probabilidad de que cierto componente resista una prueba de impacto es de . Encuentre la probabilidad de que exactamente 2 de los 4 componentes siguientes la resistan. p = 3/4 ; q = ; x = 2; n = 4 b (2, 4, ) = 4 2 3 4 2 1 4 2 b (2, 4, ) = 0,21094
32
5.2
Distribucin de Poisson
Distribucin Discreta. Propiedades de un Experimento de Poisson: o El nmero de xitos que ocurren en un intervalo de tiempo o en una regin especificada son independientes de los que ocurren en cualquier otro intervalo de tiempo o regin del espacio disjuntos. o La probabilidad de un solo xito que ocurre durante un intervalo de tiempo muy corto o en una pequea regin, es proporcional a la duracin del intervalo de tiempo o al tamao de la regin, y no depende del nmero de xitos que ocurran fuera de este intervalo de tiempo o regin. o La probabilidad de que ocurra ms de un xito en dicho intervalo de tiempo corto o de caer en dicha regin pequea, es insignificante.
e u x o p ( X, ) = x!
Aplicacin:
o Se emplea cuando se trata de un suceso de probabilidad muy pequea en cada observacin y se desea obtener la probabilidad de que suceda cierto nmero de veces en un gran nmero de observaciones. o Tambin se llama Ley de los Sucesos Raros.
Ejemplo: o En un experimento, el promedio de partculas radioactivas que pasan por un contador durante 1 milisegundo es de 4. Cul es
33
e 4 4 6 o p ( 6, 4 ) = p ( 6, 4 ) = 0,1042 6!
5.3 Distribucin Normal
Distribucin Continua. Su nombre se debe a que al principio, se consideraba que todos los fenmenos en su estado normal deban seguir esta Distribucin. Fue desarrollada por De Moivre en 1733, y luego por Gauss.
Propiedades de un Experimento Normal: o Las fuerzas causales que afectan los sucesos individuales deben ser numerosas y aproximadamente de igual ponderacin. o Las fuerzas causales deben ser independientes unas de otras. o Existe equilibrio entre las desviaciones por encima y por debajo de la media. o La curva originada es simtrica.
Teorema del Lmite Central: o La Distribucin de una Media Muestral de una poblacin que tiene una varianza finita, tiende a distribuirse normalmente a medida que el tamao de la muestra tiende hacia el infinito.
Variable Aleatoria Normal: o Tiene una Distribucin en forma de campana (de Gauss) Ecuacin:
o p ( x, , ) =
1 2
1 x 2
34
rea bajo la Curva Normal: o El rea limitada por las ordenadas x = x1 x = x2 es igual a la probabilidad de que la Variable Aleatoria X tome un valor entre x = x1 x = x2.
x2
P ( x1 < X < x2 ) =
x1
n( x, , )dx
1 2
x2
x1
1 x 2
dx
o Como quiera que la Distribucin Normal es continua, se deben transformar todas las observaciones de cualquier Variable Aleatoria en un nuevo conjunto de observaciones de una Variable Aleatoria Normal con media cero y varianza 1, mediante la transformacin:
Z=
z1
n( z,0,1)dz
Ejemplo: o Dada una Distribucin Normal con = 50 y = 10, encuentre la probabilidad de que X tome un valor entre 45 y 62.
z1 = z2 =
45 50 z1 = 0,5 10 62 50 z 2 = 1,2 10
P ( 45 < X < 62 ) = P ( -0,5 < Z < 1,2 ) = = P (Z < 1,2 ) P (Z < 0,5) = 0,8849 0,3085 = 0,5764.
Ing Luis Castellanos (Versin 1.20)
35
5.4
Ejercicios
Aplique Distribucin Binomial para calcular: o Probabilidad de que al lanzar 3 veces una moneda balanceada aparezcan: 3 caras 2 sellos y 1 cara Al menos 1 cara Al menos 1 varn Al menos 1 varn y al menos 1 hembra (Probabilidad de nacimiento de varn pv = 0,5).
o Si el 20% de los tornillos producidos por una mquina son defectuosos. Determine la probabilidad de que de 4 tornillos escogidos al azar: 1 sea defectuoso 0 sean defectuosos Menos de 2 sean defectuosos
o Probabilidad de obtener, al menos una vez, un total de 7 en 3 lanzamientos de un par de dados balanceados.
Aplique Distribucin de Poisson para calcular ( = n x p): o El 10% de las herramientas producidas son defectuosas. Encuentre la probabilidad de que en una muestra de 10 herramientas, seleccionadas al azar, exactamente 2 sean defectuosas. o Sea la probabilidad de que una persona tenga una mala reaccin a la inyeccin de determinado suero es 0,001. Determine la posibilidad de que de cada 2.000 individuos: 3 tengan mala reaccin Ms de 2 tengan mala reaccin
o 10 personas por hora en promedio utilizan una oficina de informacin al pblico. Cul es la probabilidad de que: 6 menos usen el servicio
Ing Luis Castellanos (Versin 1.20)
36
Aplique Distribucin Normal para calcular: o El peso promedio de 500 estudiantes varones en cierta universidad es de 151 libras, y la desviacin estndar es de 15 libras. Cuntos estudiantes pesan: Entre 120 y 155 libras Ms de 185 libras
o La media del dimetro interior de una muestra de 200 empaques es de 0,502 cms y la desviacin estndar es de 0,005 cms. El propsito para el cual se hicieron estos empaques permite un mximo de tolerancia en el dimetro de 0,496 a 0,508 cms., o de lo contrario se considera que los mismos son defectuosos. Determine el porcentaje de empaques defectuosos producidos. o La vida til de los cauchos de un autobs es de 50.000 Kms en promedio, con una desviacin estndar de 4.200 Kms. Cul es la probabilidad que uno de estos cauchos dure: Menos de 38.000 Kms. Entre 55.000 y 60.000 Kms. Ms de 45.000 Kms.
37
38
6 Distribucin en el Muestreo
6.1 Teora del Muestreo Concepto: o Es la rama de la Estadstica, que trata de los mtodos y teoras para seleccionar muestras, del uso de los datos obtenidos a partir de las muestras para estimar caractersticas de la poblacin, y de la evaluacin de los estimadores.
Criterios para la Seleccin de una Muestra: o Que la muestra represente a la poblacin o Que el costo de la seleccin de la muestra sea pequeo o Que los estimadores de las caractersticas de la poblacin a partir de la muestra sean precisos.
Ventajas del Muestreo: o Reduccin de costos o Reduccin de trabajo o Mayor rapidez o Atencin individual o Mayores posibilidades de obtener la informacin o Mayor exactitud
Limitaciones en el uso del Muestreo: o Se usa cuando se requieren datos para reas o grupos pequeos de la poblacin o Se usa cuando se requieren datos en instantes regulares de tiempo y se quieren medir cambios pequeos entre perodos consecutivos o Los costos de una encuesta por muestreo son muy altos (seleccin de muestra, control, significancia, etc.).
Categoras del Muestreo: o Muestreo Simple al Azar: Permite a cada muestra posible una probabilidad igual de ser elegida, y a cada elemento de la
Ing Luis Castellanos (Versin 1.20)
39
poblacin completa una oportunidad igual de ser incluido en la muestra. o Muestreo Sistemtico: los elementos que se muestran se seleccionan de la poblacin en un intervalo uniforme que se mide con respecto al tiempo, orden o espacio. o Muestreo Estratificado: la poblacin se divide en grupos homogneos o estratos, y los elementos dentro de cada estrato se seleccionan al azar. o Muestreo por Agrupacin: la poblacin se divide en grupos y se selecciona una muestra aleatoria de cada grupo.
Concepto de Estadstico: o Un valor calculado a partir de una muestra, se llama Estadstico. o Medida que se calcula para describir la caracterstica de una sola muestra (, s, s2, p). o El Estadstico vara de acuerdo a la muestra, y por lo tanto, es una variable aleatoria que depende de la muestra aleatoria observada. o La Distribucin de Probabilidad de una Estadstico se llama Distribucin Muestral.
i =1
xi
x =
X =
n 2
+ X 2
n +1 2
(n es par)
40
o
o
~ x =
4 2
4 +1 2
X x = ~
+ X3 2
~ x=
7+8 ~ x = 7,5 2
(x
n i =1
n 1
( )
o S
n(n 1)
i =1
41
o Dadas 2 compaas que envasan Jugo de Naranja. Haga un anlisis estadstico de las muestras observadas: A 75 80 74 83 86 B 86 80 69 71 94 Datos Ordenados A 74 75 80 83 86 B 69 71 80 86 94
A = 79,6; B = 80,0 ~ x A = 80,0; ~ x B = 80,0 MoA = MoB = Hasta ac, esos datos no aportan mucha informacin, y ambas muestras tienen resultados muy parecidos. Analicemos ahora el Rango y la Dispersin. rA = 12; rB = 25
SA = 5,1284; SB = 10,4163 La Compaa A tiene un contenido ms uniforme que la Compaa B (tiene menos dispersin y menos rango o picos).
Concepto de Parmetros: o Medida que se calcula para describir la caracterstica de una poblacin completa (, , 2, P).
42
6.2
Distribucin Muestral de Media Aritmtica La aproximacin normal para ser confiable para n30. Si n<30, la aproximacin ser confiable ssi la poblacin se aproxima a Poblacin Normal.
x
Z=
Ejemplo: o Una firma elctrica fabrica bombillos, cuya vida se distribuye en forma normal aproximadamente, con Media de 800 hrs y Desviacin Estndar de 40 hrs. Cul es la probabilidad de que una muestra aleatoria de 16 bombillos tenga vida promedio inferior a 775 hrs?
Z=
75 800 Z = 2,5 40 16
6.3
Z=
(x
x 2 (1 2 )
12
n1
2 2
n2
Ejemplo: o Los Monitores para PC de la Compaa A tienen una vida media de 6,5 aos y una Desviacin Estndar de 0,9 aos. Los de la Compaa B tienen una vida media de 6 aos y una Desviacin Estndar de 0,8 aos. Cul es la probabilidad de que una muestra aleatoria de 36 monitores del fabricante A tenga una vida media de la menos 1 ao mayor que la vida media de una muestra de 49 monitores de la Compaa B?
43
A n 1 - 2 = 1 6,5 0,9 36
B 6,0 0,8 49
Z=
P(1 - 2 1) = (Z > 2,2,646) = 1 - (Z < 2,2,646) = 0,0041 6.4 Distribucin Muestral 2 / Chi 2 / Ji 2
2 =
(n 1)S 2
2
Ejemplo: o Un fabricante de Bateras para carros garantiza que su producto durar, en promedio, 3 aos con una Desviacin Estndar de 1 ao. Si 5 de las Bateras tienen duraciones de 1.9, 2.4, 3.0, 3.5, y 4.2 aos, qu tan cierta ser esa garanta de duracin? n = 5; 2 = 1
S2 =
2 =
(5 1).0,815 2 = 3,26
1
con 4GL
6.5
Distribucin t de Student Fue publicada por W.S. Gosset (irlands), en 1908, bajo el seudnimo Student.
44
T=
X (Variable Aleatoria) S n
Distribucin t:
h(t ) =
[(v + 1) / 2] t 1 + v (v / 2) .v
v +1 2
o v Grados de Libertad ( v = n 1)
o Funcin Gamma
( ) = x 1e x dx
0
Aplicacin: o En problemas que tienen que ver con inferencia acerca de la media de la poblacin o en problemas que implican muestras comparativas. o 95% de los valores de una Distribucin t caen entre -t0,025 y t0,025. Un valor por debajo de -t0,025 o por encima de t0,025 es motivado generalmente por mala definicin de , o que sea improbable dicho valor.
Ejemplo: o Encuentre k tal que P (k < T < -1,761) = 0,045 para una muestra de 15 elementos. V = 15 1 v = 14 Por tabla 1,761 corresponde a t0,005 - t0,005 = - 1,761 0,045 = 0,05 - t0,005 = 2,977 - t0,005 = - 2,977 P ( -2,977 < T < -1,761 ) = 0,045 = 0,005
Otro ejemplo: o Un Ingeniero Qumico afirma que el rendimiento medio de la Poblacin de cierto proceso en lotes de de 500 gr. por mm de materia prima. Para verificar, muestrea 25 lotes cada mes. Si el
Ing Luis Castellanos (Versin 1.20)
45
valor de t calculado cae entre - t0,005 y t0,005 queda satisfecho con su afirmacin. Qu conclusin extraera de una muestra con una media de 518 gr. x mm y una Desviacin Estndar Muestral de 40 gr.? v = 25 1 v = 24 S = 40; = 518; n = 25; = 500 Por tabla t0,05 = 1,711, para v = 24
t= 518 500 t = 2,25 40 25
Por tabla 2,25 corresponde aproximadamente a t0,02 o t0,015. El Proceso produce un mejor producto del que se piensa.
6.6
h(f) =
v1 [(v1 + v 2 ) / 2 ] v 2 v v 1 2 . 2 2
0
v1 f 1 + v 2
v1 + v 2 2
;0<f<
Aplicacin: o En situaciones de dos muestras para extraer inferencias acerca de las varianzas de poblacin. De hecho, la Distribucin f se llama tambin la Distribucin de Razn de Varianzas.
46
6.7
Ejercicios
Empleando la Distribucin 2 calcule: o Suponga que los tiempos requeridos por un cierto autobs para alcanzar uno de sus destinos en una ciudad grande forman una Distribucin Normal con una desviacin estndar de 1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que 2. o Los siguientes son los pesos en gramos de 10 paquetes de semillas distribuidas por la Compaa Acme: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2, y 46.0. Encuentre un Intervalo de Confianza de 95% para la Varianza de todos los paquetes de semilla.
Empleando la Distribucin t de Student calcule: o Un fabricante de bombillos anuncia que su producto alumbrar en promedio durante 500 horas. Para mantener este promedio, prueba 25 bombillos cada mes. Si el valor t calculado cae entre t0,05 y t0,05, queda satisfecho con su publicidad? Qu conclusin debe sacar de una muestra que tiene media de 518 horas y desviacin estndar de 40 horas?
S 12 y
2 S2 son
las
Varianzas
de
Muestras
Aleatorias
12
2 2 .
Determine
la
probabilidad
S 12
2 S2
o Si tomamos 2 muestras independientes de tamao n1 = 6 y n2 = 10 de 2 poblaciones normales con la misma varianza poblacional. Halle b tal que: P(
S 12
2 S2
b ) = 0,95.
47
7 Teora de la Estimacin
7.1 Generalidades. Inferencia Estadstica: mtodos por los que se realizan inferencias o generalizaciones acerca de una poblacin. Puede ser: o Estimacin o Prueba de Hiptesis
Espacio de Decisin: conjunto de todas las decisiones posibles que pueden tomarse en un problema de estimacin. La Estimacin conlleva a determinar o inferir parmetros poblacionales, en base a estadsticas muestrales. Puede ser: o Puntual o Por Intervalo
7.2
Estimacin Puntual o Local Una estimacin puntual de algn parmetro de la poblacin es un solo valor de una Estadstica .
Por ejemplo, el valor de la Estadstica , que se calcula a partir de la muestra de tamao n, es una estimacin puntual del parmetro poblacional .
No se espera que un estimador realice la estimacin sin error o exactamente, pero s que no est muy alejado. Estimador Insesgado: una Estadstica es un estimador insesgado del parmetro si = E ( ) = o (Si la Distribucin Muestral tiene una media igual al parmetro estimado).
Varianza de un Estimador Puntual: si consideramos todos los posibles estimadores insesgados de algn parmetro , el de menor varianza se llama el estimador ms eficiente de .
Ejemplo:
48
o Si 1 y 2 son estimadores insesgados del mismo parmetro poblacional , se elegira el estimador cuya distribucin muestral tuviera la menor varianza. Si 21 < 22, decimos que 1 es un estimador ms eficiente de que 2. 7.3 Estimacin por Intervalos
Es un intervalo de anchura finita, centrado en la estimacin puntual del parmetro, que se espera contenga el verdadero valor del parmetro E<< +E I < < S
El intervalo estimado indica, por su longitud, la precisin de la estimacin puntual. El intervalo calculado se llama Intervalo de Confianza (IC) del (1- ) 100%. La fraccin (1- ) es el Coeficiente o Grado de Confianza. Los extremos I y S son los Lmites de Confianza Inferior y Superior. o P(I < < S ) = 1 o Si = 0,05, tenemos un IC de 95%. o Si = 0,01, tenemos un IC de 99%.
7.4
Error Muestral
Es un error o variacin entre Estadsticas de Muestra debido al azar, o diferencias entre cada Muestra y la Poblacin, y entre varias Muestras (E). o E = x Z o x =
Sx =
n 1
49
7.5
Estimacin de la Media
P ( - Z Ejemplo:
< < + Z
) = (1- )
o En una poblacin, considerada con tendencia normal, se ha hecho un estudio muestral (n=15) donde el rendimiento o promedio de vida til de los bombillos es de = 9000 horas, con una desviacin S = 610 hrs. De estudios anteriores, se toma que la Desviacin Poblacional = 500 hrs. Determine la Media Poblacional, considerando IC de 90% y 95%. Mtodo 1:
x =
x =
500 15
x = 129,1hrs
IC1 = 90% P(0,90) Z = 1,65 E1 = 129,1 x 1,65 E1 = 213 LI1 = 9000 213 LI1 = 8787 LS1 = 9000 + 213 LS1 = 9243 8833 1 9167 IC2 = 95% P(0,95) Z = 1,96 E2 = 129,1 x 1,96 E2 = 253 LI2 = 9000 253 LI2 = 8747 LS2 = 9000 + 253 LS2 = 9253 8787 2 9213 IC 90% P(9000Z0,05
Mtodo 2:
500 15
500 15
) = 0,90
50
IC 95% P(9000Z0,05/2
500 15
<<9000+ Z0,05/2
500 15
) = 0,95
P (9000 253 << 9000 + 253) = 0,95 P(8747 < < 9253) = 0,95
IC 99% P(9000Z0,005
500 15
<<9000+ Z0,005
500 15
) = 0,99
P (9000 333 << 9000 + 333) = 0,99 P(8667 < < 9333) = 0,99 8667 8747 8787 9213 90% 95% 99% 7.6 Cmo se calcula el tamao de una Muestra? 9253 9333
Z n= 2 error
Ejemplo:
o IC = 95%; = 0,3 o
1,96 x0,3 n= n = 138,3 0,05
2
x t
S
2
< < x + t
S
2
Ejemplo:
51
o El contenido de 7 contenedores similares de cido Sulfrico son: 9,8; 10,2; 10,4; 9,8; 10,0; 10,2; 9,6 litros. Encuentre la Media en un IC de 95%. 7.7 = 10,0; S = 0,283 10,0 2,477 (0,283/7) < < 10,0 + 2,477 (0,283/7) 9,74 < < 10,26
Lmite de Tolerancia En una Distribucin Normal, los datos estn agrupados de acuerdo a las siguientes proporciones: o s 68,27% (Zona Normal) o 2 s 95,45% o 3 s 99,73%
Ello nos ofrece un Lmite de Tolerancia, de acuerdo a los Porcentajes requeridos. Como no siempre se tiene a mano el valor , se emplea: o X k.S
Siendo k el valor tomado de la tabla de Factores de Tolerancia para Distribuciones Normales. Ejemplo: o Una Mquina produce piezas de metal de forma cilndrica. Se toma una muestra de estas piezas y se encuentran los dimetros 1.01; 0.97; 1.03; 1.04; 0.99; 0.98; 0.99; 1.01 y 1.03 cms. Encuentre los Lmites de Tolerancia del 99% que contendrn el 95% de las piezas, en una Distribucin Normal. = 1,0056 S = 0,0245 1,0056 0,1115 ( 0,8941 ; 1,1171)
52
7.8
Distincin entre Lmites de Confianza y Lmites de Tolerancia El Intervalo de Confianza sirve cuando interesa hallar la Media Poblacional. El Intervalo de Tolerancia sirve para precisar dnde caen las observaciones individuales.
7.9
Estimacin de la Varianza
Si S2 es la Varianza de una Muestra Aleatoria de tamao n de una Poblacin Normal, un Intervalo de Confianza de (1- ) 100% para 2 es: o
(n 1)s 2
2 2
< 2 <
(n 1)s 2
12
2
Ejemplo: o A continuacin se muestran los pesos de 10 paquetes de semillas: 46,4; 46,1; 45,8; 47,0; 46,1; 45,9; 45,8; 46,9; 45,2;46,0. Encuentre un IC de 95% para la Varianza, suponiendo una Distribucin Normal.
S =
2
n x i2 ( x i ) n(n 1)
S2 =
7.10 Ejercicios
Se ha calculado que la media y la desviacin estndar, para los promedios de puntuacin de una muestra aleatoria de 36 estudiantes, son 2.6 y 0.3 respectivamente. Encuentre la media poblacional con un 90, 95 y 99% de Intervalo de Confianza.
Una empresa elctrica fabrica bombillos que tienen una vida con una Distribucin aproximadamente Normal que tiene una desviacin estndar de 40 horas. Si una muestra de 30 bombillos tiene una vida promedio de
53
780 horas, encuentre la media poblacional con un Intervalo de Confianza del 96%.
Las estaturas de una Muestra Aleatoria de 50 estudiantes mostr una media de 174.5 cms y una desviacin estndar de 6.9 cms. Halle la media poblacional con un Intervalo de Confianza del 98%.
54
Aseveracin o conjetura con respecto a una o ms poblaciones. La prueba de una Hiptesis Estadstica sobre toda la Poblacin nos dar la verdad o falsedad de la misma. Ello es poco prctico, por lo cual se escoger una muestra aleatoria Significativa. La aceptacin de una Hiptesis simplemente implica que los datos no dan suficiente evidencia para rechazarla.
8.2
Es cualquier Hiptesis que deseamos probar. Su rechazo conduce a la aceptacin de una Hiptesis Alternativa (H1). Una Hiptesis Nula con respecto a un Parmetro Poblacional siempre se establecer de modo que especifique un valor exacto del parmetro (Ej. H0 p = 0,5), mientras que la Hiptesis Alternativa puede tomar uno o varios valores (H1 p 0,5; p < 0,5; p > 0,5). (Si H1 toma un valor, se habla de Hiptesis con una Cola. Si puede tomar dos valores, se habla de dos colas).
8.3
Error Tipo I: Se rechaza H0 cuando es Verdad. Error Tipo II: Se acepta H0 cuando es Falsa. Al probar cualquier Hiptesis Estadstica, hay cuatro situaciones posibles: H0 es Verdad Aceptar H0 Rechazar H0 Correcto Error Tipo I H0 es Falsa Error Tipo II Correcto
Con dos colas, se usa /2. Con una cola se usa . Ing Luis Castellanos (Versin 1.20)
55
La probabilidad de cometer un error Tipo I se denomina nivel de significancia (). La probabilidad de cometer un error Tipo II () no puede calcularse a menos que se plantee una Hiptesis Alternativa especfica. Ejemplo: o Una vacuna contra la gripe slo es eficaz un 25% a los 2 aos. Para probar si una vacuna nueva ofrece mayor proteccin, se inoculan 20 personas al azar. Si 9 ms personas rebasan ese lapso sin contraer gripe, la nueva vacuna es superior a la actual. Plantee y compruebe la Hiptesis dada. H0 : p = (25%) H1 : p > = P (error Tipo I)
b( x;20; 1 4)
x =9
20
=1-
b( x;20; 1 4)
x =0
cero.
b( x;20; 1 2)
x =0
= 0,2517
b( x;20;0,7)
x =0
56
= 0,0051
Los valores por encima del valor que divide las 2 regiones (valor crtico) constituyen la regin crtica. Los menores constituyen la regin de aceptacin.
Si la estadstica X cae en la regin crtica, se rechaza H0 a favor de H1. Si cae en la zona de aceptacin, H0 se acepta.
Otro Ejemplo: o Considere la Hiptesis Nula de que el Peso Promedio de los estudiantes varones de una Universidad es de 68 Kgr., contra la Hiptesis alternativa de que no es igual a 678 Kgr. Supngase = 3,6, y una muestra n = 36. H0 : = 68 H1 : 68 ( con < 68 > 68) (2 colas).
x =
x =
3,6 36
x = 0,6
/2
/2
67
= 68
69
57
z1 = z2 =
= P(Z < -1,67) + P(Z > 1,67) = 2 P(Z < -1,67) = 0,0950 El 9,5% de las muestras de tamao 36 conducir al rechazo de = 68, cuando H0 es verdadera.
Para reducir , se puede aumentar el tamao de la muestra o ampliar la regin de aceptacin. Ejercicio: o Haga el Ejercicio Anterior, pero con n = 64.
8.4
Se debe probar la Hiptesis de que la media de una poblacin, con varianza 2 conocida, sea igual a un valor especificado 0 contra la alternativa de que la media no es igual a 0. o H0 : = 0 o H1 : 0
2
n
Si se emplea un nivel de significancia de , se deben encontrar dos valores crticos 1 y 2, tales que el intervalo 1 < < 2, defina la regin de aceptacin y < 1 y > 2 constituyan la regin crtica, empleando: o
z=
x 0
n
Se hallan los valores crticos de Z correspondientes a 1 y 2. De la poblacin se extrae una muestra aleatoria de tamao y se calcula la media de la muestra . Si cae en la regin de aceptacin 1 < < 2, se
Ing Luis Castellanos (Versin 1.20)
58
Ejemplo:
7,8 8 0,5 50
z = 2,828
-2,828 no pertenece al intervalo [-2,58; 2,58], por lo tanto se rechaza H0. Se concluye que la resistencia a la ruptura promedio no es igual a 8 Kg sino menor.
o T= Ejemplo:
x 0 ; v = n -1 S n
59
10 minutos. Se est ensayando un nuevo procedimiento de inscripcin a travs de computadores. Si una muestra aleatoria de 12 estudiantes obtiene un tiempo promedio en inscribirse de 42 minutos con una desviacin estndar de 11,9 minutos con el nuevo sistema. Prueba la Hiptesis de que la media de la poblacin es ahora menor de 50, usando un nivel de significancia de: a) 0,05 b) 0,01.
T < - 1,796 T=
x 0 42 50 T = T = 2,33 11,9 S n 12
1=0,05 2=0,01 Se acepta H0
Se rechaza H0
8.5 Ejercicios
El fabricante de un medicamento patentado sostiene que tiene una eficacia del 90% en aliviar cierta alergia durante un perodo de 8 horas. En una muestra de 200 personas con dicha alergia, el medicamento mejor a 160 personas.
60
Se calcul que el tiempo de vida promedio de una muestra de 100 bombillos fluorescentes producidos por una compaa es de 1570 horas, con una desviacin estndar de 120 horas. Si es el tiempo de vida promedio de todos los bombillos producidos por la compaa, pruebe la Hiptesis = 1600 horas en contra de una Hiptesis Alterna 1600 horas, usando un nivel de significancia de o 0,05 o 0,01
La resistencia al rompimiento de los cables producidos por un fabricante tienen media de 1800 libras y desviacin estndar de 100 libras. Se afirma que con ayuda de una tcnica nueva introducida en el proceso, se puede aumentar dicha resistencia. Para probar esa afirmacin, se prob una muestra de 50 cables y se encontr que la resistencia promedio al rompimiento es de 1850 libras. Se acepta la Hiptesis con significancia de 0,001?
61
. . . . . . . . . .
x Regresin Lineal
. . . . . . .
x Regresin No Lineal
o Uno los principales propsitos de la Curva de Ajuste es estimar una de las variables (la variable dependiente) a partir de la otra (variable independiente). Regresin. o Regresin Lineal significa que la Media de Y|x est relacionada linealmente con x, y que la ecuacin que las relaciona es la de la recta en su forma usual dada por: Y|x = + x donde y son parmetros por estimar a partir de los datos de la muestra. Indicando a sus estimaciones por a y b respectivamente, la respuesta estimada se obtiene de la lnea de regresin muestral: =a+bx o En la Regresin No Lineal se utiliza la ecuacin de parbola:
Ing Luis Castellanos (Versin 1.20)
Ese
proceso
de
estimacin
se
denomina
62
y = a + b x + c x2
o Regresin Simple considera slo una Variable Independiente. o Regresin Mltiple considera ms de una Variable Independiente, normalmente dos (2). Usa la ecuacin: z=a+bx+cy o Generalmente la Regresin se calcula mediante el Mtodo de Mnimos Cuadrados. Clculo o La Regresin a calcular ser la Regresin Lineal Simple, con dos valores, mediante las frmulas (Ecuaciones Normales):
y = a.n + b x x. y = a x + b x
b= n x 2 ( x )
=a+ba=-b
Seleccin de un Modelo de Regresin o Todo lo sealado anteriormente se basa en el supuesto que el modelo escogido es el correcto, donde y est relacionada efectivamente con x. No se puede esperar que la prediccin de la respuesta sea buena si hay varias variables independientes, no consideradas en el modelo, que afectan la respuesta y estn variando en el sistema. De igual manera, la prediccin ser inadecuada si la estructura verdadera que relaciona a y con x es extremadamente no lineal en el rango de las variables consideradas. o Con frecuencia se usa el modelo de Regresin Lineal Simple, a pesar que se sabe que el modelo no es exactamente lineal o de que la estructura verdadera es desconocida. Esta aproximacin es bastante acertada, sobre todo cuando el rango de x es angosto. As,
63
el modelo usado se convierte en una funcin de aproximacin, que se espera sea una representacin adecuada de la regin de inters. Ejemplo:
o I xi yi Dados los siguientes datos experimentales: 1 1.5 4.8 2 1.8 5.7 3 2.4 7.0 4 3.0 8.3 5 3.5 10.9 6 3.9 12.4 7 4.4 13.1 8 4.8 13.6 9 5.0 15.3
y = 91,1 xy = 345,09
x
2
= 115,11
x = 30,3
b=
9.(345,09) (30,3)(91,1) b = 2,9303 2 9.(115,11) (30,3)
Significacin Estadstica de la Regresin o Un Diagrama de Dispersin es una representacin grfica de los puntos de datos para una muestra en particular. Si se escoge una muestra diferente o se agranda la muestra original, se obtendr seguramente un Diagrama de Dispersin diferente. Y cada Diagrama originar Rectas (o Curvas) de Regresin diferentes (aunque no deben ser muy diferentes si las muestras se toman de la misma poblacin). o La dispersin de puntos alrededor de la Recta (o Curva) de Regresin indica que para un valor particular de x, hay varios valores de y distribuidos alrededor de la Recta (o Curva). Por lo tanto, de ese concepto de distribucin se desprende que hay conexin entre la Recta o Curva y la probabilidad.
64
o La conexin se suministra al introducir las variables aleatorias X y Y, las cuales pueden asumir valores muestrales diferentes x y y, respectivamente. o Dada la funcin de densidad conjunta o funcin de probabilidad, f(x,y), de dos variables aleatorias X y Y, entonces existe una Recta (o Curva) de Regresin de Mnimos Cuadrados de Y en X dada por y = g(x) = E (Y|X=x), siempre y cuando X y Y tengan varianza finita, y se cumple que E {[Y-g(X)]2} = un mnimo. 9.2 Anlisis de Correlacin para dos variables Definicin o Al hablar de Regresin, se ha supuesto que la variable independiente x est controlada y que, en consecuencia, no es una variable aleatoria. Dentro de ese contexto, x se llama frecuentemente variable matemtica, la cual, en el proceso muestral, se mide con un error despreciable e insignificante. En muchas aplicaciones en tcnicas de Regresin, es ms realista suponer que tanto X como Y son variables aleatorias y que las mediciones {(xi,yi); i = 1, 2, , n} son observaciones tomadas de una funcin de densidad conjunta (x,y). Clculo o Formalmente, el Coeficiente de Correlacin Muestral se halla:
r=
S xy SxS y
o r=
[ (x x )(y y )] (x x ) (y y )
2
(y y ) = (y y )
est 2
La Variacin total se compone de Variacin Explicada (tiende a seguir patrones definidos por la recta de
65
regresin de mnimos cuadrados) y Variacin No Explicada (se comporta de manera aleatoria o impredecible).
El Coeficiente r2 se puede interpretar como la relacin de la variacin total que se explica por la recta de regresin de mnimos cuadrados.
El Coeficiente r mide que tan bien se ajusta la recta de regresin muestrales. de mnimos cuadrados a los datos
Si r2 = 1 o r = 1, se dice que hay Correlacin Lineal Perfecta o Regresin Lineal Perfecta (respectivamente).
= 1
2 xy 2 2 X = o = 2 2 Y Y x y
Los valores de = 1 ocurren cuando 2 = 0, y existe una relacin perfecta entre las dos variables. Los valores cercanos a cero (0) indican poca o nula correlacin. Los valores cercanos a +1 implica relacin lineal perfecta con pendiente positiva. Los valores cercanos a -1 implica relacin lineal perfecta con pendiente negativa. El Coeficiente de Correlacin Poblacional ofrece una medida de qu tan bien se ajusta la Curva de Regresin de una Poblacin dada, a los datos de la Poblacin.
Significacin Estadstica de la Correlacin o El Coeficiente de Correlacin de la Poblacin debe ser una medida de qu tan bien se ajusta una Recta o Curva de Regresin de una Poblacin dada a los datos de dicha Poblacin.
66
Ejemplo: o Dadas las estaturas de los Padres y de sus Hijos Mayores en pulgadas (x,y respectivamente):
i xi yi 1 65 68 2 63 66 3 67 68 4 64 65 5 68 69 6 62 66 7 70 68 8 66 65 9 68 71 10 67 67 11 69 68 12 71 70
b=
=a+ba=-b x = 800; y = 811; x.y = 54107; x2 = 53418 = 66,667; = 67,583 b = 0,4764 a = 35,8248 = 35,8248 + 0,4764 x (Recta de Regresin) (x-).(y-) = 40,3333; (x-)2 = 84,6667; (y-)2 = 38,9167
9.3 Ejercicios
r=
[ (x x )(y y )] (x x ) (y y )
2
r = 0,7027
(Muy cercano a 1)
o Estime la lnea de Regresin Lineal, Grafique el Diagrama de Dispersin y Halle el Coeficiente de Correlacin. En un Estudio de Correlacin entre la Precipitacin Pluvial y de la contaminacin del aire arrastrada, se obtuvieron los siguientes datos (x,y respectivamente):
Ing Luis Castellanos (Versin 1.20)
67
i xi yi
1 4.3 126
2 4.5 121
3 5.9 116
4 5.6 118
5 6.1 114
6 5.2 118
7 3.8 132
8 2.1 141
9 7.5 108
o Estime la lnea de Regresin Lineal, Grafique el Diagrama de Dispersin y halle el Coeficiente de Correlacin. Se hizo un estudio sobre la cantidad de azcar transformada en cierto proceso, a varias temperaturas (y, x respectivamente):
i xi yi 1 1.0 8.1 2 1.1 7.8 3 1.2 8.5 4 1.3 9.8 5 1.4 9.5 6 1.5 8.9 7 1.6 8.6 8 1.7 10.2 9 1.8 9.3 10 1.9 9.2 11 2.0 10.5
o Estime la lnea de Regresin Lineal, Grafique el Diagrama de Dispersin y Halle el Coeficiente de Correlacin.
68
10 Bibliografa
KUME, Hitoshi: Herramientas Estadsticas Bsicas para el
Mejoramiento de la Calidad. Ed Norma. Bogot, 1992. RIVAS G, Ernesto: Estadstica General. UCV. Caracas, 1985. SPIEGEL, SCHILLER & SRINIVASAN: Probabilidad y Estadstica. Ed McGraw Hill. Serie Schaum. Mxico, 2005. WALPOLE & MYERS: Probabilidad y Estadstica para Ingenieros. 2da Edicin. Ed Interamericana. Mxico 1984. WALPOLE, MYERS & MYERS: Probabilidad y Estadstica para Ingenieros. Editorial Pearson. Mxico 1999.
69
11 Anexos
11.1 reas bajo la Curva Normal
70
71
72
73
74