Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROBABILIDAD
Temario
Bloque I
Fundamentos de teoría de probabilidad
Variables aleatorias
Modelos analíticos de fenómenos aleatorios discretos
Bloque II
Modelos analíticos de fenómenos aleatorios continuos
Técnicas de muestreo
Bloque III
Distribuciones muestrales
Estimación puntual y por intervalo
Bloque IV
Prueba de hipótesis
Regresión y correlación lineales
OBJETIVO
El estudiante aplica conocimientos básicos de las teorías de la
estadística, desarrollando el pensamiento cuantitativo y relacional
como instrumento de las habilidades de comprensión, expresión e
interpretación de los fenómenos que ocurren en la ingeniería; el
estudiante debe apoyar su proceso de aprendizaje mediante actitudes
de responsabilidad, puntualidad, participación, colaboración y
creatividad.
Bloque I
Fundamentos de
teoría de probabilidad
Variables aleatorias
Modelos analíticos de
fenómenos aleatorios
discretos
FUNDAMENTOS DE LA
TEORIA DE
PROBABILIDAD
Definición de probabilidad
La probabilidad es una rama de las matemáticas que se encarga del estudio
formal de las reglas de la incertidumbre que permiten modelar lo
impredecible.
Ejemplo
1.-En el caso de
E={ c, x } de lanzamiento de una moneda sus sucesos elementales son :
{c} , {x}
2.-En el supuesto de lanzamiento de un dado : E={1,2,3,4,5,6}.
• Axioma 2
La probabilidad del evento seguro, Ω, es igual a 1, denotado
simbólicamente como
• Axioma 3
Si son eventos mutuamente excluyentes (es decir, su intersección es
el conjunto vacío), entonces:
VARIABLE ALEATORIA
Una variable aleatoria es una variable estadística cuyos valores se
obtienen de mediciones en algún tipo de experimento aleatorio.
Formalmente es una función, que asigna eventos. Por ejemplo, el
lanzamiento de un dado o una moneda.
Si X1, X2, X3…Xn son variables aleatorias definidas sobre el mismo espacio
muestral, dichas variables aleatorias reciben el nombre de variables
aleatorias conjuntas.
Si X1, X2, X3…Xn son variables aleatorias conjuntas discretas, se define su función de
probabilidad conjunta como:
Variables aleatorias conjuntas continuas
Dos o más variables aleatorias conjuntas son continuas, si de manera individual, cada una de las
variables consideradas es continua. La probabilidad de que el par (x,y) de variables aleatorias
continuas se sitúe en un conjunto A bidimensional se obtiene integrando una función llamada función
de densidad conjunta.
Si X y Y son v.a. conjuntas continuas, entonces su función de densidad conjunta se define como una
función que cumple las siguientes características:
Para el caso particular, donde tenemos dos variables continuas, tenemos que:
Marginal de y
Funciones de densidad
marginal Marginal de x
Funciones de
densidad condicional
Medidas de dispersión
• Valor esperado de una función de dos variables aleatorias
Si X y Y son variables aleatorias conjuntas con función de probabilidad o
de densidad conjunta f(x,y) y si g(x,y) es una función de dichas variables
aleatorias, entonces el valor esperado de g(x,y) es:
Nota: La desviación
estándar es la raíz cuadrada
de la varianza
Coeficiente de correlación lineal
Propiedades
Momentos
Si X es una variable aleatoria, el momento de orden k de X se define
como:
Funciones generadores de momentos
Teorema
Modelos analíticos de
fenómenos aleatorios
discretos
Distribución uniforme y discreta
Donde:
: indica que el suceso aparezca veces.
n: indica el número de veces que se ha repetido el suceso
: es la probabilidad del suceso
Ejemplo:
En una fiesta, el 20% de los asistentes son españoles, el 30% franceses,
el 40% italiano y el 10% portugueses. En un pequeño grupo se han
reunido 4 invitados: ¿cuál es la probabilidad de que 2 sean españoles y
2 italianos?
Solución:
4! 2 0 2 0
𝑃 ( 𝑋 ¿ ¿ 1=2 , 𝑋 2 =0 , 𝑋 3=2 , 𝑋 4 =0)= ( 0.2) ( 0.3) ( 0.4) (0.1) =0.0384 ¿
2! ∗ 0 ! ∗ 2! ∗ 0 !
Características
•
Ejemplo
Como parte de un estudio de contaminación del aire, un inspector
decide examinar la emisión de gases 6 de los 24 camiones de carga en
una compañía. Si 4 de los camiones emiten cantidades excesivas de
contaminación ¿Cuál es la probabilidad de que ninguno de ellos sea
incluido en la muestra del inspector?
Solución:
( )
𝑃 ( 𝑋 =𝑥 ) = 𝑥 −1 𝑝𝑟 (1 −𝑝 )𝑥 −𝑟
𝑟 −1
X= Número de experimentos realizados hasta
obtener el r-ésimo éxito
Ejemplo
• Se sabe que la probabilidad de que un niño expuesto a una cierta enfermedad
contagiosa la contraiga es de 0.4. Un grupo de médicos han decidido realizar un
estudio con todos los niños en la ciudad con el fin de erradicarla. Calcula la
probabilidad de que el décimo niño estudiado sea el tercero en contraer la
enfermedad.
Solución
Dando valor a los parámetros, tenemos que:
x=10 , r=3 , y p=0.4
Solución
La probabilidad de obtener por primera y única vez “cara” al lanzar una moneda
por quinta vez es de 3.125%
Distribución de Poisson y proceso de
Poisson
La variable aleatoria discreta que también tiene numerosas
aplicaciones es la variable aleatoria Poisson. Su distribución de
probabilidad da un buen modelo para datos que representan el número
de sucesos de un evento especificado en una unidad determinada de
tiempo o espacio.
Su función de distribución está dada por:
• ,
• El experimento consiste en contar el número x de veces que ocurre un
evento en particular durante una unidad de tiempo dada o en un área
o volumen.
• La probabilidad de que un evento ocurra en una unidad dada es la
misma para todas las unidades.
• El valor medio o esperado de eventos se denota por
Ejemplo
b)
{
𝑘𝑥 0 ≤ 𝑥 < 𝑎
𝑓 (𝑥 )= 𝑘(2 𝑎− 𝑥 ) 𝑎≤ 𝑥 ≤ 2 𝑎
0 ; 𝑑𝑒 𝑜𝑡𝑟𝑜 𝑚𝑜𝑑𝑜
• 3.-Una variable aleatoria discreta x tiene la función de probabilidad para x=1,2 y 3. Encuentra el
valor de k para que la función f sea de densidad , y determina la función de distribución
acumulada, además dibújala.
• 4.-Un agente de seguros vende pólizas a 5 personas de la misma edad y que disfrutan de una
buena salud. Según tablas actuales, la probabilidad de que una persona en estas condiciones viva
30 años o más es 2/3. Encuentre la probabilidad de que transcurridos 30 años vivan:
a) Las 5 personas
b) Al menos 3 personas
c) Exactamente 2 personas
d) Obtenga la media y la desviación estándar.
• 5.-Entre los 120 aspirantes para ocupar un empleo, solo 80 están realmente calificados para
hacerlo, si se seleccionan al azar 5 aspirantes para realizar una entrevista a fondo. ¿ Cuál es la
probabilidad de que solo 2 de los 5 estén calificados para el trabajo?
Bloque II
Modelos analíticos
de fenómenos
aleatorios continuos
Técnicas de muestreo
Modelos analíticos de
fenómenos aleatorios
continuos
Distribución de probabilidad continua
• Una distribución continua describe las probabilidades de los posibles
valores de una variable aleatoria continua.
• Las probabilidades de las variables aleatorias continuas (X) se definen
como el área por debajo de la curva de su función de distribución .
Por lo tanto, solo los rangos de valores pueden tener una probabilidad
diferente de cero. La probabilidad de que una variable aleatoria
continua equivalga a algún valor siempre es cero.
𝑥
En las funciones de distribución continuas que
se verán, las tablas de cada distribución
contienen el área acumulada , que se obtiene
𝑃 ( 𝑋 ≤ 𝑥 ) =∫ 𝑓 ( 𝑥 ) 𝑑𝑥
mediante la fórmula: −∞
Distribución normal
Esta distribución sirve como una aproximación excelente a una gran
cantidad de distribuciones que tienen mucha importancia práctica.
Se dice que una variable aleatoria x es una variable aleatoria normal si
y solo si su función de densidad es:
Características:
•
• ,
• Ejemplo
En cierta ciudad el consumo diario de energía eléctrica, en millones de
kilovoltios por hora puede considerarse como una variable aleatoria gamma
de parámetros 0.5. La planta de energía de esta ciudad tiene una capacidad
diaria de 10 millones de Kw/hora.
¿Cuál es la probabilidad de que este abastecimiento sea insuficiente en un
día cualquiera?
Solución
Técnicas de muestreo
• Todas las posibles muestras tienen la misma probabilidad de
Muestreo
aleatorio selección
simple
Muestre
o de
• Se puede obtener de manera facil y sencilla sin seleccion aleatoria.
convenie
ncia
Muestr
• Muestra aleatoria tomada de los conglomerados disponibles en la
eo de
conglo
merad
poblacion
os
Actividad Bloque II
1.-Menciona 2 características de la distribución normal
6.-Se sabe que el tiempo en horas en que semanalmente requiere una maquina para mantenimiento es
una variable aleatoria gamma con parámetros , encuentre la probabilidad de que el tiempo de
mantenimiento sea mayor a 8 horas.
Bloque III
Distribuciones
muestrales
Estimación puntual y
por intervalo
Distribuciones muestrales
Media muestral
Si la población tiene una distribución normal, la distribución muestral
de estará exactamente distribuida en forma normal, cualquiera que
sea el tamaño muestral n.
Estadístico de prueba:
𝑠2 = 𝑖 =1
, dado que es desconocida. 𝑛 −1
• La distribución t se parece a la distribución z en que ambas son
simétricas alrededor de una media 0.
• Cada curva t tiene forma de campana con centro en 0.
• A medida que los grados de libertad aumentan, la dispersión de la
curva t correspondiente disminuye.
• Cuando k (grados de libertad) tiene a infinito, la secuencia de curvas t
se aproxima a la curva normal estándar .
F-Fisher
• La distribución F tiene una amplia aplicaciones en la comparación de dos varianzas
muestrales y también es aplicable en problemas que implican dos o mas muestras. El
estadístico F se define como el cociente de dos variables aleatorias ji cuadradas
independientes, dividida cada una entre sus grados de libertad .
•
• S= Desviación estándar del conjunto de datos.
• = Valor absoluto de la media del conjunto de datos
Ejercicio
Calcula los coeficientes de variación de los siguientes conjunto de
datos:
•
•B
•C
Teorema del límite central
• Si muestras aleatorias de n observaciones se sacan de una población
no normal con media finita y desviación estándar , entonces cuando
n es grande, la distribución de muestreo de la media muestral está
distribuida normalmente en forma aproximada con media y
desviación estándar .
Solución
Datos: , /2 = 0.025 , =1.96 , n=50 , =56.4 , =2.6
La media poblacional puede ser 55.9531 o 56.8496 con una confianza del 95% .
• 2.-En 16 recorridos, el consumo de gasolina de un motor experimental tuvo una
desviación estándar de 2.2 galones. Construya un intervalo de confianza del
99% para .
Solución
Datos : , /2 = 0.005 , =32.8013 , =4.6009 , n=16
Nota:
= 32.8013 =4.6009
Estos valores se obtuvieron de la tabla de la distribución ji cuadrada
• 3.-Para comparar el efecto del estrés en la forma de ruido sobre la
capacidad de realizar un trabajo sencillo, 80 personas fueron divididas
en dos grupos. El primer grupo de 35 personas actúo como control,
en tanto que el segundo grupo de 45 personas fueron el grupo
experimental. Aun cuando cada persona realizo el trabajo en el
mismo cuarto de control, cada una de las personas del grupo
experimental tuvo que realizar el trabajo cuando se reproducía
música de rock a alto volumen. El tiempo para terminar el trabajo se
registró y se obtuvieron los siguientes datos:
Control Experimental
n 35 45
31 minutos 23 minutos
5 minutos 10 minutos
(( < ()
(<)
( <8+4.4126)
(3.5874 <12.4126)
El intervalo para la diferencia de medias es el (3.5874,12.4126), además como todos los valores del
intervalo son positivos, podemos asegurar que la media 1 es mayor que la media 2 con una confianza
Actividad Bloque III
1.-¿Cuál es el dominio de la distribución ji-cuadrada?
5.- Una muestra de n=100 observaciones de entre una población cuantitativa produjo
=52.4 y =9. Dé la mejor estimación puntual para la media poblacional para una confianza
del 99%
6.-Mientras se diseñan asientos de cine, se obtienen las estaturas (en mm) de una
muestra aleatoria simple de mujeres adultas mientras están sentadas: 849,807,821,859,
864, 877, 772, 848, 807, 802,887 y 815. Utilice estos datos muestrales para construir un
intervalo de confianza del 95% para , la desviación estándar de las estaturas de todas las
mujeres mientras están sentadas.
Bloque IV
Prueba de hipótesis
Regresión y
correlación lineales
Prueba de hipótesis
¿Qué es una hipótesis ?
• Solución
Dado que deseamos desmentir lo afirmado por el investigador, nuestras hipótesis quedarían
planteadas de la siguiente manera:
: La dosis de droga inducirá al 80% de las personas con insomnio.
La dosis de droga inducirá a menos del 80% de las personas con insomnio
• 4.-Región de rechazo:
Prueba de una cola Prueba de dos colas
z> :
(o z<- cuando la z> o z<
hipótesis alternativa es
)
Ejemplo
• 1.-Ingenieros civiles registran la cantidad del sal (tons) usadas para
mantener en buen estado las autopistas durante una tormenta de
nieve. La cantidad de sal para n=30 tormentas tiene =1,798.4 tons y
=671,330.9, de modo que s=819.35 tons. Realice una prueba de
hipótesis con la intención de demostrar que el uso medio de sal
durante una tormenta de nieve es menor que 2,000 tons. Considere
Solución
: (cola derecha) :
O
cola izquierda)
• 4.-Región de rechazo:
( )
3 11 33 9 57 − 519 55 643
𝑏=𝑦 −𝑚 𝑥= − = ≈ 11.4821
13 2 26 169 9 616 9 56
10 5 50 100
2 14 28 4
−519 643
∑. 57 233 473 𝑌=
616
𝑥+
56
≈− 0.8425 x +11.4821
Ejercicio
• Calcule la ecuación de la recta que mejor se aproxime al siguiente
conjunto de puntos:
x y
1 9
2 11
10 1
5 7
8 -2
3 4
4 5
-1 8
0 14
Modelo de regresión lineal simple
• El modelo de regresión lineal simple supone que:
i-ésima
: representa el valor de la variable explicativa para la
observación
i-ésima. Los parámetros a estimar
son y
representa el error para la observación i-ésima que se asume
normal ()
Hipótesis del modelo de regresión lineal simple
∑ ( 𝑥 𝑖 − 𝑥 )( 𝑦 𝑖 − 𝑦 )
𝐶𝑜𝑣 ( 𝑥 , 𝑦 ) = 𝑖 =1 La covarianza es el valor que refleja en
𝑛 −1
qué cuantía dos variables aleatorias
varían de forma conjunta respecto a sus
Si hay relación lineal positiva, la covarianza será positiva medias.
y grande.
Si hay relación lineal negativa, la covarianza será Nos permite saber cómo se comporta
negativa y grande en valor absoluto. una variable en función de lo que hace
Si hay no hay relación entre las variables o la relación otra variable. Es decir, cuando X sube
es marcadamente no lineal, la covarianza será próxima a ¿Cómo se comporta Y?
cero.
Coeficiente de correlación lineal
• Una medida de dependencia lineal que no depende de las unidades de
medida es el coeficiente de correlación lineal:
Donde: y
Propiedades
Coeficiente de determinación
El coeficiente de determinación, también llamado R cuadrado, refleja la bondad del ajuste de
un modelo a la variable que pretender explicar.
2
𝑅 =
∑ ^
( 𝑦 𝑖 − 𝑦) 2
∑ 𝑖
( 𝑦 − 𝑦)
2
Actividad Bloque IV
1.-Describa de manera general, cuáles son los pasos para realizar una prueba de hipótesis .
2.-Debido a una estimación obsoleta del peso medio de hombres y mujeres, han muerto personas en
accidentes de barco. Si se utilizan los pesos de una muestra aleatoria simple de hombres, se obtienen los
siguientes estadísticos muestrales: n=40 y Investigaciones de muchas otras fuentes sugieren que la
población de pesos tienen un desviación estándar de Utilice estos resultados para someter a prueba la
afirmación de que los hombres tienen un peso medio mayor que 166.3 libras, que era la recomendación del
sistema nacional de transporte. Hágase para una confianza del 99% .
3.-Un empacador de lácteos afirma que el promedio de llenado es de 250 gramos por yogur. Esta afirmación
debe ser verificada muestreando sucesivamente durante un mes; se toma una muestra de 10 datos
considerando una distribución t, el llenado de los envases es de: 247, 260, 234, 244, 251, 249, 250, 251,248 y
247 gramos, respectivamente.¿ La afirmación del empacador es valida o el llenado es superior?. Hágase para
una confianza del 90%.
4.-Suponga la siguiente afirmación: “El 50% de los trabajadores en la compañía X, pescara un resfriado en el
invierno , debido a las malas condiciones de trabajo”.
Suponga que se desea probar lo contrario, determine entonces y escriba los errores tipo I y tipo II en esta
situación .
• 5.- Considere los siguientes conjuntos de puntos:
x y x y
1 0 0 2
2 2 1 3
3 4 3 2
4 8 4 5
5 7 7 9
6 10 8 8
7 11 9 11
8 17 10 15
9 13 11 12