Documentos de Académico
Documentos de Profesional
Documentos de Cultura
abilidad y
Estadística
TABLA DE CONTENIDOS
Esquema ........................................................................................................................... 3
Breve Descripción del Capítulo......................................................................................... 4
Objetivos ........................................................................................................................... 5
Probabilidad........................................................................................................................ 6
1.1. Leyes de conjuntos y Diagramas de Venn................................................................ 6
1.2 Espacio muestral y Eventos.................................................................................. 10
1.2.1 Conteo de puntos de la muestra ................................................................... 11
1.3 Probabilidad de ocurrencia de un evento aleatorio................................................ 13
1.3.1 Reglas aditivas ............................................................................................. 15
1.4 Probabilidad condicional ..................................................................................... 16
1.4.1 Regla multiplicativa...................................................................................... 16
1.4.2 Teorema de Bayes ....................................................................................... 17
Bibliografía ...................................................................................................................... 18
Esquema
Conjuntos numéricos
Conteo de elementos de un
conjunto
Definiciones de probabilidad
Probabilidad Probabilidad
Leyes aditivas
Probabilidad condicional
Teorema de Bayes
Desde que tenemos uso de razón, como personas, también tenemos la tendencia a la
asociación. Ello es algo que nos facilita reconocer cosas en general: detalles comunes,
tenemos la tendencia a agrupar. Es decir, a colocar en una misma categoría “objetos” que
presente algo en común. Por ejemplo, individuos (de un mismo país, con el mismo color
de piel, que profesan la misma religión, etc.); libros (de pasatiempos, novelas, poemarios,
etc.)
datos (un conjunto de números) que representan mediciones del tiempo que demora en
conectado a una red: 𝑆 = {2, 3.1, 2.02,3, 1.2, 1.45, 0.38, … … . . } . Este conjunto de
números reales positivos tiene una significación concreta. Cada uno de sus elementos
archivo, por ejemplo, desde una página de Google, depende de varios factores: tamaño
del azar.
posibilidad de que ocurra un fenómeno, proceso o suceso que esté regido por la
aleatoriedad.
Objetivos
Probabilidad
Si pensamos desde el punto de vista de la respuesta que debe proporcionar cierto sistema
ingenieril, entonces es importante que el sistema “actúe” de forma “coherente” ante la
presencia de esa “perturbación o ruido” que tiene, tal vez, esencia desconocida y por ello
incierta.
Todas las situaciones anteriores pueden ser estudiadas a través del análisis de una
variable, y los valores que esa variable puede tomar, que están influenciados por la
aleatoriedad debido a la propia naturaleza de esta, se pueden agrupar en un conjunto.
Por ejemplo:
Todas las variables definidas en los ejemplos anteriores tienen carácter aleatorio, es
decir, para ellas no es posible determinar con absoluta certeza cuál de los posibles valores
que cada una de ellas puede tomar, será en definitiva el que tome. Pero como todas ellas
se representan a través de un conjunto de números, que cumplen con determinada
“propiedad” común a todos ellos, entonces vale la pena primero estudiar, en general
cómo se manejan los conjuntos.
Los conjuntos numéricos con que trabajaremos de forma directa serán siempre el
resultado o la forma de “observar, registrar, medir” fenómenos, sucesos o procesos que
se rigen por el azar o la casualidad. Y justamente ello les confiere (a esos conjuntos y a
las variables que los representan o describen) un carácter aleatorio o estocástico.
𝑆 = {𝐴, 𝐵, 𝐶, 𝐷, ⋯ }
𝐷 = {1,2,4}
Nos centraremos en las operaciones entre conjuntos que luego utilizaremos con
frecuencia para algo más. A saber, la unión y la intersección entre conjuntos. Y también
el complemento o negación de un conjunto.
Así, por ejemplo, si 𝐹 = {1,2,3, 4,5, 6,7}, 𝐴 = {1,2,3}, 𝐵 = {3, 4,5}; entonces:
¿Puede existir un conjunto que no contenga elementos? Esta interrogante podría resultar
absurda si tenemos en cuenta la propia definición de conjunto; sin embargo, desde una
óptica matemática abstracta, la respuesta a ella es sí. Resulta que, dentro de la Teoría de
Conjuntos, se define y desempeña un rol relevante, el Conjunto Vacío (notación: ∅) que,
por definición, es el conjunto que no contiene elemento alguno.
Diagramas de Venn
Las tres operaciones descritas arriba admiten una representación gráfica. Esta forma
gráfica de representar operaciones entre conjuntos es útil en algunas situaciones en que
se requiere cuantificar la incertidumbre. Y se denomina diagramación de Venn.
Utilicemos diagramas de Venn para representar los conjuntos y las tres operaciones entre
ellos. Ver las figuras 1 y 2:
a b
c d
regularidad con que falla (o con que no falla) un cierto tipo de circuito eléctrico
conformado por tres componentes (¿todos los circuitos de este tipo específico se
comportan siempre de la misma forma?); los registros de mediciones de voltaje que se
toman en determinada zona de un país, de una ciudad, de un barrio (cada vez que
medimos el voltaje, en un mismo “punto” de una red, durante varios días, a horas
diferentes, ¿siempre, siempre observaremos exactamente los mismos resultados?);
cantidad de patrones que identifica el Robot, de entre 3 y 8, que le provocan realizar un
cambio de dirección (y está claro que unas veces reconocerá 3 , otras 4, etc. Y no
reconoce solo dos, entonces mantiene la dirección “actual”)
El conjunto 𝑆𝑎𝑛𝑡𝑖𝑒𝑟 es un evento simple porque solo contiene un elemento (antier José
solo recibió una llamada a su móvil). El conjunto 𝑆𝑎𝑦𝑒𝑟 no es un evento simple porque
contiene diez elementos. Sí está claro que, tanto 𝑆𝑎𝑦𝑒𝑟 , como 𝑆𝑎𝑛𝑡𝑖𝑒𝑟 son subconjuntos
del conjunto universal 𝑆𝑋 (universal para el problema o la variable que estamos
observando o midiendo en este caso)
¿Y qué tan grande puede ser un espacio muestral? Por la estructura que presenta el
conjunto 𝑆𝑋 , es claro que, si consideramos todos los días de una semana, obtendremos
un espacio muestral más pequeño que si consideramos todos los días del pasado mes al
que pertenece la semana analizada. Entonces, en teoría, pueden existir espacios
muestrales tan grandes, que nos resulte casi imposible poder “contar” a simple vista, la
cantidad de elementos que contiene.
Ya se conoce que el espacio muestral para esta “situación” (entendiendo por situación al
problema, el fenómeno, el experimento). A saber, 𝑆𝑦 = {𝑦1 = 3, 𝑦2 = 4, 𝑦3 = 5, 𝑦4 =
6, 𝑦5 = 7, 𝑦6 = 8 }. Sin embargo, la materialización de un espacio muestral no es única,
ello va a depender de lo que interese observar y estudiar.
Entonces podría interesar conocer de cuántas maneras diferentes (cuántas son las
combinaciones diferentes de 3 de los 8 patrones, que se pueden formar) podría lograrse
que el Robot cambie el sentido de su movimiento (no se pierda de vista que se hace
referencia a un movimiento en línea recta)
Está demostrado que ese número de combinaciones se puede hallar de forma sencilla
aplicando la siguiente fórmula:
𝑛 𝑛!
( )=
𝑚 𝑚! (𝑛 − 𝑚)!
𝑛: cantidad de elementos del conjunto.
𝑚: cantidad de elementos o tamaño de los subconjuntos que se desea formar.
Recordemos que la operación factorial de un número entero positivo es: 𝑛! =
𝑛 × (𝑛 − 1) × (𝑛 − 2) × ⋯ × 2 × 1
Entonces
8 8! 8! 5! × 6 × 7 × 8
( )= = = = 48
3 3! (8 − 3)! 3! × 5! 3 × 2 × 1 × 5!
En el cálculo anterior se ha utilizado el hecho que 𝑛! = 𝑛 × (𝑛 − 1)!
Así, existen 48 formas o combinaciones diferentes, que incluyen 3 de los 8 patrones. Por
tanto, 48 situaciones o escenarios que provocarían cambio de sentido del movimiento
del Robot. 𝑆𝑦 = {48 𝑝𝑜𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒𝑠}, es decir, este conjunto o espacio muestral, para esta
situación específica, contiene 48 elementos o puntos muestrales. No estamos viendo
todos esos puntos muestrales, pero, muy importante, conocemos su cantidad. Y es
suficiente para muchas aplicaciones, y en particular para lo que interesa más adelante.
que este “vea” 4, 5, 6, 7 o los 8 patrones a la vez. Evidentemente, el tamaño del espacio
muestral se incrementa considerablemente; pero igual, es posible conocerlo.
Existen varias formas de realizar combinaciones con los elementos de un conjunto. Para
profundizar sobre ellas, estudiar en el libro de texto (de Oteyza, Lam, Hernández, Carrillo,
2015, p. 48), el Capítulo 3 “Cálculo Combinatorio”; los epígrafes desde el 3.1 hasta el 3.4,
a partir de la página 48.
Supongamos que, entre los 100 archivos descargados (para contextualizar el problema,
imaginemos que estudiamos matemáticas y todos los archivos están relacionados con la
integración definida; es decir, para estudiar nos hemos descargado libros, artículos,
videos de YouTube; relacionados con el cálculo integral definido). Supongamos también
que estas descargas las realizamos durante 5 días sucesivos; mientras nos preparábamos
para un examen global.
Si transcurrido cierto tiempo, enfrentamos una situación similar, pero esta vez
corresponde preparar un examen sobre métodos de solución de sistemas de ecuaciones
en general, entonces, para una mejor organización del estudio, podríamos decidir buscar
y descargar primero videos, porque tenemos la percepción o la idea que la descarga de
este tipo de materiales demora menos, y tenemos curiosidad por ver cuanto antes algo
relacionado con el tema. Igual, todos los videos no son de la misma extensión. Podríamos
preguntarnos cuál es la posibilidad (probabilidad) de que seleccionemos un determinado
video de Internet, y la descarga de este dure menos de 10 segundos.
ordenador, del tráfico que haya en la red en cada momento, de la calidad de la conexión,
entre otros aspectos. Este proceso es estocástico, probabilístico.
𝑁(𝐴): cantidad de elementos del subconjunto A (es decir, cantidad de realizaciones del
proceso, ocurrencias del fenómeno o resultados del experimento, que son favorables al
evento A)
𝑁(𝑆): cantidad de elementos del conjunto Universo (es decir, cantidad de elementos del
espacio muestral, cantidad de resultados posibles del proceso, fenómeno o del
experimento aleatorio)
Esta definición, conocida como clásica, tiene una restricción. No es posible aplicarla si el
espacio muestral es infinito, porque no habría cómo contar sus elementos.
Supongamos que, de los 100 archivos descargados de Internet la vez anterior, 28, entre
los que están todos los videos bajados, tuvieron un tiempo de descarga menor a 10
segundos. Entonces, para esta vez, considerando que estamos utilizando el mismo
computador, y con las mismas condiciones de conectividad, podríamos esperar que el
primer video que encontremos sobre el tema buscado demore menos de 10 s en
descargarse con una posibilidad (probabilidad) que se cuantifica en un 0.28 (o 28%). ¿Por
qué?
Sea C el evento que definimos como cantidad de archivos que se descargan en un tiempo
inferior a 10 s. Como fueron realizadas, en total, 100 descargas (el proceso se repitió 100
veces), entonces:
𝐶 = {𝑡1 , 𝑡2 , ⋯ , 𝑡28 }
𝑓𝑟 (𝐶) 28
𝑃(𝐶) = = = 0.28 = 28%
𝑛 100
La probabilidad puede ser expresada en términos porcentuales. Ello, para el ejemplo
anterior, significa que, si se mantienen invariables las condiciones de ejecución (la
descarga de archivos), entonces es de esperar que, de la totalidad de archivos que se
descarguen, el 28% de ellos va a demorar un tiempo inferior a los 10 s para completarse
esa descarga.
Además, como se aprecia en las definiciones 4 y 5, siempre será un número que está en
el intervalo [0,1]. Este detalle permite también pensar en probabilidad como si se tratara
de una función o correspondencia entre dos conjuntos; el espacio muestral del
experimento y el intervalo real [0,1].
𝐶 = {𝑡1 , 𝑡2 , ⋯ , 𝑡28 }
𝐷 = {𝑡1 , 𝑡2 , ⋯ , 𝑡11 }
Habría que aplicar una propiedad de la probabilidad que pertenece a un tipo conocido
como reglas aditivas, para expresar y hallar la probabilidad deseada:
𝑃(𝐶 ∪ 𝐷) =?
Y en este caso, cobra valor la clasificación de eventos como excluyentes o simultáneos.
Hay que recordar que dos eventos son mutuamente excluyentes si, 𝐴 ∩ 𝐷 = ∅; mientras
que se denominan simultáneos, si 𝐴 ∩ 𝐷 ≠ ∅.
Para ampliar los conocimientos sobre las definiciones de probabilidad, cómo se utilizan,
cómo se caracteriza esta función a la que se ha hecho alusión, y qué otras propiedades
de la definición de probabilidad se verifican (otras reglas aditivas), estudiar en el libro de
texto (de Oteyza, Lam, Hernández, Carrillo, 2015, p. 78), el Capítulo 4 “Probabilidad
simple y compuesta”; los epígrafes desde el 4.1 hasta el 4.3, a partir de la página 78.
Así, queremos conocer la probabilidad de que ocurra el suceso D bajo la condición que
ya ocurrió el evento C.
¿Y cómo calcular esa probabilidad? Pensemos esta vez en el ejemplo relacionado con las
llamadas telefónicas:
Cantidad de llamadas telefónicas que recibe José a su celular durante un día. La variable
sería X: número de llamadas que recibe José a su celular en un día determinado (de la
semana, del mes, del año): 𝑆𝑋 = {𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛 }.
Pensemos que queremos saber la probabilidad de que José reciba mañana una llamada
telefónica, si en el día de ayer recibió 5 llamadas.
Si denotamos los eventos 𝐿𝐿𝑎𝑦𝑒𝑟 : cantidad de llamadas que José recibió ayer; 𝐿𝐿𝑚𝑎ñ𝑎𝑛𝑎 :
cantidad de llamadas que José recibirá mañana. Entonces el evento 𝐿𝐿𝑎𝑦𝑒𝑟 ya ocurrió,
además 𝐿𝐿𝑎𝑦𝑒𝑟 = {5 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 (𝑙𝑎𝑠 5 𝑙𝑙𝑎𝑚𝑎𝑑𝑎𝑠 𝑟𝑒𝑐𝑖𝑏𝑖𝑑𝑎𝑠 𝑝𝑜𝑟 𝐽𝑜𝑠é 𝑎𝑦𝑒𝑟)}.
En tal situación se aplican las denominadas reglas multiplicativas. Y para conocer sobre
ellas estudia, en el libro de texto (Obando López, J., Arango Londoño, N., 2019, p. 9), el
Capítulo 1 “Probabilidades”; los epígrafes desde el 1.1 hasta el 1.3, a partir de la página
9.
𝑆 = 𝐴1 ∪ 𝐴2 ∪ ⋯ ∪ 𝐴9 .
Además, 𝐴i ∩ 𝐴j = ∅, ∀ 𝑖 ≠ 𝑗
Dado cualquier otro evento B, subconjunto de S; pero que no forma parte de la partición
de S, es posible hallar la probabilidad de que este ocurra con la ayuda de la fórmula de la
Probabilidad Total. Sea B el evento que se representa en la figura 4.
Si la partición del espacio muestral está formada por n eventos, entonces la fórmula
anterior se generaliza a:
FIGURA 4: Evento B en relación con los subconjuntos de la partición de S (𝐴1 , ⋯ 𝐴9 ) FUENTE: AUTOR
𝑃(𝐴𝑖 |𝐵) =?
Bibliografía
de Oteyza, E., Lam, E., Hernández, C., Carrillo, A. (2015). Probabilidad y estadística. Pearson
Educación, México.
https://bibliotecas.ups.edu.ec:3488/es/ereader/bibliotecaups/38015
Obando López, J., Arango Londoño, N. (2019). Probabilidad y Estadística. Fondo Editorial EIA.
https://bibliotecas.ups.edu.ec:3488/es/ereader/bibliotecaups/125705
Islas-Salomón, C. A., Colín Uribe, M. P., Morales Téllez, F. (2018). Probabilidad y Estadística.
Grupo Editorial Éxodo, México.
https://bibliotecas.ups.edu.ec:3488/es/ereader/bibliotecaups/128557
Estadística
TABLA DE CONTENIDOS
Esquema ........................................................................................................................................ 3
Breve Descripción del Capítulo ...................................................................................................... 4
Objetivos........................................................................................................................................ 4
Introducción a la Estadística .......................................................................................................... 5
2.1. Introducción. ................................................................................................................. 5
2.1.1. Datos discretos y continuos ...................................... ¡Error! Marcador no definido.
2.2. Características numéricas .............................................................................................. 7
2.2.1. Medidas de posición .............................................................................................. 8
2.2.2. Medidas de variabilidad ......................................................................................... 9
2.3. Distribución empírica ................................................................................................... 11
Bibliografía ................................................................................................................................. 17
Datos discretos
Introducción
Datos continuos
Características numéricas
Medidas de variabilidad
Distribución empírica
¿Qué es la Estadística?
La anterior interrogante resultará familiar a todos. En cada país, por lo general, existe un
con las actividades económicas, sociales, y de otra índole; que describen cómo es el país
interpretación, y presentación de los datos, así como el proceso aleatorio que los genera
Objetivos
2.1. Introducción.
En los cinco ejemplos o casos de estudio que fueron abordados en la Unidad 1, es
evidente que se genera información: registros de tiempos de descarga de archivos de
Internet; cantidad de llamadas telefónicas; frecuencias (instantes de tiempo) de fallo de
un circuito eléctrico conformado por tres elementos; mediciones de voltajes; cantidad de
patrones que “reconoce” cierto Robot.
Toda esta información se guarda en cierto objeto, que denominamos comúnmente como
variable: t: tiempo de descarga de un archivo de Internet; X: número de llamadas que se
reciben en un día determinado; 𝑳𝑳𝒊 : instante en que falla el componente i del circuito;
𝑖 = 1,2,3; V: mediciones de Voltaje, en Voltios; Y: cantidad de patrones de cambio de
sentido del movimiento que identifica el Robot.
𝐽 = {𝐶𝑎𝑓é, 𝑉𝑒𝑟𝑑𝑒, 𝑉𝑒𝑟𝑑𝑒 𝑐𝑎𝑙𝑟𝑜, 𝐴𝑧ú𝑙 𝑡𝑢𝑟𝑞𝑢𝑒𝑠𝑎, 𝑁𝑒𝑔𝑟𝑜 𝑜𝑠𝑐𝑢𝑟𝑜, 𝑁𝑒𝑔𝑟𝑜 𝑐𝑙𝑎𝑟𝑜, ⋯ }
Definición 1: una variable se llama continua si los valores que ella puede tomar completan
o llenan un intervalo real. En caso contrario, la variable se denomina discreta.
Los datos que correspondan a una variable continua serán datos continuos; mientras que
los datos que correspondan a una variable discreta serán discretos.
Para tratar de tener mejor claridad en cuanto a la diferenciación entre datos discretos y
continuos, analicemos la siguiente variable: E- edad de una persona. Conocemos, casi
seguro, la edad de nuestros padres, hermanos, familiares cercanos en general. Pero si se
va a realizar una investigación, por ejemplo, en el ámbito de la salud; seguramente que
no conoceremos con exactitud las edades de las personas seleccionadas dentro de la
muestra para llevar adelante la investigación. Por tal motivo E es una variable, y en ella
vamos a guardar información que, hasta tanto no sea aclarada, presenta incertidumbre
(no conoceremos la edad concreta de una persona hasta tanto no le consultemos al
respecto). Ahora bien, cuando nos preguntan nuestra edad en una consulta médica, o en
cualquier otro ámbito, la respuesta siempre es una cantidad de años representada por
un número entero (años cumplidos, ya vividos por la persona): 17, 80, 55, 32, etc. Desde
el punto de vista práctico, la variable E se asume como discreta.
Sin embargo, el tiempo de vida de una persona empieza con el nacimiento y para
(termina) cuando esa persona muere. Y está muy claro, ya hemos advertido que el tiempo
no deja de transcurrir, de avanzar o pasar. Entonces, por su naturaleza matemática, E es
una variable continua.
Si una determinada variable estocástica puede tomar TODOS los valores de un intervalo,
entonces es continua. En caso contrario, discreta.
Por otro lado, en cuanto a la variable Y: cantidad de patrones de cambio de sentido del
movimiento que identifica el Robot, es claro que si el Robot identificó 3 patrones de
cambio y modificó el sentido de su desplazamiento, entonces fueron 3 y no 4. Y entre el
valor 3 y el valor 4 no cabe ningún otro número que represente otra cantidad de patrones
de cambio. Es decir, entre el valor 3 y el valor 4, la variable Y no puede tomar ningún otro
valor. Entre esos valores existe un espacio vacío, un hueco. Ella es discreta, pues no puede
llenar todo el intervalo [3, 8] (recordemos que la cantidad mínima de patrones que
puede identificar el Robot es 3; mientras que la cantidad máxima es 8)
Bien, se cuenta con un conjunto de datos que representan valores de voltaje en esa zona.
Pero qué nos dicen esos datos continuos. ¿Es posible tomar alguna decisión a partir de
esta información? Poco factible.
De momento, lo que se podría afirmar es que, por ejemplo, en uno de los puntos de
medición del barrio, en cierto día y a determinada hora, se registró un voltaje de 112.301
Voltios. Y que otra medición arrojó un valor de 112 Voltios; y así 40 veces, porque el
conjunto de datos contiene 40 elementos (40 mediciones de voltaje).
Ah, también podríamos decir que varios valores de voltaje se repiten varias veces.
Las principales medidas de posición de una variable son la media, la mediana, la moda.
𝑍 = {𝑧1 , 𝑧2 , ⋯ , 𝑧𝑛 }
Definición 2: sea una variable probabilística Z.
- Se llama Moda al valor de la variable que más se repite dentro del conjunto. Lo
denotaremos 𝑍𝑚𝑜𝑑𝑎𝑙 . Una variable puede tener más de una moda.
Pondremos atención sobre las dos principales medidas de dispersión o variabilidad, que
son la varianza y la desviación estándar o típica.
𝑆𝑍 = √𝑆𝑍2
1
= [(112.29 − 110.407)2 + (108.6 − 110.407)2 + ⋯ + (110 − 110.407)2 ]
39
≈ 1.811
Imaginemos que, dentro del conjunto de datos de la variable voltaje, tenemos las
observaciones 109.207 y 111.607. Estas dos mediciones están a la misma distancia
respecto del promedio o media de la variable V. Y como estamos considerando las
distancias desde esos puntos sobre la recta real que representa las mediciones de
̅, entonces tendríamos
voltajes; y un valor está a la izquierda y el otra a la derecha de 𝑉
que tomarlos con signos contrarios en esa suma general en que estaríamos considerando
esas “separaciones” o errores respecto de la media. Y es aquí donde ocurriría la
cancelación de esos dos números. En otras palabras, estaríamos dejando de considerar
un error, y por tanto, perdiendo información relevante para lo que se analiza.
¿Y qué tal si esto no fuese suficiente para la toma de decisiones? ¿Habrá más información
oculta en el “interior” de ese conjunto de datos que son mediciones de voltaje?
La respuesta a la interrogante con que hemos terminado la sección 2.2 es sí. Para conocer
más sobre la variable en análisis, basta construir una tabla de frecuencias y unos gráficos
asociados a ella. Y 𝑡𝑎𝑏𝑙𝑎 + 𝑔𝑟á𝑓𝑖𝑐𝑜𝑠 conforman lo que se conoce como distribución
empírica de la variable.
La tabla de frecuencias, como lo indica su nombre, es una tabla cuyas filas hacen
referencia a cierta caracterización de un subintervalo de variación de la variable en
estudio. Es decir, el intervalo de variación de la variable V es [108.56, 112.31]. Este
intervalo será dividido en subintervalos que llamaremos clases. Las clases ocuparán la
primera columna de la tabla.
Existen varias formas de determinar la cantidad de clases que conforman una tabla de
frecuencias. En el presente curso utilizaremos la Regla de Sturges para determinar esa
cantidad, que denotaremos como K:
Para conocer de dónde y cómo se deriva la fórmula anterior, visitar por ejemplo el sitio
web https://www.lifeder.com/regla-sturges/
Para V:
Significa que tendremos una tabla de frecuencias con 7 intervalos o clases (en el caso de
este valor, es aconsejable aproximar por exceso. Por ese motivo el 6.37 lo hemos
redondeado a 7)
¿De qué tamaño será cada uno de los 7 intervalos o clases de la tabla de frecuencias?
𝑅 = 𝑍𝑚𝑎𝑥 − 𝑍𝑚𝑖𝑛
Nro. Clases
1 [108.5,109.5)
2 [109.5,110.5)
3 [110.5,111.5)
4 [111.5,112.5)
5 [112.5,113.5)
6 [113.5,114.5)
7 [114.5,115.5)
Observación: notemos varias cosas. Hemos tomado los valores de K y C redondeando por
exceso. Y además, la primera clase o intervalo no inicia con el valor 𝑉𝑚𝑖𝑛 = 108.56. Estas
no son condiciones necesarias para construir la tabla de frecuencias, pero lo que se
consigue siguiendo este criterio, es que todos los valores de la variable (mediciones de
voltaje) estén considerados (evitamos la pérdida de algún dato, es decir, de información).
¿Qué inconvenientes se podrían tener procediendo de esta forma?
Por ejemplo, para el caso que analizamos, el hecho de tomar 𝐶 = 1 provoca que el último
intervalo se vaya hasta 115.5. Y el valor 𝑉𝑚𝑎𝑥 = 112.31; es decir, las clases 5, 6 y 7
estarán vacías, no contendrán información.
También prestar atención sobre la forma en que se han tomado los intervalos. Cerrados a
la izquierda, abiertos a la derecha; de forma continua.
En este caso, para evitar clases vacías, no aproximaremos el valor de C, por lo que
tomaremos 𝐶 = 0.54 y el primer intervalo lo iniciamos desde 𝑉𝑚𝑖𝑛 = 108.56
Nro. Clases 𝑛𝑗 𝑓𝑗 𝑁𝑗 𝐹𝑗
1 [108.56,109.10)
2 [109.10,109.64)
3 [109.64,110.18)
4 [110.18,110.72)
5 [110.72,111.26)
6 [111.26,111.80)
7 [111.80,112.34)
Esta vez no tendremos clases vacías y se garantiza que todas las observaciones estén
incluidas en una única clase. En el resto de las columnas de la tabla tenemos:
Para completar la tabla, miremos nuevamente sobre los datos (y por comodidad
aprovechando el hecho de que los tenemos ordenados de manera creciente):
Entonces:
Nro. Clases 𝑛𝑗 𝑓𝑗 𝑁𝑗 𝐹𝑗
1 [108.56,109.10) 12 0.3 12 0.3
2 [109.10,109.64) 2 0.05 14 0.35
3 [109.64,110.18) 10 0.25 24 0.6
4 [110.18,110.72) 0 0 24 0.6
5 [110.72,111.26) 2 0.05 26 0.65
6 [111.26,111.80) 1 0.025 27 0.675
7 [111.80,112.34) 13 0.325 40 1
𝑁2 = 𝑁1 + 𝑛2 = 12 + 2 = 14 y así sucesivamente.
¿Y qué más en este momento, en cuanto a nueva información que brindada por los
datos?
Veamos:
𝑛4 = 0: hubo cero mediciones de voltaje entre los 110.18 y los 110.72 Voltios.
𝑛3 = 10: significa que 10 mediciones de voltaje están entre los 109.64 y los 110.18
Voltios.
𝑓3 = 0.25: significa que el 25% de las 40 mediciones de voltaje, están entre los 109.64 y
los 110.18 Voltios.
𝑁3 = 24: significa que 24 mediciones de voltaje están entre los 108.56 y los 110.18
Voltios (en este caso, el dato se acumula desde el extremo izquierdo de la primera clase
hasta el extremo derecho de la clase 3)
𝐹3 = 0.6: significa que el 60% de las mediciones de voltaje están entre los 108.56 y los
110.18 Voltios (otra vez se acumula el valor)
Ahora, para el ejemplo que se analiza, la Empresa Eléctrica cuenta con mayor cantidad
de información, extraída de los datos recopilados (características numéricas y tabla de
frecuencias), para apoyar la toma de decisiones.
0.25 0.25
0.2
0.15
0.1
0.05 0.05
0.05 0.05 0.05 0.025
0 0.025
0 0
108.83 109.37 109.91 110.45 110.99 111.53 112.07
Clases (puntos medios de los intervalos de voltajes)
Pero esta idea quedará más clara cuando estudiemos las distribuciones.
Retomando las características numéricas de una variable, tales valores se pueden calcular
también a partir de la información resumida en la tabla de frecuencias. Y en este caso se
debe incluir, en la tabla, la columna que corresponde a las marcas de clase.
Nro. Clases 𝜆𝑗 𝑛𝑗 𝑓𝑗 𝑁𝑗 𝐹𝑗
1 [108.56,109.10) 108.83 12 0.3 12 0.3
2 [109.10,109.64) 109.37 2 0.05 14 0.35
3 [109.64,110.18) 109.91 10 0.25 24 0.6
4 [110.18,110.72) 110.45 0 0 24 0.6
5 [110.72,111.26) 110.99 2 0.05 26 0.65
6 [111.26,111.80) 111.53 1 0.025 27 0.675
7 [111.80,112.34) 112.07 13 0.325 40 1
1
= [108.83 × 12 + 109.37 × 2 + ⋯ + 112.07 × 13] ≈ 110.356
40
𝐾 𝐾
1 2 1 2
𝑆𝑉2 = ̅) =
∑ 𝑛𝑗 (𝜆𝑗 − 𝑉 ∑ 𝑛𝑗 (𝜆𝑗 − 110.356) =
𝑛−1 39
𝑗=1 𝑗=1
1
= [(108.83 − 110.356)2 + (109.37 − 110.356)2 + ⋯ + (112.07 − 110.356)2 ] ≈
39
≈ 1.853
¿Qué explica tales diferencias? Sencillamente cuando se aplican las fórmulas para datos
no agrupados, se utilizan todos los valores de la variable. Mientras que las fórmulas para
datos agrupados utilizan aproximaciones de esas mediciones, porque solo se considera
el punto medio de los intervalos donde se ubican esos datos.
https://www.youtube.com/watch?v=cyXenZEbGz4
Bibliografía
https://bibliotecas.ups.edu.ec:3488/es/ereader/bibliotecaups/70059
Estadística
TABLA DE CONTENIDOS
Esquema ........................................................................................................................... 3
Breve Descripción del Capítulo......................................................................................... 4
Objetivos ........................................................................................................................... 4
Variables aleatorias, distribuciones de probabilidad y esperanza matemática ..... ¡Error!
Marcador no definido.
3.1. Definición de variable aleatoria. ......................... ¡Error! Marcador no definido.
3.1.1. Distribución discreta de probabilidad ........................................................ 7
3.1.2. Distribución continua de probabilidad ..................................................... 11
3.1.3. Distribución conjunta de probabilidad ..................................................... 14
3.2 Características numéricas de una variable aleatoria1¡Error! Marcador no
definido.
3.2.1 Media y varianza de una variable aleatoria ............................................. 16
3.2.2 Covarianza de dos variables aleatorias .................................................... 18
3.2.3 Media y varianza de combinaciones lineales de variables aleatorias ...... 19
3.3 Teorema de Chevyshev .................................................................................... 19
Bibliografía ...................................................................................................................... 20
Distribución discreta de
probabilidad
Distribución conjunta de
probabilidad
Variables aleatorias,
Media y varianza de una
distribuciones de probabilidad
variable aleatoria
y esperanza matemática
Media y varianza de
combinaciones lineales de
variables aleatorias
Teorema de Chevyshev
En las Unidades 1 y 2 de nuestro curso ya han sido abordadas las variables aleatorias. Se
probabilístico, es posible definir un conjunto de todos los resultados posibles de este (el
espacio muestral S). Los elementos de S pueden presentar cualquier naturaleza; sin
embargo, se continuará analizando los ejemplos de la vida real que han sido discutidos
Resulta que una variable aleatoria también puede ser definida, desde un punto de vista
Objetivos
distribución correspondiente.
y esperanza matemática
Para mostrar la definición 1, será utilizado un ejemplo bastante clásico dentro de la Teoría
de las Probabilidades. A saber, el lanzamiento de un dado legal. Cada vez que se lanza un
dado, hecho que puede estar asociado el desarrollo de algún juego de azar, se está
realizando una acción que tiene carácter estocástico, porque antes de que se haya
ejecutado el lanzamiento no es posible conocer, con absoluta certeza, cuál de los posibles
resultados de la acción es el que va a ocurrir. Entonces, tiene sentido preguntar cuál es
el espacio muestral de este fenómeno o suceso aleatorio.
Es evidente que, para el experimento del dado, el espacio muestral contiene seis
elementos: las cantidades estampadas, en forma de puntos generalmente, en cada una
de las seis aristas o caras del dado.
𝑀(∎∎∎∎∎) = 5, 𝑀(∎∎∎∎∎∎) = 6
Es evidente que los valores que puede tomar la variable aleatoria M son 1,2,3,4,5,6.
𝑻: 𝑡1 , 𝑡2 , ⋯ , 𝑡100
𝑡1 : tiempo que demoró en descargarse el primer archivo.
𝑿: 𝑥1 , 𝑥2 , ⋯ , 𝑥10
Bien, si se tienen ahora variables aleatorias, entonces cabe preguntarse si será posible
“armar” o definir funciones que dependan de ellas (en este caso se trataría de una
función de otra función, porque se ha visto que las variables aleatorias son funciones.
Pero no podrían ser clasificadas o consideradas como las funciones compuestas que se
definen en Cálculo Diferencial)
Antes hay que aclarar que tales distribuciones expresan la probabilidad de que una
variable aleatoria, discreta o continua, tome uno de los valores que ella podría tomar. Por
ejemplo, para la variable X, podría desearse conocer la probabilidad de que 𝑥1 = 5 (es
decir, cuál es la probabilidad de que José reciba, el lunes siguiente, exactamente 5
llamadas telefónicas)
Definición 2: sea M una variable aleatoria discreta, y 𝑚1 , 𝑚2 , ⋯ valores que esta puede
tomar. La función 𝑓(𝑚) se llama función de probabilidad para la variable M si ella asocia
a cada valor m que puede tomar la variable, la probabilidad de que esto ocurra (que la
variable tome justamente ese valor: 𝑓(𝑚) = 𝑃(𝑀 = 𝑚); P representa probabilidad), y
cumple las propiedades siguientes:
1. 0 ≤ 𝑓(𝑚) ≤ 1, ∀𝑚.
2. ∑∀𝑚∈𝑀 𝑓(𝑚) ≡ 1.
Este análisis empírico (observación histórica) permite llegar a la conclusión que es factible
aceptar que la variable X: cantidad de llamadas que recibe José a su celular los lunes, es
aleatoria (porque no sabemos de antemano si el próximo lunes, a partir de hoy, José
recibirá 3, 4, 5, 7 u 11 llamadas). Pero también se puede asumir que los valores que puede
tomar la variable X son, precisamente: 3, 4, 5, 7 u 11.
𝑿 3 4 5 7 11
15 8 20 5 2
𝒇(𝒙) 50 50 50 50 50
Todos los valores que ella toma son positivos y menores que 1.
15 8 20 5 2
∑ 𝑓(𝑥) = + + + + ≡1
50 50 50 50 50
∀𝑥∈𝑋
El gráfico de este tipo de función no es una línea o curva, en general continua, como
ocurre cuando se abordan funciones no estocásticas (determinísticas). O sea, las
funciones que se estudian en Cálculo Diferencial. El gráfico de la función f(x) se aprecia a
continuación.
Función de probabilidad
0.45
0.40
0.35
0.30
Valores de f(x)
0.25
0.20
0.15
0.10
0.05
0.00
0 2 4 6 8 10 12
Valores de la variable X
GRÁFICA 1: Función de probabilidad para la variable X: cantidad de llamadas que recibe José los
lunes a su celular. FUENTE: AUTOR
Definición 3: sea M una variable aleatoria discreta, y 𝑚1 , 𝑚2 , ⋯ valores que esta puede
tomar. La función 𝐹𝑀 (𝑛) (o F(n)) se llama función de distribución o de probabilidad
acumulada para la variable M si ella asocia a cada valor real que puede tomar la variable,
un número del intervalo [0,1], y es definida por:
2. Es continua a tramos.
La forma de definir a esta función (de probabilidad acumulada) es clara por cuanto lo que
refleja es la probabilidad que se acumula para los valores de la variable aleatoria que
están a la izquierda de uno concreto. Ello es lo que se expresa en 𝐹𝑀 (𝑛) = 𝑃(𝑀 ≤ 𝑛)
La función F(x) cumple con las condiciones. Tiene puntos de discontinuidad evitable para
los valores 3, 4, 5, 7 y 11; en cada uno de los subintervalos, en el interior de estos, es
continua; es monótona no decreciente porque en cada subintervalo es constante y al
pasar de un subintervalo al siguiente, crece. Además, es evidente que cumple con los dos
límites.
De forma similar a lo analizado para variable aleatoria discreta, a una variable aleatoria
continua se asocian dos funciones. La función de densidad y la función de distribución (o
probabilidad acumulada).
Definición 4: sea T una variable aleatoria continua, y 𝑡1 , 𝑡2 , ⋯ valores que esta puede
tomar. La función 𝑔(𝑡) se llama función de densidad para la variable T y es aquella que
expresa cómo se reparten las probabilidades de ocurrencia de un evento o experimento
aleatorio, en relación con el resultado de este. Entonces, una función g(t) es una función
de densidad si cumple con las siguientes propiedades:
1. 𝑔(𝑡) ≥ 0; ∀𝑡.
∞
2. ∫−∞ 𝑔(𝑡)𝑑𝑡 = 1 (el área de la región del plano, bajo la curva, en todo el eje real,
es igual a la unidad)
𝑃(𝑡𝑎 ≤ 𝑇 ≤ 𝑡𝑏 ) = ∫ 𝑔(𝑡)𝑑𝑡
𝑡𝑎
¿Es 𝑔(𝑡) una función de densidad para la variable T? veamos si se cumplen las
propiedades.
La primera propiedad es válida, porque la función toma valores entre 0.5 y 1.5 o cero.
Definición 5: sea T una variable aleatoria continua, y 𝑡1 , 𝑡2 , ⋯ valores que esta puede
tomar. La función 𝐺𝑇 (𝑡), o sencillamente G(t), se denomina función de distribución o de
probabilidad acumulada para la variable T si ella asocia a cada valor real que puede tomar
la variable, un número del intervalo [0,1], y es definida por:
2. Es continua a tramos.
La función de distribución para variable continua se define de la misma forma que para
variable discreta, claro, salvando las distancias en cuanto al comportamiento o la cantidad
de valores que puede tomar una variable continua.
1 1 3 3
En la expresión anterior, 𝑡1 ∈ (−∞, 2) ; 𝑡 ∈ (2 , 2) ; 𝑡2 ∈ (2 , ∞). Las tres integrales son
paramétricas, porque el límite superior de integración, en cada una de ellas, es una
variable que se mueve en los intervalos indicados respectivamente.
1 3
La función 𝑔(𝑡) = 0 para 𝑡 ∈ (−∞, 2) y para 𝑡 ∈ (2 , ∞) . Pero al sobrepasar el valor de
1.5, ya se ha acumulado toda la probabilidad. Entonces:
𝑡 𝑡 𝑡
1 1 𝜏2
∫ 𝑔(𝜏)𝑑𝜏 = ∫ 𝜏 𝑑𝜏 = | = (𝑡2 − )
2 0.5 2 4
0.5 0.5
Y
1
0; 𝑡<
2
1 2 1 1 3
𝐺(𝑡) = (𝑡 − ) ; < 𝑡 <
2 4 2 2
3
{ 1; 𝑡>
2
Por ejemplo, para un vector bidimensional discreto (𝑋, 𝑌) que puede tomar los valores
(𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), ⋯ Entonces la función 𝑓: ℝ2 → [0,1] es una función de probabilidad
conjunta para este vector, si cumple las siguientes propiedades:
𝑓(𝑥𝑖 , 𝑦𝑗 ) ≥ 0, ∀ 𝑥𝑖 ∈ 𝑋, ∀ 𝑦𝑗 ∈ 𝑌
∑ ∑ 𝑓(𝑥𝑖 , 𝑦𝑗 ) = 1
∀ 𝑥𝑖 ∈𝑋 ∀ 𝑦𝑗 ∈𝑌
𝑓(𝑥, 𝑦) ≥ 0, ∀ 𝑥 ∈ 𝑋, ∀ 𝑦 ∈ 𝑌
∞ ∞
∫ ∫ 𝑓(𝑥, 𝑦)𝑑𝑥 𝑑𝑦 = 1
−∞ −∞
Además,
𝑏 𝑑
De manera similar pueden también pueden ser extendidas las definiciones de las
funciones de distribución para ambos tipos de variables. Y teniendo en cuenta que el
vector considerado es de dos dimensiones, entonces se pueden definir también
funciones que explican el comportamiento de una de las variables cuando la otra está fija
(las llamadas distribuciones marginales). Y también cobra sentido la idea de
independencia entre variables aleatorias.
Para profundizar sobre todo lo abordado en esta sección 3.1, estudiar, en el libro de texto
(Llinás Solano, H., Rojas Álvarez, C., 2017, p. 184), el Capítulo 3 “Variables aleatorias
discretas y distribuciones de probabilidad”, epígrafes del 3.1 y 3.2, a partir de la página
184. También en el texto (Llinás Solano, H., Rojas Álvarez, C., 2017, p. 258), el capítulo 4
“Variables aleatorias continuas y distribuciones de probabilidad”, epígrafe 4.1, a partir de
la página 258. Y en el mismo texto (Llinás Solano, H., Rojas Álvarez, C., 2017, p. 318), el
Capítulo 5 “Distribución Conjunta” (en su totalidad), epígrafes del 5.1 al 5.4, a partir de la
página 318.
Para una variable aleatoria X, se había utilizado la notación 𝑋̅, 𝑆𝑋2 , 𝑆𝑋 para identificar su
media, varianza y desviación estándar o típica. Pero entonces utilizamos algunos de los
valores que podían tomar las variables de los casos de estudio que se han considerado.
Por tal razón, en esta situación se habla de muestra (no la totalidad) de los valores que
puede tomar una variable aleatoria. En general, y en Estadística en particular, las
características numéricas así halladas llevan el apellido muestral: media muestral (𝑋̅ ),
varianza muestral (𝑆𝑋2 ), desviación típica muestral (𝑆𝑋 )
Definición 6: sea X una variable aleatoria discreta, y 𝑥1 , 𝑥2 , ⋯ valores que esta puede
tomar, y sea f(x) la función de probabilidad de esta variable.
𝑖=1
15 8 20
= (3 − 4.68)2 × + (4 − 4.68)2 × + (5 − 4.68)2 ×
50 50 50
5 2
+ (7 − 4.68)2 × + (11 − 4.68)2 × = 3.0976
50 50
𝜎 = √𝜎 2 = √3.0976 = 1.76
Los valores obtenidos significan que, cuando se considere una cantidad suficiente de
lunes, se espera que José reciba, como promedio 4.68 llamadas a su móvil por día (lunes).
Además, la dispersión del número de llamadas los lunes, respecto al promedio es de 1.76;
ello que significa que podrá haber algunos días en los que José reciba 4.68 − 1.76 = 2.92
llamadas y otros en los que reciba 4.68 + 1.76 = 6.44 llamadas a su móvil.
Definición 7: sea T una variable aleatoria continua, 𝑡1 , 𝑡2 , ⋯ valores que esta puede tomar
y 𝑔(𝑡) su función de densidad.
𝜇 = ∫ 𝑡 𝑔(𝑡)𝑑𝑡
−∞
𝜎 = ∫ (𝑡 − 𝜇)2 𝑔(𝑡)𝑑𝑡
2
−∞
∞ 1.5 1.5
1.5 1.5
𝑡4 𝑡3 𝑡2
= ∫ (𝑡 3 − 2.17𝑡 2 + 1.082 𝑡) 𝑑𝑡 = [ − 2.17 + 1.082 ]| ≈ 0.07
4 3 2 0.5
0.5
𝜎 = √𝜎 2 = √0.07 ≈ 0.26
1. 𝐸[𝑎𝑋 + 𝑏] = 𝑎𝐸[𝑋] + 𝑏
2. 𝐸[𝑎] = 𝑎
3. 𝑉[𝑎] = 0
4. 𝑉[𝑎𝑋 + 𝑏] = 𝑎2 𝑉[𝑋]
Las definiciones teóricas de las características numéricas pueden ser extendidas, también
de forma natural, a vectores aleatorios. Lo más interesante, desde el punto de vista de
las aplicaciones, es contar con una medida de la relación entre dos variables aleatorias
dependientes. Esa medida de denomina covarianza.
Definición 8: sea un vector bidimensional discreto (𝑋, 𝑌) que puede tomar los valores
(𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), ⋯ y la función 𝑓: ℝ2 → [0,1] su función de probabilidad conjunta o de
densidad conjunta, según corresponda. Sea también que las varianzas de ambas variables
es un valor finito. Entonces, se llama covarianza de las variables aleatorias, y se denota
como 𝐶𝑜𝑣(𝑋, 𝑌), a:
Si las variables aleatorias son independientes, entonces 𝐸 [𝑋𝑌] = 𝐸 [𝑋]𝐸 [𝑌]; en este caso
𝐶𝑜𝑣(𝑋, 𝑌) = 0.
Para profundizar en este tema, consultar, en el libro de texto (Llinás Solano, H., Rojas
Álvarez, C., 2017, p. 345), el capítulo 5 “Distribución Conjunta”, epígrafes del 5.5 al 5.7, a
partir de la página 345.
Ejemplo 3: sean las variables aleatorias continuas 𝑍1 , 𝑍2 tales que 𝜇(𝑍1 ) = 2; (𝑍2 ) =
−1; 𝜎 2 (𝑍1 ) = 0.25; 𝜎 2 (𝑍2 ) = 0.49 . Además, se conoce que tales variables son
independientes. Hallar la esperanza matemática y la varianza de la variable aleatoria
𝑍 = 3𝑍1 − 𝑍2
Como la variable Z es una combinación lineal de las variables 𝑍1 , 𝑍2 , entonces:
𝐸[𝑍] = 𝐸[3𝑍1 − 𝑍2 ] = 3𝐸[𝑍1 ] − 𝐸[𝑍2 ] = 3 × 2 − (−1) = 7
Para una mayor profundización sobre los temas combinaciones de variables aleatorias y
funciones de varias variables aleatorias, estudiar en el texto (Obando López, J., Arango
Londoño, N., 2019, p. 39), el Capítulo 3 “Estadística Multivariada”, a partir de la página
39.
Recordemos que la media de una variable aleatoria es una medida de posición que se
ubica hacia el centro del intervalo de variación de la variable; mientras que la desviación
estándar es una medida de dispersión que explica o cuantifica la diferencia entre los
valores que puede tomar la variable y la media de esta. El resultado teórico conocido
como teorema o desigualdad de Chevyshev, sin embargo, analiza lo referido a la
Teorema de Chevyshev: sea X una variable aleatoria, discreta o continua, con media 𝜇 y
varianza finita 𝜎 2 . Entonces, para todo valor 𝑘 > 1, se verifica que:
1
𝑃(|𝑋 − 𝜇| < 𝑘𝜎) ≥ 1 −
𝑘2
La desigualdad anterior es equivalente a:
1
𝑃(|𝑋 − 𝜇| ≥ 𝑘𝜎) ≤
𝑘2
Para profundizar sobre este resultado, estudiar, en el libro de texto (de Oteyza, Lam,
Hernández, Carrillo, 2015, p. 246), el Capítulo 8 “Medidas de Dispersión”; el epígrafe 8.4,
a partir de la página 246.
https://www.youtube.com/watch?v=CkJ67vziT6U
Bibliografía
https://bibliotecas.ups.edu.ec:3488/es/ereader/bibliotecaups/70059
Obando López, J., Arango Londoño, N. (2019). Probabilidad y Estadística. Fondo Editorial EIA.
https://bibliotecas.ups.edu.ec:3488/es/ereader/bibliotecaups/125705
de Oteyza, E., Lam, E., Hernández, C., Carrillo, A. (2015). Probabilidad y estadística. Pearson
Educación, México.
https://bibliotecas.ups.edu.ec:3488/es/ereader/bibliotecaups/38015
Estadística
TABLA DE CONTENIDOS
Esquema ........................................................................................................................... 3
Breve Descripción del Capítulo......................................................................................... 4
Objetivos ........................................................................................................................... 4
Distribuciones discretas de probabilidad ......................................................................... 5
4.1. Distribución Binomial ......................................................................................... 5
4.1.1 Distribución Multinomial ................................................................................... 7
4.1.2 Distribución Geométrica .................................................................................... 9
4.1.3 Distribución Binomial Negativa........................................................................ 11
4.2 Distribución Hipergeométrica.......................................................................... 12
4.3 Distribución de Poisson.................................................................................... 15
Bibliografía ...................................................................................................................... 17
Esquema
Distribución Multinomial
Distribución
Distribución Binomial
Geométrica
Distribución de Poisson
distribución, asociada a una variable aleatoria discreta o continua, asigna a cada valor que
pueda tomar la variable, la probabilidad de que la variable tome ese valor. En otras
palabras, teniendo en cuenta que el hecho que una variable aleatoria tome cierto valor,
de entre sus posibles, representa que ocurrió alguno de los posibles resultados de un
fenómeno, suceso o experimento estocástico descrito o registrado por esa variable. Por
tanto, la función de distribución asigna un valor entre cero y uno a la posibilidad de que
Objetivo
Este tipo de análisis puede ser aplicado a diferentes situaciones de la ingeniería. Así que,
retomando el caso de estudio relacionado con la Electrónica y Automatización, se
considera la siguiente situación:
𝑛
𝑓 (𝑥 ) = ( ) 𝑝 𝑥 𝑞 𝑛−𝑥 ; 𝑥 = 0,1, ⋯ 𝑛
𝑥
Notación: 𝑋~𝐵 (𝑥; 𝑝, 𝑛)
𝑛 𝑛!
Recordemos que ( ) =
𝑥 𝑥!(𝑛−𝑥)!
Con ayuda de esta distribución (función) es posible responder la interrogante formulada:
¿cuál es la probabilidad de que el electrodoméstico deje de funcionar o falle?
25
𝑃(𝑋 = 0) = 𝑓(0) = ( ) 0.0010 0.99925−0 = 0.99925
0
≈ 0.9752
Es decir, si el equipo electrodoméstico es utilizado 100 veces, en el 97.52 de esas veces
no habrá fallo.
¿Cuál es la probabilidad de que fallen más de tres circuitos, cuál es la probabilidad de falle
a lo sumo 2 circuitos, etc.?
Para conocer la probabilidad de que fallen más de tres circuitos habría que realizar una
cantidad de cálculos que podría representar un trabajo engorroso, porque habría que
hallar la probabilidad de que fallaran 4, 5, 6, …, 25 circuitos (más de tres). Es decir, hallar
el valor de la función de distribución para los valores de la variable 4, 5, 6, …, 25; y luego
sumar todos los resultados. Una variante más rápida sería aplicar la propiedad del
complemento (la definición de probabilidad total) para la variable aleatoria discreta X,
porque:
Para profundizar sobre esta distribución, estudiar en el libro de texto (Obando López, J.,
Arango Londoño, N., 2019, p. 57), el Capítulo 4 “Distribuciones de probabilidad”, los
epígrafes 4.1 y 4.2, a partir de la página 57.
Otra ventaja de las distribuciones teóricas es que, para las variables cuyo
comportamiento describen, se cuenta con expresiones específicas para hallar sus
características numéricas. En el caso de la Distribución Binomial, si 𝑋~𝐵(𝑥; 𝑝, 𝑛)
entonces:
𝜇𝑋 = 25 × 0.001 = 0.025;
𝜎𝑋 = √25 × 0.001 × 0.999 ≈ 0.24975
Estos resultados expresan que, la cantidad de circuitos del electrodoméstico, que se
espera que falle, es 0.025 (es decir, que se espera que ni un solo circuito falle). Ello hace
pensar que este equipo presenta una fiabilidad alta, una muy buena calidad.
Existen otras distribuciones teóricas relacionadas con el proceso de Bernoulli y, por tanto,
con la Distribución Binomial. Esas distribuciones se abordan a continuación.
Entonces, sea un experimento o suceso aleatoria que pueda tener los resultados
𝐴1 , 𝐴2 , ⋯ 𝐴𝑘 (k resultados posibles diferentes), con probabilidades de ocurrir 𝑝1 , 𝑝2 , ⋯ 𝑝𝑘
respectivamente. La Distribución Multinomial cuantifica la posibilidad de que el resultado
𝐴1 ocurra 𝑥1 veces, de que el resultado 𝐴2 ocurra 𝑥2 veces, etc., que el resultado 𝐴𝑘
ocurra 𝑥𝑘 veces; esto en n repeticiones del experimento o fenómeno. De tal suerte que
debe cumplirse que 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑘 = 𝑛. Y en este caso no se tiene independencia
entre los resultados.
Definición 2: sea que se repite n veces un experimento estocástico que puede tener k
resultados diferentes 𝐴1 , 𝐴2 , ⋯ 𝐴𝑘 con probabilidades 𝑝1 , 𝑝2 , ⋯ 𝑝𝑘 respectivamente. Se
llama Multinomial a la distribución de probabilidades del vector aleatorio discreto
(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑘 ), cuyas coordenadas representan la cantidad de veces que ocurre cada
posible resultado 𝐴𝑖 , 𝑖 = 1,2, ⋯ , 𝑘. La función de probabilidad de esta distribución es:
𝑛 𝑥 𝑥 𝑥
𝑓(𝑥1 , 𝑥2 , ⋯ , 𝑥𝑘 ; 𝑝1 , 𝑝2 , ⋯ 𝑝𝑘 ; 𝑛) = (𝑥 , 𝑥 , ⋯ , 𝑥 ) 𝑝1 1 × 𝑝2 2 × ⋯ × 𝑝𝑘 𝑘 ,
1 2 𝑘
Entonces:
𝑃(𝑋1 = 2, 𝑋2 = 1, 𝑋3 = 1, 𝑋4 = 0, 𝑋5 = 2) =
= 𝑓(2,1,1,0,2; 0.1, 0.2,0.4,0.02,0.28; 6) =
6
=( ) (0.1)2 × (0.2)1 × (0.4)1 × (0.02)0 × (0.28)2 =
2,1,1,0,2
6!
= (0.1)2 × (0.2)1 × (0.4)1 × (0.02)0 × (0.28)2 =
2! × 1! × 1! × 0! × 2!
≈ 0.0113
Así, la probabilidad de que fallen dos circuitos tipo I, uno de tipo II, uno de tipo III, ninguno
de tipo IV y dos de tipo V es 0.0113. Y aquí se admite la posibilidad simultánea de fallo de
circuitos de varios tipos (no existe independencia entre los eventos)
𝐸 [𝑋𝑖 ] = 𝑛𝑝𝑖
𝑉 [𝑋𝑖 ] = 𝑛𝑝𝑖 (1 − 𝑝𝑖 )
𝑖 = 1, ⋯ , 𝑘
En esta subsección se retoma el proceso de Bernoulli. Hay que recordar que el rasgo
distintivo de este tipo de evento aleatorio es que tiene solo dos posibles resultados. Si
este tipo de experimento se repite varias veces, y cada realización de este es
independiente de las demás, entonces tenemos la Distribución Binomial. Pero supóngase
que lo que interesa esta vez es contar la cantidad de veces que se repite el proceso de
Bernoulli hasta que ocurra el resultado “éxito” por primera vez.
Regresando al experimento aleatorio que consiste en el lanzamiento de moneda,
supongamos se lanza una vez y cae “cara”. Se vuelve a lanzar la moneda y otra vez cae
“cara”. El tercer lanzamiento arroja el mismo resultado: “cara”. Y a la cuarta, el resultado
es “cruz”. Si se hubiese definido como éxito que el lado de la moneda que quede hacia
arriba sea “cruz”; en el caso hipotético descrito hubo que repetir el experimento cuatro
veces (lanzar la moneda cuatro veces) hasta que ocurrió el “éxito” por primera vez.
Si se define una variable aleatoria que registre la cantidad de veces que se repite un
proceso de Bernoulli, hasta que ocurra “éxito” por vez primera; entonces esa variable
aleatoria es discreta (se cuentan las realizaciones completas del suceso o experimento) y
tiene un comportamiento teórico conocido como Distribución Geométrica.
Definición 3: sea X una variable aleatoria discreta. X sigue Distribución Geométrica si ella
cuenta el número de veces que tiene que repetirse un proceso de Bernoulli hasta que
ocurra el resultado identificado como “éxito” la primera vez.
1 1−𝑝
𝐸 [ 𝑋 ] ≡ 𝜇𝑋 = ; 𝑉[𝑋] ≡ 𝜎𝑋2 =
𝑝 𝑝2
Además, el experimento o proceso termina cuando ocurre éxito por primera vez.
Ejemplo 3: suponga que se está montando una red de comunicación en una zona
apartada del país, y por las características topográficas del terreno, se ha determinado
que la probabilidad de que a un punto específico de la zona (llamado punto A) llegue la
señal de telefonía celular es 0.32. La empresa de telecomunicaciones que se encarga del
proyecto ha estimado colocar una antena repetidora en un punto estratégico, para
solucionar esta dificultad.
¿Cuál es la probabilidad de que, con tres repeticiones de la señal se logre establecer
comunicación de telefonía celular con el punto A? ¿Cuál es el número promedio de
repeticiones de la señal, que se espera sean receptadas en el punto A?
1 1
𝜇𝑋 = = = 3.125
𝑝 0.32
O sea, la cantidad promedio de pulsos, que se espera sean receptados en A, es 3.125.
Definición 4: sea X una variable aleatoria discreta. X sigue Distribución Binomial Negativa
si ella cuenta el número de veces que tiene que repetirse un proceso de Bernoulli hasta
que ocurra el suceso “éxito” k veces sucesivas por primera vez.
La función de probabilidad de esta distribución es:
𝑥 − 1 𝑘 𝑥−𝑘
𝑓(𝑥 ) = ( )𝑝 𝑞 ; 𝑥 ∈ (𝑘, 𝑘 + 1, 𝑘 + 2, ⋯ )
𝑥−𝑘
Las características numéricas de esta distribución son:
𝑘 2
𝑘(1 − 𝑝)
𝐸 [ 𝑋 ] ≡ 𝜇𝑋 = [ ]
; 𝑉 𝑋 ≡ 𝜎𝑋 =
𝑝 𝑝2
Observación: si en las expresiones para la función de distribución y las características
numéricas de la Distribución Binomial Negativa, se reemplaza el valor 𝑘 = 1, se puede
verificar que se obtienen las correspondientes expresiones para la Distribución
Geométrica. Verificarlo.
Ejemplo 4: supongamos que cierto Robot es capaz de identificar los siguientes patrones
que, combinados, al menos 3 a la vez, “indican” al artefacto que cambie de sentido en su
movimiento en línea recta. Esos patrones son distancia hasta un objeto en su camino,
cambio de pendiente del recorrido, sonidos con intensidades 1, 2, 3; luz con intensidades
1, 2, 3. En aras de la simplicidad, se denotan estos 8 patrones de la forma siguiente:
distancia, pendiente, sonido 1, sonido 2, sonido 3, luz 1, luz 2 y luz 3. Si la probabilidad de
que el Robot detecte cualquiera de esos patrones es 0.56, ¿cuál es la probabilidad de que
cambie de sentido de movimiento por haber detectado los patrones siguientes en el
orden especificado: luz 2, sonido 3, pendiente, sonido 1; con 6 activaciones de su sistema
de detección (inteligencia artificial)? Se asume que cuando el sistema de inteligencia
artificial del Robot detecta al menos tres patrones, se desactiva automáticamente.
patrones, en cualquier orden, también son éxitos). Así, interesa cuantificar la posibilidad
de que ocurran cuatro éxitos (detectar la sucesión de patrones luz 2, sonido 3, pendiente,
sonido 1) en exactamente seis activaciones del sistema de detección.
Para este ejemplo 𝑋 = 6; 𝑘 = 4 (que sean necesarias seis repeticiones, en este caso,
activaciones del sistema de detección; para que ocurra la sucesión de los cuatro éxitos:
luz 2, sonido 3, pendiente, sonido 1)
6−1 4 6−4
Entonces: 𝑃 (𝑋 = 6) = 𝑓 (6) = ( ) 0.32 0.68 =
6−4
5 4 2 5!
= ( ) 0.32 0.68 = 0.324 0.682 ≈ 0.0485
2 2! × 3!
Es decir, en el 4.85% de las veces que el Robot cambia de dirección porque el sistema de
detección ha identificado la sucesión de patrones luz 2, sonido 3, pendiente, sonido 1;
han sido necesarias seis activaciones de ese sistema de inteligencia artificial.
Se hace notar que la Distribución Binomial Negativa se caracteriza por el hecho de que el
experimento de Bernoulli se compone de un número no definido de repeticiones
(pruebas) y concluye con la ocurrencia de determinado número de resultados favorables
k. Todas las pruebas son independientes y las probabilidades de éxito y fracaso se
mantienen constantes para todas las pruebas.
Nótese que realizar la selección de las muestras como se ha explicado garantiza que el
resultado de la segunda prueba no dependa de lo ocurrido en la primera, porque se ha
reestablecido el espacio muestral S del experimento (se han reintegrado al conjunto
universal los n elementos del subconjunto seleccionado en la prueba anterior. Por tanto,
para la prueba siguiente se cuenta con los mismos resultados posibles)
𝑁1 𝑁
)( 2 ) (
𝑓(𝑡) ≡ 𝑃(𝑋 = 𝑡) = 𝑡 𝑛−𝑡 ;
𝑁
( )
𝑛
𝑚á𝑥 {0; 𝑛 − 𝑁2 } ≤ 𝑡 ≤ 𝑚í𝑛{𝑁1 , 𝑛}
𝑛𝑁1 𝑛𝑁1 𝑁2 (𝑁 − 𝑛)
𝐸 [ 𝑋 ] ≡ 𝜇𝑋 = ; 𝑉 [𝑋] ≡ 𝜎𝑋2 =
𝑁2 𝑁2 (𝑁 − 1)
El técnico cuenta en su caja con 18 interruptores (𝑁 = 18). Que sean de tipo A o B implica
que estos tipos son mutuamente excluyentes (un interruptor es de un tipo o del otro).
Además, los de tipo B son 8 (𝑁1 = 8); mientras que los de tipo A son 10 (𝑁2 = 10)
Pero en el restante 79.27 % de las habitaciones en las que instala, debe repetir el trabajo
en alguna medida, porque se equivoca en el orden de colocación de los interruptores.
¿Tal vez necesite algún tipo de capacitación para reducir las pérdidas de tiempo por
repetición del trabajo?
Sea que 𝜆 > 0 representa el número de veces que se espera que ocurra cierto evento o
fenómeno aleatorio en un intervalo de tiempo dado. Por ejemplo, retomando la situación
relacionada con la cantidad de llamadas que recibe José a su celular los lunes,
supongamos que lo normal es que esto ocurra a un promedio de 2 llamadas cada 15
minutos.
Ejemplo 6: se conoce que José recibe a su celular los lunes, un promedio de 2 llamadas
cada 15 minutos. ¿Cuál es la probabilidad de que José reciba, el próximo lunes, 4 llamadas
en 10 minutos?
Definición 6: sea X una variable aleatoria discreta con la que se cuenta la cantidad de
eventos de un mismo tipo (la frecuencia promedio de ocurrencia de este suceso es 𝜆 >
0, conocida) que tienen lugar en un intervalo de tiempo de longitud t. Entonces el
comportamiento de la variable se describe por una función llamada Distribución de
Poisson (notación 𝑋~𝑃(𝑥; 𝜆)), con función de probabilidad:
𝑒 −𝜆 𝜆𝑘
𝑓(𝑘) ≡ 𝑃(𝑋 = 𝑘) = ; 𝑘 = 0,1,2, ⋯
𝑘!
k- número de veces que ocurre el evento.
𝑝𝑎𝑟𝑎 15 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 ↦ 𝜆 = 2
𝑝𝑎𝑟𝑎 10 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 ↦ 𝜆 =?
𝜆 ≈ 1.33
𝑒 −1.33 (1.33)4
𝑃(𝑋 = 4) = 𝑓(𝑘) = ≈ 0.0345
4!
La probabilidad de que José reciba, el próximo lunes, cuatro llamadas en un intervalo de
10 minutos, es 0.0345 aproximadamente.
Asimismo, podría ser de interés conocer las probabilidades de que José reciba más de 8
llamadas en un intervalo de una hora (𝑃(𝑋 > 8); 𝜆 =?), o que reciba a lo sumo una
llamada en un intervalo de 5 minutos ( 𝑃(𝑋 ≤ 1); 𝜆 =? ). En casos como estos nos
enfrentamos a situaciones similares descritas para la Distribución Binomial, y otra vez la
ventaja es que también está tabulada la función de probabilidad acumulada de la
Distribución de Poisson.
Para profundizar sobre esta distribución, estudiar en el libro de texto (Obando López, J.,
Arango Londoño, N., 2019, p. 66), el Capítulo 4 “Distribuciones de probabilidad”, el
epígrafe 4.2.4, a partir de la página 66.
Bibliografía
Obando López, J., Arango Londoño, N. (2019). Probabilidad y Estadística. Fondo Editorial EIA.
https://bibliotecas.ups.edu.ec:3488/es/ereader/bibliotecaups/125705
Estadística
TABLA DE CONTENIDOS
Esquema ........................................................................................................................... 3
Breve Descripción del Capítulo......................................................................................... 4
Objetivos ........................................................................................................................... 4
Distribuciones continuas de probabilidad ........................................................................ 5
5.1. Distribución Normal. Aplicaciones. .................................................................... 5
5.1.1. Aproximación de la Distribución Binomial a la Normal .............................. 9
5.1.2. Distribución LogNormal ............................................................................ 10
5.2 Distribución Gamma ........................................................................................ 11
5.2.1. Distribución Exponencial .......................................................................... 13
5.3 Distribución Ji-Cuadrada .................................................................................. 14
Bibliografía ...................................................................................................................... 15
Esquema
Aproximación de la
Distribución Normal Distribución Binomial a la Distribución Log-Normal
Distribución Normal
Distribuciones
Distribución
continuas de Distribución Gamma
exponencial
probabilidad
Distribución Chi-
Cuadrado
distribución, asociada a una variable aleatoria discreta o continua, asigna a cada valor que
pueda tomar la variable, la probabilidad de que la variable tome ese valor. En otras
palabras, teniendo en cuenta que el hecho que una variable aleatoria tome cierto valor,
de entre sus posibles, representa que ocurrió alguno de los posibles resultados de un
fenómeno, suceso o experimento estocástico descrito o registrado por esa variable. Por
tanto, la función de distribución asigna un valor entre cero y uno a la posibilidad de que
Objetivo
Definición 1: sea X una variable aleatoria continua. Se dice que esta variable sigue
Distribución Normal con media 𝜇 y varianza 𝜎 2 , y se denota 𝑋~𝑁(𝜇, 𝜎 2 ), si su función de
densidad es:
1 (𝑥−𝜇)2
2) −
𝑓(𝑥; 𝜇, 𝜎 = 𝑒 2𝜎 2 ; −∞ < 𝑥 < ∞
𝜎√2𝜋
𝜇; 𝜎 2 son respectivamente, la media y la varianza de la distribución.
𝑏
1 (𝑥−𝜇)2
−
𝑃 (𝑎 < 𝑥 < 𝑏 ) = ∫ 𝑒 2𝜎 2 𝑑𝑥 =
𝜎√2𝜋
𝑎
𝑏
1 (𝑥−𝜇)2
−
= ∫𝑒 2𝜎 2 𝑑𝑥
𝜎 √2𝜋
𝑎
Para cada variable aleatoria continua que siga Distribución Normal habrá un valor de
media 𝜇 ∈ ℝ, y un valor de desviación estándar 𝜎 > 0. Ello significa que estos valores
son parámetros para esta distribución.
El área total bajo la Campana de Gauss, sobre toda la recta real, es una unidad de área.
Es muy importante hacer notar que la probabilidad acumulada es el área bajo la Campana
de Gauss, desde menos infinito hasta un cierto valor 𝑥𝑖 de la variable. Es decir, “área
bajo la curva a la izquierda del punto 𝑥𝑖 ”
Entonces, supóngase que se tiene una variable aleatoria continua Y, tal que:
𝑌~𝑁(𝜇 = −1, 𝜎 2 = 5)
3.2 2
(𝑦+1)
1 −
𝑃(𝑌 > 3.2) = 1 − 𝑃(𝑌 ≤ 3.2) = 1 − ∫ 𝑒 2(5) 𝑑𝑦 =
√5√2𝜋
−∞
3.2
(𝑦+1)
2
1 −
=1− ∫ 𝑒 10 𝑑𝑦
√10𝜋 −∞
𝑌 − 𝜇 3.2 − 𝜇
𝑃(𝑌 > 3.2) = 1 − 𝑃(𝑌 < 3.2) = 1 − 𝑃 ( < )=
⏟𝜎 𝜎
𝑍
3.2 + 1
1 − 𝑃 (𝑍 < ) = 1 − 𝑃(𝑍 < 2.2361) =
√5
2.2361 2
1 𝑧
= 1− ∫ 𝑒− 2 𝑑𝑧
√2𝜋 −∞
Se insiste que sigue siendo una dificultad calcular la anterior integral impropia; pero ello
no es necesario porque se cuenta con la Tabla de la Distribución Normal Estandarizada.
Como se observa, el eje de simetría de la curva ahora coincide con el eje de las ordenadas.
El máximo local se alcanza en el punto 𝑧 = 𝜇 = 0; mientras que los puntos de inflexión
de la curva están en 𝑧 = 𝜇 + 𝜎 = 1, 𝑧 = 𝜇 − 𝜎 = −1.
En este caso se desea calcular 𝑃(1 < 𝑇 < 1.5) . Para conocer esta probabilidad no
necesitamos calcular la correspondiente integral, sino que estandarizamos:
1 − 𝜇 𝑇 − 𝜇 1.5 − 𝜇 1 − 1.08 1.5 − 1.08
𝑃(1 < 𝑇 < 1.5) = 𝑃 ( < < ) = 𝑃( <𝑍< )=
𝜎 𝜎 𝜎 0.26 0.26
= 𝑃(−0.31 < 𝑍 < 1.62)
Utilizando la tabla interactiva de Internet, se obtiene que:
Para profundizar sobre esta distribución, estudiar en el libro de texto (Obando López, J.,
Arango Londoño, N., 2019, p. 72), el Capítulo 4 “Distribuciones de probabilidad”, el
epígrafe 4.3.2, a partir de la página 72.
variable aleatoria que cuenta la cantidad de éxitos en esas repeticiones, y que sigue
Distribución Binomial, puede ser asumida como una variable aleatoria que sigue
Distribución Normal. Concretamente:
Sea X una variable aleatoria discreta, tal que 𝑋~𝐵(𝑛, 𝑝). Si n es suficientemente grande
(𝑛 → ∞), entonces el comportamiento de la variable X puede ser asumido como Normal,
con media 𝜇 = 𝑛𝑝 y 𝜎 2 = 𝑛𝑝𝑞.
Para profundizar sobre esta distribución, estudiar en el libro de texto (Devore, J. L., 2012,
p. 160), el Capítulo 4 “Variables aleatorias continuas y distribuciones de probabilidad”, el
epígrafe “Distribución Normal y poblaciones discretas”, a partir de la página 160.
Definición 2: sea X una variable aleatoria continua positiva. Tal variable sigue Distribución
Log-Normal con media 𝜇 y varianza 𝜎 2 , y se denota 𝑋~𝐿𝑜𝑔𝑁𝑜𝑟𝑚𝑎𝑙(𝜇, 𝜎 2 ), si al tomar
el logaritmo natural de los valores de X se obtiene una variable que sigue Distribución
Normal con media 𝜇 y varianza 𝜎 2 (es decir, ln (𝑋)~𝑁(𝜇, 𝜎 2 )).
1 (ln (𝑥)−𝜇)2
−
𝑓 (𝑥; 𝜇, 𝜎 2 ) = 𝑒 2𝜎 2
𝜎𝑥 √2𝜋
Mientras que sus características numéricas son:
𝜎2 2 2
𝜇+ 2
𝐸 [𝑋 ] = 𝑒 ; 𝑉[𝑋] = (𝑒 𝜎 − 1)𝑒 2𝜇+𝜎
Ejemplo 2: sea que el tiempo de procesamiento de un microprocesador de una
computadora es una variable aleatoria que sigue Distribución Log-normal, con media 2
segundos y varianza 0.25 segundos cuadrados. Hallar la probabilidad de que el
procesador demore más de 3 minutos en correr cierto algoritmo.
𝑇~𝐿𝑜𝑔𝑁𝑜𝑟𝑚𝑎𝑙(𝜇 = 2, 𝜎 2 = 0.25)
𝑌~𝑁(𝜇 = 2, 𝜎 2 = 0.25)
Entonces,
𝑃(𝑇 > 3 𝑚𝑖𝑛𝑢𝑡𝑜𝑠) = 𝑃(𝑇 > 180 𝑠) = 1 − 𝑃(𝑇 < 180) = 1 − 𝑃[ln(𝑇) < ln(180)] =
5.19 − 2
= 1 − 𝑃[𝑌 < 5.19] = 1 − 𝑃 (𝑍 < ) = 1 − 𝑃(𝑍 < 6.38) = 0
0.5
Por lo visto, el procesador es muy rápido, porque la probabilidad de que demore más de
tres minutos en correr cierto algoritmo es cero.
Para profundizar sobre esta distribución, estudiar en el libro de texto (Obando López, J.,
Arango Londoño, N., 2019, p. 79), el Capítulo 4 “Distribuciones de probabilidad”, el
epígrafe 4.3.3, a partir de la página 79.
Definición 3: sea X una variable aleatoria continua. Esta variable sigue Distribución
Gamma, y se denota 𝑋~𝐺𝑎𝑚𝑚𝑎(𝛼, 𝛽), si su función de densidad es de la forma:
1 𝑥
𝛼−1 −
𝑓 (𝑥; 𝛼, 𝛽 ) = 𝛼 𝑥 𝛽
𝑒 ; 𝑥≥0
𝛽 Γ(𝛼 )
Sus características numéricas son:
Γ(𝛼 ) = ∫ 𝑡 𝛼−1 𝑒 −𝑡 𝑑𝑡
0
Y satisface las siguientes propiedades
- Γ(2) = Γ(1) = 1
- Γ(𝛼 + 1) = 𝛼Γ(𝛼 ), 𝛼 > 0
- Γ(𝑛 + 1) = 𝑛!; 𝑛 ∈ ℤ+
1
- Γ ( ) = √𝜋
2
𝑛 √𝜋(𝑛−1)!
- Γ( ) = 𝑛−1 , ∀𝑛 ∈ ℤ+
2 2𝑛−1 ( 2 )!
Ejemplo 3: sea que cierto circuito electrónico integrado por cuatro componentes
necesita, para completar su función, un tiempo (en segundos) que sigue Distribución
Gamma con 𝛼 = 2, 𝛽 = 4. Hallar la probabilidad de que el circuito demore un tiempo de
entre dos y tres segundos para completar una operación. Calcular el tiempo promedio
que se espera que demore el circuito para funcionar, y la variabilidad de ese tiempo.
𝐸 [𝑋] = 𝛼𝛽 = 8; 𝑉 [𝑋] = 𝛼𝛽 2 = 2 × 16 = 32
𝜎 = √32 ≈ 5.66
Es decir, el tiempo medio en que se espera que el circuito complete una operación es de
8 segundos, con una desviación estándar de 5.66 s aproximadamente.
Para profundizar sobre esta distribución, estudiar en el libro de texto (Obando López, J.,
Arango Londoño, N., 2019, p. 82), el Capítulo 4 “Distribuciones de probabilidad”, el
epígrafe 4.3.4, a partir de la página 82.
- distribucion-gamma.pdf (webnode.com.ve)
- Distribución Gamma | Aplicación (Problemas Resueltos) – YouTube
Definición 4: sea X una variable aleatoria continua. Esta variable sigue Distribución
1 1
Exponencial, y se denota 𝑋~𝐸𝑥𝑝 (𝛽), o también 𝑋~𝐸𝑥𝑝(𝜆), 𝜆 = 𝛽, con parámetro 𝜆 >
0, si su función de densidad es:
𝑓(𝑥; 𝜆) = 𝜆𝑒 −𝜆𝑥 ; 𝑥 ≥ 0
Evidentemente, otra variante de la función de densidad es:
1 −𝛽𝑥
𝑓(𝑥; 𝛽) = 𝑒 ; 𝑥≥0
𝛽
Las características numéricas de la distribución son:
1 1
𝐸 [𝑋 ] = 𝛽 = ; 𝑉 [𝑋 ] = 𝛽 2 =
𝜆 𝜆2
Ejemplo 4: sea que el tiempo que transcurre entre dos instantes en que un Robot detecta
diferentes combinaciones de parámetros para ejecutar una acción de su brazo, es una
1
variable aleatoria que sigue Distribución Exponencial, con 𝜆 = 4. Hallar la probabilidad de
que el Robot detecte dos combinaciones diferentes de parámetros en un tiempo entre 2
y 3 segundos. Hallar las características numéricas de esta variable.
𝑇~𝐸𝑥𝑝(𝛽 = 4)
1
𝑇~𝐸𝑥𝑝 (𝜆 = )
4
3
1 𝑥
𝑃(2𝑠 < 𝑇 < 3 𝑠) = ∫ 𝑒 −4 𝑑𝑥 ≈ 0.1342
4
2
1 1
𝐸 [𝑋 ] = = 4; 𝑉[𝑋] = = 16
𝜆 𝜆2
Para profundizar sobre esta distribución, estudiar en el libro de texto (Obando López, J.,
Arango Londoño, N., 2019, p. 84), el Capítulo 4 “Distribuciones de probabilidad”, el
epígrafe 4.3.4, a partir de la página 84.
Definición 4: sea X una variable aleatoria continua que representa la suma de los
cuadrados de L variables que siguen Distribución Normal estándar. La variable X sigue
Distribución Chi-Cuadrado con L grados de libertad, y se denota 𝑋~𝜒𝐿2 , si su función de
densidad es de la forma:
𝐿
1 2
(2) 𝐿 𝑥
−1 −
𝑓(𝑥 ) = (𝑥) 𝑒 2 ;
2 𝑥>0
𝐿
Γ (2)
En la expresión de la función de densidad aparece la función especial Gamma Γ(𝛼 ) vista
anteriormente.
𝐸 [𝑋] = 𝐿; 𝑉[𝑋] = 2𝐿
Esta distribución también es conocida como Distribución de Pearson y tiene muchas
aplicaciones en la Inferencia Estadística.
Bibliografía
Obando López, J., Arango Londoño, N. (2019). Probabilidad y Estadística. Fondo Editorial EIA.
https://bibliotecas.ups.edu.ec:3488/es/ereader/bibliotecaups/125705
Desarrollo de la Actividad
S C∩F
C
1 10
1 9 1 9
10 2 7
2 2 7 3 8
7 3 4 4
5
8 9 6
F =
4
5 3 10
7
8
5
(C∩F) C
1
4
2 3
5 6
8 9 10
CC
FC CC U FC
3 5 1 2
6 10 4
6 =
8 9
E∩GC
(E∩G) U (E∩GC)
7
9
ambos proyectos 1/3 de las veces. Si se selecciona un día laboral de este especialista, al
azar:
a. ¿Cuál es la probabilidad de que trabaje, ese día, solo en el proyecto B?
2
𝑃 (𝐴 ) = = 0.6666 = 66.66%
3
1
𝑃 (𝐵 ) = = 0.5 = 50%
2
2 1 1
𝑃 (𝐴 ∩ B ) = − = = 0.3333 = 33.33%
3 3 3
𝑃 (𝐵) − 𝑃(𝐴 ∩ B) = 50% − 33.33% = 16.67%
b. ¿Cuál es la probabilidad de que se dedique a otra actividad?
1 1 1
𝑃 (𝐶 ) = 1 − − = = 0.1666 = 16.66%
2 3 6
4) Según cierta información de una casa de Software, de sus tres programadores estelares, el
Programador A escribe más líneas de código diarias que el Programador B en el 35% de
las veces. Mientras que el mismo Programador A escribe más líneas de código que el
Programador C en el 55% de las veces. Si se selecciona un día laboral cualquiera, de
forma aleatoria, ¿cuál es la probabilidad de que el Programador A hubiese escrito, ese día,
más líneas de código que los otros dos programadores estelares de la empresa?
𝑃(𝐵) = 35%
𝑃 (𝐶 ) = 55%
𝑃 (𝐶 ) = 𝑃 (𝐵 ∩ C) = 0.35 ∗ 0.55 = 0.1925 = 19.25%
La probabilidad de que el programador escriba más líneas de código es de 19.25%
Problemas
1. Para los clientes que adquieren dispositivos de comunicación, sean los eventos:
- A: que el dispositivo sea manufacturado en algún país de la Unión Europea.
- B: que el dispositivo tenga un radio de alcance de al menos 10Km
- C: que el dispositivo sea multipropósito
Se conoce la siguiente información probabilística: P(A) = 0.7; P(B/A) = 0.85; P(B/Ac) = 0.75;
P(C/A∩B) = 0.8; 𝑃 (𝐶/𝐴 ∩ 𝐵c) = 0.55; 𝑃(𝐶/𝐴c∩𝐵) = 0.65; 𝑃 (𝐶/𝐴c ∩ 𝐵c) = 0.25
a. Construya el correspondiente diagrama de árbol para todas las relaciones entre los
distintos eventos
P(B ∩ A)
𝑃(𝐵/𝐴) =
𝑃 (𝐴 )
P(B ∩ A)
0.85 =
0.7
P(B ∩ A) = 0.85 ∗ 0.7 = 0.595
𝐴𝐶 = 0.3
P(B ∩ 𝐴𝐶 )
P(B/𝐴𝐶 ) =
𝑃(𝐴𝐶 )
P(B ∩ 𝐴𝐶 )
0.75 =
0.3
P(B ∩ 𝐴𝐶 ) = 0.75 ∗ 0.3 = 0.225
P(B ∩ A) = P(A ∩ B) = 0.595
P(C ∩ A ∩ B)
P(C/A ∩ B) =
P(A ∩ B)
P(C ∩ A ∩ B)
0.8 =
0.595
0.8 ∗ 0.595 = 0.476
P(B) = P(A ∩ B) + B ∩ 𝐴𝐶
P(B) = 0.595 + 0.225 = 0.82
Universidad Politécnica Salesiana
P(C ∩ A ∩ 𝐵𝐶 )
P(C/A ∩ 𝐵𝐶 ) =
P(A ∩ 𝐵𝐶 )
P(A ∩ 𝐵𝐶 ) = 0.7 − 0.595 = 0.105
P(C ∩ A ∩ 𝐵𝐶 )
0.55 =
0.105
P(C ∩ A ∩ 𝐵𝐶 ) = 0.55 ∗ 0.105 = 0.05775
P(A ∩ C) − 𝑃 (A ∩ B ∩ C) = P(C ∩ A ∩ 𝐵𝐶 )
P(A ∩ C) = P(C ∩ A ∩ 𝐵𝐶 ) + 𝑃(A ∩ B ∩ C)
P(A ∩ C) = 0.05775 + 0.476 = 0.53375
P(C ∩ 𝐴𝐶 ∩ B)
P(C/𝐴𝑐 ∩ B) =
P(B ∩ 𝐴𝐶 )
P(C ∩ 𝐴𝐶 ∩ B)
P(C/𝐴𝑐 ∩ B) =
P(B ∩ 𝐴𝐶 )
P(C ∩ 𝐴𝐶 ∩ B)
0.65 =
0.225
P(C ∩ 𝐴𝐶 ∩ B) = 0.225 ∗ 0.65 = 0.14625
𝑃(𝐶 ∩ 𝐴𝑐 ∩ 𝐵𝑐 )
P(C/𝐴𝑐 ∩ 𝐵𝑐 ) =
𝑃(𝐴𝑐 ∩ 𝐵𝑐 )
𝑃(𝐴𝑐 ∩ 𝐵𝑐 ) = 1 − 𝑃(A ∩ B)
𝑃 (𝐴𝑐 ∩ 𝐵𝑐 ) = 1 − 0.595 = 0.405
𝑃(𝐶 ∩ 𝐴𝑐 ∩ 𝐵𝑐 )
0.25 =
0.405
𝑃(𝐶 ∩ 𝐴𝑐 ∩ 𝐵𝑐 ) = 0.25 ∗ 0.405 = 0.10125
𝑃(𝐶 ) = P(C ∩ A ∩ B) + P(C ∩ A ∩ 𝐵𝐶 ) + 𝑃(𝐶 ∩ 𝐴𝑐 ∩ B) + 𝑃(𝐶 ∩ 𝐴𝑐 ∩ 𝐵𝑐 )
𝑃 (𝐶 ) = 0.476 + 0.05775 + 0.14625 + 0.101525
𝑃(𝐶 ) = 0.781525
B
FIN
P(A∩B)
B P(A∩BC)
C
A
FIN
P(A∩C)
FIN
FIN
C
P(A∩C∩B)
Total B
C A
FIN
P(B∩AC)
FIN
B
P (C∩ A ∩ B)
A
FIN
C
B
FIN
P(C∩ AC ∩ BC )
b. Calcular 𝑃(𝐶).
𝑃(𝐶 ) = 0.781525
c. Calcular 𝑃 (𝐴 ∩ 𝐵 ∩ 𝐶).
P(C ∩ A ∩ B) = 𝑃 (𝐴 ∩ B ∩ C) = 0.476
d. Calcular 𝑃 (𝐶 ∩ 𝐵).
P(C ∩ B) = P(C ∩ 𝐴𝐶 ∩ B) + P(C ∩ A ∩ B)
P(C ∩ B) = 0.14625 + 0.476
P(C ∩ B) = 0.62225
e. Calcular 𝑃 (𝐴/𝐶 ∩ 𝐵).
P(C ∩ A ∩ B)
P(A/C ∩ B) =
P(C ∩ B)
0.476
P(𝐴/𝐶 ∩ B) =
0.62225
P(𝐴/𝐶 ∩ B) = 0.7649658497
2. Tres máquinas de troquelado A, B y C producen el 35%, 55% y 10% respectivamente, de
la producción de cierta industria. Además, las probabilidades de que de cada máquina
salga un producto defectuoso es, respectivamente, 0.2; 0.3 y 0.15. Si se selecciona un
producto de esta industria, de forma aleatoria:
3. En una tienda de telefonía celular, el 35% de los clientes adquieren equipos de marca
IPhone, el 35% de los clientes compran equipos de marca Samsung; mientras que el 30%
de los clientes prefieren equipos marca Huawei. De los clientes que gustan del IPhone, el
c. Si el siguiente cliente que llega a esta tienda a comprar pidió memoria adicional, ¿cuál es
la probabilidad de que haya comprado en equipo marca Samsung?
Desarrollo de la Actividad
Para poder resolver este ejercicio lo primero que se tiene que hacer es ordenar los valores de menor
a mayor.
4,6 1 2,2
11,2 2 2,3
7,5 3 3,3
8,3 4 3,4
5,4 5 3,4
7,6 6 3,5
5,4 7 3,6
8,4 8 3,7
5,1 9 3,7
10,8 10 3,9
7,8 11 4
9,3 12 4,1
12,3 13 4,3
10,5 14 4,5
Universidad Politécnica Salesiana
6,2 15 4,6
6,5 16 4,8
4,8 17 4,8
3,9 18 5
5,5 19 5
7,3 20 5
6,7 21 5,1
15,5 22 5,1
7 23 5,1
9,6 24 5,4
7,1 25 5,4
14,3 26 5,5
5,8 27 5,5
7,6 28 5,6
7,5 29 5,6
11,9 30 5,6
4,3 31 5,7
10,3 32 5,8
10,2 33 5,9
7,5 34 6
6,9 35 6
10,4 36 6,1
7 37 6,2
8 38 6,2
2,3 39 6,2
9,3 40 6,2
6 41 6,3
2,2 42 6,4
9 43 6,4
11,9 44 6,4
6,2 45 6,5
6,4 46 6,6
4,1 47 6,6
9,3 48 6,6
4 49 6,7
8,8 50 6,7
3,4 51 6,8
9,2 52 6,9
6,9 53 6,9
15 54 6,9
12,7 55 6,9
6 56 7
8,4 57 7
3,4 58 7
3,6 59 7,1
6,9 60 7,2
9,2 61 7,2
6,4 62 7,3
10,4 63 7,3
7,3 64 7,4
10,8 65 7,5
7,2 66 7,5
11,3 67 7,5
5,6 68 7,5
7 69 7,5
5,5 70 7,6
11,9 71 7,6
9,8 72 7,8
6,7 73 8
5,1 74 8,2
9,8 75 8,3
5 76 8,4
7,5 77 8,4
6,1 78 8,8
7,4 79 9
9,5 80 9,1
4,8 81 9,2
6,6 82 9,2
3,7 83 9,3
9,1 84 9,3
6,9 85 9,3
5,6 86 9,3
6,6 87 9,5
6,3 88 9,6
6,6 89 9,6
15,3 90 9,6
5 91 9,7
9,3 92 9,8
5,6 93 9,8
5,9 94 10,2
5,7 95 10,3
10,6 96 10,4
11,5 97 10,4
9,6 98 10,4
3,7 99 10,5
13,8 100 10,5
5 101 10,6
18,9 102 10,8
3,5 103 10,8
10,4 104 11,2
10,5 105 11,3
15 106 11,3
6,8 107 11,5
4,5 108 11,9
5,1 109 11,9
7,5 110 11,9
6,4 111 12,3
6,2 112 12,7
3,3 113 13,8
7,2 114 14,3
8,2 115 14,6
9,7 116 15
14,6 117 15
9,6 118 15,3
11,3 119 15,5
6,2 120 18,9
Para calcular la duración representativa de las llamadas, se tiene que calcular el promedio
de todas las 120 llamadas.
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 942.6
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = = = 7.855𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 120
c. Indicar, de haberlo, cuál es el valor extremo.
d. Construir un diagrama de cajas y bigotes para estos datos. Valorar la dispersión de los datos
sobre la base del gráfico obtenido.
Lo primero que se tiene que hacer para poder hacer el diagrama de cajas y bigotes se tiene
que tener en cuenta los cuartiles, siendo un total de 3, para poder calcular los cuartiles se
usa la siguiente formula.
𝑘∗𝑁
= 1,2,3.
4
Una ver encontrado los cuartiles se tiene que tener en cuenta el número total de datos, ya
que si se tiene un número par se tiene que tomar el siguiente valor y sacar un promedió, de
lo contrario si es par se toma el valor redondeado al numero superior.
𝑘 ∗ 𝑁 1 ∗ 120
𝑄1 = = = 30
4 4
El valor en la posición 30 es 5.6 pero como el número total de números es de 120 se tendría
que sacar un promedio de la posición 30 mas la 31 que sería:
𝑘 ∗ 𝑁 2 ∗ 120
𝑄2 = = = 60
4 4
𝑘 ∗ 𝑁 3 ∗ 120
𝑄3 = = = 90
4 4
2. Para los siguientes datos, que representan mediciones de las distancias recorridas por un
robot, expresadas en metros, mientras se verifica un nuevo dispositivo de control para
activar y desactivar la marcha del robot. Los valores positivos y negativos significan que el
avance del robot se produjo hacia adelante o hacia atrás, respectivamente:
a. Construir, para estos datos, una distribución empírica, es decir, la tabla de frecuencias y los
gráficos asociados (histograma y polígono de frecuencias)
∑(𝑋𝑖 − 𝑋)2
𝑆2 =
𝑛−1
∑(𝑋𝑖 − 𝑋)2
𝑆=√
𝑛−1
(Xi-X) (Xi-X)2
1 -1,47 2,16
2 -1,40 1,96
3 -1,39 1,93
4 -1,33 1,77
5 -1,31 1,71
6 -1,07 1,14
7 -0,63 0,40
8 -0,40 0,16
9 -0,29 0,08
10 -0,08 0,01
11 -0,05 0,00
12 0,33 0,11
13 0,35 0,12
14 0,39 0,15
15 0,93 0,87
16 1,01 1,02
17 1,01 1,02
18 1,31 1,72
19 2,00 4,00
20 2,08 4,33
Suma Total de (Xi-X)2 = 24.66
Desarrollo de la Actividad
Problemas:
1. Los siguientes datos representan mediciones de resistencia a la fractura de muestras de un
material polimérico utilizado en la manufactura de cierto tipo de robot. Las mediciones
están dadas en Mega Pascales (MPa).
85; 96; 99; 101; 108; 117; 131; 134; 145; 160.
a. Calcule los valores de la mediana y la media muestrales.
Resistencia a la fractura
Muestra MPa
1 85
2 96
3 99
4 101
5 108
6 117
7 131
8 134
9 145
10 160
- Media:
𝑛
1
𝑧 = ∑ 𝑧𝑖
𝑛
𝑖=1
- Mediana:
𝑛 10
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = = = 5 (𝑃𝑎𝑟)
2 2
Tomando en cuenta que la diferencia es del 4% entre sus valores extremos, y teniendo
en cuenta que los valores son heterogéneos y por esta variación es la que no se tiene
valores extremos encontrados como en tareas anteriores.
2. Los datos del siguiente conjunto representan mediciones del tiempo, en segundos, que demoran los
mensajes de SMS en ser receptados por los dispositivos móviles de cierto número de personas, en
un día específico. La distancia entre equipos emisores y equipos receptores es considerablemente
grande:
Para empezar con la resolución de este ejercicio, tenemos que ordenar de menor a mayor
los valores de la muestra.
87 + 87 + 93 + 99 + 103 + 105 + 119 + 124 + 130 + 132 + 138 + 145 + 145 + 152 + 153 + 160 + 180 + 195 + 211
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 =
19
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 134.9𝑆𝑒𝑔
Después utilizamos las respectivas fórmulas para el cálculo de la varianza y desviación
estándar.
Muestra (i) seg (Zi) (Zi-Zm) (Zi-Zm)^2
[seg] [seg^2]
1 87 -47,9 2293,9
2 87 -47,9 2293,9
3 93 -41,9 1755,2
4 99 -35,9 1288,4
5 103 -31,9 1017,3
6 105 -29,9 893,7
7 119 -15,9 252,6
8 129 -5,9 34,7
9 130 -4,9 24,0
10 132 -2,9 8,4
11 138 3,1 9,6
12 145 10,1 102,1
13 145 10,1 102,1
14 152 17,1 292,6
15 153 18,1 327,8
16 160 25,1 630,3
17 180 45,1 2034,5
18 195 60,1 3612,6
19 211 76,1 5792,0
- Desviación estándar:
c. Si los valores se expresaran en minutos, ¿cuáles serían los resultados para ambas medidas
de dispersión?
Para esta pregunta se hace una regla de 3 con respecto a los minutos.
- Varianza:
1𝑚𝑖𝑛2
1264.8 𝑠𝑒𝑔2 = = 0.35𝑚𝑖𝑛2
(60𝑠𝑒𝑔)2
- Desviación estándar:
1𝑚𝑖𝑛
35.56 𝑠𝑒𝑔 = = 0.59𝑚𝑖𝑛
60𝑠𝑒𝑔
d. Calcular el recorrido de los datos y el valor de K a utilizar si se fuese a construir, para esta
variable, una distribución empírica.
Se sabe que k es el numero de intervalos que se irán a crear, se calcula con la Regla de Sturges.
𝑘 = 1 + 3.322 log 𝑛
𝑘 = 1 + 3.322 log 19
𝑘 = 5.24 ≈ 5 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑎 𝑐𝑟𝑒𝑎𝑟.
Para el calculo del recorrido se tiene que tener en cuenta el valor máximo y mínimo siendo 211
y 87 segundos respectivamente.
El rango es la resta del valor máximo y mínimo.
𝑅𝑎𝑛𝑔𝑜 𝑜 𝑅𝑒𝑐𝑜𝑟𝑟𝑖𝑑𝑜 = 𝑉𝑎𝑙𝑜𝑟 𝑀𝑎𝑥 − 𝑉𝑎𝑙𝑜𝑟 𝑀𝑖𝑛 = 211 − 87 = 124𝑠𝑒𝑔
Podemos calcular algo más que sería la amplitud de cada rango que sería:
𝑅 124
𝐴= = = 24.8 ≈ 25
𝐾 5
Desarrollo de la Actividad
1. Un establecimiento de comidas rápidas que brinda servicio por teléfono, tiene 5 canales
destinados a la atención a las solicitudes de los clientes. Sea que se registra la cantidad de
canales en uso en un instante específico, y la función de probabilidad para esta variable es
la siguiente:
𝑃̅̅̅̅̅̅̅̅̅̅
(𝑥 ≥ 4) = 1 − 𝑃 (𝑥 ≥ 4)
𝑃̅̅̅̅̅̅̅̅̅̅
(𝑥 ≥ 4) = 1 − [𝑃(𝑥 = 4) + 𝑃(𝑥 = 5)]
𝑃̅̅̅̅̅̅̅̅̅̅
(𝑥 ≥ 4) = 1 − [0.07 + 0.03]
𝑃̅̅̅̅̅̅̅̅̅̅
(𝑥 ≥ 4) = 1 − [0.10]
̅̅̅̅̅̅̅̅̅̅
𝑃 (𝑥 ≥ 4) = 0.90 = 90%
2. El tiempo que demora en descargarse un archivo de internet con un peso de hasta 60 MB, en cierto
ordenador, está entre cero y dos segundos. Sea que este tiempo es guardado en la variable Y, que
está representada por la siguiente expresión analítica:
𝑐𝑦 2 ; 0 < 𝑦 < 2
𝑓 (𝑦 ) = {
0; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. ¿Cuál debe ser el valor de la constante c para que la función anterior sea la función de densidad
de probabilidad de la variable Y.
𝑓 (𝑦 ) ≥ 0 ∀ 𝑦
𝑐(2)3 𝑐(0)3
[ ]−[ ]=1
3 3
8𝑐
=1
3
3
𝑐=
8
3 2
𝑓 (𝑦) = {8 𝑦 ; 0 < 𝑦 < 2
0; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
1.25
3 2
𝑓 (𝑦 ) = ∫ 𝑦 ∗ 𝑑𝑦
−∞ 8
0 1.25 1.25
3 2
∫ 𝑓 (𝑦) ∗ 𝑑𝑦 + ∫ 𝑓 (𝑦) ∗ 𝑑𝑦 = ∫ 𝑦 ∗ 𝑑𝑦
−∞ 0 0 8
1.25 3 1.25
3 2 3 𝑦
∫ 𝑦 ∗ 𝑑𝑦 = [ ∗ ]
0 8 8 3 0
1.25 1.25
3 2 𝑦3
∫ 𝑦 ∗ 𝑑𝑦 = [ ]
0 8 8 0
1.25 (1.25)3 (0)3
3 2
∫ 𝑦 ∗ 𝑑𝑦 = [ ]−[ ]
0 8 8 8
1.25
3 2
∫ 𝑦 ∗ 𝑑𝑦 = 0.244
0 8
2 2
3 𝑦3
∫ 𝑦 2 ∗ 𝑑𝑦 = [ ]
0.5 8 8 0.5
2 (2)3 (0.5)3
3 2
∫ 𝑦 ∗ 𝑑𝑦 = [ ]−[ ] = 0.98
0.5 8 8 8
𝑦 𝑦
3 𝑦3
∫ 𝑦 2 ∗ 𝑑𝑦 = [ ]
0 8 8 0
0; 𝑦 < 0
3
𝑦
𝑓 (𝑦 ) = { ; 0 < 𝑦 < 2
8
1; 𝑦 = 2
3. Cierto circuito está conformado por dos transistores, denominados A y B. Sea X la cantidad
de milisegundos que demora en activarse el dispositivo A; mientras que Y es la cantidad de
milisegundos que demora en activarse el dispositivo B. La función de masa de probabilidad
conjunta de las variables X, Y se refleja a continuación:
a. El tiempo esperado de activación del circuito está en función del tiempo de activación
de cada transistor. Hallar entonces 𝐸 (𝑋 + 𝑌).
b. Si cada transistor se activa en el tiempo máximo posible, cuál será el valor esperado
de activación del circuito.
∑ 𝑥𝑓 (𝑥𝑖)
𝑃(𝑥 = 2|𝑦 = 3)
𝑓 (𝑥𝑖) =
𝑃(𝑦 = 3)
0.01
𝑓(𝑥𝑖) =
0.10 + 0.10 + 0.01
𝑓(𝑥𝑖) = 0.05
𝑥 ∗ 𝑃(𝑥 = 2|𝑦 = 3)
2 ∗ 0.05 = 0.0952
1
(1 )
𝑓 (ℎ) = {3 − ℎ2 ; 1 ≤ 𝑦 ≤ 3
0; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Hallar la función de distribución de la demanda de energía eléctrica del dispositivo de
control.
𝑃 (𝑀 = 𝑚 ) = 𝑓 (𝑚 )
ℎ ℎ ℎ
∫ 𝑓 (ℎ) ∗ 𝑑ℎ + ∫ 𝑓 (ℎ) ∗ 𝑑ℎ + ∫ 𝑓 (ℎ) ∗ 𝑑ℎ
−∞ 1 3
ℎ ℎ
1
∫ 3 (1 − ) ∗ 𝑑ℎ = ∫ (3 − 3ℎ−2 ) ∗ 𝑑ℎ
1 ℎ2 1
ℎ
−2 )
3ℎ
(
∫ 3 − 3ℎ ∗ 𝑑ℎ = [3ℎ + ]
1 ℎ1
3ℎ 3
[3ℎ + ] = 3ℎ + − (3 + 3)
ℎ1 ℎ
3 ℎ 3
[3ℎ + ] = 3ℎ + − 6
ℎ1 ℎ
0;ℎ < 1
3
𝐹 (ℎ) = {3ℎ + −6 ;1 ≤ 𝑦 ≤ 3
ℎ
1; ℎ > 3
∞ 3
3
∫ ℎ ∗ 𝑓 (ℎ) ∗ 𝑑ℎ = ∫ ℎ (3 − ) ∗ 𝑑ℎ
0 1 ℎ2
3 3
3 3
∫ ℎ (3 − 2 ) ∗ 𝑑ℎ = ∫ (3ℎ − ) ∗ 𝑑ℎ
1 ℎ 1 ℎ
3 3
3 3ℎ2
∫ (3ℎ − ) ∗ 𝑑ℎ = [ − 3 ln(ℎ)]
1 ℎ 2 1
3
3ℎ2 3(3)2 3(1)2
[ − 3 ln(ℎ)] = − 3 ln(3) − − 3 ln(1) = 8.70 𝑉𝑎𝑙𝑜𝑟 𝐸𝑠𝑝𝑒𝑟𝑎𝑑𝑜.
2 1
2 2
∞
𝜎 2 = ∫ (ℎ − 𝑢)2 ∗ 𝑓(ℎ) ∗ 𝑑ℎ
−∞
3
3
𝜎 2 = ∫ (ℎ − 8.70)2 ∗ (3 − ) ∗ 𝑑ℎ
1 ℎ2
3
3
𝜎 2 = ∫ (ℎ2 − 17.4ℎ + 75.69) ∗ (3 − 2 ) ∗ 𝑑ℎ
1 ℎ
3
17.4 ∗ 3 75.69 ∗ 3
𝜎 2 = 3 ∫ ℎ2 − 17.4ℎ + 75.69 − 3 + − ∗ 𝑑ℎ
1 ℎ ℎ2
3
2
ℎ3 17.4ℎ2 227.08
𝜎 = 3[ − + 72.69 + 52.2 ln(ℎ) − ]
3 2 −ℎ 1
𝜎 2 = 171.31 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 ℎ
Desarrollo de la Actividad
X/Y -2 -1 1 2 15
-2 0 0.2 0 0 0
-1 0.2 0 0 0 0
1 0 0 0 0.2 0
2 0 0 0.2 0 0
13 0 0 0 0 0.2
a. Calcular 𝑃 (𝑋 = 𝑌).
𝑃 (𝑋 = 𝑌 ) = 0 + 0 + 0 + 0 = 0
𝑃 (𝑋 = 𝑌 ) = 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 = 0
2. En cierto circuito eléctrico hay dos resistencias que pueden estar conectadas en paralelo o
en línea. Sea 𝑋1 la cantidad de resistencias que encuentra el flujo de electrones cuando las
mismas están conectadas en línea; mientras que sea 𝑋2 la cantidad de resistencias que
encuentra el flujo de electrones cuando las mismas están conectadas en paralelo.
Supongamos que estas variables son independientes, con función de probabilidad
conjunta según la tabla a continuación:
Universidad Politécnica Salesiana
X1) X2)
b. Calcular 𝜇H; σ2𝐻 . ¿Cómo se relacionan estos valores con la media y la varianza de la
población, respectivamente?
𝑛=2
𝜇𝐻 = 𝑛 ∗ 𝜇 = 1.23 ∗ 2 = 2.46
𝑣𝑎𝑟𝐻 = σ2 ∗ 𝑛 = 0.36 ∗ 2 = 0.72
3. Sea tres variables aleatorias 𝑌1; 𝑌2¸𝑌3 que representan los tiempos necesarios para que
un robot realice tres actividades sucesivas respectivamente. Además, las tres variables son
independientes entre sí y siguen distribución normal con 𝜇1 = 𝜇2 = 𝜇3 = 35; 𝜎21 =
𝜎22 = 𝜎23 = 9.
a. Si 𝐻 = 𝑌1 + 𝑌2 + 𝑌3, calcular 𝑃(60 < 𝐻 < 109).
𝑛=3
𝜇𝐻 = 3 ∗ 3.35 = 105
𝑣𝑎𝑟𝐻 = 27 = 𝑠 2
𝑠 = √27 = 5.2
𝜇𝐻 − 𝐾𝜎 = 60
105 − 𝐾(5.2) = 60
105 − 60
𝐾= = 8.65
5.2
1
𝑃 (60 < 𝑥 < 109) ≥ 1 −
𝐾2
1
𝑃(60 < 𝑥 < 109) ≥ 1 −
8.652
( )
𝑃 60 < 𝑥 < 109 ≥ 0.98
b. Con las medias y las varianzas dadas, hallar 𝑃(𝑌̅ > 33).
1
𝑃(𝑋 ≥ 𝐾 ) = 𝑃(𝑌 ≥ 𝐾 ∗ 𝜇) ≤
𝐾
𝜇 = 35
𝐾 ∗ 𝜇 = 33
𝐾 ∗ 35 = 33
33
𝐾= = 0.94
35
𝐾>0
1
𝑃(𝑌 ≥ 33) ≤
0.94
𝑃(𝑌 ≥ 33) ≤ 1.06
Desarrollo de la Actividad
Problemas.
1. Cierto emprendedor se dedica a la instalación, a domicilio, de nuevos programas computacionales.
Se ha comprobado que en el 15% de las instalaciones nuevas, es necesario reinstalar actualizaciones.
Si se considera que las instalaciones son independientes entre sí, y en determinada semana el
emprendedor realizó 8 instalaciones:
a. ¿Cuál es la probabilidad de que el técnico tenga regresar a tres de los sitios donde instaló nuevos
programas?
𝑋 = 1 0.15; 𝑋 = 0 0.85
𝑛
𝑓(𝑥) = ( ) ∗ 𝑝 𝑥 ∗ 𝑞 𝑛−𝑥
𝑥
𝑛 = 8; 𝑥 = 3; 𝑝 = 0.15
8
𝑓 (𝑥) = ( ) ∗ 0.153 ∗ 0.858−3
3
8!
𝑓(𝑥) = ( ) ∗ 0.153 ∗ 0.858−3
3! (8 − 3)!
𝑓(𝑥) = 0.838 = 8.38%
b. ¿Cuál es la probabilidad de que el técnico tenga regresar a por lo menos cinco de los sitios
donde instaló nuevos programas?
𝑋 = 1 0.15; 𝑋 = 0 0.85
𝑃(𝑋 > 4) = 1 − 𝑃(𝑋 ≤ 4)
𝑃(𝑋 > 4) = 𝐹 (𝑋 = 4) = 𝑓(0) + 𝑓(1) + 𝑓 (2) + 𝑓 (3) + 𝑓 (4)
𝑛
𝑓(𝑥) = ( ) ∗ 𝑝 𝑥 ∗ 𝑞 𝑛−𝑥
𝑥
𝑛 = 8; 𝑥 = 0; 1; 2; 3; 4; 𝑝 = 0.15
𝑃(𝑋 > 4) = 0.272 + 0.384 + 0.237 + 0.083 + 0.018 = 0.994
𝑃(𝑋 > 4) = 1 − 𝑃(𝑋 ≤ 4)
𝑃 (𝑋 > 4) = 1 − 𝑃(𝑋 ≤ 4) = 1 − 0.996 = 0.004 = 0.4%
Universidad Politécnica Salesiana
c. ¿Cuál es la probabilidad de que el técnico tenga regresar a lo sumo a dos de los sitios
dondeinstaló nuevos programas.
𝑋 = 1 0.15; 𝑋 = 0 0.85
𝑛
𝑓(𝑥) = ( ) ∗ 𝑝 𝑥 ∗ 𝑞 𝑛−𝑥
𝑥
𝑛 = 8; 𝑥 = 3; 𝑝 = 0.15
𝐹 (𝑋 ≤ 2) = 𝑓 (0) + 𝑓(1) + 𝑓(2)
𝑓(0) + 𝑓(1) + 𝑓 (2) = 0.272 + 0.384 + 0.237 = 0.893 = 89.3%
2. Sea que el número de mensajes de correo electrónico que intercambian dos usuarios de Gmail, en
determinado lapso de tiempo a la semana, es una variable aleatoria que sigue distribución de Poisson
con 𝜇 = 11.
a. ¿Cuál es la probabilidad de que el número de mensajes intercambiados sea a lo sumo 6?
𝜆 = 11
𝐹 (6) = 𝑃 (𝑋 ≤ 6) = 𝑓(0) + 𝑓(1) + 𝑓 (2) + 𝑓 (3) + 𝑓 (4) + 𝑓(5) + 𝑓(6)
𝑘=𝑥
𝑒 −𝜆 ∗ 𝜆𝑘
𝑓 (𝑔) =
𝑘!
𝐹(6) = 0.0000167 + 0.0001837 + 0.0010104 + 0.003704 + 0.010188 + 0.022415 + 0.04109 = 0.0786 = 7.86%
b. ¿Cuál es la probabilidad de que el número de mensajes intercambiados esté entre 10 y 13, ambos
inclusive?
𝜆 = 11
𝑃(10 ≤ 𝑋 ≤ 13) = 𝑓(10) + 𝑓 (11) + 𝑓(12) + 𝑓 (13)
𝑘=𝑥
𝑒 −𝜆 ∗ 𝜆𝑘
𝑓 (𝑔) =
𝑘!
𝑃(10 ≤ 𝑋 ≤ 13) = 0.119 + 0.119 + 0.109 + 0.0925 = 0.4395 = 43.95%
𝜆 = 11
𝑃(4 ≤ 𝑋) = 𝑓 (0) + 𝑓(1) + 𝑓(2) + 𝑓 (3) + 𝑓(4)
𝑘=𝑥
𝑒 −𝜆 ∗ 𝜆𝑘
𝑓 (𝑔) =
𝑘!
𝑃(4 ≤ 𝑋) = 0.000167 + 0.0001837 + 0.0010104 + 0.003704 + 0.010188 = 0.01509 = 1.509%
3. A una fábrica de radio receptores han sido devueltos 10 aparatos. De ellos 4 tienen problemas de
recepción de la señal y los demás han sufrido alteraciones estéticas por mala manipulación. Si los
radios se examinan de forma aleatoria, sea que la variable L representa el número de aparatos, entre
los 5 primeros examinados, que tienen problemas de recepción de la señal.
a. Calcular 𝑃(𝐿 = 2).
𝑁 = 10; 𝑛 = 5; 𝑘 = 4; 𝑥 = 2
(42) ∗ (10−4
5−2
) (42) ∗ (63) 6 ∗ 20
𝑃(𝐿 = 2) = = = = 0.4761 = 47.61%
(10
5
) (10
5
) 252
𝑁 = 10; 𝑛 = 5; 𝑘 = 4; 𝑥 = L ≥ 1
𝑃(𝐿 ≥ 1) = 1 − 𝑃(𝐿 = 0)
(40) ∗ (10−4
5−0
) (40) ∗ (65) 6
𝑃(𝐿 = 2) = = = = 0.0238 = 2.38%
(10
5
) (10
5
) 252
𝑛 ∗ 𝑁1
μ=
𝑁2
5∗4
μ= = 3.33333
6
𝑛𝑁1𝑁2(𝑁 − 𝑛)
𝜎= √
𝑁2(𝑁 − 1)
(5)(4)(6)(10 − 5)
𝜎=√
(6)(10 − 1)
𝜎 = 3.3333
Para poder hacer que no sobrepase su media aplicamos:
𝑃(𝑋 ≤ 3) = 1 − 𝑃(𝑋 = 4)
(44)
∗ (10−4
5−4
) 1(61) 6
𝑃 (𝑋 = 4) = = = = 0.0238 = 2.38%
(10
5
) (10
5
) 252
( )
𝑃 𝑋 ≤ 3 = 1 − 0.0238 = 0.9762 = 97.62%
Problemas
𝑝 = 0.00167 ; 𝑛 = 30000 ; 𝑥 = 43
30000!
𝑓(43) = ∗ 0.0016743 ∗ 0.99830000−43
43! (30000 − 43)!
𝑓(43) = 0.03629 = 3.629%
𝑥 = 2 ; 𝐴 = 12 ; 𝐴𝑐 = 13 ; 𝑛 = 4 ; 𝑡 𝑜 𝑥 = 2
(𝑁1
𝑡
𝑁2
)(𝑛−𝑡 )
𝑓(𝑥) =
(𝑁1
𝑛
)
𝑁1! 𝑁2!
( )( )
𝑡! (𝑁1 − 𝑡)! (𝑛 − 𝑡)! (𝑁2 − 𝑛 − 𝑡)!
𝑓(𝑥) =
𝑁!
( )
𝑛! (𝑁 − 𝑛)!
Universidad Politécnica Salesiana
12! 13!
( )( )
4! (12 − 4)! (4 − 2)! (13 − 4 + 2)!
𝑓(2) =
25!
( )
4! (25 − 4)!
12! 13!
( )( )
4! (10)! (2)! (11)!
𝑓(2) =
25!
( )
4! (21)!
b. ¿Cuál es la probabilidad de que a lo sumo uno de los proyectos no aprobados sea sobre
energía eólica?
𝐴 = 𝐵 = 𝑁1 = 13 ; 𝐴𝑐 = 𝑁2 = 132; 𝑁 = 4 ; 𝑡 𝑜 𝑥 = 4
13! 12!
( )( )
4! (13 − 4)! (0)! (12)!
𝑓(𝑡) =
25!
( )
4! (21)!
𝑘=𝑥=1
2 30𝑚𝑖𝑛
𝜆 = 0.733 11𝑚𝑖𝑛
𝑘
𝑒 −𝜆 ∗ 𝜆
𝑓(𝑘) =
𝑘!
𝑒 −0.733 ∗ 0.7331
𝑓(𝑘) =
11
𝑓(𝑘 ) = 0.3521 = 35.21%
Problemas
1. Cierto equipo de medición de corriente tiene una sensibilidad promedio de 1.5 miliamperios, con
una desviación típica de 0.03 miliamperios. Para cierto tipo de investigaciones se consideran
apropiadas las mediciones que están en un rango de entre 1.48 y 1.52 miliamperios. ¿Cuántas
mediciones realizadas con este equipo se espera que sean rechazadas, de un total de 328
realizadas, si se asume que las mediciones siguen distribución normal?
𝜇 = 1.5𝑚𝐴; 𝜎 = 0.03𝑚𝐴
1.48𝑚𝐴 ≤ 𝑃 ≤ 1.52𝑚𝐴
Tipificar
𝑃 ≥ 1.48𝑚𝐴
𝑥 − 𝜇 (1.48𝐸 − 3) − (1.5𝐸 − 3)
𝑧= = = −0.667
𝜎 0.03𝐸 − 3
𝑧 ≥ −0.667 = 0.7454
(𝑃 < 1.52𝑚𝐴) = 1 − (𝑃 ≥ 1.52𝑚𝐴)
𝑥 − 𝜇 (1.52𝐸 − 3) − (1.52𝐸 − 3)
𝑧= = = 0.667
𝜎 0.03𝐸 − 3
𝑧 ≥ 0.667 = 0.7454
(𝑃𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎𝑠) = +(1 − 0.7454) + (1 − 0.7454) = 0.5092
𝜇 = 150𝐾𝑚; 𝜎 = 2𝐾𝑚/ℎ
Solución a)
𝑥 − 𝜇 (151.5) − (150)
𝑧= = = 0.75
𝜎 2
𝑃(𝑧 ≥ 0.75) = 0.2266 = 22.66%
Solución b)
𝑥 − 𝜇 (147) − (150)
𝑧= = = −1.5
𝜎 2
𝑃(𝑧 < −1.5) = 0.0668 = 6.68%
Solución c)
𝑥 − 𝜇 (152) − (150)
𝑧= = =1
𝜎 2
𝑃(𝑧 < 1) = 0.8413
𝑥 − 𝜇 (148) − (150)
𝑧= = = −1
𝜎 2
𝑃(𝑧 ≥ 1) = 0.8413
𝜇 = 20; 𝜎 = 0.36
1 − 0.94 = 0.06
0.06
𝛼 = 0.94 +
2
𝑃(𝑧 < 𝑘) = 97%
𝑃(𝑍 < 1.88) = 97%
𝑥 − 𝜇 𝑋 − 20
1.88 = = = 20.6768
𝜎 0.36
𝑘 = 20.6768 − 20 = 0.6768 = 67.68%
𝑃(𝑋 ≥ 18) = 97
𝑥 − 𝜇 (18) − (20)
𝑧= = = −5.556
𝜎 0.36
𝑃(𝑍 ≥ −5.556) ≈ 1 ≈ 100%
𝑝 ≈ 100%; 𝑞 ≈ 0%
𝑃(𝑌 ≥ 2) = 1 − 𝑃(𝑌 = 1) − 𝑃(𝑌 = 0)
𝑃(𝑌 ≥ 2) ≈ 100%
Problemas
𝜇 = 25𝑚𝑖𝑛; 𝜎 2 = 64min2
𝜇 = 𝛼𝛽 ; 𝜎 2 = 𝛼𝛽2 ; 25 = 𝛼𝛽
64 = 𝛼𝛽𝛽
64 = 25𝛽
64
𝛽= = 2.56 ≈ 3
25
25 = 𝛼 (2.56)
25
𝛼= = 9.77 ≈ 10
2.56
b. ¿Cuál es la probabilidad de que el terminal esté en uso 11 min cuanto mínimo?
1 𝑥
𝛼−1 −𝛽
𝑥 𝑒
𝛽 𝛼 𝜏 (𝛼 )
1 11
1110−1𝑒 − 3 = 2.812𝐸 − 3 = 0.002812 = 0.281%
310 (362880)
∞
1 𝑥
10−1 −3
𝑃(11 < 𝑇 < 𝑖𝑛𝑓𝑖𝑛𝑖𝑡𝑜) = ∫ 𝑥 𝑒
11 310 (362880)
𝑃(11 < 𝑇 < 𝑖𝑛𝑓𝑖𝑛𝑖𝑡𝑜) = 0.0995 = 9.95%
c. ¿Cuál es la probabilidad de que el terminal esté entre 20 y 27 min en uso?
Γ(α) = (α − 1)!
9! = 362880
Universidad Politécnica Salesiana
27
1 𝑥
10−1 −3
𝑃 (20 < 𝑇 < 27) = ∫ 𝑥 𝑒 𝑑𝑥
20 310 (362880)
27 𝑥
𝑃(20 < 𝑇 < 27) = 4.67𝑥10 −11
∫ 𝑥 10−1 𝑒 −3 𝑑𝑥
20
𝑅𝑒𝑠𝑖𝑠𝑡𝑒𝑛𝑐𝑖𝑎 = 𝑌 ; μ = 4 ; σ = 0.3
135 (𝑥−4)2
1 −
P(100 ≤ Y ≤ 135) = ∫ 𝑒 20.32 𝑑𝑥 =0
100 0.3√2𝜋
b. Si se ensayan 25 probetas del referido material, cuantas se esperaría que tengan una
resistencia a la compresión de por lo menos 120 unidades de resistencia.
2 2
𝑉(𝑦) = (𝑒 𝜗 − 1)𝑒 2𝜇+𝜗
2 2
𝑉(𝑦) = (𝑒 0.3 − 1)𝑒 2(4)+0.3
𝑉 (𝑦) = 307.167
3. Sea que el tiempo hasta que se presenta una falla en cierto circuito es una variable exponencial
con media igual a 16000 horas.
𝜇 = 𝛽 = 16000
1
𝛽2 =
𝜆2
a. ¿Cuál es la probabilidad de que uno de estos circuitos dure como mínimo 18000 horas?
1 −𝛽𝑥 1 18000
𝑓 (𝑥; 𝛽) = 𝑒 = 𝑒 −16000 = 2.0290𝐸 − 5 = 0.0029%
𝛽 16000
b. ¿Cuál es la probabilidad de que uno de estos circuitos dure entre 14000 y 15000 horas?
15000 𝑥
−
∫ 𝜆𝑒 𝛽 𝑑𝑥
14000
1
𝜆=√ = 6.25𝐸 − 5
𝛽2
15000 𝑥
∫ 6.25𝐸 − 5𝑒 −16000 𝑑𝑥 = 0.0252 = 2.52%
14000