Está en la página 1de 13

Corporación Universitaria Unitec

Estadı́stica y Probabilidad
Taller Introductorio
Docente: Ana Marı́a Cruz Pacheco

Conceptos Básicos
Ya sea en lo cotidiano o en un laboratorio cuando se desea observar un determinado evento, se obtienen datos para
su estudio. Cualquiera de los 2 métodos de recolección de datos se conoce como experimento. La observación o
medición generada por un experimento puede o no ser un valor numérico. Algunos ejemplos de experimentos son
los siguientes:
• El registro de las pruebas de un examen.
• Lanzar al aire una moneda y observar el resultado.

• Probar un bombillo para determinar si es un producto defectuoso o no.


• Los resultados de la evaluación docente para el departamento de Matemáticas.
Al realizar un experimento, lo que medimos es lo que podemos llamar un evento simple (resultado que se observa
en una sola repetición del experimento). Se dice evento a una reunión o conjunto de eventos simples.

Ejemplo.
Experimento: Lanzamiento de un dado para la observación del número en la cara superior.

Los eventos
E1 = ”observar un 1” E4 = ”observar un 4”
E1 = ”observar un 2” E4 = ”observar un 5”
E1 = ”observar un 3” E4 = ”observar un 6”
son las observaciones o eventos simples del experimento.
Si contemplamos la situación en que el número en el dado sea un número par, estaremos frente al evento

A = {Observar un x : x = 2, 4, 6}.

Note que el evento A es la reunión de los eventos simples E2 , E4 y E6 .

Definiciones
1. El conjunto de todos los eventos sencillos se denomina espacio muestral , S.
2. Dos eventos son mutuamente excluyentes si, cuando ocurre un evento, los otros no pueden ocurrir y vicev-
ersa.

1
Variable Aleatoria
Una variable X varı́a o cambia, dependiendo del resultado particular del experimento que se mida. Retomando el
experimento del ejemplo anterior:
”Lanzamiento de un dado para la observación del número en la cara superior”, la variable X puede tomar cualquiera
de seis valores. En muchos experimentos aleatorios los resultados no son intrı́nsecamente numéricos; el número
resulta de aplicar un instrumento de medida (función) al objeto observado. De aquı́ la siguiente definición.

Definición de variable aleatoria


Una variable aleatoria X es una función que asocia un número real con cada elemento del Espacio Muestral.
Veamos ejemplos de variables aleatorias que podemos definir en la cotidianidad:
• Mediciones de la presión sistólica de 100 individuos.

• Número de piezas defectuosas en un lote de 1000 piezas.


• Resultados del lanzamiento de una moneda (no cargada) 10 veces.
En el caso de las variables aleatorias cuantitativas al igual que las variables cuantitativas, se pueden clasificar como
discretas o contı́nuas. Lo anterior es de gran importancia, pues para describir su comportamiento (distribución)
por medio de algunas técnicas, se necesita saber su clasificación.

Tipos de variables aleatorias


Una variable aleatoria es llamada variable aleatoria discreta si se puede contar su conjunto de resultados posibles.
Cuando una variable aleatoria puede tomar valores en una escala continua (intervalo), se le denomina variable
aleatoria continua.

Distribuciones de probabilidad
Una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de un
experimento si éste se llevase a cabo, es decir, describe la probabilidad de que un evento se realice en el futuro.
Toda distribución de probabilidad es generada por una variable (porque puede tomar diferentes valores) aleatoria
x (porque el valor tomado es totalmente al azar), y puede ser de dos tipos.

1. La distribución de probabilidad para una variable aleatoria discreta es una fórmula, tabla o gráfica
que da los posibles valores de x, y la probabilidad p(x) asociada con cada valor de x.

Condiciones para la distribución de probabilidad de una v.a. discreta

1. 0 ≤ p(x) ≤ 1.
X
2. p(x) = 1.
x
3. p(x) = P (X = x).

2. Aunque la distribución de probabilidad de una variable aleatoria continua no se puede representar de forma
tabular, sı́ se establece como una fórmula, la cual necesariamente será función de los valores numéricos de la
variable aleatoria continua X y como tal se representará mediante f (x).
Al tratar con variables continuas, f (x), por lo general, se llama función de densidad de probabilidad o
simplemente función de densidad de X.

2
Condiciones para la función de densidad de una v.a.contı́nua

La función f (x) es una función de densidad de probabilidad (fdp) para la variable aleatoria continua
X, definida en el conjunto de números reales R, si
1. p(x) ≥ 0
Z ∞
2. f (x)dx = 1.
−∞
Z b
3. P (a < X < b) = P (a ≤ X ≤ b) = f (x)dx (no se pueden calcular probabilidades puntuales).
a

Algunas distribuciones de probabilidad discretas


I. Distribución de Probabilidad Binomial
Un experimento a menudo consiste en pruebas repetidas, cada una con dos resultados posibles, los cuales se pueden
marcar como éxito o fracaso. La distribución que cuenta el número de éxitos en una secuencia de n ensayos, se
denomina distribución de probabilidad binomial.
Aunque dichos experimentos tengan distintos fines en la práctica, sus caracterı́sticas serán bastante similares; las
caracterı́sticas de un experimento binomial:

1. El experimento consiste en n ensayos idénticos.


2. Cada intento resulta en uno de dos resultados: éxito (S) ó fracaso (F).
3. Para cada uno de los intentos, las probabilidades de éxito p y la de fracaso q = 1 − p, son las mismas.
4. Los ensayos son independientes.
5. Nuestro interés se enfoca en conocer el número de éxitos x, observados en los n ensayos, con x = 0, 1..., n.

Un experimento binomial consta de n ensayos idénticos con probabilidad p de éxito en cada ensayo. La proba-
bilidad de k éxitos en n intentos es:  
n k n−k
P (X = k) = p q ,
k
n!
para k = 0, 1, 2, ..., n y con nk =

.
k!(n − k)!

Observación
La media µ, varianza σ 2 y desviación estándar, de una variable aleatoria binomial son respectivamente:

µ = np
σ 2 = npq

σ = npq

Ejemplos.
1. Cuentas del médico. Unos registros muestran que 30% de todos los pacientes ingresados en una clı́nica
médica no pagan sus cuentas y que, en última instancia, esas cuentas son olvidadas. Suponga que n = 4 nuevos
pacientes repreentan una selección aleatoria de entre un gran conjunto de prospectos pacientes atendidos por
la clı́nica. Encuentre estas probabilidades:
a. Las cuentas de todos los pacientes tendrán finalmenteque olvidarse.
b. Una tendrá que olvidarse.
c. Ninguna tendrá que olvidarse.

3
2. El sistema de seguridad de una casa está diseñado para tener un 99% de confiabilidad. Suponga que nueve
casas equipadas con este sistema experimentan un intento de robo. Encuentre las probabilidades de estos
eventos:
a. Al menos una de las alarmas se activó.
b. Más de 7 alarmas se activaron.
c. Ocho o menos alarmas se activaron.

Ejercicios.
1. Diez individuos, cada uno de ellos propenso a la tuberculosis, entran en contacto con un portador de la
enfermedad. La probabilidad de que la enfermedad se contagie del portador a un sujeto cualquiera es de
0.1.¿Cuántos se espera que contraigan la enfermedad? (Rta. 1 persona)
2. La probabilidad de que cierto antibiótico presente una reacción negativa al administrarse a un ave rapaz en
recuperación es de 0.15. Si se les ha administrado dicho antibiótico a 10 aves, calcúlense las probabilidades
de que haya reacción negativa:

a. Exactamente en 2 aves.
b. En ningún ave.
c. En menos de 4 aves.
d. En más de 3 aves.
e. Entre 2 y 5 aves.
[Pista:] Identifique la variable aleatoria como X =”Número de aves a las que se les presenta la reacción
negativa”.
3. Según la Sociedad protectora de animales de Estados Unidos, hay aproximadamente 65 millones de perros
con dueño en Estados Unidos y alrededor del 40% de todas las familias en Estados Unidos tienen al menos
un perro. Suponga que la cifra del 40% es correcta y que 15 familias se seleccionan al azar para un estudio
sobre propiedad de mascotas.
a. ¿Cuál es la probabilidad de que exactamente ocho de las familias tenga al menos un perro?
b. ¿Cuál es la probabilidad de que al menos cuatro de las familias tenga al menos un perro?
c. ¿Cuál es la probabilidad de que más de 10 familias tenga al menos un perro?

II. Distribución de Probabilidad Poisson


Los experimentos que dan valores numéricos de una variable aleatoria X, el número de resultados que ocurren
durante un intervalo dado o en una región especı́fica, se llaman experimentos de Poisson. El intervalo dado
puede ser de cualquier longitud, como un minuto, un dı́a, una semana, un mes o incluso un año. Algunos ejemplos
de experimentos para los cuales la variable aleatoria X puede ser modelada por la variable aleatoria de Poisson son:

• El número de llamadas recibidas por un conmutador durante un tiempo determinado


• El número de bacterias por volumen pequeño de fluido.
• El número de llegadas de clientes al mostrador de una caja de pago en un minuto determinado.
• El número de descomposturas de una máquina durante un dı́a determinado.

• El número de accidentes de tránsito en un crucero dado durante un tiempo determinado.


• El número de dı́as que esta cerrada la escuela en invierno.

4
Los únicos supuestos necesario al usar la distribución de Poisson para modelar experimentos tales como éstos, son
que las cuentas o eventos ocurren al azar e independientemente unos de otros.

La distribución de probabilidad de una variable aleatoria de Poisson X, que representa el número de


resultados que ocurren en un intervalo dado o región especı́ficos, es
e−λ (λ)k
p(X = k) = , k = 0, 1, 2, ...,
k!
donde λ es el número promedio de resultados por unidad de tiempo, distancia,área o volumen, y e = 2.71828...

Obsevación
La media µ, varianza σ 2 y desviación estándar, de una variable aleatoria Poisson son respectivamente:

µ = λt
σ 2 = λt

σ = λt

Ejemplos
1. En una gasolinera la llegada de vehı́culos sigue la distribución de Poisson de parámetro 1.6. Calcúlese la
probabilidad de que:
a. El número de vehı́culos que lleguen sea superior a 3.
b. Esté comprendido entre dos y cinco.
c. Llegue algún vehı́culo.

Solución del ejemplo


Definimos la variable X como sigue:

X = ”Número de vehı́culos que entran a la gasolinera en un tiempo determinado”,

donde X sigue una distribución poisson con parámetro λ = 1.6.

a. Para calcular que tan probable es que ingresen mas de 3 vehı́culos a la gasolinera, se debe utilizar la propiedad
del complemento. Ası́,

P (X > 3) = 1 − P (X ≤ 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)),
donde
e−1.6 (1.6)0
P (X = 0) = = e−1.6 = 0.2019,
0!
e−1.6 (1.6)1
P (X = 1) = = e−1.6 · (1.6) = 0.3230,
1!
e−1.6 (1.6)2 e−1.6 (1.6)2
P (X = 2) = = = 0.2584,
2! 2
e−1.6 (1.6)3 e−1.6 (1.6)3
P (X = 3) = = = 0.1378,
3! 6
por lo tanto, P (X > 3) = 1 − (0.2019 + 0.3230 + 0.2584 + 0.1378) = 1 − 0.9211 = 0.0789. Esto significa que
la probabilidad de que lleguen mas de 3 vehı́culos a la gasolinera es de 7.89%
b. Si se desea calcular la probabilidad de que el número de vehı́culos que entran a la gasolinera está comprendido
entre 2 y 5, queda planteada como sigue:
e−1.6 (1.6)3 e−1.6 (1.6)4
P (2 < X < 5) = P (X = 3) + P (X = 4) = + = 0.1378 + 0.0551 = 0.1929.
3! 4!

5
c. La probabilidad de que llegue algún vehı́culo, se puede calcular usando la propiedad del complemento. Luego,

P (X ≥ 1) = 1 − P (X < 1) = 1 − P (X = 0) = 1 − e−1.6 = 0.7981

2. Durante un experimento de laboratorio el número promedio de partı́culas radiactivas que pasan a través de
un contador en un milisegundo es 4. ¿Cuál es la probabilidad de que 6 partı́culas entren al contador en un
milisegundo dado?.
3. El número promedio de camiones-tanque que llega cada dı́a a cierta ciudad portuaria es 10. Las instalaciones
en el puerto pueden manejar a lo más 15 camiones-tanque por dı́a. ¿Cuál es la probabilidad de que en un dı́a
dado los camiones se tengan que regresar?

Ejercicios.
1. El número x de personas ingresadas a una unidad de cuidados intensivos en un hospital particular, en un dı́a,
tiene una distribución de probabilidad de Poisson con media igual a cinco personas por dı́a.
a. ¿Cuál es la probabilidad de que el número de personas ingresadas a una unidad de cuidados intensivos
en un hospital particular, en un dı́a particular, sea dos? ¿Menor o igual a dos?
2. Los padres preocupados porque sus hijos son “propensos a accidentes” pueden estar tranquilos, de acuerdo a
un estudio realizado por el Departamento de Pediatrı́a de la Universidad de California, San Francisco. Los
niños que se lesionan dos o más veces tienden a sufrir estas lesiones durante un tiempo relativamente limitado,
por lo general un año o menos. Si el número promedio de lesiones por año para niños en edad escolar es de
dos, ¿cuáles son las probabilidades de estos eventos?
a. Un niño sufrirá dos lesiones durante el año.
b. Un niño sufrirá dos o más lesiones durante el año.
c. Un niño sufrirá a lo sumo una lesión durante el año.

3. Si una gota de agua se pone en la platina y se examina bajo un microscopio, el número x de un tipo particular
de bacteria presente se ha encontrado que tiene una distribución de probabilidad de Poisson. Suponga que la
cantidad máxima permisible por espécimen de agua para este tipo de bacteria es cinco. Si la cantidad media
para el suministro de agua de usted es de dos y usted prueba una sola muestra, ¿es probable que la cantidad
exceda la cantidad máxima permisible? Explique.

III. Distribución Normal de probabilidad


Las distribuciones de probabilidad continua pueden tomar varias formas, pero un gran número de variables aleatorias
observadas en la naturaleza poseen una distribución de frecuencia que tiene más o menos la forma de montı́culo,
o bien, como dirı́a un estadı́stico, es aproximadamente una distribución normal de probabilidad. La fórmula que
genera esta distribución es
1 2
/2σ 2
f (x) = √ e−(x−µ) − ∞ < x < ∞.
2πσ 2
Los sı́mbolos e y π son constantes matemáticas dadas en forma aproximada por 2.7183 y 3.1416, respectiva-
mente; µ y σ (σ > 0) son parámetros que representan la media poblacional y desviación estándar, respectivamente.

La media µ localiza el centro de la distribución, y la distribución es simétrica alrededor de su media µ. Como el


área total bajo la distribución normal de probabilidad es igual a 1, la simetrı́a implica que el área a la derecha de µ
es 0.5 y el área a la izquierda de µ es también 0.5. La forma de la distribución está determinada por σ, la desviación
estándar de la población.

6
Gráfica de la distribución de probabilidad normal con media µ y desviación σ
Valores grandes de σ reducen la altura de la curva y aumentan la dispersión; valores pequeños de σ aumentan la
altura de la curva y reducen la dispersión. La siguiente figura muestra tres distribuciones normales de probabilidad
con diferentes medias y desviaciones estándar. Nótese las diferencias en forma y ubicación.

Curvas normales con distintos valores de µ y σ

Cálculo de probabilidades de la distribución normal


Para hallar la probabilidad de que una variable aleatoria normal x se encuentre en el intervalo de a a b, necesitamos
hallar el área bajo la curva normal entre los puntos a y b.

7
La distribución de probabilidad f (x). P (a < x < b) es igual al área sombreada bajo la curva
No obstante, hay un número infinitamente grande de distribuciones normales, uno para cada media y desviación
estándar diferentes. Una tabla separada de áreas para cada una de estas curvas es obviamente impráctica; en cambio,
usamos un procedimiento de estandarización que nos permite usar la misma tabla para todas las distribuciones
normales.

Variable aleatoria normal estándar


Una variable aleatoria normal x está estandarizada al expresar su valor como el número de desviaciones estándar
(σ) que se encuentran a la izquierda o derecha de su media µ. Éste es realmente sólo un cambio en las unidades de
medida que usamos. La variable aleatoria normal estandarizada, z, se define como
x−µ
z=
σ
De la fórmula para z, podemos sacar estas conclusiones:
a) Cuando x es menor que la media µ, el valor de z es negativo.
b) Cuando x es mayor que la media µ, el valor de z es positivo.
c) Cuando x = µ, el valor de z = 0.
La distribución normal cuya media es 0 y cuya desviación estándar es 1, se denomina distribución normal
estandarizada. El área bajo la curva normal estándar a la izquierda de un valor especificado de z, por ejemplo
z0 , es la probabilidad P (z ≤ z0 ).

Distribución normal estandarizada


¿Cómo uso la tabla para calcular probabilidades bajo la curva normal estándar? Para el calculo de
las áreas se utiliza la tabla de la distribución normal estándar.
1. Para calcular el área a la izquierda de un valor z, encuentre el área directamente de la tabla.
2. Para calcular el área a la derecha de un valor z, encuentre el área en la tabla y réstela de 1.
3. Para calcular el área entre dos valores de z, encuentre las dos áreas en la tabla y reste un área de la otra.

8
Cálculo de probabilidades para una variable aleatoria normal general
Para el ejemplo y los ejercicios, usaremos la tabla de la distribución normal estándar del libro Estadı́stica para
administración y economı́a1 en su versión virtual y al final de este documento, se adjunta la tabla.

Casi todo el tiempo, las probabilidades en las que estamos interesados contienen x, una variable aleatoria normal
con media µ y desviación estándar σ. Entonces se debe estandarizar el intervalo de interés, escribiéndolo como el
intervalo equivalente en términos de z, la variable aleatoria normal estándar. Una vez hecho esto, la probabilidad
de interés es el área que se encuentra usando la distribución de probabilidad normal estándar.

Ejemplo
Una variable aleatoria X con distribución normal tiene media µ = 10 y desviación estándar σ = 2. Encuentre las
probabilidades de ocurrencia para los siguientes eventos con la variable X:
a. X > 13.5
b. X < 8.2
c. 9.4 < X < 10.6

Solución del ejemplo


Las probabilidades que se calcularan son P (X > 13.5), P (X < 8.2) y P (9.4 < X < 10.6) respectivamente. Al
estandarizar cada una de las variables con sus correspondientes intervalos los valores obtenidos se buscaran en la
tabla normal.
 
X −µ 13.5 − 10
a. P (X > 13.5) = P > = P (Z > 1.75) = 1 − P (Z < 1.75) = 1 − 0.9599 = 0.0401
σ 2

Gráficamente, tenemos que la probablidad calculada se puede representar como sigue:

 
X −µ 8.2 − 10
b. P (X < 8.2) = P < = P (Z < −0.9) = 0.1841
σ 2

Luego, el área calculada se representa en la curva normal, ası́:


1 Anderson, Sweeney and Williams, 2008

9
 
9.4 − 10 X −µ 10.6 − 10
c. P (9.4 < X < 10.6) = P < < = P (−0.3 < Z < 0.3)
2 σ 2

= P (z < 0.3) − P (Z < −0.3) = 0.6179 − 0.3821 = 0.2358

Finalmente, la última representación gráfica serı́a:

10
Ejemplo de aplicación distribución normal
Las estaturas de un grupo de estudiantes se distribuyen normalmente con media 165cm y varianza de 100cm. Al
seleccionar un estudiante de dicho grupo cual es la probabilidad de que:
a. Mida menos de 170 cm?

b. Mida más de 172cm?


c. Mida entre 170cm y 180cm?
d. Si el grupo está formado por 500 estudiantes cuantos miden: Menos de 160 cm? Más de 162 cm? Midan entre
155cm y 182cm?

Ejercicios de aplicación distribución normal


Ejercicios
1. Una psicóloga estudio la fatiga ocular utilizando una medida particular que aplica a los alumnos después
de 1 hora de trabajo escribiendo en una computadora. Con esta medida, la psicóloga ha descubierto que la
distribución presenta una curva normal con media 3.5 puntos y desviación de 1.5 puntos. Al seleccionar un
alumno que presento la prueba cual es la probabilidad de que:
a. Presente más de 4 puntos?
b. Presente entre 2.5 y 3.9 puntos?
c. Presente menos de 3.8 puntos?

2. Una prueba de coordinación presenta una distribución normal con media de 50 y desviación estándar de 10.
Qué valor mı́nimo necesita una persona para estar en el 5% superior? Qué valor máximo necesita una persona
para estar en el 30% inferior?
3. Supongamos que las puntuaciones de arquitectos en determinada prueba de creatividad están distribuidas
normalmente con media 3.8 y desviación de 2. Cuál es la probabilidad de que al seleccionar un arquitecto
este obtenga:
a. Más de 4 puntos?
b. Entre 2.5 y 3 puntos?
c. Menos de 4.2 puntos?
d. Si a las pruebas asistieron 80 arquitectos. Cuántos de ellos obtuvieron más de 4.5 puntos? Cuántos entre
3 y 4 puntos?
Más de 3.5 puntos?

11

También podría gustarte