Está en la página 1de 9

UNMSM-EP GENETICA Y BIOTECNOLOGIA SEM.

: 2023-I
Asignatura: Fundamentos de Estadística

VARIABLE ALEATORIA

1. DEFINICIÓN
Una variable aleatoria (v.a.), X , es una función definida en el espacio muestral Ω (dominio) y toma
valores reales (rango). Empíricamente la v.a. representa los resultados de un experimento aleatorio
mediante números.

Veamos: si elige al azar a dos mujeres


postmenopáusicas e interesa observar la X
variable aleatoria, X : número de mujeres
que tiene osteoporosis, en el siguiente
gráfico se muestra el dominio (espacio
muestral) y su rango conformado por los
valores 0, 1 y 2.

Siendo S: Tiene osteoporosis y N: no tiene


osteoporosis.

2. VARIABLE ALEATORIA DISCRETA


Una v.a. X es discreta cuando su rango es un conjunto enumerable finito o infinito.

Ejemplo 1:
• Número de aleteos de una polilla cada 5 minutos
• Número de llamas esquiladas anualmente en el departamento de Huancavelica.
• Número de cerdas en Drosophila
• Número de plantas de café afectadas por la Roya amarilla del café por hectárea de cultivo

2.1 DISTRIBUCIÓN DE PROBABILIDAD


La distribución de probabilidad de una v.a. X es una manera de modelar la variabilidad o la forma
de cómo se distribuyen los valores de su rango. La distribución de probabilidad se representa
mediante una tabla, un gráfico o una fórmula, se muestra todos los valores posibles de la v.a. con
sus probabilidades de ocurrencias respectivas.

xi x1 x2 .. .. .. xk
P ( X = xi ) P ( X = x1 ) P ( X = x2 ) .. .. .. P ( X = xk )

Propiedades
k

1. P( X = xi ) ≥ 0 2. ∑ P( X = x ) = 1
i =1
i

Ejemplo 2:
La distribución de probabilidad del número de cerdas en Drosophila ( X) es :

x 1 2 3 4 5 6 7 Total
P( X = x) 0,008 0,033 0,058 0,0258 0.467 0,142 0.033 1

Se elige al azar una Drosophila, calcular la probabilidad que tenga


1
Docente: Mg. Violeta Alicia Nolberto Sifuentes Lima, 29/05/2023
UNMSM-EP GENETICA Y BIOTECNOLOGIA SEM.: 2023-I
Asignatura: Fundamentos de Estadística
1. Dos cerdas 3. A lo sumo 3 cerdas.

2. Mínimo 5 cerdas 4. Más de 4 cerdas

3. Interpretar el gráfico de la distribución de probabilidad

Grafico 1: Distribución de probabilidad del número de cerdas en Drosophila

2.2 ESPERANZA Y VARIANZA DE UNA VARIABLE ALEATORIA DISCRETA


La distribución de probabilidad de una v.a. es un modelo teórico que representa a la distribución
empírica y asociada a ella están su media y varianza. La media de una v.a. comúnmente llamada
esperanza, se denota con E(X) o µ y la varianza de una v.a. se denota con σ2, el cálculo respectivo
para una v.a. discreta es:
k
µ = E ( X ) = ∑ xi * P( X = xi ) (1)
i =1
k
σ = V ( X ) = ∑ (xi − E ( X ))2 * P( X = xi )
2
(2)
i =1
Ejemplo 3:
Calcular e interpretar la esperanza, varianza y coeficiente de variación de la v.a. del ejemplo 2.

Cálculos para obtener esperanza y varianza de la v.a. X: número de cerdas en Drosophila

2
Docente: Mg. Violeta Alicia Nolberto Sifuentes Lima, 29/05/2023
UNMSM-EP GENETICA Y BIOTECNOLOGIA SEM.: 2023-I
Asignatura: Fundamentos de Estadística

3. DISTRIBUCION DE PROBABILIDAD BINOMIAL

Comprende lo siguiente:

3.1 PROCESO DE BERNOULLI


Es el experimento aleatorio que tiene las siguientes características:
1. Sólo hay dos resultados posibles: - Éxito ( A) - Fracaso ( A c )
2. P( A) = p (es conocida y constante) y P( A c ) = 1 − p = q
3. Los resultados de las observaciones son independientes
Se dice que es un proceso de Bernoulli, cuyo parámetro es la probabilidad de éxito.

Ejemplo 4: Algunos casos que siguen el proceso Bernoulli son (¿explique por qué?):
• Un sujeto puede o no tener VIH.
• La prueba da resultado positivo o negativo sobre cierta enfermedad.
• Una PAM tiene COVID-19
• Un RN tiene o no malformación congénita

3.2 DISTRIBUCION DE PROBABILIDAD BERNOULLI


La Distribución de probabilidad Bernoulli, se define a partir de la siguiente v.a.
X : Nº de éxitos que ocurren en un experimento de Bernoulli, cuya distribución de probabilidad es:

P( X = x) = p x q 1− x , x = 0,1 (3)
El parámetro de esta v.a. es p y con E ( X ) = p y V ( X ) = pq . En su forma tabular es:

x 0 1
P( X = x) q p

3
Docente: Mg. Violeta Alicia Nolberto Sifuentes Lima, 29/05/2023
UNMSM-EP GENETICA Y BIOTECNOLOGIA SEM.: 2023-I
Asignatura: Fundamentos de Estadística

3.3 DISTRIBUCION DE PROBABILIDAD BINOMIAL (definición)


Si se repite un número fijo de veces, n , un experimento de Bernoulli con parámetro p , el número de
éxitos que ocurren en repeticiones u observaciones, sigue una distribución Binomial con parámetros
n y p . En este caso la v.a. asociada al experimento aleatorio es X : Nº de éxitos que ocurren en n
observaciones, cuya distribución de probabilidad se expresa como:

 n  x n− x
P( X = x) =   p q , x = 0,1,2, .....n (4)
 x
Con E ( X ) = np y V ( X ) = npq
Notación.: X ~ B(n, p ) , la v.a. X tiene distribución de probabilidad Binomial, con parámetros n y
p

3.4 CÁLCULO DE PROBABILIDAD BINOMIAL (Excel)

A) Para probabilidades puntuales, esto es, P( X = x) :


Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función:
DISTR BINOM.N → Núm_éxitos x → Ensayos n → Prob_éxitos p → Acumulado: FALSO
B) Para probabilidades acumuladas, esto es, P( X ≤ x) :
Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función:
DISTR BINOM.N → Núm_éxitos x → Ensayos n → Prob_éxitos p → Acumulado:
VERDADERO

Ejemplo 5: Estudiosos de un centro de investigación afirman que el 20% de niños en edad escolar
tienen hiperactividad producida por una mutación genética Si se elige al azar a 5 niños de esta
población, cuánto es la probabilidad de que tengan hiperactividad producida por una mutación
genética:

1. exactamente 2 2. máximo 4 3. a lo sumo 2 4. más de su media

Sol.: Primero veamos si el experimento aleatorio sigue un proceso Bernoulli:


1. Sólo hay dos resultados posibles, para niños en edad escolar sufren de hiperactividad:
- Éxito: producida por una mutación genética ( A)
- Fracaso. Otras causas ( A c )
2. P( A) = p = 0,20 (es constante) y P( A c ) = 1 − p = q = 0,80
3. Los resultados de las observaciones son independientes

Además el número de observaciones es fijo n = 5


La v.a. es, X : Nº de niños en edad escolar que sufren de hiperactividad producida por una mutación
genética, de un grupo de 5 niños, con distribución de probabilidad, reemplazando en (4), igual a :
5 
P( X = x) =  0,20 x 0,80 5− x , x = 0,1, 2, 3, ,4 ,5
 x
4
Docente: Mg. Violeta Alicia Nolberto Sifuentes Lima, 29/05/2023
UNMSM-EP GENETICA Y BIOTECNOLOGIA SEM.: 2023-I
Asignatura: Fundamentos de Estadística
Con E ( X ) = np = 5 * 0,20 = 1 niño, V ( X ) = npq = 5 * 0,20 * 0,80 = 0,8 niños2 , σ = 0,8944 niños
y CV(X)=

La distribución de probabilidad de esta v.a., en su forma tabular y su gráfica son:

x 0 1 2 3 4 5
P( X = x) 0,32768 0,4096 0,2048 0,0512 0,0064 0,00032

Gráfico Nº 2: X ~ B(5, 0,20)

Usando los procedimientos pertinentes, los resultados son:

1. P(X = 2) = 2. P(X ≤ 4) =

3. P(X ≤ 2) = 4. P( X > 1) =

4. DISTRIBUCION DE PROBABILIDAD HIPERGEOMETRICA


Comprende lo siguiente:

4.1 PROCESO HIPERGEOMETRICO


Los experimentos aleatorios que tienen las siguientes características:
a) Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados.
b) Las probabilidades asociadas a cada uno de los resultados no son constantes.
c) Cada ensayo o repetición del experimento no es independiente de los demás.
d) El número de repeticiones del experimento (n) es constante.
siguen un proceso hipergeométrico.

4.2 DISTRIBUCION DE PROBABILIDAD HIPERGEOMETRICA (Definición)


Se tiene un conjunto A con N elementos. Se particiona A en dos subconjuntos E y Ec , con N1 y
N2 =N− N1 elementos respectivamente. En A se elige una muestra aleatoria de n elementos sin
reemplazamiento de manera que N1 < N y n < N.

Se define la variable aleatoria X: Número de elementos de E que están en la muestra aleatoria de


tamaño n, que tiene distribución Hipergeométrica, dada por:
5
Docente: Mg. Violeta Alicia Nolberto Sifuentes Lima, 29/05/2023
UNMSM-EP GENETICA Y BIOTECNOLOGIA SEM.: 2023-I
Asignatura: Fundamentos de Estadística

(5)

Notación: , la v.a. X tiene distribución de probabilidad


Hipergeométrica, con parámetros N, N1 y n

4.3 CÁLCULO DE PROBABILIDAD HIPERGEOMETRICA: (Excel)

A) Para probabilidades puntuales, esto es, P( X = x) :


Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función:

DISTR.HIPERGEOM.N → Muestra_éxitos x → Num_de_muestra n → Población_éxito N1


→ Núm_de_población N → Acumulado: FALSO

B) Para probabilidades acumuladas, esto es, P( X ≤ x) :


Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función:

DISTR.HIPERGEOM.N → Muestra_éxitos x → Num_de_muestra n → Población_éxito N1


→ Núm_de_población N → Acumulado: VERDADERO

Ejemplo 7: Seis animales de una determinada población que está en extinción son capturados y
marcados, luego liberados en una región determinada. Información fidedigna afirma que hay 11 animales
de este tipo en la región. Después de un período de tiempo se selecciona una muestra aleatoria de 5 de
animales de este tipo en esa región. Calcular las siguientes probabilidades:
1) Que estén marcados 3 animales 2) Mínimo 4 animales estén marcados
Sol.: Primero veamos a identificar que el experimento aleatorio es un proceso hipergeométrico:

a) Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados
E: Los animales están marcados, N1 = 6 Ec: Los animales no están marcados N2 = 5
b) Las probabilidades asociadas a cada uno de los resultados no son constantes. Se elige una m.a. de
n=5 animales sin reemplazamiento de manera que: N1=6 < N=11 y n=5 < N=11
c) Cada ensayo o repetición del experimento no es independiente de los demás., debido a b). Las
probabilidades de obtener un animal marcado van cambiando de elección en elección.
d) El número de repeticiones del experimento (n=5 ) es constante.

La v.a. X: Numero de animales marcados en una m.a. (n=5 animales), tiene distribución de probabilidad
Hipergeométrica, dada por:
6
Docente: Mg. Violeta Alicia Nolberto Sifuentes Lima, 29/05/2023
UNMSM-EP GENETICA Y BIOTECNOLOGIA SEM.: 2023-I
Asignatura: Fundamentos de Estadística

Con E(X)= 2.73 animales, V(X)= 0.7438 animales2 , σ =0.8624 animales y CV (X)=

La distribución de probabilidad de esta v.a., en su forma tabular y su gráfica son:

x 0 1 2 3 4 5
P( X = x) 0.0022 0.0649 0.3247 0.4329 0.1623 0.0130

Gráfico Nº 3: H~ (11, 6, 5)

1)

2)

5. DISTRIBUCION DE PROBABILIDAD POISSON


Comprende lo siguiente:

5.1 PROCESO DE POISSON


Un experimento aleatorio que sigue un proceso Poisson tiene las siguientes características:
1. Se observa el número de ocurrencias, x , de algún evento en un intervalo de tiempo, de espacio,
volumen, área geográfica, etc.
2. La probabilidad que ocurra el evento en un intervalo es la misma para los intervalos del mismo
tamaño; también es proporcional a la longitud del intervalo y ocurren de forma independiente.
3. El número de eventos que ocurren en un intervalo es independiente del número de eventos que
ocurren en otro intervalo.

5.2 DISTRIBUCION DE PROBABILIDAD POISSON (Definición)

7
Docente: Mg. Violeta Alicia Nolberto Sifuentes Lima, 29/05/2023
UNMSM-EP GENETICA Y BIOTECNOLOGIA SEM.: 2023-I
Asignatura: Fundamentos de Estadística
La distribución de Poisson se puede obtener como límite de una distribución Binomial cuando n → ∞
y p → 0 . Sea la v.a. X : Nº de eventos que ocurren en un intervalo de longitud fija, con parámetro
λ = np , que representa al número promedio de eventos en ese intervalo, cuya distribución de
probabilidad, llamada de Poisson, es:

e −λ λx
P( X = x) = , x = 0,1, 2, 3, 4, ........... (6)
x!
Con E ( X ) = λ (tasa promedio de ocurrencia del evento) y V ( X ) = λ

Notación.: X ~ P(λ ) , la v.a. X tiene distribución de probabilidad Poisson, con parámetro λ

Ejemplo 8: Los siguientes casos corresponden a una v.a. de tipo Poisson.


• Número de células afectadas por mercurio en un cm3 de sangre de cierto pez.
• Número de llamadas de teléfono que se reciben una central de emergencias en una hora.
• Número de fallecidos por la COVID-19 mensualmente.

5.2 CÁLCULO DE PROBABILIDAD POISSON: (Excel)


A) Para probabilidades puntuales, esto es, P( X = x) :
Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función:
POISSON.DIST → Núm_éxitos x → Media λ → Acumulado: FALSO

B) Para probabilidades acumuladas, esto es, P( X ≤ x) :


Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función:
POISSON.DIST → x → Media λ → Acumulado: VERDADERO

Ejemplo 6: El número de microorganismos en una muestra de 1 mm3 de agua de un río sigue una
distribución de Poisson de parámetro λ = 15 microorganismos/mm3. Calcular las siguientes
probabilidades de observar:
1. 10 microorganismos, en 1 mm3. 2. por lo menos de 15 microorganismo en 1 mm3
3. menos de 61 microorganismos, en 5 mm3 .

Sol: Primero veamos si el experimento aleatorio sigue un proceso de Poisson

1. Se observa el número de ocurrencias, x ,de algún evento, este caso microorganismos por 1 mm3
(volumen).
2. La probabilidad de que encontrar microorganismos por 1 mm3 es la misma para los intervalos
del mismo tamaño. También es proporcional a la longitud del intervalo, en este caso por volumen
igual a 2, 3, 5, 10 mm3 y ocurren de forma independiente.
3. El número microorganismos que ocurren en cierto volumen es independiente del número que
ocurren en otro volumen.

La v.a., es, X : Nº de microorganismos por 1 mm3 , con parámetro λ = 15 , cuya distribución de


probabilidad, llamada de Poisson, reemplazando en (6), es:
8
Docente: Mg. Violeta Alicia Nolberto Sifuentes Lima, 29/05/2023
UNMSM-EP GENETICA Y BIOTECNOLOGIA SEM.: 2023-I
Asignatura: Fundamentos de Estadística

e −15 15 x
P( X = x) = , x = 0,1, 2, 3, 4, ...........
x!
Con E ( X ) = 15 y V ( X ) = 15

La distribución de probabilidad de esta v.a., en su forma tabular (para los 22 primeros valores de la
v.a.) y su gráfica son:

x 0 1 2 3 4 5 6 7 8 9 10
3E- 3E- 0,000 0,000 0,001 0,004 0,010 0,019 0,032 0,048
P( X = x) 07 5E-06 05 2 6 9 8 4 4 4 6

x 11 12 13 14 15 16 17 18 19 20 21
0,066 0,082 0,095 0,102 0,102 0,096 0,084 0,070 0,055 0,041 0,029
P( X = x) 3 9 6 4 4 0 7 6 7 8 9

Gráfico Nº 4: X ~ P(15)

Usando los procedimientos pertinentes, los resultados son:

1. P( X = 10) =

2. P( X ≥ 15) =

3. En este caso el parámetro es proporcional a la longitud del intervalo (5 mm3 ), por tanto λ = 75

P ( X < 61) = P ( X ≤ 60) =

9
Docente: Mg. Violeta Alicia Nolberto Sifuentes Lima, 29/05/2023

También podría gustarte