Está en la página 1de 20

5/04/2024

DISTRIBUCIONES DE PROBABILIDAD

Una distribución de
frecuencia muestra las
frecuencias de ocurrencia
de las observaciones en un
conjunto de datos.

“Distribución de frecuencia
empírica”

“Distribución de
probabilidad teórica”
(determinado a partir de modelo
matemático)

Modelo teórico para calcular la probabilidad de ocurrencia de un evento.


cvilchezp

La distribución de probabilidad muestra cómo el conjunto de todos los posibles


eventos mutuamente exclusivos está distribuido y pueden ser presentados como
una ecuación, una gráfico o una tabla.

Se puede considerar a distribución de probabilidad como el equivalente teórico


de una distribución de frecuencia relativa empírica, con su propia media y varianza.

Una variable, la cual puede Una distribución de probabilidad


tomar diferentes valores con comprende todos los valores que
probabilidades dadas, se la variable aleatoria puede
denomina VARIABLE ALEATORIA tomar, con sus probabilidades
(AL AZAR) asociadas.

Existe diferentes distribuciones de probabilidad

DISCRETA CONTINUA
(Finito número de (Infinito número de valores
valores posibles) posibles en un rango de valores)

cvilchezp

1
5/04/2024

Discretas:
Solo toma valores
enteros.
Cuantitativas
Continuas:
Pueden asumir cualquier valor
real dentro de un cierto rango.

Tipos de
Variables
Nominales:
Valores son nombres o
códigos sin relación
Cualitativas intrínseco entre ellos

Ordinales:
Valores son nombres o
códigos con relación
intrínseco entre ellos

CONSIDERACIONES IMPORTANTES

Los parámetros importantes que describen una variable aleatoria:


media (Esperanza, E) y la varianza.
Esperanza ̴ Media

E(y) = μy

Var(y) = σ2y = E[(y – uy)2] = E(y2) – uy2

σ = Vσ2

cvilchezp

2
5/04/2024

Reglas necesarias a tomar en cuenta cuando una constante


es multiplicado o adicionado a una variable, o la suma, entre
si, de dos variables:

1. La esperanza de una constante c es el valor de la misma constante:


E(c) = c

2. La esperanza de la suma de una constante c a una variable y es la suma de la


constante y la esperanza de la variable y:
E(c + y) = c + E(y)

3. La esperanza del producto de una constante c y una variable y es igual al


producto de la constante y la esperanza de la variable y:
E(cy) = cE(y)

4. La esperanza de la suma de dos variables x y y es la suma de las esperanzas


de las dos variables:
E(x + y) = E(x) + E(y)

cvilchezp

5. La varianza de una constante c es 0: Var(c) = 0

6. La varianza del producto de una constante c y una variable y es el


producto de la constante al cuadrado multiplicado por la varianza
de la variable y: Var(cy) = c2 Var(y)

7. La covarianza de dos variables x y y: Cov(x,y) = E[(x – ux) (y – uy)]


= E(xy) – E(x)E(y)
= E(xy) - uxuy
La covarianza es la variabilidad simultanea de dos variables.

8. La varianza de la suma de dos variables es igual a la suma de


las varianzas individuales más el doble de la covarianza:
Var(x+y) = Var(x) + Var(y) + 2Cov(x,y)

cvilchezp

3
5/04/2024

ZT3034 METODOS ESTADISTICOS APLICADOS A LA CIENCIA ANIMAL

VARIABLES ALEATORIAS Y
SUS DISTRIBUCIONES

Carlos Vílchez Perales, Ph.D.


Profesor Principal - Nutrición

www.lamolina.edu.pe cvilchezp

DISTRIBUCIONES DE PROBABILIDAD DISCRETA

Una distribución de probabilidad discreta liga o le asigna una probabilidad a


cada posible evento mutuamente excluyente definido por una variable
aleatoria discreta.

Debe satisfacer:

1. p(xi) > 0; xi ϵ (Rx, Conjunto finito/infinito numerable). (0 < P(x) < 1)

2. Σ p(xi) = 1
(Xi ϵ Rx)

Sea X una variable aleatoria discreta:

p(xi) = (1/2, si xi = 2; 1/3, si xi = 3; 1/6, si xi = 6)


… entonces, p es una correcta función de probabilidad discreta (puntual) en
Rx = [2, 3, 6] porque sus valores NO son negativas y su suma es 1.

cvilchezp

4
5/04/2024

Ejemplo:
Experimento: Lanzar al aire dos monedas. C y S representa, Cara y Sello,
respectivamente. Sea y una variable aleatoria definida como el número de caras en un
lanzamiento de dos monedas. Los posibles resultados son: 0, 1 y 2.

Cuál es la distribución de probabilidad de la variable y?


Evento simple = Posible resultado  4 posibles resultados: CC, CS, SC, SS
Presentado en una Tabla:
Evento Simple Resultado y P(y)
E1 CC 2 1/4
E2 CS 1 1/4
E3 SC 1 1/4
E4 SS 0 1/4
De la Tabla se puede observar que:

La probabilidad que y = 2 es P(y=2) = P(E1) = ¼

La probabilidad que y = 1 es P(y=1) = P(E2) + P(E3) = ¼ + ¼ = ½

La probabilidad que y = 0 es P(y=0) = P(E4) = ¼


cvilchezp

Entonces, la distribución de probabilidad de la variable y es:

y P(y)
0 ¼
1 ½
2 ¼

Condiciones:

1.- 0 < P(y) < 1

2.- Σ (todo y) = P(y=0) + P(y=1) + P(y=2) = ¼ + ½ + ¼ = 1

cvilchezp

5
5/04/2024

Una distribución probabilidad acumulada F(yi) describe la probabilidad


que una variable y tiene valores menos que o igual a un valor yi
F(yi) = P(y < yi)

Para el ejemplo del lanzamiento al aire de dos monedas, cuál es la


distribución acumulada???

y P(y) F(y)
0 ¼ ¼
1 ½ ¾
2 ¼ 4/4

… la probabilidad F(1) = ¾ denota la probabilidad que y (el número de


caras) sea 0 o 1; es decir, que al lanzar dos monedas se tiene al menos
un sello (o no se tiene dos caras)

cvilchezp

DISTRIBUCION BINOMIAL

La distribución de probabilidad binomial describe la distribución de diferentes


valores de la variable y {0, 1, 2, . . ., n} en un total de n experimentos (pruebas).

Características de un experimento binomial:

1. El experimento consiste de n pruebas equivalentes, independientes


entre ellos.
2. Existe solo dos resultados posibles de una prueba simple: SI (S) y NO
(N), o de manera equivalente, 1 y 0.
3. La probabilidad de obtener S es la misma de prueba a prueba,
representado por p. La probabilidad de N se representa por q, de tal
manera que p + q = 1.
4. La variable aleatoria y es el número de éxitos en el total de n pruebas.

cvilchezp

6
5/04/2024

La distribución de la probabilidad de una variable aleatoria y está


determinado por el parámetro y el número de n pruebas:

donde: p = es la p de éxito en una simple prueba.


q = 1 – p = probabilidad de fracaso en una simple prueba.

La Esperanza y la Varianza de una variable binomial:

E(y) = np y Var(y) = σ2 = npq

cvilchezp

La forma de la distribución depende del parámetro p:

• Es simétrica solamente cuando p = 0.5.

• Es asimétrica en todos los otros casos.

n = 8 ; p = 0.5 n = 8 ; p = 0.2

cvilchezp

7
5/04/2024

Ejemplo:

Determinar la distribución de probabilidad del número de terneras en tres


partos consecutivos. Asumir que solo es posible una cría por parto (no
mellizo) y que la probabilidad de sea hembra en un parto es p = 0.5

La variable aleatoria y está definida como el número de terneras en tres


consecutivos partos. Los posibles resultados serían: ; 0, 1, 2, 3 (MMM,
HMM, HHM, HHH)

cvilchezp

Los posibles valores con sus correspondientes probabilidades :


y p(y)
0 3 (0.5)0 (0.5)3 = 0.125
0

1 3 (0.5)1 (0.5)2 = 0.375


1

2
3
2 (0.5)2 (0.51 = 0.375

3
3 (0.5)3 (0.5)0 = 0.125
3

La suma de las probabilidades de todos los posibles valores:


Σi p(yi) = 0.125 + 0.375 + 0.375 + 0.125 = 1 0.4
0.3
Probabilidad

Esperanza: u = E(y) = np = (3)(0.5) = 1.5


0.2
0.1
Varianza: σ2 = var(y) = npq = (3)(0.5)(0.5) = 0.75
0
0 1 2 3
Número deTerneras
cvilchezp

8
5/04/2024

DISTRIBUCION DE POISSON
La distribución Poisson se refiere a cierto procesos que pueden ser descritos
con una variable aleatoria discreta. La letra λ suele representar esa variable
y puede, además, asumir valores enteros x (0, 1, 2, 3, etc.).

Formula:

Donde:
λ = representa la variable aleatoria.
x = Valor específico (ocurrencias)

cvilchezp

A menudo, en lugar del número esperado, se conocen las proporciones


de éxitos la cual es un estimado de la probabilidad de éxitos en una
prueba simple (p). Cuando el valor de p es muy pequeño y el número
total de pruebas (n) es grande, la distribución de Poisson se aproxima a
la distribución binomial.

Una característica de la variable Poisson es que tanto la esperanza


como la varianza son iguales al parámetro λ.

E(x) = μ = λ y Var(x) = σ2 = λ

cvilchezp

9
5/04/2024

En general, la distribución de Poisson se deriva del denominado proceso


de Poisson que se asocia al número de ocurrencias de un suceso A en
una región continua, que puede ser un tiempo , una superficie o un
volumen, cuando la ocurrencia de A en un punto de la región es
independiente a la ocurrencia en otro punto.

El proceso de Poisson presupone principalmente que:

1. El número de eventos que ocurren en regiones disjuntas son


independientes.

2. La probabilidad que un evento ocurra dos o más veces en una


región pequeña es virtualmente cero.

3. El parámetro de la distribución del número de eventos que ocurre


en una región dada es proporcional al tamaño de la región.

cvilchezp

Ejemplo 1:

Un Profesor-Tutor de la Facultad de Zootecnia atiende en promedio a cinco


(5) estudiantes por semana. Cuál es la probabilidad de que en la semana
siguiente atienda solamente a tres (3) estudiantes?

1. Media o promedio de atención por semana = λ = 5 estudiantes.


2. Número de éxitos que suceden = x = 3 estudiantes.

53 * (2.7182)-5
p(x=3) =
3!
125 * 1/(2.7182)5
p(x=3) =
3*2*1

p(x=3) = 0.1404 14.04 %


cvilchezp

10
5/04/2024

Ejemplo 2:

En una población de ratones de laboratorio 2% presentan cuadros de cáncer.


En una muestra de 300 ratones de laboratorio, cuál es la probabilidad de que
más de un (1) ratón tenga cáncer?

1. μ = λ = 300 (0.02) = 6 (Esperado, 2% de 300).


2. p( x > 1).

p(x > 1) = 1 – [p(x =0) + p(x =1)]

60 * (2.7182)-6 _ 61* (2.7182)-6


p(x > 1) = 1 _
0! 1!
p(x > 1) = 1 - 0.00248 - 0.01488 = 0.9826

98.26%
cvilchezp

11
5/04/2024

DISTRIBUCIONES DE PROBABILIDAD CONTINUAS

Relación entre las distribuciones de probabilidad discretas y


continuas

La curva
que define
el área se
denomina:

cvilchezp

Propiedades de una distribución de probabilidad continua:

1. Una distribución de probabilidad continua está definida por una


función de densidad de probabilidad.

2. El área total bajo la función de densidad de probabilidad es 1 (unidad).

3. La probabilidad de que la variable aleatoria continua está entre ciertos


límites es igual al área bajo la función de densidad de probabilidad
entre estos límites.

cvilchezp

12
5/04/2024

Cálculo de probabilidades a partir de la función de densidad de


probabilidad

Si la variable de interés es continua, la probabilidad que ese valor esté en


un intervalo particular está dado por el área relevante bajo la curva de la
función de densidad de probabilidad.
Prob {x0 < x < x1}
Prob {x < x0}

Area = proceso matemático = integración.


Prob {x > x1}
Tablas  Normal, T-Student, Chi-cuadrado, F.

cvilchezp

DISTRIBUCION NORMAL

• La distribución Normal (N), o distribución Gaussiana, es la más


importante de las distribuciones continuas debido a su rol en la
teoría de muestreo.

• Es una distribución teórica.

• Las observaciones hechas sobre una determinada variable tienen


una distribución de frecuencia empírica la cual es similar a una
distribución N.

• La propiedad, común con otras distribuciones continuas, de que


el área bajo la curva que es definida por su función de densidad
de probabilidad es la unidad (1). La distribución N tiene varias
propiedades útiles.

cvilchezp

13
5/04/2024

PROPIEDADES DE LA DISTRIBUCION NORMAL


• La distribución N está descrito completamente por dos parámetros: Media
(μ) y la desviación estándar (DE, σ).

• Es unimodal.

• Es simétrico en relación a su media.

• La media, mediana y moda son todos iguales.

• Si la DE se mantiene constante, un incremento en el valor de la media mueve


la curva horizontalmente hacia la derecha. Una disminución en el valor de la
media mueve la curva horizontalmente hacia la izquierda:

cvilchezp

• Una disminución en la DE hace que la curva se haga más delgada, alta y más
aguda. Un incremento en la DE hace que la curva sea más ancha, pequeña y
aplanada:

• Los límites (μ – σ) y (μ + σ) contienen 68.3 % de la distribución.

• Los límites (μ – 1.96σ) y (μ + 1.96σ) contienen 95 % de la distribución.


Este hecho es a menudo usado en el cálculo de un rango de referencia
(intervalo de referencia).

cvilchezp

14
5/04/2024

• Los límites (μ – 2.586σ) y (μ + 2.58σ) contienen 99 % de la distribución

cvilchezp

AREAS BAJO LA CURVA Y LA DISTRIBUCION NORMAL ESTANDAR (DNS)

Calcular la probabilidad que un valor de la variable, x, sea mayor que x1.

Prob {x > x1}

1. Reconocer que la probabilidad que x tiene un valor mayor que x1 is igual al


área bajo la curva de la distribución N a la derecha de x1.

2. Definir la media y la desviación estándar de la DN (propia): μ y σ.

cvilchezp

15
5/04/2024

3. Convertir esta distribución N en una distribución Normal estándar, la cual


tiene una media de 0 y una desviación estándar de 1. Esta es la distribución
de una nueva variable, z, llamada Desviación Normal Estandarizada (DNE).

En términos generales: Para el caso del ejemplo, la DNE


será:

cvilchezp

Ejemplo 1:

Carrera de caballos de pura sangre:

Distancia recorrida: 1 200 m.

Tiempo promedio en recorrer esa distancia = μ = 75.2 segundos y con una


desviación estándar = σ = 2.2 segundos.

Determinar la probabilidad de que un caballo de carrera llegue a la meta


en menos de 72 segundos??

El valor de z correspondiente a x1 = 72.0 es :

z1 = (72.0 – 75.2) / (2.2) = - 1.45

DNE = Simétrica, 0

cvilchezp

16
5/04/2024

- 1.45  DNE  1.45

De la Tabla de DNE: para z = 1.45, la probabilidad es 0.1471 (dos colas)

Para el caso de ejercicio, solo interesa un lado (inferior) del área total:

0.50 * 0.1471 = 0.0736

Entonces, la probabilidad de que un caballo de carrera


recorra 1 200 m en menos de 72 segundos es
aproximadamente 7 %

cvilchezp

17
5/04/2024

Ejemplo 2:
Asumir una distribución N teórica de pesos de terneros de 6 m de edad
definido con u = 200 kg y σ = 20 kg. Determinar la proporción teórica de
terneros:
a) Más de 230 kg.
b) Menos de 230 kg.
c) Menos de 210 kg y más de 170 kg.

a) Proporción de terneros que pesan más de 230 kg.


Determinar el valor de la variable normal estándar,
z0, que corresponde al valor y0 = 230.

230 - 200
z0 = = 1.50
20

Esto indica que 230 es 1.5 DE por encima de la media

18
5/04/2024

La probabilidad de que y es mayor que y0 es igual a la probabilidad de


que z sea mayor que z0

P(y > y0 ) = P(z > z0 ) = P(z > 1.50) = 0.0668


Respuesta: El porcentaje esperado de terneros que pesan más de 230 kg es 6.68%
b) Proporción de terneros que pesan menos de 230 kg.
Dado que el área total bajo la curva es igual a 1, entonces la probabilidad
de que y tenga un valor menor que y0 = 230 kg es:

P(y < y0 ) = P(z < z0 )


= 1 – P(z < 1.50)
= 1 – 0.0668
= 0.9332

Respuesta: El porcentaje esperado de terneros que pesan menos de 230 kg es 93.32%

c) Proporción de terneros que sus pesos estén entre 170 y 210 kg.

y1 = 170 kg
y2 = 210 kg
210 - 200
170 - 200 z2 = = 0.50
z1 = = - 1.50 20
20

P(y1 < y < y2 ) = P(170 < y < 210) = P( z1 < z < z2 ) = (-1.5 < z < 0.5)

19
5/04/2024

Recordar que la curva es simétrica, lo que significa que:

P(z < - z0 ) = P(z > z0 ) P(z < - 1.5) = P(z > 1.5)

P( z > 1.5) = 0.0668


P(z > 0.5) = 0.3085
Entonces:
P(170 < y < 210) = P(- 1.5 < z < 0.5)
= 1 - [P(z > 1.5) + P(z > 0.5)]
= 1 – (0.0668 + 0.3085)
= 0.6247

Respuesta:
El porcentaje esperado de terneros que pesan entre 170 y 210 kg es 62.47%

20

También podría gustarte