Está en la página 1de 12

FUNCION DISTRIBUCION DE PROBABILIDAD

1) ¿Qué es una función de densidad?

En la teoría de la probabilidad, la función de densidad de


probabilidad, función de densidad, o, simplemente, densidad de una variable
aleatoria continua describe la probabilidad relativa según la cual dicha variable
aleatoria tomará determinado valor.
La probabilidad de que la variable aleatoria caiga en una región específica del
espacio de posibilidades estará dada por la integral de la densidad de esta
variable entre uno y otro límite de dicha región.
La función de densidad de probabilidad (FDP o PDF en inglés) es positiva a lo
largo de todo su dominio y su integral sobre todo el espacio es de valor unitario.

Una función de densidad de probabilidad caracteriza el comportamiento


probable de una población en tanto especifica la posibilidad relativa de que una
variable aleatoria continua X tome un valor cercano a x.

Una variable aleatoria X tiene densidad f, siendo f una función no-negativa


integrable de Lebesgue, si:

b
P [ a ≤ X ≤ b ]=∫ f ( x )dx
a

Por lo tanto, si F es la función de distribución acumulativa de X, entonces:

F(x) = ∫ f (u ) du ,
−∞

y (si f es continua en x)

d
f ( x )= f(x).
dx

Ejemplo 1
A partir de la función de densidad de probabilidad f(x), calcular P(1 ≤ X ≤ 3)
Solución:

En este problema, nos piden calcular P(1 ≤ X ≤ 3). Y con la función de


probabilidad de una variable aleatoria continua, las probabilidades se calculan
mediante el área bajo la curva, por ello:

Graficamos la función f(x) para que se vea mucho mejor:

Como queremos calcular la probabilidad de que nuestra variable aleatoria


discreta X tome un valor entre 1 y 3, entonces sombreamos el área bajo la
función f(x) en ese intervalo:

Solo nos queda calcular el valor del área sombreada y en este caso se puede
realizar de 2 formas diferentes: mediante la fórmula del rectángulo y mediante la
integral definida de f(x) desde x igual a 1 hasta 3.
Con áreas:
Con integrales:

Ejemplo 2
El jefe de recursos humanos de una empresa realiza un test de diez ítems a los
aspirantes a un puesto, teniendo en cada ítems cuatro posibles respuestas, de las
que sólo una es correcta. Suponiendo que los aspirantes teniendo la misma
probabilidad de responder. Se pide hallar las probabilidades para el aspirante:

a) Conteste todos los ítems mal


b) Conteste al menos cuatro ítems bien
c) Conteste entre cuatro y seis ítems bien
d) Conteste todos los ítems bien
e) Conteste menos de tres ítems bien

Solución:
Sea X = "contestar ítems bien en el test", la variable sigue una distribución binomial
1 10
n = 10 , p =
4
= 0,25 , b(10, 0,25) , P(X = k) = ⟨ ⟩
k
.0,25k .0,7510−k k 0,1, ,10

a) P(X = 0) = ⟨ 100⟩ .0,250.0,7510= 0,250.0,7510 = 0,0563


b) P(X ≥ 4) ¿ 1 - P(X < 4) ¿ 1 - P(X ¿ 0) + P(X ¿ 1) + P(X ¿ 2) + P(X ¿ 3) =
¿1 – [(100 ).0,25 .0,75 +(101 ).0,25 .0,75 +(102 ). 0,25 .0,75 +(103 ). 0,25 .0,75 ] ¿
0 10 1 9 2 8 3 7

¿ 1 – [0,0563 + 0,1877 0,2816 0,2503] = 0,2241

c) P(4 ≤ X ≤ 6) ¿P(X ¿ 4 ) + P(X ¿ 5) + P(X ¿ 6) ¿

¿ 10 .0,254 .0,756 + 10 . 0,255.0,755+ 10 .0,256 .0,754 =¿0,1460+0,0584+ 0,0162¿0,2206


( )
4 ( )
5 6( )

2 ¿Qué es una Variable Aleatoria?

Una variable aleatoria es una función que asigna un valor, usualmente


numérico, al resultado de un experimento aleatorio. Por ejemplo, los posibles
resultados de tirar un dado dos veces: (1, 1), (1, 2), etc. o un número real (la
temperatura máxima medida a lo largo del día en una ciudad concreta).

Ejercicio 1. Dada la variable aleatoria discreta X, cuya función de probabilidad


viene definida por

P(X = x) = kx, x = 1, 2, ..., 5

a) Calcular el valor de la constante k

b) Calcular P(X > 2)

c) Calcular E[X] y V ar[X].

d) Calcular E[Y] si Y = 2X + 5

Solución:

a) Como P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = 1, se tiene que

k + 2k + 3k + 4k + 5k = 1

1
15k = 1 ⇒ k =
15

3 4 5 4
b) P(X > 2) = + + =
15 15 15 5
1 2 3 4 5 11
c) E[X] = 1 x +2 x + 3 x + 4 x +5 x =
15 15 15 15 15 3

Para calcular la varianza aplicamos Var[X] = E[ X 2 ] − E[X]2, donde

1 2 3 4 5
E[ X 2 ] = 12 x +22 x +3 2 x +4 2 x +52 x =15
15 15 15 15 15

11 14
y por tanto Var[X] = 15 – ( )2=
3 9

11
d) E[Y] = 2E[X] + 5 = 2 x + 5 = 12,33
3

14
Var[Y] = 4Var[X] = 4 × = 6,22
9

Ejercicio 2. Dada la variable aleatoria X, cuya función de densidad es

a) Obtener k.
b) Dibujar la función de densidad.
c) Calcular la probabilidad P(X < 0,3).
d) Obtener la media y la varianza de X.
e) Obtener la media y la varianza de la variable Y = 3X − 1.
f) Obtener la media y la varianza de la variable Z = 3 X 2 .
Figura 2.1 Función de densidad del ejercicio 2

a) Para que f sea una función de densidad debe cumplir f(x) ≥ 0 y ∫ f (x)dx¿
−∞

1. Según la primera k > 0 y según la segunda

por tanto k = 3/2.

b) Se muestra en la figura 2.1


3 ¿Qué son Pruebas no paramétricas?
Las pruebas no paramétricas, también conocidas como pruebas de
distribución libre, son las que se basan en determinadas hipótesis, pero lo datos
observados no tienen un organización normal. Las hipótesis son estrictas. Las
observaciones deben de ser independientes.
Las pruebas o técnicas no paramétricas engloban una serie de pruebas
estadísticas que tienen en común la ausencia de asunciones acerca de la ley de
probabilidad que sigue la población de la que ha sido extraída la muestra. Así,
estas técnicas se aplican cuando no sabemos si la población de la cual se extrae
la muestra es normal o aproximadamente normal.
Ejercicio 1 Métodos no paramétricos
Una agencia publicitaria está investigando a qué tipo de avisos le prestan más
atención los adolescentes. Se observan a 11 niños, a 6 se les muestra avisos
sobre comida y a los 5 restantes se les muestra avisos sobre bebidas. Todos los
avisos tienen duración similar. Se registra el tiempo de atención (en segundos) de
los 11 niños.
a) Establezca las hipótesis de interés
Solución: La agencia está explorando acerca de la duración de la atención de los
adolescentes y quiere saber a qué tipo de avisos le prestan más atención, pero
no tenemos ninguna información a priori sobre cuál de los dos tipos de avisos son
los preferidos, por lo tanto planteamos la hipótesis bilateral y le podremos
contestar a agencia si hay o no diferencias entre ellos.
Ho: la distribución del tiempo de atención que prestan los adolescentes a
avisos sobre comida es igual a la distribución de los avisos de bebidas
H1: la distribución del tiempo de atención que prestan los adolescentes a
avisos sobre comida es distinta a la distribución de los avisos de bebidas
o
Ho: mediana del tiempo de atención que prestan los adolescentes a avisos
sobre comida es igual a la mediana de los avisos de bebidas
H1: mediana del tiempo de atención que prestan los adolescentes a avisos
sobre comida es distinta a la mediana de los avisos de bebidas

b) Use la salida de SPSS para reproducir lo que pueda de los cálculos que hace SPSS.
Solución: Para la hipótesis de interés usamos el test de Wilcoxon para
muestras independientes es decir el "Test de suma de rangos de
Wilcoxon".

Primero ordenamos los datos, sin importar el grupo:

SPSS considera el estadístico W de Wilcoxon, a la suma menor de los


rangos en este caso 19 que corresponde a la suma de los rangos de las
bebidas.
Es test estadístico aproximado Z se construye a partir de W, la media y la
desviación estándar:

5 x 12 √5 x 6 x 12 = 5,477
Media: μW = = 30 Desviación estándar: σ W =
2 12

19−30
Test Z aproximado: z = = - 2,008
5,477
El resultado es igual al de la tabla ya que en este caso no hay empates y
no es necesario hacer corrección.

La sig. asintótica (bilateral) es el valor p bilateral aproximado 0,045 y sale


de las tablas de la distribución normal.

La sig. exacta 0,052 es el valor p para el test exacto que propuso


Wilcoxon.

c) Explique el origen de los dos valores p que da SPSS. ¿Cuál se prefiere?


La “sig. asintótica (bilateral)” es el valor p bilateral aproximado 0,045 y sale
de las tablas de la distribución normal.

La “sig. exacta" 0,052 es el valor p para el test exacto que propuso


Wilcoxon originalmente.

La aproximación Normal funciona bien si el tamaño de la muestra es


grande, pero en general los métodos no paramétricos son usados para
tamaños muestrales pequeños.

En general, vamos a preferir el valor p exacto si es posible obtenerlo. Si no


es posible, usamos el valor p aproximado y esperamos que los dos nos
lleven a la misma conclusión. Lo que NO ocurre en este caso!

d) Informe su análisis y conclusión a la agencia publicitaria.


Solución:
Para la hipótesis en (a) usamos el test de suma de rangos de Wilcoxon
(test para muestras independientes).

Para resolver el test nos basamos en la distribución exacta del estadístico


W=19, la tabla del SPSS nos da un valor p de 0,052

Este valor p es mayor que el nivel de significancia 0,05 por lo tanto


aceptamos Ho y concluimos que no tenemos suficiente evidencia para
decir que hay diferencias significativas en la atención de avisos
publicitarios.
Distribución chi-cuadrada ( 2)

La distribución chi cuadrada es toda una familia de distribuciones. Existe una distribución
chi-cuadrada para cada grado de libertad. La Figura 1 muestra que a medida que se
incrementan los grados de libertad la distribución se vuelve menos sesgada. Las
aplicaciones más comunes de la distribución chi-cuadrada son (1) pruebas de bondad de
ajuste y (2) pruebas de independencia.

A. Pruebas de bondad de ajuste

Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma de
distribución particular planteada como hipótesis. Si el ajuste es razonablemente cercano,
puede concluirse que si existe la forma de distribución planteada como hipótesis.

k 2
( Oi−E i )
χ 2 =∑
Prueba chi-cuadrada i=1 Ei (1.1)
donde k: Número de categorías o clases
k-m-1: grados de libertad donde m es el número de parámetros a estimar.

Ejercicio 2. Prueba para un ajuste uniforme. Juan Pérez, director de Mercadeo de


Alden de Juárez, tiene la responsabilidad de controlar el nivel de existencias para cuatro
tipos de automóvil vendidos por la firma. En el pasado, ha ordenado nuevos automóviles
bajo la premisa de que los cuatro tipos son igualmente populares y la demanda de cada tipo
es la misma. Sin embargo, recientemente las existencias se han vuelto más difíciles de
controlar, y Juan considera que debería probar su hipótesis respecto a una demanda
uniforme. Sus hipótesis son:

H0: La demanda es uniforme para los cuatro tipos de autos.


H1: La demanda no es uniforme para los cuatro tipos de autos.

La Tabla 1.1 muestra la expectativa uniforme para una muestra de 48 autos vendidos
durante el último mes

Tabla 1.1 Registro de Ventas de Alden de Juárez


Tipo de auto Ventas observadas Ventas esperadas
Ka 15 12
Fiesta 11 12
Focus 10 12
Clio 12 12
2 (15−12 )2 ( 11−12 )2 (10−12 )2 (12−12 )2
χ = + + + =1 .17
12 12 12 12
Debido a que no hay parámetros que estimarse el número de grados de libertad es k-1 = 3
grados de libertad. Si Juan deseara probar al nivel del 5%, se encontraría, como lo muestra

la Figura 1.2, que


χ 20 .05 ,3 =7 . 815

Regla de decisión: Norechazarsiχ rSup { size 8{2} } <= 7 . 815 . Rechazarsiχ rSup { size 8{2} } >7 . 815
Como 1.17 < 7.815, la hipótesis de que la demanda no es uniforme no se rechaza.

B.Tablas de contingencia. Una prueba de independencia

La distribución chi-cuadrada también permite la comparación de dos atributos para


determinar si existe una relación entre ellas.

Ejemplo. Paty Alvarado es la directora de investigación de Plaguicidas de Juárez. En su


proyecto actual Paty debe determinar si existe alguna relación entre la clasificación de
efectividad que los consumidores asignan a un nuevo insecticida y el sitio (urbano o rural)
en el cual se utiliza. De los 100 consumidores a quienes se le aplicó la encuesta, 75 vivían
en zonas urbanas y 25 en zonas rurales. La Tabla 1.2 resume las clasificaciones hechas por
los consumidores.

Tabla 1.2 Tabla de contingencia de Plaguicidas de Juárez


Clasificación Urbano Rural Total
Arriba del promedio 20 11 31
23.3 7.75
Promedio 40 8 48
36 12
Debajo del promedio 15 6 21
15.8 5.25
Total 75 25 100

H0: La clasificación y la ubicación son independientes.


H1: La clasificación y la ubicación no son independientes.
2 2
2 ( 20−23 .3 ) ( 11−7.75 ) ( 40−36 ) ( 8−12 )
2 2
(15−15. 8 )2 ( 6−5.25 )2
χ= + + + + +
23.3 7 .75 36 12 15. 8 5. 25
=3.76
La prueba tiene (r – 1)(c – 1) = (3 -1)(2 – 1) = 2 grados de libertad. Si Paty fija  = 10%,
χ 20 .10 , 2 =4 .605 , la hipótesis nula no se rechaza.

También podría gustarte