Está en la página 1de 14

Concepto de aleatorio y axiomas básicos de probabilidad:

Concepto de aleatorio: En la naturaleza y dada la posición como observador


de la misma que tiene el ser humano, existen fenómenos que se llaman aleatorios.

“El que sean aleatorios, significa simplemente que no es posible predecir con
entera exactitud sus resultados”.

Debemos notar que el que un fenómeno sea aleatorio no necesariamente es una


propiedad del fenómeno mismo, sino de la posición relativa del observador.
Familias de distribuciones:

Distribución Bernoulli: Un ensayo Bernoulli es un experimento


probabilístico que puede tener sólo dos resultados posibles, éxito ( x=1) y fracaso (
x=0) y en el cual la probabilidad de éxito es “ p” Nosotros nos referimos a “ p” como el
parámetro de la distribución Bernoulli.

Ejemplo: De un ensayo Bernoulli es la inspección de un elemento aleatorio de


una línea de producción y los posibles resultados del elemento son aceptable o
defectuoso.

El ensayo Bernoulli es la base de otras distribuciones discretas, tales como


Binomial, Geométrica y Binomial Negativa. El parámetro p de la distribución
Bernoulli, 0<p<1.

Concepto Fórmula (A mano)

Función de probabilidad: fx( x ; p)=P( X=x )= p x (1−p)1− x .


con x=0,1 0 ≤θ ≤ 1

Esperanza E( X)= p

Varianza Var ( X )= p (1− p)

Distribución Binomial: Surge de contar en número de éxitos en “n”


repeticiones independientes de un experimento Bernoulli, es decir, aquel en el cual
hay solo dos resultados posibles, llamados éxito y fracaso, y siendo p la
probabilidad de obtener un éxito. Cuando n=1, la distribución resultante se llama
distribución de Bernoulli.

Concepto Fórmula (A mano)

Función de probabilidad:
f ( x )=P ( X =x ; n , p )= n p x q n−x
()x
En el Intervalo I ={0,1, … , n }(x), y con q=1− p
Esperanza E( X)=np

Varianza Var ( X )=npq

Ejemplo: La probabilidad de que cierta clase de componente sobreviva a una


prueba de choque es de 3/ 4. Calcule la probabilidad de que sobrevivan
exactamente 2 de los siguientes 4 componentes que se prueben.

o Solución: Sea X el número de componente que sobreviven, entonces a X la


podemos ver como una variable binomial de parámetros n=4 y p=3 /4 [X ∼
Bin(4 , 3/4)], dado que se puede ver como la suma de estos cuatro ensayos
de dos posibles resultados sobrevivir y no sobrevivir.

o Formula P ( X=2 )= ( 42)(.75) (.25)


2 4−2
=27 /128

Ejemplo: Un paciente que padece una rara enfermedad de la sangre tiene 0.04 de
probabilidad de recuperarse. Si se sabe que 1000 personas contrajeron esta
enfermedad, ¿cuál es la probabilidad de que sobrevivan menos de 300?

1000 (0.04)300 (1−0.04)1000−300 =1


o Formula P ( X=300,1000,0.04 )=
300 ( )
Distribución Normal:

o Si X ∼ N (0 , 1) entonces P ( μ−2 σ ≤ X ≤ μ+2 σ ) ≈ .95, también


P ( μ−3 σ ≤ X ≤ μ+3 σ ) ≈ .99.
o La densidad normal es de forma acampanada, simétrica alrededor de
a=E( X) .

Concepto Fórmula (A mano)

Función de densidad
2

f ( x ; a , b )=
1 {
e
−(x−a)
2b
2 }
√2 π σ
En el Intervalo I R (X ) =−∞<a< ∞ , b> 0

Esperanza E( X)=a
Varianza Var (X )=b2

Distribución Poisson: Surge en situaciones en las que se cuenta el


número de eventos que suceden en intervalos de tiempo, en la superficie, o en el
espacio. En ocasiones se asocia a la densidad de Poisson con el estudio de
’eventos raros".

Ejemplos: El número de visitas a cierta página web por día. El número de


homicidios que ocurren en una ciudad por día. El número de accidentes en un
tramo de un kilómetro de la carretera.

También la puedes interpretar como una aproximación a la distribución Binomial,


cuando “n → ∞” y “ p →0”, entonces “X ∼ Bin” con esas características se puede ver
también como una variable “X ∼ Pois (λ=np)”.

Concepto Fórmula (A mano)

Función de densidad −λ λk
f ( x )=P ( X =k ) =e
k!
En el Intervalo I {0,1 , … }( x )=λ> 0

Esperanza E( X)=λ

Varianza Var ( X )= λ
Ejemplo: Un paciente que padece una rara enfermedad de la sangre tiene 0.04 de
probabilidad de recuperarse. Si se sabe que 1000 personas contrajeron esta
enfermedad, ¿cuál es la probabilidad de que sobrevivan menos de 300?
Solución: “X ” cuenta el numero de personas que sobreviven. “
X ∼ Bin(n=1000 , p=0.04)”, “X ∼ Pois (λ=1000∗0.04=40)”

P ( x<300 )=P ( X=0 )+ P ( X=1 ) +…+ P ( X =40 )+ …+ P( X =2)

400 −40 401 299


−40 −40 40
¿e +e +…+e
0! 1! 299 !

≈ 1= ppois(299,40)

Comandos en RStudio:

Distribución Soporte P( X =x) Simular k valores


Bernoulli ( p ) 0,1 dbinom(x,1,p) rbinom(k,1,p)
Binomial (n , p) x=0 , … , n dbinom(x,n,p) rbinom(k,n,p)
Normal x=(−∞ , ∞ ) dbinom(x,a,b) rnorm(k,a,b)
“para graficas”
dnorm()
Poisson x={0,1, … } ppoix(x=k, λ) rpois(k, λ)

dbinom(x,n,p)

MAS EN LOS ARCHIVOS: “Untitle2*” “ES_ Ejercicios mios.R”, “ES_ Ejercicios


maestra.R” y “ ES_ Tarea 2.R”
Estadística Descriptiva:

Población (Definición): Se llama Población al conjunto de todos los


elementos de un tipo particular cuyo conocimiento es de nuestro interés.

Muestra (definición): Se llama Muestra a cualquier subconjunto de la


población.

Datos no métricos o cualitativos: Los datos no métricos o cualitativos son


atributos, características, o propiedades categóricas que identifican o describen un
sujeto, estos no admiten una medición numérica.

Datos métricos o cuantitativos: Los datos métricos o cuantitativos si son


contables o medibles numéricamente, tales como, la demanda de trabajo, el nivel
de ozono en la atmosfera, etc.

Estadística Descriptiva (Definición): La parte de la estadística que


resume y describe a la totalidad de individuos de una población o muestra se
llama Estadística Descriptiva

Escalas de Medición:

1. ESCALAS DE MEDIDA CUALITATIVAS O NO METRICAS:


a. Escala nominal o categoría: En esta escala podemos usar n
́umeros para etiquetar o identificar a los sujetos u objetos, pero no
hay una relación de orden. Por ejemplo, el número que se le asigna
al sexo de una persona.
b. Escala ordinal: Las variables pueden ser ordenadas o clasificadas
con escalas ordinales en relación a la cantidad del atributo poseído.
Por ejemplo, el nivel de satisfacción de una persona sobre un
producto determinado.
2. ESCALAS DE MEDIDA CUANTITATIVAS O METRICAS:
a. Escala de intervalo: Se pueden medir distancias, el cero es
arbitrario como punto de referencia. Las escalas de intervalo m ́as
son las escalas de temperatura Celsius y Fahrenheit.
b. Escala de razón (proporción): En esta escala podemos hacer todas
las operaciones aritméticas y, es propicia para variables tanto
discretas como continuas.

Estadística Descriptiva para Datos no Agrupados:

Es una función evaluada en X 1 , X 2 ,... , X n (una muestra aleatoria) se llama


estadística. Una estadística es una variable aleatoria porque los datos son
variables aleatorias, y que no depende de parámetros desconocidos. Depende
solo de los datos; dados los datos, el valor de una estadística se puede calcular.

Los estadísticos más comunes de la estadística descriptiva que estudiaremos se


dividen en tres tipos:

1. Medidas Centrales: Media (Promedio), moda y mediana.


2. Medidas de Dispersión: Rango, varianza y desviación estándar.
3. Cuantiles.

Ejemplo (Con mis datos a MANO):

Calcular el promedio, mediana y moda:


1. Promedio: Es x́=1.87.
2+3+1+1+2+0+1+0+5+2+4+0+2+6+5+2+3+2+0+2+1+4+3+2+0+4+2+3+0+2+1+3+
2+3+0+1+2+0+1+3+2+2+1+3+3+4+1+2+0+3+0+1+4+1+3+1+3+4+1+3+1+0+3+0+
0+2+6+3+2+1+4+1+3+0+5+4+3+0+4+2+1+1+2+0+0+1+1+1+2+0+1+1+2+0+4+1+
0+2+0+1

2+3+1+1+0+1+0+ …+0+ 4+1+0+ 2+ 0+1


o Calculado x́= .
100
187
 Simplificando x́= .
100
o Queda x́=1.87..
2. Mediana: Es x́=2.
o Acomodando
x́=0+ 0+0+0+ 0+0+0+ 0+0+0+ 0+0+ 0+0+0+ 0+0+0+ 0+0+0+ 1+1+1+1+1+1+1+1+1+1
2+2
o Calculando x́= .
2
4
 Simplificando x́= .
2
o Queda x́=2.
3. Moda: Es 1 con 25 apariciones.
 Tenemos
x́=0+ 0+0+0+ 0+0+0+ 0+0+0+ 0+0+ 0+0+0+ 0+0+0+ 0+0+0+ 1+1+1+1+1+1+1+1+1+1
o Aparece 21veces el 0.
o Aparece 25 veces el 1.
o Aparece 22 veces el 2.
o Aparece 17 veces el 3.
o Aparece 10 veces el 4.
o Aparece 3 veces el 5.
o Aparece 2 veces el 6.
 El que más aparece es el 1 con 25 apariciones.

Calcule la varianza y desviación estándar:

4. Varianza: Es σ 2=2.255657.
2 1
 Calculando σ = [ (2−1.87 )2 + ( 3−1.87 )2+ …]
n−1
 Queda σ 2=2.255657.
5. Desviación estándar: Es σ =1.501884.
 Calculando σ =√ 2.255657.
 Queda σ =1.501884 .

Ejemplo (Con mis datos en RStudio):

Datos:
2+3+1+1+2+0+1+0+5+2+4+0+2+6+5+2+3+2+0+2+1+4+3+2+0+4+2+3+0+2+1+3+
2+3+0+1+2+0+1+3+2+2+1+3+3+4+1+2+0+3+0+1+4+1+3+1+3+4+1+3+1+0+3+0+
0+2+6+3+2+1+4+1+3+0+5+4+3+0+4+2+1+1+2+0+0+1+1+1+2+0+1+1+2+0+4+1+
0+2+0+1
Datos
x=as.matrix(Datos[,12])
mean(x)#Promedio es1.87
median(x)#mediana es 2
table(x)#moda es 1 que aparece 25 veces
var(x)#varianzza es 2.255657
sd(x)#sd es 1.501884
Rango=max(x)-min(x)#rango es 6
Rango#Rango es 6
Ley de los grandes números:

LEY DE LOS GRANDES NÚMEROS: x 1 , x 2 , … , x k una muestra grande de


Variables Aleatorias Independientes e Idénticamente Distribuidas (iid) ( x 1 , x 2 , … , x k
~iid f (x), k tiende a \infinito). El promedio converge cuando k crece a esperanza
de las variables aleatorias

Ejemplo: Con x 1 , x 2 , … , x k en una Distribución Bernoulli con p=.3, el Promedio


Converge a p=0.3

#usando simulación

p=.6
k=100000
x=rbinom(k,1,p)
mean(x)

Ejemplo: Con x 1 , x 2 , … , x k en una Distribución Binomial con n=15 y p=.5, el


Promedio (Esperanza) es E ( x )=np=15 ( 0.5 )=7.5, por lo que el Promedio Converge
a 7.5 cuando la muestra k crece.

n=15
p=.5
k=10000
Y=rbinom(k,n,p)
mean(Y)

Ley de los grandes números, LGN, Ejemplo: Con x 1 , x 2 , … , x k una


muestra grande de Variables Aleatorias Independientes e idénticamente
distribuidas (iid), ( x 1 , x 2 , … , x k ~iid f (x), k tiende a \infinito). La frecuencia relativa
en el intervalo [a , b] converge a la P(a≤X ≤b)

#mostrarlo por simulación

Ejemplo: Con x 1 , x 2 , … , x k en una Distribución Bernoulli con p=.7, la Frecuencia


Relativa en el intervalo [ 0,1 ) Converge a P ( X ¿ [ 0,1 ) ).
k=100000
p=0.7
x=rbinom(k,1,p)
length(which(x==0))/k#frecuencia relativa de una muestra
dbinom(0,1,p)#probabilidad teorica

Ejemplo: Con x 1 , x 2 , … , x k una muestra grande de Variables Aleatorias


Independientes e idénticamente distribuidas (iid), una Distribución Normal ( 0,1 ) ,
la Frecuencia Relativa en el Intervalo [ 0,2 ) Converge a P ( X ¿ [ 0,2 ) ). Con la
Probabilidad como “P ( 0≤ X <2 )=P ( X <2 ) −P ( X< 0 )”.

k=100000
x=rnorm(k,0,1)
length(which((x<2)&(x>=0)))/k#frecuencia relativa de una muestra
pnorm(2,0,1)-pnorm(0,0,1)#Probabilidad teorica

Ejemplo: Con x 1 , x 2 , … , x k una muestra grande de Variables Aleatorias


Independientes e idénticamente distribuidas (iid), una Distribución Binomial con
n=10 y p=.5, la Frecuencia Relativa en el Intervalo [ 0,3 ) Converge a P ( X ¿ [ 0,3 ) )
cuando k crece. Con la Probabilidad como “ P ( 0≤ X <3 )=P ( X =0 ) + P ( X=1 )+ P( X=2)
”.

k=100000
x=rbinom(k,10,.5)
length(which((x<3)&(x>=0)))/k#frecuencia relativa de una muestra
pbinom(2,10,.5)+pbinom(1,10,.5)+pbinom(0,10,.5)#Probabilidad teórica
sum(dbinom(0:2,10,.5))#Probabilidad teórica BUENA
Histogramas:

Algoritmo:

1. Defina el valor de “k” (puede ser empleado, el entero más cercano a


k =log 2 ( n ) , √ n , etc).
2. Calcular el rango o amplitud (las observaciones suceden sobre algún
intervalo “I =¿ ¿ b−a).
3. Dividimos el rango entre la cantidad de intervalos “k”.
4. Formamos los intervalos cerrados “[]” en los extremos derechos y en los
extremos izquierdos abiertos “()”, considerando la última clase en ambos
extremos cerrada.
5. Calculamos las frecuencias para cada intervalo.
6. Representamos en el eje “X ” los intervalos y en el eje “Y ” las Frecuencias
o Frecuencias Relativas (Frecuencia del Intervalo entre “n”).

Ejemplo (Con mis datos a MANO):

Datos:
0+ 0+0+0+ 0+0+0+ 0+0+0+ 0+0+0+ 0+0+0+ 0+0+ 0+0+0+1+1+1+1+1+1+1+1+1+1+1+ 1+ 1+ 1+1+1+

1. Definimos el valor de “k”, k =10 , 100,1000…


2. Calculamos el rango, con el dato más alto “6” y más bajo “0”, R=6−0,
R=6.
6
3. Dividimos el Rango “R=6” entre la cantidad de intervalos “k =10”, L= ,
10
L=0.6.
4. Formamos los Intervalos:

Intervalo Frecuencia Relativa


[ 0 , L ] =[0,0.6] 21
( L ,2 L ] =¿ 25
( 2 L, 3 L ] =¿ 0
( 3 L , 4 L ] =¿ 22
( 4 L, 5 L ] =¿ 17
( 5 L ,6 L ] =¿ 0
( 6 L ,7 L ]=¿ 10
( 7 L ,8 L ] =¿ 0
( 8 L , 9 L ]=¿ 3
( 9 L ,10 L ] =¿ 2
5. Calculamos las frecuencias para cada intervalo

Intervalo Frecuencia Relativa


[ 0 , L ] =[0,0.6] 21
( L ,2 L ] =¿ 25
( 2 L, 3 L ] =¿ 0
( 3 L , 4 L ] =¿ 22
( 4 L, 5 L ] =¿ 17
( 5 L ,6 L ] =¿ 0
( 6 L ,7 L ]=¿ 10
( 7 L ,8 L ] =¿ 0
( 8 L , 9 L ]=¿ 3
( 9 L ,10 L ] =¿ 2
6. Representamos en el eje “X” los intervalos y en el eje “Y” las Frecuencias
o Frecuencias Relativas (Frecuencia del Intervalo entre “n”).

Histograma
30
25
20
15
10
5
0
[0, 0.6] (0.6, 1.2) (1.2, 1.8) (1.8, 2.4) (2.4, 3) (3, 3.6) (3.6, 4.2) (4.2, 4.8) (4.8, 5.4) (5.4, 6)

Histograma

Ejemplo (Con mis datos en RStudio):

Datos:
0+ 0+0+0+ 0+0+0+ 0+0+0+ 0+0+0+ 0+0+0+ 0+0+ 0+0+0+1+1+1+1+1+1+1+1+1+1+1+ 1+ 1+ 1+1+1+

#Empezar con el histograma

x=as.matrix(Datos[,12])

#1.-k es 10
n=length(x)
k=round(sqrt(n),0)
k

#2.-Rango es 6
R=max(x)-min(x)
R

#3.-R/k es 0.6
L=R/k
L

#4.-

#5.-frecuencia
sort(x)
freq=length(which((x>=min(x)&(x<=min(x)+L))))
freq=length(which((x>=min(x)+L)&(x<=min(x)+2*L)))

freq=c()
con=min(x)
freq[1]=length(which((x>=min(x)&(x<=min(x)+L))))
for(i in 2:10)
{
con=con+L
freq[i]=length(which(((x>con)&(x<=con+L))))
}

#6. Graficar
plot(1:10,freq, type="h")
plot(0:9,freq/100,type="h")

#función directa
hist(x,nclass=10,freq = FALSE)
points(0:9,freq/100,type="h")

También podría gustarte