Está en la página 1de 25

Resumen Prob.

y Estadstica Juan Pablo Mart



U.T.N. F.R.M. - 1 - Probabilidad y Estadstica
PROBABILIDAD Y ESTADSTICA PROBABILIDAD Y ESTADSTICA PROBABILIDAD Y ESTADSTICA PROBABILIDAD Y ESTADSTICA

UNIDAD I: Introduccin a la estadstica y al anlisis de datos

Medidas de tendencia central:
Media:

Media muestral:
n
x
n
x x x
x
n
i
i
n

=
=
+ + +
=
1 2 1
L
x

La media aritmtica puede considerarse como el punto de equilibrio de los datos.
Es la mejor medida de tendencia central en conjuntos numricos carentes de valores
extremos.

Media poblacional:
N
x
N
i
i
=
=
1

donde N es el nmero de observaciones (slo cuando ste es finito).

Mediana:

Es el punto donde la muestra se divide en dos partes iguales. En una muestra ordenada
en forma creciente, es el dato central si el nmero de observaciones es impar, o es el
promedio de los dos valores centrales si el nmero de observaciones es par.
( ) ( ) ( )

+
=
+
|

\
| +
Par
2
Impar
~
1 2 / 2 /
2
1
n n
n
x x
x
x
Es la mejor medida de tendencia central en conjuntos numricos donde aparecen valores
extremos.

Moda:

La moda es la observacin que se presenta con mayor frecuencia en la muestra.

Puede existir ms de una moda.
Es la mejor medida de tendencia central para datos cualitativos.

Medidas de variabilidad:
Rango:

( ) ( )
i i
x x r mn mx =

Es una medida sencilla de la variabilidad de los datos. Entre mayor sea el rango, ms
variabilidad tendr la muestra.

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 2 - Probabilidad y Estadstica

Varianza y Desviacin Estndar:

Varianza y Desviacin Estndar muestrales:
( )
1
1
2
2

=
n
x x
s
n
i
i

La varianza es la suma de los cuadrados de las desviaciones respecto de la media de
cada dato, dividido la cantidad de muestras menos uno. El cuadrado elimina las
cancelaciones por signos opuestos.
La Desviacin Estndar es la raz cuadrada positiva de la varianza.
( )
1
1
2

=
n
x x
s
n
i
i

1 n
x

Como el clculo manual de la varianza es tedioso, existe un mtodo abreviado ms
prctico:
1
2
1
1
2
2

\
|

=
=
n
n
x
x
s
n
i
i
n
i
i


Varianza y Desviacin Estndar poblacionales:

( )
N
x
N
i
i
=

=
1
2
2



( )
N
x
N
i
i
=

=
1
2


n
x

Coeficiente de Variacin:

x
s
cv =

El coeficiente de variacin es un nmero que representa a la desviacin estndar como
fraccin de la media. Sirve para comparar la variabilidad de distintas muestras, incluso
con valores y unidades de medida diferentes.

Medidas de posicin:
Cuartiles:

Son los puntos intermedios que resultan de dividir un conjunto ordenado de
observaciones en 4 partes iguales. El primer cuartil (
1
q ) es un valor que tiene
aproximadamente la cuarta parte de las observaciones iguales o por debajo de l y las
tres cuartas partes restantes iguales o por encima. El segundo cuartil (
2
q ) corresponde a

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 3 - Probabilidad y Estadstica
la mediana. El tercer cuartil (
3
q ) tiene aproximadamente las tres cuartas partes de las
observaciones iguales o por debajo de l y la cuarta parte restante iguales o por encima.
Si ms de un valor satisface la definicin de un cuartil, se utiliza el promedio de ellos
como cuartil.

Rango Intercuartlico:

1 3
RIC q q =
El rango intercuartlico es menos sensible a los valores extremos que el rango
total.

Percentiles:

El simo 100 k percentil
k
p es un valor tal, que al menos el % 100k de las
observaciones estn en el valor o por debajo de l, y al menos el ( )% 1 100 k estn en
el valor o por encima de l.

Procedimiento de clculo:
1) Encontrar k n i . = . Si nk no es un entero, entonces i es el siguiente entero ms
grande. Si nk es entero, i es igual a 5 , 0 + nk .
2) El percentil
k
p ser el valor de la muestra ubicada en la posicin i (si la
posicin tiene una parte decimal de 5 dcimos, el percentil es el promedio entre
( ) nk
x y
( ) 1 + nk
x )

Correspondencia:
25 , 0 1
p q = , x p q
~
50 , 0 2
= = ,
75 , 0 3
p q =

Deciles:

Son los puntos intermedios que resultan de dividir un conjunto ordenado de
observaciones en 10 partes iguales.

Correspondencia:
10 , 0 1
p d = ,
20 , 0 2
p d = ,, x q p d
~
2 50 , 0 5
= = = ,,
90 , 0 9
p d =

Representacin grfica:
Diagrama de puntos:

El diagrama de puntos es una grfica muy til para visualizar un conjunto pequeo de
datos; por ejemplo, de unas 20 observaciones. La grfica permite distinguir a simple
vista la tendencia central de los datos y su variabilidad.


Diagrama de tallo y hoja:

El diagrama de tallo y hojas es una buena manera de obtener una presentacin visual
informativa del conjunto de datos donde cada nmero est formado al menos por dos
16,0 16,5 17,0 17,5 18,0

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 4 - Probabilidad y Estadstica
dgitos. Para construirlo, los nmeros se dividen en dos partes: un tallo, formado por
uno o ms de los dgitos principales, y una hoja, la cual contiene el resto de los dgitos.
En general debe escogerse un nmero relativamente pequeo de tallos en comparacin
con la cantidad de observaciones. Lo usual son entre 5 y 20 tallos.
Tallo Hoja Frecuencia
12 1 0 3 3
13 4 1 3 5 3 5 6
14 2 9 5 8 3 1 6 9 8
15 4 7 1 3 4 0 8 8 6 8 0 8 12
16 3 0 7 3 0 5 0 8 7 9 10
17 8 5 4 4 1 6 2 1 0 6 10
18 0 3 6 1 4 1 0 7
19 9 6 0 9 3 4 6

Distribucin de frecuencias:

La distribucin de frecuencias ofrece un resumen ms compacto de los datos.
Primero debe dividirse el rango de los datos en intervalos llamados intervalos de clase
o celdas, los cuales deben tener el mismo ancho cuando sea posible. El nmero de
clases es arbitrario, aunque es una buena opcin aproximarlo a la raz cuadrada de la
cantidad de observaciones.
Intervalo de
clase Conteo Frecuencia
Frecuencia
relativa
Frecuencia
relativa
acumulada
130 110 < x ||||| | 6 0,1375 0,1375
150 130 < x ||||| ||||| |||| 14 0,1750 0,3125
170 150 < x ||||| ||||| ||||| ||||| || 22 0,2750 0,5875
190 170 < x ||||| ||||| ||||| || 17 0,2125 0,8
210 190 < x ||||| ||||| 10 0,2 1

Histograma:

Ojiva:


120 140 160 180 200
20
15
10
5
Frecuencia
Valor de la
Variable
40
35
30
25
60
55
50
45
70
65
120 140 160 180 200
20
15
10
5
Frecuencia
Valor
de la
Variable

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 5 - Probabilidad y Estadstica
Grfico de caja:

Los lmites de la caja son el primer y el tercer cuartil. La lnea media de la caja es la
mediana.

Los lmites del bigote son:
RIC . 5 , 1
1 1
= q b y RIC . 5 , 1
3 2
+ = q b
Luego:
RIC . 3
1 1
= q l y RIC . 3
3 2
+ = q l

Los valores entre
1 1
y l b y
2 2
y l b son valores atpicos y se representan con puntos
rellenos.
Los valores ms all de
2 1
o l l , son valores atpicos extremos y se representan con
puntos vacos.



UNIDAD 2: Probabilidad

Espacio muestral:

Observacin: Cualquier registro de informacin, ya sea numrico o categrico
Experimento: Cualquier proceso que genere un conjunto de datos.
ESPACIO MUESTRAL: Es un conjunto de todos los resultados posibles de un experimento
estadstico. Se representa con la letra S
Punto muestral: Es cada resultado en un espacio muestral.

Eventos:

EVENTO: Es un subconjunto en un espacio muestral.

Complemento:

El complemento de un evento A con respecto a S es el subconjunto de todos los
elementos de S que no estn en A.
Representamos el complemento de A con A o A

Interseccin:

La interseccin de dos eventos A y B , denotada mediante el smbolo B A , es el
evento que contiene a todos los elementos que son comunes a A y a B

120 140 160 180 200
1
b
2
b 1
q
3
q
2
q

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 6 - Probabilidad y Estadstica
Unin:

La unin de dos eventos A y B , denotada mediante el smbolo B A , es el evento
que contiene a todos los elementos que pertenecen a A o a B o a ambos.

Eventos mutuamente excluyentes:

Dos eventos A y B son mutuamente excluyentes o disjuntos si / = B A ; es
decir, si A y B no tienen elementos en comn.

Propiedades:

1. / = / A
2. A A = /
3. / = A A
4. S A A =
5. / = S
6. S = /
7. ( ) / =

A
8. ( ) B A B A =


9. ( ) B A B A =



Conteo de puntos de la muestra:
Regla de la multiplicacin:

Si una operacin se puede llevar a cabo de
1
n formas, y si para cada una de stas se
puede realizar una segunda operacin en
2
n formas, entonces las dos operaciones se
pueden ejecutar en
2 1
.n n formas.

Permutaciones:

Una permutacin es un arreglo de todo o parte de un conjunto de objetos en un espacio
muestral.
El nmero de permutaciones de n objetos distintos es ! n

El nmero de permutaciones de n objetos distintos tomados de r a la vez es:
( )!
!
P
r n
n
r n

= nPr

El nmero de combinaciones de n objetos distintos tomados de r a la vez es:
( )! !.
!
C
r n r
n
r
n
r n

=
|
|

\
|
= nCr




Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 7 - Probabilidad y Estadstica
Probabilidad de un evento:

La probabilidad de un evento A es la suma de los pesos de todos los puntos muestrales en A.
Por tanto:
( ) 1 0 A P ( ) 0 = / P ( ) 1 = S P

Si un experimento puede tener como resultado cualquiera de N diferentes resultados
igualmente probables, y si exactamente n de stos resultados corresponden al evento A,
entonces la probabilidad del evento A es:
( )
N
n
A P =

Reglas aditivas:

Si A y B son cualesquiera dos eventos, entonces:
( ) ( ) ( ) ( ) B A P B P A P B A P + =

Si A y B son dos eventos mutuamente excluyentes, entonces:
( ) ( ) ( ) B P A P B A P + =

Para tres eventos A, B y C :
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) C B A P C B P C A P B A P C P B P A P C B A P + + + =

Probabilidad condicional:

La probabilidad de que un evento B ocurra, cuando se sabe que ya ocurri algn evento A se
llama probabilidad condicional.

La probabilidad condicional de B , dado A es:
( )
( )
( )
( ) 0 si | >

= A P
A P
A B P
A B P

Reglas multiplicativas:

Si en un experimento pueden ocurrir los eventos A y B , entonces:
( ) ( ) ( ) A B P A P B A P | . =


Para tres eventos A, B y C :
( ) ( ) ( ) ( ) C A B P A B P A P C B A P = | . | .

Eventos independientes:

Dos eventos A y B son independientes si y slo si cumplen ALGUNA de las siguientes
condiciones:
1. ( ) ( ) B P A B P = | y ( ) ( ) A P B A P = |
2. ( ) ( ) ( ) B P A P B A P . =


Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 8 - Probabilidad y Estadstica
Teorema de la probabilidad total:

Si los eventos
k
B B B , , ,
2 1
L constituyen una particin del espacio muestral S tal que
( ) 0
i
B P para k i , , 2 , 1 L = , entonces para cualquier evento A de S :
( ) ( ) ( ) ( )

= =
= =
k
i
i i
k
i
i
B A P B P A B P A P
1 1
| .



Regla de Bayes:

Si los eventos
k
B B B , , ,
2 1
L constituyen una particin del espacio muestral S donde
( ) 0
i
B P para k i , , 2 , 1 L = , entonces para cualquier evento A en S tal que ( ) 0 A P :
( )
( )
( )
( ) ( )
( ) ( )
k r
B A P B P
B A P B P
A B P
A B P
A B P
k
i
i i
r r
k
i
i
r
r
, , 2 , 1 para
| .
| .
|
1 1
L = =

=

= =


UNIDAD 3: Variables aleatorias y distribuciones de probabilidad

Concepto de variable aleatoria:

Una variable aleatoria es una funcin que asocia un nmero real con cada elemento del
espacio muestral.
Utilizaremos la letra mayscula X para denotar una variable aleatoria, y su correspondiente
minscula x para uno de sus valores. Cada valor posible de X representa un evento que es un
subconjunto del espacio muestral para el experimento dado.

Si un espacio muestral contiene un nmero finito de posibilidades, o infinito numerable, se
llama espacio muestral discreto.
En cambio, si contiene un nmero infinito no numerable de posibilidades, se llama espacio
muestral continuo.

Distribuciones discretas de probabilidad:

Para la variable aleatoria discreta X , ( ) x f es una funcin de probabilidad, funcin masa
de probabilidad o distribucin de probabilidad, si se cumple para todo x que:
1. ( ) 0 x f
Particin del espacio muestral S
A
1
B
2
B
4
B
n
B
k
B
3
B

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 9 - Probabilidad y Estadstica
2. ( ) 1 =

x
x f
3. ( ) ( ) x X P x f = =

La distribucin acumulada ( ) x F de una variable aleatoria discreta X , con distribucin de
probabilidad ( ) x f es:
( ) ( ) ( ) < < = =

x t f x X P x F
x t
para

Grficas de la distribucin de probabilidad y de la distribucin acumulada


Distribuciones continuas de probabilidad:

Una variable aleatoria continua tiene una probabilidad cero de tomar exactamente cualquiera
de sus valores. Trataremos el clculo de probabilidades para varios intervalos de variables
aleatorias, no importa si incluimos o no alguno de los extremos.

Para la variable aleatoria continua X , ( ) x f es una funcin densidad de probabilidad o
funcin densidad, si se cumple para todo R x que:
1. ( ) 0 x f
2. ( ) 1 . =


dx x f
3. ( ) ( )

= < <
b
a
dx x f b X a P .

Entonces ahora, grficamente, la probabilidad de un intervalo continuo es el rea bajo la curva
de la funcin densidad.

La distribucin acumulada ( ) x F de una variable aleatoria continua X , con funcin densidad
( ) x f es:
( ) ( ) < < = =


x dt t f x X P x F
x
para ). (

De aqu concluimos que:

0 1 2 3 4 5
( ) x f
x
0 1 2 3 4 5
( ) x F
x

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 10 - Probabilidad y Estadstica
( ) ( ) ( ) = < < a F b F b X a P ( )
( )
dx
x dF
x f =

UNIDAD 4: Esperanza matemtica

Media de una variable aleatoria:

Sea X una variable aleatoria con distribucin de probabilidad ( ) x f , la media o valor
esperado de X es para:

X discreta:
( ) ( )

= =
x
x f x X E .
X continua:
( ) ( )


= = dx x f x X E . .

La media o valor esperado es el resultado promedio que podemos esperar del experimento a
largo plazo.

Generalizando para ( ) X g , funcin de variable aleatoria:

X discreta:
( )
( ) [ ] ( ) ( )

= = x f x g X g E
X g
.
X continua:
( )
( ) [ ] ( ) ( )


= = dx x f x g X g E
X g
. .

Varianza:

Sea X una variable aleatoria con distribucin de probabilidad ( ) x f y media , la varianza
de X es para:

X discreta:
( ) [ ] ( ) ( )

= =
x
x f x X E .
2 2 2

X continua:
( ) [ ] ( ) ( )


= = dx x f x X E . .
2 2 2


La raz cuadrada positiva de la varianza, es la desviacin estndar de X .

Frmula alternativa de clculo:
( )
2 2 2
= X E

Tambin se pueden generalizar las frmulas anteriores para ( ) X g funcin de variable aleatoria,
reemplazndola por la variable.



Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 11 - Probabilidad y Estadstica
Propiedades de la media y la varianza:

1. ( ) ctte = = c c c E
2. ( ) ( ) ctte . . = = a X E a X a E
3. ( ) ( ) [ ] ( ) [ ] ( ) [ ] X h E X g E X h X g E =

1. ( ) ctte 0
2
= = c c
2. ( ) ( ) ctte . .
2 2 2
= = a X a X a
3. ( ) ( ) [ ] ( ) [ ] ( ) [ ] X h X g X h X g
2 2 2
+ =

Teorema de Chebyshev:

La probabilidad de que cualquier variable aleatoria X tome un valor dentro de k desviaciones
estndar de la media es al menos
2
1 1 k , es decir:
( )
2
1
1 . .
k
k X k P + < <

UNIDAD 5: Distribuciones de probabilidad discreta

Distribucin binomial:

Un experimento consiste en pruebas repetidas, cada una con dos posibles resultados que se
pueden etiquetar como xito o fracaso.

El proceso de Bernoulli:
Se habla de un proceso de Bernoulli cuando:
1. El experimento consiste en n pruebas que se repiten.
2. Cada prueba tiene dos resultados posibles: xito o fracaso.
3. La probabilidad de un xito ( p ) permanece constante en cada prueba.
4. Las pruebas que se repiten son independientes.

El nmero X de xitos en n experimentos de Bernoulli se denomina variable aleatoria
binomial. La distribucin de probabilidad de sta variable aleatoria discreta se llama
distribucin binomial, y sus valores se denotarn como ( ) p n x b , ; , pues dependen del nmero
de pruebas y de la probabilidad de xito en cada prueba dada.

Un experimento de Bernoulli puede tener como resultado un xito con probabilidad p y un
fracaso con probabilidad p q =1 . Entonces la distribucin de probabilidad de la variable
aleatoria binomial X (el nmero de xitos en n pruebas independientes) es:
( ) n x q p
x
n
p n x b
x n x
, , 2 , 1 , 0 . . , ; L =
|
|

\
|
=



La media y la varianza de la distribucin binomial ( ) p n x b , ; son:
q p n p n . . y .
2
= =




Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 12 - Probabilidad y Estadstica
Distribucin hipergeomtrica:

En el caso de la distribucin binomial, se requiere independencia entre las pruebas. Como
resultado, si se aplica la binomial a tomar muestras de un lote de artculos, el muestreo se debe
efectuar con reemplazo de cada artculo despus de que se observe. Por otro lado, la
distribucin hipergeomtrica no requiere independencia y se basa en el muestreo que se
realiza sin reemplazo.

Experimento hipergeomtrico:
1. Se selecciona sin reemplazo una muestra aleatoria de tamao n de N artculos.
2. k de los N artculos se pueden clasificar como xitos y k N se clasifican como
fracasos.

El nmero X de xitos de un experimento hipergeomtrico se denomina variable aleatoria
hipergeomtrica. La distribucin de probabilidad de sta variable aleatoria discreta se llama
distribucin hipergeomtrica, y sus valores se denotarn como ( ) k n N x h , , ; , pues dependen
del nmero de xitos ( k ) en el conjunto N del que seleccionamos n artculos.

La distribucin de probabilidad de la variable aleatoria hipergeomtrica X (el nmero de xitos
de una muestra aleatoria de tamao n que se selecciona de N artculos de los que k se
denominan xito y k N fracaso) es:
( ) n x
n
N
x n
k N
x
k
k n N x h , , 2 , 1 , 0
.
, , ; L =
|
|

\
|
|
|

\
|

|
|

\
|
=

La media y la varianza de la distribucin hipergeomtrica ( ) k n N x h , , ; son:
|

\
|

= =
N
k
N
k
n
N
n N
N
k n
1
1
y
.
2


Si N n << , podemos tomar la distribucin de artculos de manera binomial, reemplazando en
su media
N
k
p =




Distribucin geomtrica:

Si pruebas independientes repetidas pueden tener como resultado un xito con probabilidad p
y un fracaso con probabilidad p q =1 , entonces la distribucin de probabilidad de la variable
aleatoria X (el nmero de la prueba en el que ocurre el primer xito) es:
( ) ,... 3 , 2 , 1 . ;
1
= =

x q p p x g
x


La media y la varianza de una variable aleatoria que sigue la distribucin geomtrica son:
2
2
1
y
1
p
p
p

= =

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 13 - Probabilidad y Estadstica

Distribucin de Poisson y proceso de Poisson:

Los experimentos que dan valores numricos de una variable aleatoria X , que es el nmero de
resultados que ocurren durante un intervalo dado o en una regin especfica, se llaman
experimentos de Poisson. Un experimento de Poisson se deriva del proceso de Poisson y
posee las siguientes propiedades:
1. El nmero de resultados que ocurren en un intervalo o regin especfica es
independiente del nmero que ocurre en cualquier otro intervalo o regin del espacio
disjunto. Esto quiere decir que el proceso de Poisson no tiene memoria.
2. La probabilidad de que ocurra un solo resultado durante un intervalo muy corto o en
una regin pequea es proporcional a la longitud del intervalo o al tamao de la regin
y no depende del nmero de resultados que ocurren fuera de ste intervalo o regin.
3. La probabilidad de que ocurra ms de un resultado en tal intervalo corto o que caiga en
tal regin pequea es insignificante.

El nmero X de resultados que ocurren durante un experimento de Poisson se llama variable
aleatoria de Poisson y su distribucin de probabilidad se llama distribucin de Poisson. El
nmero medio de resultados se calcula como t . = donde t es el tiempo o regin de inters.

La distribucin de probabilidad de la variable aleatoria de Poisson, que representa el nmero de
resultados que ocurren en un intervalo dado o regin especfica que se denota con t es:
( )
( )
,.... 2 , 1 , 0
!
. .
. ;
.
= =

x
x
t e
t x p
x t



La media y la varianza de la distribucin de Poisson ( ) t x p . ; tienen el valor t .
2
= =

Distribucin de Poisson como forma limitante de la Binomial:
Sea X una variable aleatoria binomial con distribucin de probabilidad ( ) p n x b , ; . Cuando
n , 0 p y np = permanece constante, entonces:
( ) ( ) ; , ; x p p n x b

UNIDAD 6. Algunas distribuciones continuas de probabilidad

Distribucin uniforme continua:

La funcin densidad de la variable aleatoria uniforme continua X en el intervalo [ ] B A; es:
( )

=
caso otro cualquier en 0
1
, ;
B x A
A B
B A x f

La media y la varianza de la distribucin uniforme son:
2
B A+
= y
( )
12
2
2
A B
=

Distribucin normal:

La funcin densidad de la variable aleatoria normal X , con media y varianza
2
, es:

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 14 - Probabilidad y Estadstica
( )
2
2
1
2
. . 2
1
, ;
(



x
e x n
para < < x

Una vez que se especifican y , la curva normal queda determinada por completo.

Propiedades de la curva normal:
1. La moda ocurre en el punto mximo de la curva, o sea en = x
2. La curva es simtrica alrededor del eje vertical = x
3. La curva tiene sus puntos de inflexin en = x , es cncava hacia abajo dentro del
intervalo, y cncava hacia arriba fuera de l.
4. Cuando x , la curva tiende a cero de manera asinttica
5. El rea total bajo la curva es igual a 1

Distribucin normal estndar:
Como sera muy difcil calcular, e incluso tabular todos los valores de la funcin respecto de
cada valor de los parmetros, existe una transformacin de la variable que la estandariza para
poder calcular los valores de la probabilidad con una sola tabla. Dicha transformacin es la
siguiente:


=
x
z

( ) ( ) 1 , 0 ; , ; z n x n =
Los valores de la distribucin para la variable z estn tabulados y son fciles de encontrar.

Aproximacin normal a la binomial:

Si X es una variable aleatoria binomial con media p n. = y varianza q p n . .
2
= , entonces
la forma limitante de la distribucin de:
q p n
p n X
Z
. .
.
=
conforme n , es la distribucin normal estndar ( ) 1 , 0 ; z n . Se puede aproximar siempre
que p no sea cercana a 0 o a 1.

Para realizar sta aproximacin, debemos tener en cuenta que el valor de X a usar, va a ser 0,5
unidades ms grande o ms chico que el valor discreto que estamos buscando, dependiendo de
si es el primer valor o el ltimo del intervalo.

sta aproximacin ser buena siempre que se cumpla alguna de stas condiciones:
que n sea muy grande
que n sea pequeo o grande, pero que p sea razonablemente cercana a
que np y nq sean mayores o iguales a 5

Distribucin exponencial:

La variable aleatoria continua X tiene una distribucin exponencial, con parmetro , si su
funcin densidad est dada por:

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 15 - Probabilidad y Estadstica
( )

>
=

0 0
0
1
x
x e
x f
x


donde 0 >

La media y la varianza de la distribucin exponencial son:
= y
2 2
=

Relacin con el proceso de Poisson:

La distribucin de Poisson se utiliza para calcular cantidades de eventos en un intervalo de
tiempo, espacio, etc. La distribucin exponencial se utiliza para calcular tiempos, espacios, etc.
de esos intervalos.
Ambas se relacionan en base a sus parmetros, donde:

1
=

Distribucin logartmica normal:

La variable aleatoria continua X tiene una distribucin logartmica normal si la variable
aleatoria ( ) X Y ln = tiene una distribucin normal con media y varianza
2
. La funcin
densidad de X resulta que es:
( )
( ) [ ]
( )

<

0 0
0
. . . 2
1 2
2
. 2
ln
x
x e
x
x f
x




La media y la varianza de la distribucin logartmica normal son:
( )
2
2
+
= e x E y ( ) ( ) 1 . Var
2 2
. 2
=
+
e e x

UNIDAD 7: Funciones de variables aleatorias. Combinaciones lineales
de variables aleatorias.

Propiedades Reproductivas:

Distribucin normal:
Si
n
X X X ,..., ,
2 1
son variables aleatorias independientes que tienen distribuciones normales
con medias
n
,..., ,
2 1
y varianzas
2 2
2
2
1
,..., ,
n
respectivamente, entonces la variable
aleatoria

n n
X a X a X a Y . . .
2 2 1 1
+ + + = L

tiene una distribucin normal con media

n n Y
a a a . . .
2 2 1 1
+ + + = L

y varianza

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 16 - Probabilidad y Estadstica

2 2 2
2
2
2
2
1
2
1
2
. . .
n n Y
a a a + + + = L

Distribucin ji cuadrada:
Si
n
X X X ,..., ,
2 1
son variables aleatorias mutuamente independientes que tienen,
respectivamente, distribuciones ji cuadrada con
n
v v v ,..., ,
2 1
grados de libertad, entonces la
variable aleatoria

n
X X X Y + + + = L
2 1


tiene una distribucin ji cuadrada con
n
v v v v + + + = L
2 1
grados de libertad.

Distribuciones normales idnticas estandarizadas:
Si
n
X X X ,..., ,
2 1
son variables aleatorias independientes que tienen distribuciones normales
idnticas con media y varianza
2
, entonces la variable aleatoria

=
|

\
|
=
n
i
i
X
Y
1
2



tiene una distribucin ji cuadrada con n v = grados de libertad.

UNIDAD 8: Distribuciones fundamentales de muestreo y descripcin de
datos.
Muestreo aleatorio:

Para eliminar cualquier tipo de sesgo, se realizan muestreos aleatorios.

Cualquier funcin de las variables aleatorias que forman una muestra aleatoria se llama
estadstica.

Distribuciones muestrales:

Como una estadstica es una variable aleatoria que depende slo de la muestra observada, debe
tener una distribucin de probabilidad.

La distribucin de probabilidad de una estadstica se llama distribucin muestral.

La distribucin muestral de una estadstica depende del tamao de la poblacin, del tamao de
las muestras y del mtodo de eleccin de las muestras.

Distribuciones muestrales de medias:

Consideraremos la distribucin de las medias muestrales X , en muestras de tamao n , de una
poblacin normal con media y varianza
2
. La media y varianza de sta distribucin
muestral de medias sern:
=
X
y
n
x
2
2

=

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 17 - Probabilidad y Estadstica
Si la poblacin no es normal, pero la muestra es grande ( 30 n ), la distribucin de X ser an
aproximadamente normal.

Teorema del lmite central:

Si X es la media de una muestra aleatoria de tamao n tomada de una poblacin con
media y varianza finita
2
, entonces la forma lmite de la distribucin de

n
X
Z


=

conforme n , es la distribucin normal estndar ( ) 1 , 0 ; z n .

La aproximacin normal para X por lo general ser buena si v sin importar la forma de
la poblacin. Si 30 < n , la aproximacin es buena slo si la poblacin no es muy
diferente de una distribucin normal. Si se sabe que la poblacin es normal, la
distribucin de X seguir una distribucin normal exacta, no importa que tan pequeo
sea el tamao de la muestra.




Distribucin muestral de la diferencia entre dos promedios:

Si se extraen al azar muestras independientes de tamao
1
n y
2
n de dos poblaciones,
discretas o continuas, con medias
1
y
2
, y varianzas
2
1
y
2
2
, respectivamente,
entonces la distribucin muestral de las diferencias de las medias,
2 1
X X est
distribuida aproximadamente de forma normal con media y varianza dadas por:
2 1
2 1
=
X X
y
2
2
2
1
2
1 2
2 1
n n
X X

+ =
De aqu
( ) ( )
2
2
2 1
2
1
2 1 2 1
n n
X X
Z


+

=

es aproximadamente una variable normal estndar.

Las consideraciones respecto del tamao de las muestras y la exactitud de la
aproximacin son similares a la distribucin de medias.

Distribucin muestral de la varianza:

Si
2
S es la varianza de una muestra aleatoria de tamao n que se toma de una poblacin
normal que tiene varianza
2
, entonces la estadstica

( ) ( )

=
n
i
i
X X S n
1
2
2
2
2
2
. 1



Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 18 - Probabilidad y Estadstica

tiene una distribucin ji cuadrada con 1 = n v grados de libertad.

Distribucin t de Student:

En muchos escenarios experimentales, el conocimiento de ciertamente no es ms razonable
que el conocimiento de la media de la poblacin .
Una estadstica natural a considerar para tratar con las inferencias sobre es
n S
X
T

=
Para tamaos de muestra menores que 30, es til trabajar con sta distribucin exacta de T , ya
que para 30 n , dicha distribucin no difiere mucho de la normal estndar.

UNIDAD 9: Problemas de estimacin de una y dos muestras.

Inferencia estadstica.

La inferencia estadstica se puede dividir en dos reas principales: estimacin y prueba de
hiptesis.

Mtodos clsicos de estimacin:

Una estimacin puntual de algn parmetro de la poblacin es un solo valor

de una
estadstica

. No se espera que un estimador realice la estimacin del parmetro poblacional


sin error.

Estimador insesgado:

Se dice que una estadstica

es un estimador insesgado del parmetro si:


( ) = =

E

Varianza de un estimador puntual:

Si consideramos todos los posibles estimadores insesgados de algn parmetro , el de
menor varianza se llama estimador ms eficiente de .

Un ejemplo es la comparacin entre la media muestral X y la mediana muestral X
~
. Se
puede demostrar que X es ms eficiente, y por lo tanto mejor estimador de , que X
~
.

Estimacin por intervalo:

Es improbable que incluso el estimador insesgado ms eficiente estime el parmetro
poblacional con exactitud. Hay muchas situaciones en las que es preferible determinar
un intervalo dentro del cual esperaramos encontrar el valor del parmetro. Tal intervalo
se llama intervalo de estimacin.

Existe un intervalo
U L


< < que se calcula a partir de la muestra seleccionada, que
se llama intervalo de confianza, para el cual:

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 19 - Probabilidad y Estadstica

( ) = < < 1

U L
P

donde 1 es el coeficiente de confianza y los extremos
L

y
U

se denominan
lmites de confianza inferior y superior.

Una sola muestra: estimacin de la media.

Intervalo de confianza de

con

conocida:

Si x es la media de una muestra aleatoria de tamao n de una poblacin con varianza
2
conocida, un intervalo de confianza del ( ) % 100 . 1 para est dado por

n
z x
n
z x


. .
2 / 2 /
+ < <

donde
2 /
z es el valor de z que deja un rea de 2 / a la derecha.

Si se utiliza x como una estimacin de , podemos tener una confianza de
( ) % 100 . 1 de que el error no exceder de
n
z

.
2 /


Si se utiliza x como una estimacin de , podemos tener ( ) % 100 . 1 de confianza
de que el error no exceder una cantidad especfica e cuando el tamao de la muestra
es:
2
2 /
.
|

\
|
=
e
z
n



Intervalo de confianza de

con

desconocida:

Si x y s son la media y la desviacin estndar de una muestra aleatoria de tamao n
de una poblacin normal con varianza
2
, desconocida, un intervalo de confianza del
( ) % 100 . 1 para es

n
s
t x
n
s
t x . .
2 / 2 /
+ < <

donde
2 /
t es el valor de t con 1 = n v grados de libertad, que deja un rea de 2 /
a la derecha.

Error estndar de una estimacin puntual.

El error estndar de un estimador es su desviacin estndar.




Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 20 - Probabilidad y Estadstica
Dos muestras: estimacin de la diferencia entre dos medias.

Intervalo de confianza para
2 1

con
2
1

y
2
2

conocidas:

Si
1
x y
2
x son las medias de muestras aleatorias independientes de tamao
1
n y
2
n de
poblaciones con varianzas conocidas
2
1
y
2
2
, respectivamente, un intervalo de
confianza del ( ) % 100 . 1 para
2 1
est dado por

( ) ( )
2
2
2
1
2
1
2 / 2 1 2 1
2
2
2
1
2
1
2 / 2 1
. .
n n
z x x
n n
z x x




+ + < < +

donde
2 /
z es el valor de z que deja un rea de 2 / a la derecha.

Si el intervalo contiene el valor 0, significa que los parmetros comparados no difieren
significativamente.

Intervalo de confianza para
2 1

con
2
2
2
1
= pero desconocidas:

Si
1
x y
2
x son las medias de muestras aleatorias independientes de tamao
1
n y
2
n ,
respectivamente, de poblaciones aproximadamente normales con varianzas iguales pero
desconocidas, un intervalo de confianza del ( ) % 100 . 1 para
2 1
est dado por

( ) ( )
2 1
2 / 2 1 2 1
2 1
2 / 2 1
1 1
. .
1 1
. .
n n
s t x x
n n
s t x x
p p
+ + < < +



donde
p
s es la estimacin de unin de la desviacin estndar poblacional, dada por:
( ) ( )
2
. 1 . 1
2 1
2
2 2
2
1 1
+
+
=
n n
s n s n
s
p

y donde
2 /
t es el valor de t con 2
2 1
+ = n n v grados de libertad, que deja un rea
de 2 / a la derecha.

Si el intervalo contiene el valor 0, significa que los parmetros comparados no difieren
significativamente.

Intervalo de confianza para
2 1

con
2
2
2
1
y desconocidas:

Si
1
x y
2
1
s ,
2
x y
2
2
s , son las medias y varianzas de muestras pequeas independientes
de tamao
1
n y
2
n , respectivamente, de distribuciones aproximadamente normales con
varianzas desconocidas y diferentes, un intervalo de confianza aproximado del
( ) % 100 . 1 para
2 1
es


Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 21 - Probabilidad y Estadstica
( ) ( )
2
2
2
1
2
1
2 / 2 1 2 1
2
2
2
1
2
1
2 / 2 1
. .
n
s
n
s
t x x
n
s
n
s
t x x + + < < +



donde
2 /
t es el valor de t con
( )
( )
( )
( )
(
(

+
(
(

|
|

\
|
+
=
1 1
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
n
n s
n
n s
n
s
n
s
v
grados de libertad, que deja un rea de 2 / a la derecha.

Si el intervalo contiene el valor 0, significa que los parmetros comparados no difieren
significativamente.

Una sola muestra: estimacin de una proporcin:

Un estimador puntual de la proporcin p en un experimento binomial est dado por la
estadstica n X P /

= , donde X representa el nmero de xitos en n pruebas. Estimaremos a


p a travs de p .
Para n suficientemente grande, P

est distribuida de forma aproximadamente normal con


media y varianza
p
P
=

y
n
pq
p
=
2



Si p es la proporcin de xitos en una muestra aleatoria de tamao n , y p q 1 = , un
intervalo de confianza aproximado del ( ) % 100 . 1 para el parmetro binomial p est dado
por

n
q p
z p p
n
q p
z p
.
.
.
.
2 / 2 /
+ < <

donde
2 /
z es el valor de z que deja un rea de 2 / a la derecha.

Cuando n es pequea y la proporcin desconocida p se considera cercana a 0 o a 1, el
procedimiento anterior no es confiable. Para estar seguro, se debe requerir que p n . o q n . sea
mayor o igual que 5.

Si se utiliza p como una estimacin de p , podemos tener ( ) % 100 . 1 de confianza de que
el error no exceder una cantidad especfica e cuando el tamao de la muestra es
aproximadamente:
2
2 /
2
. .
e
q p z
n

=


Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 22 - Probabilidad y Estadstica
Si se utiliza p como una estimacin de p , podemos tener una confianza de al menos
( ) % 100 . 1 de que el error no exceder una cantidad especfica e cuando el tamao de la
muestra es:
2
2 /
2
. 4 e
z
n

=

Dos muestras: estimacin de la diferencia entre dos proporciones:

Deseamos estimar la diferencia entre dos parmetros binomiales
1
p y
2
p . Un estimador
puntual de la diferencia entre las dos proporciones,
2 1
p p est dado por la estadstica
2 1

P P , que est distribuida de forma aproximadamente normal con media y varianza
2 1
2 1
p p
P P
=

y
2
2 2
1
1 1

2
. .
2 1
n
q p
n
q p
P P + =

Si
1
p y
2
p son las proporciones de xitos en muestras aleatorias de tamao
1
n y
2
n ,
respectivamente,
1 1
1 p q = y
2 2
1 p q = , un intervalo de confianza aproximado del
( ) % 100 . 1 para la diferencia de dos parmetros binomiales
2 1
p p est dado por

( ) ( )
2
2 2
1
1 1
2 / 2 1 2 1
2
2 2
1
1 1
2 / 2 1
. .
.
. .
.
n
q p
n
q p
z p p p p
n
q p
n
q p
z p p + + < < +



donde
2 /
z es el valor de z que deja un rea de 2 / a la derecha.

Si el intervalo contiene el valor 0, significa que los parmetros comparados no difieren
significativamente.

Una sola muestra: estimacin de la varianza:

Si
2
s es la varianza de una muestra aleatoria de tamao n de una poblacin normal, un
intervalo de confianza del ( ) % 100 . 1 para
2
es

( ) ( )
2 / 1
2
2
2
2 /
2
2
. 1 . 1

< <
s n s n


donde 2 /
2
y 2 / 1
2
son valores de
2
con 1 = n v grados de libertad, que dejan reas de
2 / y 2 / 1 , respectivamente, a la derecha.

Dos muestras: estimacin de la razn de dos varianzas:

Si
2
1
s y
2
2
s son varianzas de muestras independientes de tamao
1
n y
2
n , respectivamente, de
poblaciones normales, entonces un intervalo de confianza del ( ) % 100 . 1 para
2
2
2
1
es

( )
( )
1 2 2 /
2
2
2
1
2
2
2
1
2 1 2 /
2
2
2
1
, .
,
. v v f
s
s
v v f
s
s

< <
1


Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 23 - Probabilidad y Estadstica

donde ( )
2 1 2 /
, v v f

es un valor de f con 1
1 1
= n v y 1
2 2
= n v grados de libertad que deja
un rea de 2 / a la derecha y ( )
1 2 2 /
, v v f

es un valor similar con 1


2 2
= n v y 1
1 1
= n v
grados de libertad.

UNIDAD 10: Pruebas de hiptesis de una y dos muestras

Hiptesis estadsticas: conceptos generales:

Una hiptesis estadstica es una afirmacin o conjetura con respecto a una o ms poblaciones.

>> La aceptacin de una hiptesis simplemente implica que los datos no dan suficiente
evidencia para rechazarla.
>> El rechazo implica que la evidencia muestral la refuta. El rechazo significa que hay una
pequea probabilidad de obtener la informacin muestral observada cuando, de hecho, la
hiptesis es verdadera.

Hiptesis nula y alternativa:

La Hiptesis nula es la que deseamos probar. Se denota con
0
H y siempre se establece con
una igualdad con el parmetro poblacional.

El rechazo de la hiptesis nula conduce a la aceptacin de una Hiptesis Alternativa, que se
denota con
1
H y se establece con una desigualdad (<, > o simplemente ) respecto del
parmetro poblacional.

Prueba de una hiptesis estadstica:

Estadstica de prueba:
La estadstica de prueba es la variable que utilizaremos para tomar la decisin. sta depender
mucho de los datos, ya que si queremos calcular la media poblacional y tenemos el valor de la
varianza poblacional, utilizaremos Z , en cambio si no poseemos este ltimo valor, utilizaremos
T .

Regiones:
El proceso de inferencia en una prueba de hiptesis no difiere mucho del concepto de intervalos
de confianza. Nuestra regin crtica ser la que est fuera de nuestro intervalo, que ahora se
llamar regin de aceptacin, y el parmetro , parte del nivel de confianza, ser ahora el
nivel de significancia, tambin llamado tamao de la regin crtica. El ltimo valor que
observamos al pasar de la regin de aceptacin a la crtica se llama valor crtico.

Errores:
Existen dos tipos de errores que podemos cometer al aceptar o rechazar la hiptesis nula. stos
son:

Error tipo I:
Es rechazar la hiptesis nula cuando es verdadera.
La probabilidad de que ocurra un error tipo I es .

Error tipo II:
Es aceptar la hiptesis nula cuando es falsa.

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 24 - Probabilidad y Estadstica
La probabilidad de que ocurra un error tipo II es .

Los parmetros y se relacionan inversamente, es decir, cuando uno aumenta, el otro
disminuye. Tambin ambos tienen relacin con el tamao de la muestra, ya que si lo
aumentamos, los valores de y disminuirn.

Propiedades de los errores:
1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de
uno por lo general tiene como resultado un aumento en la probabilidad del otro.
2. El tamao de la regin crtica, y por lo tanto la probabilidad de cometer un error tipo I,
siempre se puede reducir al ajustar el o los valores crticos.
3. Un aumento en el tamao muestral n reducir y de forma simultnea.
4. Si la hiptesis nula es falsa, es un mximo cuando el valor real de un parmetro se
aproxima al valor hipottico. Entre ms grande sea la distancia entre el valor real y el
valor hipottico, ser menor .

Potencia de una prueba:
La potencia de una prueba es la probabilidad de rechazar
0
H dado que una alternativa
especfica es verdadera. sta potencia se calcula como 1 .

Para producir una potencia deseable, se debe aumentar o n .

Pruebas de una y dos colas:

Una prueba de cualquier hiptesis estadstica, donde la alternativa es unilateral, como
0 1 0 1
0 0 0 0
: :
quiz o
: :


< >
= =
H H
H H

se denomina prueba de una sola cola.

Una prueba de cualquier hiptesis alternativa donde la alternativa es bilateral, como
0 1
0 0
:
:

=
H
H

se llama prueba de dos colas.

Uso de valores P para la toma de decisiones:

El valor P es la probabilidad de que el valor del estadstico de prueba calculado con los datos
del problema se encuentre en la regin crtica. Esto se usa para darle menor nivel de
significancia a la decisin tomada, que uno que pudiera haberse preestablecido (generalmente
05 , 0 = o 01 , 0 = ).

El valor P es el nivel (de significancia) ms bajo en el que el valor observado de la estadstica
de prueba es significativo.

Pasos principales de una prueba de hiptesis:

1. Establecer la hiptesis nula
0 0
: = H

Resumen Prob. y Estadstica Juan Pablo Mart

U.T.N. F.R.M. - 25 - Probabilidad y Estadstica
2. Elegir una hiptesis alternativa apropiada
1
H a partir de una de las alternativas:
,
0
<
0
> o
0
.
3. Elegir un nivel de significancia de tamao .
4. Seleccionar la estadstica de prueba apropiada y establecer la regin crtica (Si la
decisin se basa en un valor P , no es necesario establecer la regin crtica).
5. Calcular el valor de la estadstica de prueba a partir de los datos de la muestra.
6. Decisin: Rechazar
0
H si la estadstica de prueba tiene un valor en la regin crtica (o
si el valor P calculado es menor o igual que el nivel de significancia que se desea);
en cualquier otro caso, no rechazar
0
H .

Eleccin del tamao de la muestra para probar medias:

Cuando conocemos el valor en el que se desva la media verdadera de la poblacin respecto de
la media hipottica (valor ), podemos estimar el tamao de la muestra necesario para no
rechazar la hiptesis nula:

( )
2
2 2
.


z z
n
+
=

donde
n
a
z

= y

z
n
z = .

En el caso de una prueba de dos colas:
( )
2
2 2
2 /
.


z z
n
+


Cuando tenemos la diferencia entre dos medias, el tamao de las muestras
2 1
n n n = = ser:

( ) ( )
2
2
2
2
1
2
.



+ +
=
z z
n

También podría gustarte