Está en la página 1de 12

Elementos de Estadística – Estadística Analítica

PROBABILIDAD

cantidad de casos favorables


P(A) =
cantidad de casos posibles

1) TEOREMA DE LA SUMA DE PROBABILIDADES

P(A  B) = P(A)+ P(B) - P(A  B)

2) PROBABILIDAD CONDICIONAL
P(A  B)
P(A/B) =
P(B)

3) TEOREMA DEL PRODUCTO DE PROBABILIDADES

P(A  B) = P(A/B).P(B) = P(B/A).P(A)

4) ESPERANZA MATEMATICA

Sea x una variable aleatoria con función de probabilidad p(x) o f(x):

1)E(X)=  x i. p( x i ) si x es v. a. discreta
+
2)E(X)=  x.f(x).dx
-
si x es v. a. continua

5) DISTRIBUCION DE PROBABILIDAD

A) DISTRIBUCIONES DISCRETAS:

A.1) DISTRIBUCION DE BERNOULLI

 p x(1- p )1-x para x = 0 y x = 1 ; 0  p  1



p(x)= 

 0 para otros valores de x
donde: E(X) = p ; V(X) = p(1-p)

A.2) DISTRIBUCION BINOMIAL


 n x
p (1- p ) para x = 0,1,...,n ; 0  p  1
n-x

p(x)=   x 
 0 para otros valores de x

r
n x
P(X  r)= Bi(r, p,n)=    p (1- p )
n-x

0  x

E(X)= np ; V(X)= np(1- p)

1
Elementos de Estadística – Estadística Analítica

B) DISTRIBUCIONES CONTINUAS:

B.1) DISTRIBUCION NORMAL


2
1 1
( x− )
f x (x,  ,  2 ) = e
-
2 2

2 2
Condiciones: x  (-;+ ) ;   (-;+ ) ;  > 0
E(X) =  ; V(X) =  2

La función de distribución de probabilidad acumulada se define como:


x
F(X) =  f(y).dy
-

B.2) DISTRIBUCION NORMAL ESTANDARIZADA

(X -  )
Sea la variable aleatoria: Z=

1 − Z2
con función de densidad: f(z)= e 2 para -   Z  +
2

recibe el nombre de Distribución Normal Estandarizada o N(0;1), donde:


E(Z) = 0 ; V(Z) = 1
La función de distribución de probabilidad acumulada está definida por:
z
F(Z  z) =  f(Z).dZ
-

Nota : f(-z) = f(z) (-z) = 1 - (z)

B.3) DISTRIBUCION JI CUADRADO

2
n
x −  n
Sea la variable aleatoria: V = i  i  i  = i ( zi )
2

 i 


 1 −1 −
x
para x  0
( )

2 2
x e
 2 
con función de densidad: f ( x) =  2  2


0 para x  0

recibe el nombre de función de densidad Ji cuadrado. Donde la letra  representa el número


de términos independientes y recibe el nombre de grados de libertad y:
E(V) =  ; V(V) = 2

2
Elementos de Estadística – Estadística Analítica

B.4) DISTRIBUCION t DE STUDENT

Z
Sea la variable aleatoria: t=
V

( + 1) 
  +1

 2 
  t2 

2
f (t ) = +
( )

 
1
  2  

recibe el nombre de función de densidad t de Student con  grados de libertad, donde:



E(t) = 0 para  > 1 V(t)= para  > 2
 -2
t ;1-


-
f(t).dt = 1-  = F( t  ;1- )= P( t   t  ;1- )

B.5) DISTRIBUCION F DE SNEDECOR

U
Sea la variable aleatoria: 1 donde U ~1 y V ~2
2 2
F=
V
2

  (1 +2 ) / 2
1 / 2
F(
1 / 2 ) −1
 
g(F)= . 1  . para F > 0
 1 / 2  2 / 2  2   1 
(1+2 ) / 2

1+ F 
 2 

recibe el nombre de función de densidad F de Snedecor con 1 y 2 grados de libertad,


 2 (  + - 2)
2

E(F)= 2 para 2 > 2 V(F)= 2 1 2 2 para 2 > 4


2 - 2 1( 2 - 2) ( 2 - 4)
donde: F (  , );1-
1 2


0
g(F).dF = 1-  = G( F ( 1 ,2 );1- ) = P( F ( 1 ,2 ) < F ( 1 ,2 );1- )

3
Elementos de Estadística – Estadística Analítica
ESTADISTICA DESCRIPTIVA

1) MEDIDAS DE POSICION

A.- MEDIA ARITMETICA ( x )

 xi
* Para n valores observados no agrupados: x =
n

* Cuando los n valores están ordenados en una tabla de frecuencias:


 x 'i f i
x= =  xi hi
n

B.- MEDIANA (Me)

Dados n valores ordenados de menor a mayor o de mayor a menor, se define como Me:
❖ Si n es impar: Me es la observación de la posición (n+1)/2 (PosMe)
❖ Si n es par: Me es la media aritmética de las observaciones que correspondan a los 2
valores centrales.

Cuando la variable es cuantitativa continua o los datos están agrupados en una tabla de
frecuencias:

 PosMe - F (i-1) 
Mex = L i + c  
 fi 
Donde:
Li: Límite inferior del intervalo mediana.
c: Amplitud del intervalo.
F(i-1): Frecuencia acumulada del intervalo anterior al intervalo mediana.
fi: Frecuencia absoluta del intervalo mediana.

C.- MODO (Md o Mo)

Para variables cuantitativas discretas, el modo es el valor de la variable de mayor frecuencia


simple.
Cuando la variable es cuantitativa continua o los datos están agrupados en una tabla de
frecuencias:
 1 
Mo = L i + c  
 1 +  2 
Donde:
1 = f (Max) − f (ant)
 2 = f (Max) − f (post)

Li: Límite inferior del intervalo Modal.


c: Amplitud del intervalo Modal.
f(post): Frecuencia absoluta del intervalo posterior al intervalo Modal.
f(ant): Frecuencia absoluta del intervalo anterior al intervalo Modal.
f(Max): Frecuencia absoluta del intervalo Modal.

4
Elementos de Estadística – Estadística Analítica
2) MEDIDAS DE DISPERSION

A.- VARIANZA (sx2)


1  2 (  xi ) 
2

❖ Para n valores observados no agrupados: sx2 = 


 xi - 
n -1  n 

❖ Cuando los n valores están ordenados en una tabla de frecuencias:

1  2 (  x i fi ) 
2

  x i fi -
2
s =
x 
n -1  n 

B.- DESVIO ESTANDAR (sx)

sx = sx2

C.- COEFICIENTE DE VARIACION (C.V.)

sx
C.V.x % = 100
x

5
Elementos de Estadística – Estadística Analítica

ESTADISTICOS MAS EMPLEADOS

A) NORMAL ESTANDAR

x -
Z= ~ N(0;1)
/ n

pˆ - p
Z=  N (0;1)
ˆ
p(1- ˆ
p)/n

p̂ - p
Z=  N (0;1)
p(1- p)/n

Z=
(X 1 − X 2 ) − ( 1 − 2 )
~ N ( 0;1)
 12  22
+
n1 n2

( pˆ1 − pˆ 2 ) − ( p1 − p2 )  N x1 x2 x +x
Z= ( 0;1) pˆ1 = ; pˆ 2 = ; pˆ = 1 2
1 1  n1 n2 n1 + n2
pˆ (1 − pˆ )  + 
 n1 n2 

Z=
( pˆ1 − pˆ 2 ) − ( p1 − p2 )  N ( 0;1)
pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 )
+
n1 n2

B) t DE STUDENT
x −
t= ~ t( n −1)
sX
n

t=
( x1 − x2 ) − ( 1 − 2 ) ~ t
sa2 =
( n1 − 1) s12 + ( n2 − 1) s22
( n1 + n2 − 2 )
1 1 n1 + n2 − 2
sa +
n1 n2

6
Elementos de Estadística – Estadística Analítica

(𝑥̄ 1 − 𝑥̄ 2 ) − (𝜇1 − 𝜇2 )  s12 s22 


2
𝑡= ~𝑡𝜔  + 
 =  12 2  2
n n
𝑠2 𝑠2
√ 1+ 2
𝑛1 𝑛2  s12   s22 
   
 n1  +  n2 
n1 − 1 n2 − 1


( ) 
n 2
n
di   di 
d − D
( )
n
1
 
2
di = x1i − x2i ; t = ; 
1 2 1
~ t( n −1) d= sd = d -
sD n n-1  1 i n 
 
n  

C) JI CUADRADO

(n - 1)sx2
 = 2
~  n2−1
 2

k 2
( - )
 =  o i ei   (k2 -1) ; donde ei = n.pi y k = N  clases
2

i=1 ei

f c 2
( oij - eij )
2=    (f2 -1)(c-1) ; donde f = N  filas y c = N  columnas
i=1 j=1 eij

D) F DE SNEDECOR

s12 s12
 12 s22
F= ~F( n1 −1),( n2 −1) o F= ~F( n1 −1),( n2 −1)
s22  12
 22  22

E) CORRECCIÓN DE TAMAÑO DE MUESTRA PARA POBLACIONES FINITAS

N = Tamaño de la población; n0= tamaño de muestra hallado; nf = tamaño de muestra corregido

n0
nf =
n
1+ 0
N

7
Elementos de Estadística – Estadística Analítica
F) PRUEBA DE WILCOXON DE RANGOS SIGNADOS

T+ = sumando los rangos correspondientes a las diferencias Positivas


T- = sumando los rangos correspondientes a las diferencias Negativas

+ − n ( n + 1)
Suma total de rangos: T = T + T =
2

n ( n + 1)
V . crítico sup.= − V . crítico inf .
2

G) PRUEBA DE MANN WHITNEY

n
T1 =  ri ; siendo ri los rangos de la muestra de menor tamaño
i =1

n1 ( n1 + 1)
U = T1 −
2

V . crítico sup.= n1  n 2 − V . crítico inf .

8
Elementos de Estadística – Estadística Analítica
ANALISIS DE REGRESION

a) Estimación de la ecuación de la regresión

yˆi = a + bxi ecuación de regresión estimada

a.1) Estimación de  y 

 xi yi -
(  xi )(  yi )
 ( xi - x )( yi - y ) n n.  xi yi -(  xi )(  yi )
b= = =
( xi - x ) 2 (  xi ) n.  xi2 -(  xi )
2 2 2
 xi -
n
a = y - bx

a.2) Estimación de σ2

1  (  yi )  (  xi )  
2 2
2
s =   yi -
2
- b   xi -
2 2

e
n-2  n  n 
  
2 2
n.se se
Vˆ b = sb =
2
=
n  xi - (  xi ) (  xi )
2 2 2

 xi -
2

b) Estimación por intervalo de confianza

b.1) Para 
b-
t= ~ t (n-2)
sb2

b.2) Para E(Yi)


Dados n pares de valores (xi; yi), se estiman los parámetros del modelo: Yi =  + xi + ei

 
1 (x0 - x )
2 
a + bx0  t (n-2);(1- / 2) se2  + 
 n  x 2 - (  xi ) 
2

 
 
i
n
a : Estimador de  ( ˆ ) y b : Estimador de  ( ˆ )

9
Elementos de Estadística – Estadística Analítica
c) Docimasia de hipótesis
Para 
b-0
t H0 = 2
~ t (n-2)
s
b

d) Coeficiente de determinación (R²)

2 (
  xi ) 
2

b  xi - 
2

2
b
2
(
(xi - x )
2

= 
 ) n 
R =
 ( yi − y ) 2 (  yi )
2 2

 yi -
n
e) Intervalo de predicción

 
 1 (x − x)  2

Yˆn +1 tn − 2;1− 2 s 2 1 + + n n +1 
 n 2 

 i =1
( xi − x ) 

ó

 
 1 (xn +1 - x )
2 
a + bxn +1  t (n-2);(1- / 2) se2 1 + + 
(  xi )
2
 n
 
 
2
x -
 
i
n

f) Análisis de varianza en Regresión Lineal Simple

Fuentes de G.L. Suma de Cuadrados Cuadrados F


Variación Medios

 (  xi ) 
2
Debida a la SC REG SC REG
1 b   xi −
2 2  =
Regresión  n  GLREG 1 CM REG
  ~ F( GLREG ;GLRES )
CM RES
( y − a − bxi )
2 SCRES SCRES
Residual n-2 i =
GLRES n−2

( y )
2

TOTAL n-1
y −
2 i
i
n

10
Elementos de Estadística – Estadística Analítica

1
se2 =  SCTOTAL − SCREG 
n−2

ANALISIS DE VARIANZA – DISEÑO COMPLETAMENTE ALEATORIZADO

Fuentes de G.L. Suma de Cuadrados Cuadrados F


Variación Medios

2
Modelo o k SCTRAT
Tratamiento
k-1
 ni ( yi − y.. )
i =1
k −1 CM TRAT
k
CM ERROR
Error N-k  ( n − 1) * s
i
2
i sP2 =
SCERROR
i =1 N −k
TOTAL N-1

s 2
=
( n1 − 1) * s12 + ... + ( nk − 1) * sk2
n1 + ... + nk − k
P

Prueba de Kruskal Wallis

k
12 Ri. ²
H= 
N ( N + 1) i =1 ni
− 3( N + 1)

Donde:
N es el total de observaciones
Ri. es el rango total de la muestra i

Bajo Ho H   k2−1

11
Elementos de Estadística – Estadística Analítica
ANALISIS DE CORRELACION

a) Estimación del coeficiente de correlación():

 x1i x2i -
(  x1i )(  x2i )
 ( x1i - x1 )( x2i - x2 )
ˆ = r = = n
  ( x1i - x1 )    ( x2i - x2 ) 
2 2
 2 (  x1i ) 2
  2 (  x2i )2 
     x1i -    x2i - 
 n   n 

b) Docimasia de hipótesis

r (n - 2)
Para =0: t H0 = 2
~ t (n-2)
(1 - r )
NOTA: Para los fines prácticos el valor del Coeficiente de Determinación (R2) coincide
numéricamente con:
2 2
R =r
c) Coeficiente de correlación de Spearman

6  di2
rS = 1 −
(n − 1) n (n + 1)

n: número de diferencias

12

También podría gustarte