Está en la página 1de 12

Elementos de Estadística – Estadística Analítica

PROBABILIDAD

cantidad de casos favorables


P(A) =
cantidad de casos posibles

1) TEOREMA DE LA SUMA DE PROBABILIDADES

P(A  B) = P(A)+ P(B) - P(A  B)

2) PROBABILIDAD CONDICIONAL
P(A  B)
P(A/B) =
P(B)

3) TEOREMA DEL PRODUCTO DE PROBABILIDADES

P(A  B) = P(A/B).P(B) = P(B/A).P(A)

4) ESPERANZA MATEMATICA

Sea x una variable aleatoria con función de probabilidad p(x) o f(x):

1)E(X)=  x i. p( x i ) si x es v. a. discreta
+
2)E(X)=  x.f(x).dx
-
si x es v. a. continua

5) DISTRIBUCION DE PROBABILIDAD

A) DISTRIBUCIONES DISCRETAS:

A.1) DISTRIBUCION DE BERNOULLI

 p x(1 - p )1- x para x = 0 y x = 1 ; 0  p  1


p(x)= 
 0 para otros valores de x
donde: E(X) = p ; V(X) = p(1-p)

A.2) DISTRIBUCION BINOMIAL


  n x n-x
   p (1- p ) para x = 0,1,...,n ; 0  p  1
p(x)=   x 
 0 para otros valores de x

r
n x
P(X  r)= Bi(r, p,n)=    p (1- p )
n-x

x
0  

E(X)= np ; V(X) = np(1 - p)

1
Elementos de Estadística – Estadística Analítica

B) DISTRIBUCIONES CONTINUAS:

B.1) DISTRIBUCION NORMAL

1 1
x 
2
f x (x ,  ,  2 ) = e
-
2 2
2 2
Condiciones: x  (-;+ ) ;   (-;+ ) ;  > 0
E(X) =  ; V(X) =  2

La función de distribución de probabilidad acumulada se define como:


x
F(X) =  f(y).dy
-

B.2) DISTRIBUCION NORMAL ESTANDARIZADA

(X -  )
Sea la variable aleatoria: Z=

1  Z2
con función de densidad: f(z)= e 2 para -   Z  +
2

recibe el nombre de Distribución Normal Estandarizada o N(0;1), donde:


E(Z) = 0 ; V(Z) = 1
La función de distribución de probabilidad acumulada está definida por:
z
F(Z  z) =  f(Z).dZ
-

Nota : f(-z) = f(z) (-z) = 1 - (z)

B.3) DISTRIBUCION JI CUADRADO

2
 x  i 
n n
Sea la variable aleatoria: V    i    zi 
2

i  i  i


 1 1 
x
x e para x  0
 
2 2
  
con función de densidad: f x   2  2
2


 0 para x  0

recibe el nombre de función de densidad Ji cuadrado. Donde la letra  representa el número


de términos independientes y recibe el nombre de grados de libertad y:
E(V) =  ; V(V) = 2

2
Elementos de Estadística – Estadística Analítica

B.4) DISTRIBUCION t DE STUDENT

Z
Sea la variable aleatoria: t
V

   1  
  1

 2   
t2  2
f t   1 
 

   2   

recibe el nombre de función de densidad t de Student con  grados de libertad, donde:



E(t) = 0 para  > 1 V(t)= para  > 2
 -2
t ;1-


-
f(t).dt = 1-  = F( t ;1- )= P( t   t  ;1- )

B.5) DISTRIBUCION F DE SNEDECOR

U
Sea la variable aleatoria: 1 donde U ~21 y V ~22
F=
V
2

  ( 1 +  2 ) / 2    1 
1 / 2
F
1 / 2  1
g(F ) = .  . para F > 0
  1 / 2    2 / 2    2   1 
 1 + 2  / 2

1 +  F 
 2 

recibe el nombre de función de densidad F de Snedecor con 1 y 2 grados de libertad, donde:


 2 ( + - 2)
2

E(F)= 2 para 2 > 2 V(F)= 2 1 2 2 para 2 >4


2 - 2 1(2 - 2) (2 - 4)
F (  , );1-
1 2


0
g(F).dF = 1-  = G( F ( 1 ,2 );1- )= P( F ( 1 ,2 ) < F ( 1 ,2 );1- )

3
Elementos de Estadística – Estadística Analítica

E S T A D I S T I C A D E S C R I P T I VA

1) MEDIDAS DE POSICION

A.- MEDIA ARITMETICA ( x )

 xi
* Para n valores observados no agrupados: x =
n

* Cuando los n valores están ordenados en una tabla de frecuencias:


 x 'i f i
x=   xi hi
n

B.- MEDIANA (Me)

Dados n valores ordenados de menor a mayor o de mayor a menor, se define como Me:
 Si n es impar: Me es la observación de la posición (n+1)/2 (PosMe)
 Si n es par: Me es la media aritmética de las observaciones que correspondan a los 2
valores centrales.

Cuando la variable es cuantitativa continua o los datos están agrupados en una tabla de
frecuencias:

 PosMe - F (i-1) 
Mex = L i + c  
 fi 
Donde:
Li: Límite inferior del intervalo mediana.
c: Amplitud del intervalo.
F(i-1): Frecuencia acumulada del intervalo anterior al intervalo mediana.
fi: Frecuencia absoluta del intervalo mediana.

C.- MODO (Md o Mo)

Para variables cuantitativas discretas, el modo es el valor de la variable de mayor frecuencia


simple.
Cuando la variable es cuantitativa continua o los datos están agrupados en una tabla de
frecuencias:
 1 
Mo = L i + c  
 1 +  2 
Donde:
1  f (Max)  f (ant)
 2  f (Max)  f (post)

Li: Límite inferior del intervalo Modal.


c: Amplitud del intervalo Modal.
f(post): Frecuencia absoluta del intervalo posterior al intervalo Modal.
f(ant): Frecuencia absoluta del intervalo anterior al intervalo Modal.
f(Max): Frecuencia absoluta del intervalo Modal.

4
Elementos de Estadística – Estadística Analítica

2) MEDIDAS DE DISPERSION

A.- VARIANZA (sx2)


1  2 (  xi ) 
2

 xi -
2
 Para n valores observados no agrupados: s =
x 
n-1  n 

 Cuando los n valores están ordenados en una tabla de frecuencias:

1  2 (  x i fi ) 
2
sx2 = 
 i i
x f - 
n-1  n 

B.- DESVIO ESTANDAR (sx)

sx = sx2

C.- COEFICIENTE DE VARIACION (C.V.)

sx
C.V.x % = 100
x

5
Elementos de Estadística – Estadística Analítica

ESTADISTICOS MAS EMPLEADOS

A) NORMAL ESTANDAR

x -
Z= ~ N(0;1)
/ n

pˆ - p
Z=  N (0;1)
ˆ
p(1- ˆ
p)/n

p̂ - p
Z=  N (0;1)
p(1- p)/n

Z
X 1  X 2    1  2 
~ N  0;1
 12  22

n1 n2

 pˆ1  pˆ 2    p1  p2   N x1 x x x
Z  0;1 pˆ1  ; pˆ 2  2 ; pˆ  1 2
1 1  n1 n2 n1  n2
pˆ 1  pˆ    
 n1 n2 

Z
 pˆ1  pˆ 2    p1  p2   N  0;1
pˆ1 1  pˆ1  pˆ 2 1  pˆ 2 

n1 n2

B) t DE STUDENT
x 
t ~ t n 1
sX
n

 x  x    1  2  ~ t
t 1 2 s2

 n1  1 s12   n2  1 s22
 n1  n2  2 a
1 1 n1  n2  2
sa 
n1 n2

6
Elementos de Estadística – Estadística Analítica

2
 s12 s22 
 x1  x2    1  2   t   
n n
t     12 2  2
s12 s22  s12   s22 
    
n1 n2  n1    n2 
n1  1 n2  1


  
n 2
n
d i  d i 
d  D 1
 
n
d i  x1i  x2i ; t 
sD
~ t n 1 d= 1
; s 2d =
2
 di - 1
n

n n -1  1 
n  
 

C) JI CUADRADO

(n - 1)sx2
 =2
~  n21
 2

k 2
( - )
 2 =  o i ei   (k2 -1) ; donde ei = n.pi y k = N  clases
i=1 ei

f c
( oij - eij )2
 =
2
  (f2 -1)(c-1) ; donde f = N  filas y c = N  columnas
i=1 j=1 eij

D) F DE SNEDECOR

s12 s12
 12 s 22
F  ~ F( n1 1), ( n 2 1) o F  ~ F( n1 1), ( n 2 1)
s 22  12
 22  22

E) CORRECCIÓN DE TAMAÑO DE MUESTRA PARA POBLACIONES FINITAS

N = Tamaño de la población; n0= tamaño de muestra hallado; nf = tamaño de muestra corregido

n0
nf 
n
1 0
N
7
Elementos de Estadística – Estadística Analítica

F) PRUEBA DE WILCOXON DE RANGOS SIGNADOS

T+ = sumando los rangos correspondientes a las diferencias Positivas


T- = sumando los rangos correspondientes a las diferencias Negativas

n  n  1
Suma total de rangos: T  T T 
2

n  n  1
V . crítico sup.=  V . crítico inf .
2

G) PRUEBA DE MANN WHITNEY

n
T1   ri ; siendo ri los rangos de la muestra de menor tamaño
i 1

n1  n1  1
U  T1 
2

V . crítico sup.= n1  n 2  V . crítico inf .

8
Elementos de Estadística – Estadística Analítica

ANALISIS DE REGRESION

a) Estimación de la ecuación de la regresión

yˆi = a + bxi ecuación de regresión estimada

a.1) Estimación de  y 

xi yi -
 xi   yi 
 xi - x  yi - y  n n.xi yi -( xi )(  yi )
b= = =
 xi - x 
2 2 2
(  xi) n.xi2 -( xi )
xi2 -
n
a= y - bx

a.2) Estimación de σ2

1    yi     xi  
2 2
2
s =   yi -
2
- b   xi -
2 2

e
n-2  n  n 
  
2 n.s e2 s e2
ˆ
Vb = s = =
n  xi2 -   xi    xi 
b 2 2

 xi -
2

b) Estimación por intervalo de confianza

b.1) Para 
b-
t= ~ t (n-2)
sb2

b.2) Para E(Yi)


Dados n pares de valores (xi; yi), se estiman los parámetros del modelo: Yi =  + xi + ei

 
1 (x 0 - x ) 2 
a + b x 0  t (n - 2);(1- / 2 ) s e2  + 2

 n  x 2 - (  xi ) 
 i 
 n 
a : E stim a d o r d e  ( ˆ ) y b : E stim a d o r d e  ( ˆ )

9
Elementos de Estadística – Estadística Analítica

c) Docimasia de hipótesis
Para 
b-0
t H0 = 2
~ t (n-2)
sb

d) Coeficiente de determinación (R²)

2 
  xi 
2

b  xi - 
2

2
2

b (xi - x )
2
=  n 
R =
  yi  y   yi
2 2
2
y i -
n
e) Intervalo de predicción

 
 1  xn 1  x  
2

Yˆn 1  t n  2;1 2 s 1  
2
n
 n  xi  x  

2

 i 1 
ó

 
 1 (x n  1 - x )
2 
a + b x n  1  t (n - 2 );(1 -  / 2 ) s e2  1  + 
 n (  xi )2 
  xi -
2

 n 

f) Análisis de varianza en Regresión Lineal Simple

Fuentes de G.L. Suma de Cuadrados Cuadrados F


Variación Medios

   xi  
2
SCREG SCREG
Debida a la
1 b   xi 
2 2  
CM REG
Regresión  n  GLREG 1
  ~ FGLREG ;GLRES 
CM RES
 y  a  bxi  SCRES SCRES
2
Residual n-2 i 
GLRES n2

 y 
2

y
i
TOTAL n-1 2

i
n

10
Elementos de Estadística – Estadística Analítica

1
s e2   SC TO T A L  SC R E G 
n2

ANALISIS DE VARIANZA – DISEÑO COMPLETAMENTE ALEATORIZADO

Fuentes de G.L. Suma de Cuadrados Cuadrados F


Variación Medios

Modelo o k 2
SCTRAT
Tratamiento
k-1
 ni  yi  y.. 
i 1
k 1 CM TRAT
k
CM ERROR
Error N-k   n  1 * s
i
2
i sP2 
SCERROR
i 1 N k
TOTAL N-1

sP2 
 n1  1 * s12  ...   nk  1 * sk2
n1  ...  nk  k

Prueba de Kruskal Wallis

k
12 Ri . ²
H  
N ( N  1) i 1 ni
 3( N  1)

Donde:
N es el total de observaciones
Ri. es el rango total de la muestra i

Bajo Ho H   k21

11
Elementos de Estadística – Estadística Analítica
ANALISIS DE CORRELACION

a) Estimación del coeficiente de correlación():

 x1i x2 i -
  x1i   x2i 
  x1i - x1  x2 i - x2  n
ˆ = r = =
   x1i - x1      x2 i - x2  
2 2
   x1i 
2
   x2 i  
2
     x1i -
2
   x2 i -
2

 n   n 

b) Docimasia de hipótesis

r (n - 2)
Para =0: tH0 = 2
~ t (n -2)
(1 - r )
NOTA: Para los fines prácticos el valor del Coeficiente de Determinación (R2) coincide
numéricamente con:
2 2
R =r
c) Coeficiente de correlación de Spearman

6  di2
rS  1 
(n  1) n (n  1)

n: número de diferencias

12

También podría gustarte