1 Formul 1cua2021

Elementos de Estadística – Estadística Analítica
PROBABILIDAD
cantidad de casos favorables

P(A) =
cantidad de casos posibles
1) TEOREMA DE LA SUMA DE PROBABILIDADES
P(A  B) = P(A)+ P(B) - P(A  B)
2) PROBABILIDAD CONDICIONAL
P(A  B)
P(A/B) =
P(B)
3) TEOREMA DEL PRODUCTO DE PROBABILIDADES
P(A  B) = P(A/B).P(B) = P(B/A).P(A)
4) ESPERANZA MATEMATICA
Sea x una variable aleatoria con función de probabilidad p(x) o f(x):
1)E(X)=  x i. p( x i ) si x es v. a. discreta
+
2)E(X)=  x.f(x).dx
-
si x es v. a. continua
5) DISTRIBUCION DE PROBABILIDAD
A) DISTRIBUCIONES DISCRETAS:
A.1) DISTRIBUCION DE BERNOULLI
 p x(1- p )1-x para x = 0 y x = 1 ; 0  p  1


p(x)= 

 0 para otros valores de x
donde: E(X) = p ; V(X) = p(1-p)
A.2) DISTRIBUCION BINOMIAL

 n x
p (1- p ) para x = 0,1,...,n ; 0  p  1
n-x

p(x)=   x 
 0 para otros valores de x

r
n x
P(X  r)= Bi(r, p,n)=    p (1- p )
n-x
0  x
E(X)= np ; V(X)= np(1- p)
1
B) DISTRIBUCIONES CONTINUAS:
B.1) DISTRIBUCION NORMAL

2
1 1
( x− )
f x (x,  ,  2 ) = e
-
2 2
2 2
Condiciones: x  (-;+ ) ;   (-;+ ) ;  > 0
E(X) =  ; V(X) =  2
La función de distribución de probabilidad acumulada se define como:

x
F(X) =  f(y).dy
-
B.2) DISTRIBUCION NORMAL ESTANDARIZADA
(X -  )
Sea la variable aleatoria: Z=

1 − Z2
con función de densidad: f(z)= e 2 para -   Z  +
2
recibe el nombre de Distribución Normal Estandarizada o N(0;1), donde:

E(Z) = 0 ; V(Z) = 1
La función de distribución de probabilidad acumulada está definida por:
z
F(Z  z) =  f(Z).dZ
-
Nota : f(-z) = f(z) (-z) = 1 - (z)
B.3) DISTRIBUCION JI CUADRADO
2
n
x −  n
Sea la variable aleatoria: V = i  i  i  = i ( zi )
2
 i 

 1 −1 −
x
para x  0
( )

2 2
x e
 2 
con función de densidad: f ( x) =  2  2


0 para x  0
recibe el nombre de función de densidad Ji cuadrado. Donde la letra  representa el número

de términos independientes y recibe el nombre de grados de libertad y:
E(V) =  ; V(V) = 2
2
B.4) DISTRIBUCION t DE STUDENT
Z
Sea la variable aleatoria: t=
V

( + 1) 
  +1
 2 
  t2 
−
2
f (t ) = +
( )

 
1
  2  
recibe el nombre de función de densidad t de Student con  grados de libertad, donde:


E(t) = 0 para  > 1 V(t)= para  > 2
 -2
t ;1-

-
f(t).dt = 1-  = F( t  ;1- )= P( t   t  ;1- )
B.5) DISTRIBUCION F DE SNEDECOR
U
Sea la variable aleatoria: 1 donde U ~1 y V ~2
2 2
F=
V
2
  (1 +2 ) / 2
1 / 2
F(
1 / 2 ) −1
 
g(F)= . 1  . para F > 0
 1 / 2  2 / 2  2   1 
(1+2 ) / 2
1+ F 
 2 
recibe el nombre de función de densidad F de Snedecor con 1 y 2 grados de libertad,

 2 (  + - 2)
2
E(F)= 2 para 2 > 2 V(F)= 2 1 2 2 para 2 > 4

2 - 2 1( 2 - 2) ( 2 - 4)
donde: F (  , );1-
1 2

0
g(F).dF = 1-  = G( F ( 1 ,2 );1- ) = P( F ( 1 ,2 ) < F ( 1 ,2 );1- )
3
ESTADISTICA DESCRIPTIVA
1) MEDIDAS DE POSICION
A.- MEDIA ARITMETICA ( x )
 xi
* Para n valores observados no agrupados: x =
n
* Cuando los n valores están ordenados en una tabla de frecuencias:

 x 'i f i
x= =  xi hi
n
B.- MEDIANA (Me)
Dados n valores ordenados de menor a mayor o de mayor a menor, se define como Me:
❖ Si n es impar: Me es la observación de la posición (n+1)/2 (PosMe)
❖ Si n es par: Me es la media aritmética de las observaciones que correspondan a los 2
valores centrales.
Cuando la variable es cuantitativa continua o los datos están agrupados en una tabla de
frecuencias:
 PosMe - F (i-1) 
Mex = L i + c  
 fi 
Donde:
Li: Límite inferior del intervalo mediana.
c: Amplitud del intervalo.
F(i-1): Frecuencia acumulada del intervalo anterior al intervalo mediana.
fi: Frecuencia absoluta del intervalo mediana.
C.- MODO (Md o Mo)
Para variables cuantitativas discretas, el modo es el valor de la variable de mayor frecuencia

simple.
Cuando la variable es cuantitativa continua o los datos están agrupados en una tabla de
frecuencias:
 1 
Mo = L i + c  
 1 +  2 
Donde:
1 = f (Max) − f (ant)
 2 = f (Max) − f (post)
Li: Límite inferior del intervalo Modal.

c: Amplitud del intervalo Modal.
f(post): Frecuencia absoluta del intervalo posterior al intervalo Modal.
f(ant): Frecuencia absoluta del intervalo anterior al intervalo Modal.
f(Max): Frecuencia absoluta del intervalo Modal.
4
2) MEDIDAS DE DISPERSION
A.- VARIANZA (sx2)

1  2 (  xi ) 
2
❖ Para n valores observados no agrupados: sx2 = 

 xi - 
n -1  n 
❖ Cuando los n valores están ordenados en una tabla de frecuencias:
1  2 (  x i fi ) 
2
  x i fi -
2
s =
x 
n -1  n 
B.- DESVIO ESTANDAR (sx)
sx = sx2
C.- COEFICIENTE DE VARIACION (C.V.)
sx
C.V.x % = 100
x
5
ESTADISTICOS MAS EMPLEADOS
A) NORMAL ESTANDAR
x -
Z= ~ N(0;1)
/ n
pˆ - p
Z=  N (0;1)
ˆ
p(1- ˆ
p)/n
p̂ - p
Z=  N (0;1)
p(1- p)/n
Z=
(X 1 − X 2 ) − ( 1 − 2 )
~ N ( 0;1)
 12  22
+
n1 n2
( pˆ1 − pˆ 2 ) − ( p1 − p2 )  N x1 x2 x +x
Z= ( 0;1) pˆ1 = ; pˆ 2 = ; pˆ = 1 2
1 1  n1 n2 n1 + n2
pˆ (1 − pˆ )  + 
 n1 n2 
Z=
( pˆ1 − pˆ 2 ) − ( p1 − p2 )  N ( 0;1)
pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 )
+
n1 n2
B) t DE STUDENT
x −
t= ~ t( n −1)
sX
n
t=
( x1 − x2 ) − ( 1 − 2 ) ~ t
sa2 =
( n1 − 1) s12 + ( n2 − 1) s22
( n1 + n2 − 2 )
1 1 n1 + n2 − 2
sa +
n1 n2
6
(𝑥̄ 1 − 𝑥̄ 2 ) − (𝜇1 − 𝜇2 )  s12 s22 

2
𝑡= ~𝑡𝜔  + 
 =  12 2  2
n n
𝑠2 𝑠2
√ 1+ 2
𝑛1 𝑛2  s12   s22 
   
 n1  +  n2 
n1 − 1 n2 − 1

( ) 
n 2
n
di   di 
d − D
( )
n
1
 
2
di = x1i − x2i ; t = ; 
1 2 1
~ t( n −1) d= sd = d -
sD n n-1  1 i n 
 
n  
C) JI CUADRADO
(n - 1)sx2
 = 2
~  n2−1
 2
k 2
( - )
 =  o i ei   (k2 -1) ; donde ei = n.pi y k = N  clases
2
i=1 ei
f c 2
( oij - eij )
2=    (f2 -1)(c-1) ; donde f = N  filas y c = N  columnas
i=1 j=1 eij
D) F DE SNEDECOR
s12 s12
 12 s22
F= ~F( n1 −1),( n2 −1) o F= ~F( n1 −1),( n2 −1)
s22  12
 22  22
E) CORRECCIÓN DE TAMAÑO DE MUESTRA PARA POBLACIONES FINITAS
N = Tamaño de la población; n0= tamaño de muestra hallado; nf = tamaño de muestra corregido
n0
nf =
n
1+ 0
N
7
F) PRUEBA DE WILCOXON DE RANGOS SIGNADOS
T+ = sumando los rangos correspondientes a las diferencias Positivas

T- = sumando los rangos correspondientes a las diferencias Negativas
+ − n ( n + 1)
Suma total de rangos: T = T + T =
2
n ( n + 1)
V . crítico sup.= − V . crítico inf .
2
G) PRUEBA DE MANN WHITNEY
n
T1 =  ri ; siendo ri los rangos de la muestra de menor tamaño
i =1
n1 ( n1 + 1)
U = T1 −
2
V . crítico sup.= n1  n 2 − V . crítico inf .
8
ANALISIS DE REGRESION
a) Estimación de la ecuación de la regresión
yˆi = a + bxi ecuación de regresión estimada
a.1) Estimación de  y 
 xi yi -
(  xi )(  yi )
 ( xi - x )( yi - y ) n n.  xi yi -(  xi )(  yi )
b= = =
( xi - x ) 2 (  xi ) n.  xi2 -(  xi )
2 2 2
 xi -
n
a = y - bx
a.2) Estimación de σ2
1  (  yi )  (  xi )  
2 2
2
s =   yi -
2
- b   xi -
2 2

e
n-2  n  n 
  
2 2
n.se se
Vˆ b = sb =
2
=
n  xi - (  xi ) (  xi )
2 2 2
 xi -
2
b) Estimación por intervalo de confianza
b.1) Para 
b-
t= ~ t (n-2)
sb2
b.2) Para E(Yi)

Dados n pares de valores (xi; yi), se estiman los parámetros del modelo: Yi =  + xi + ei
 
1 (x0 - x )
2 
a + bx0  t (n-2);(1- / 2) se2  + 
 n  x 2 - (  xi ) 
2
 
 
i
n
a : Estimador de  ( ˆ ) y b : Estimador de  ( ˆ )
9
c) Docimasia de hipótesis
Para 
b-0
t H0 = 2
~ t (n-2)
s
b
d) Coeficiente de determinación (R²)
2 (
  xi ) 
2
b  xi - 
2
2
b
2
(
(xi - x )
2
= 
 ) n 
R =
 ( yi − y ) 2 (  yi )
2 2
 yi -
n
e) Intervalo de predicción
 
 1 (x − x)  2
Yˆn +1 tn − 2;1− 2 s 2 1 + + n n +1 
 n 2 
 i =1
( xi − x ) 

ó
 
 1 (xn +1 - x )
2 
a + bxn +1  t (n-2);(1- / 2) se2 1 + + 
(  xi )
2
 n
 
 
2
x -
 
i
n
f) Análisis de varianza en Regresión Lineal Simple
Fuentes de G.L. Suma de Cuadrados Cuadrados F

Variación Medios
 (  xi ) 
2
Debida a la SC REG SC REG
1 b   xi −
2 2  =
Regresión  n  GLREG 1 CM REG
  ~ F( GLREG ;GLRES )
CM RES
( y − a − bxi )
2 SCRES SCRES
Residual n-2 i =
GLRES n−2
( y )
2
TOTAL n-1
y −
2 i
i
n
10
1
se2 =  SCTOTAL − SCREG 
n−2
ANALISIS DE VARIANZA – DISEÑO COMPLETAMENTE ALEATORIZADO
Fuentes de G.L. Suma de Cuadrados Cuadrados F

Variación Medios
2
Modelo o k SCTRAT
Tratamiento
k-1
 ni ( yi − y.. )
i =1
k −1 CM TRAT
k
CM ERROR
Error N-k  ( n − 1) * s
i
2
i sP2 =
SCERROR
i =1 N −k
TOTAL N-1
s 2
=
( n1 − 1) * s12 + ... + ( nk − 1) * sk2
n1 + ... + nk − k
P
Prueba de Kruskal Wallis
k
12 Ri. ²
H= 
N ( N + 1) i =1 ni
− 3( N + 1)
Donde:
N es el total de observaciones
Ri. es el rango total de la muestra i
Bajo Ho H   k2−1
11
ANALISIS DE CORRELACION
a) Estimación del coeficiente de correlación():
 x1i x2i -
(  x1i )(  x2i )
 ( x1i - x1 )( x2i - x2 )
ˆ = r = = n
  ( x1i - x1 )    ( x2i - x2 ) 
2 2
 2 (  x1i ) 2
  2 (  x2i )2 
     x1i -    x2i - 
 n   n 
b) Docimasia de hipótesis
r (n - 2)
Para =0: t H0 = 2
~ t (n-2)
(1 - r )
NOTA: Para los fines prácticos el valor del Coeficiente de Determinación (R2) coincide
numéricamente con:
2 2
R =r
c) Coeficiente de correlación de Spearman
6  di2
rS = 1 −
(n − 1) n (n + 1)
n: número de diferencias
12

1 Formul 1cua2021

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

1 Formul 1cua2021

Cargado por

Copyright:

Formatos disponibles

Elementos de Estadística – Estadística Analítica

cantidad de casos favorables

1) TEOREMA DE LA SUMA DE PROBABILIDADES

P(A  B) = P(A)+ P(B) - P(A  B)

3) TEOREMA DEL PRODUCTO DE PROBABILIDADES

P(A  B) = P(A/B).P(B) = P(B/A).P(A)

Sea x una variable aleatoria con función de probabilidad p(x) o f(x):

A.1) DISTRIBUCION DE BERNOULLI

 p x(1- p )1-x para x = 0 y x = 1 ; 0  p  1

A.2) DISTRIBUCION BINOMIAL

E(X)= np ; V(X)= np(1- p)

B.1) DISTRIBUCION NORMAL

La función de distribución de probabilidad acumulada se define como:

B.2) DISTRIBUCION NORMAL ESTANDARIZADA

recibe el nombre de Distribución Normal Estandarizada o N(0;1), donde:

Nota : f(-z) = f(z) (-z) = 1 - (z)

B.3) DISTRIBUCION JI CUADRADO

recibe el nombre de función de densidad Ji cuadrado. Donde la letra  representa el número

B.4) DISTRIBUCION t DE STUDENT

recibe el nombre de función de densidad t de Student con  grados de libertad, donde:

B.5) DISTRIBUCION F DE SNEDECOR

recibe el nombre de función de densidad F de Snedecor con 1 y 2 grados de libertad,

E(F)= 2 para 2 > 2 V(F)= 2 1 2 2 para 2 > 4

A.- MEDIA ARITMETICA ( x )

* Cuando los n valores están ordenados en una tabla de frecuencias:

B.- MEDIANA (Me)

C.- MODO (Md o Mo)

Para variables cuantitativas discretas, el modo es el valor de la variable de mayor frecuencia

Li: Límite inferior del intervalo Modal.

A.- VARIANZA (sx2)

❖ Para n valores observados no agrupados: sx2 = 

❖ Cuando los n valores están ordenados en una tabla de frecuencias:

B.- DESVIO ESTANDAR (sx)

C.- COEFICIENTE DE VARIACION (C.V.)

ESTADISTICOS MAS EMPLEADOS

(𝑥̄ 1 − 𝑥̄ 2 ) − (𝜇1 − 𝜇2 )  s12 s22 

E) CORRECCIÓN DE TAMAÑO DE MUESTRA PARA POBLACIONES FINITAS

N = Tamaño de la población; n0= tamaño de muestra hallado; nf = tamaño de muestra corregido

T+ = sumando los rangos correspondientes a las diferencias Positivas

G) PRUEBA DE MANN WHITNEY

V . crítico sup.= n1  n 2 − V . crítico inf .

a) Estimación de la ecuación de la regresión

yˆi = a + bxi ecuación de regresión estimada

b) Estimación por intervalo de confianza

b.2) Para E(Yi)

d) Coeficiente de determinación (R²)

f) Análisis de varianza en Regresión Lineal Simple

Fuentes de G.L. Suma de Cuadrados Cuadrados F

ANALISIS DE VARIANZA – DISEÑO COMPLETAMENTE ALEATORIZADO

Fuentes de G.L. Suma de Cuadrados Cuadrados F

Prueba de Kruskal Wallis

a) Estimación del coeficiente de correlación():

También podría gustarte