Está en la página 1de 11

FORMULARIO

Matemáticas II – GDIDP – ETSID – DEIOAC

Estadísticos MUESTRALES
Media (Promedio): Mediana o Segundo cuartil Q2:
N
El 50% de las observaciones ≤ Q2
∑x i
Si N es impar ⇒ valor de la posición (N+1)/2
X= i =1
Si N es par ⇒ media de los valores que ocupan las posiciones N/2 y (N/2+1)
N
Cuartiles:
Q1 (Cuartil inferior): Q3 (Cuartil superior):

El 25% de las observaciones son ≤ Q1 El 75% de las observaciones ≤ Q3

(xi − X)2 N

Varianza: S = ∑
2
Desviación típica (Desviación estándar): S = S2
i =1 N −1
Recorrido (Rango): Recorrido Intercuartílico (Rango Coeficiente de variación:
intercuartilico):
S
R = Xmax - Xmin RI = Q3 – Q1 CV =
X
Coeficiente de asimetría Coeficiente de asimetría estandarizado (Sesgo estandarizado) (CAE):
(Sesgo):
∑𝑁𝑁 3
𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥̄ ) / (𝑁𝑁 − 1) Si CAE < -2 ⇒ distribución asimétrica negativa
𝐶𝐶𝐶𝐶 = Si CAE ∈ [-2, 2] ⇒ distribución simétrica
𝑆𝑆 3
Si CAE > 2 ⇒ distribución asimétrica positiva
Coeficiente de curtosis Coeficiente de curtosis estandarizado (Curtosis estandarizado) (CCE):
(Curtosis):
∑𝑁𝑁 4
𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥) ⁄(𝑁𝑁 − 1) Si CCE < -2 ⇒ datos más “aplanados” de lo normal
𝐶𝐶𝐶𝐶 = Si CCE ∈ [-2, 2] ⇒ datos “normales”
𝑠𝑠 4
Si CCE > 2 ⇒ datos más apuntados” de lo normal
Covarianza: Coeficiente de correlación lineal:
N

∑ ( x - x )( y - y )
i i
𝑟𝑟𝑥𝑥𝑥𝑥 =
𝑐𝑐𝑐𝑐𝑣𝑣𝑥𝑥𝑥𝑥
𝑟𝑟𝑥𝑥𝑥𝑥 ∈ [−1, +1]
cov xy = i=1
𝑆𝑆𝑥𝑥 𝑆𝑆𝑦𝑦
N-1

Probabilidad
Propiedades:
P(A) ≥ 0 P(A) ≤ 1 Si A y B son excluyentes ⇒ P(A ∪ B)= P(A) + P(B) y P(A ∩ B) =

P(A)= 1 − P(A) P(E) = 1 P(∅ ) =0

Regla de Laplace: Leyes de Morgan:


Casos favorables
P(A) = A B = A B A B = A B
Casos posibles

1
FORMULARIO
Matemáticas II – GDIDP – ETSID – DEIOAC

Suma de sucesos:
P(A ∪ B)=P(A)+P(B)-P(A ∩ B)
P(A ∪ B ∪ C)=P(A)+P(B)+P(C)-P(A ∩ B)-P(A ∩ C)-P(B ∩ C)+P(A ∩ B ∩ C)

En general:
P(A1 ∪  ∪ An )=∑ (P(Ai ) ) − ∑ (P(Ai ∩ A j ) ) + ∑ (P(Ai ∩ A j ∩ Ak )) + + (-1)n+1 ( ∑ (P(A  A ))
1 n

Probabilidad condicional: Producto de sucesos: Si A y B son independientes ⇒


P(A ∩ B) P(A ∩ B) = P(A).P(B/A) P(A ∩ B) = P(A).P(B)
P(A/B) =
P(B) P(A ∩ B) = P(B).P(A/B)
Teorema de la probabilidad total: Teorema de Bayes
n P(Ai ∩ B) P(Ai )P(B/Ai )
P(B)= ∑ P(A j )P(B/A j ) = P(A1 )P(B/A1 ) +…+ P(A n )P(B/A n ) P(Ai /B) = = n
P(B)
j=1
∑ P(A j )P(B/A j )
j=1

Distribuciones de probabilidad
Función de distribución: F(x)=P(X ≤ x) Propiedad: P(a < X ≤ b)=F(b)-F(a)
Variables aleatorias discretas Variables aleatorias continuas
dF(x)
Función de probabilidad: P(X = xi) Función de densidad: f(x)=
dx
Esperanza matemática y parámetros poblacionales
Media: µ = E(𝑋𝑋) Varianza: σ 2 = E (X – µ) 2 = E (X 2) - E(X)2 Desviación típica: σ = σ2
Propiedades de la media:
Si Y= a0 ± a1·X1 ± a2·X2 ± … ± an·Xn ⇒ µY = a0 ± a1· µX1 ± a2· µX2 ± … ± an· µn
Casos particulares:
Si Y= a + b·X ⇒ µY = a + b· µX Si Y= a - b·X ⇒ µY = a – b· µX
Si Y= X1 + X2 ⇒ µY = µX1 + µX2 Si Y= X1 - X2 ⇒ µY = µX1 - µX2

Propiedades de la varianza:
Si Y= a0 ± a1·X1 ± a2·X2 ⇒ 𝜎𝜎𝑌𝑌2 = a12 . 𝜎𝜎𝑋𝑋21 + a22 . 𝜎𝜎𝑋𝑋22 ± 2.a1 .a2 . 𝐶𝐶𝐶𝐶𝑣𝑣𝑋𝑋1 𝑋𝑋2

Casos particulares:
Si Y= a + b·X ⇒ σ Y = b .σ X σ Y2 = b2 .σ X2
2 2 2
Si Y= a - b·X ⇒
Y= X1 ± X2 ⇒ σ Y = σ X1 + σ X2
2 2 2
Si X1 y X2 son independientes:
𝜎𝜎𝑋𝑋 Rango Intercuartílico: Q3 – Q1 Rango: Xmax - Xmin
Coeficiente de variación: 𝐶𝐶𝑉𝑉𝑋𝑋 =
µ𝑋𝑋

Covarianza: 𝜎𝜎𝑋𝑋21 𝑋𝑋2 = 𝐸𝐸 ��𝑋𝑋1 − µ𝑋𝑋1 ��𝑋𝑋2 − µ𝑋𝑋2 �� Coeficiente de correlación:


Cov X1X2
ρX X =
1 2
σ X .σ X
1 2

2
FORMULARIO
Matemáticas II – GDIDP – ETSID – DEIOAC

Distribuciones más importantes


Binomial: X∼B(n, p) (X = 0, 1, ..., n)
Función de probabilidad: Media: Varianza:
n x µ𝑋𝑋 = 𝐸𝐸 (𝑋𝑋) = 𝑛𝑛. 𝑝𝑝 σ X2 = n.p.(1- p )
P ( X = x ) =  .px .(1- p )
n-x

x
P(X ≤ x)= ∑ P(X=xi )
xi =0

Propiedades:
X 1 ≈ B(n1 , p )
............... ⇒ Y = X 1 + ... + X N ≈ B(n1 + ... + nN , p )
X N ≈ B ( nN , p )

Poisson: X ∼ Ps (λ) (X = 0, 1, ..., ∞)


Función de probabilidad: x Media: Varianza:
-λ λ
x P(X ≤ x)= ∑ P(X=xi ) ⇒ mX = E ( X ) = λ σ2X =λ
P( X = x) = e . xi =0
x!
Ábaco de Poisson
Propiedades:
𝑿𝑿𝟏𝟏 ≈ 𝑷𝑷𝑷𝑷(𝝀𝝀𝟏𝟏 )
. . . . . . . . . . . . . . . ⇒ 𝒀𝒀 = 𝑿𝑿𝟏𝟏 +. . . +𝑿𝑿𝑵𝑵 ≈ 𝑷𝑷𝑷𝑷(𝝀𝝀𝟏𝟏 +. . . +𝝀𝝀𝑵𝑵 )
𝑿𝑿𝑵𝑵 ≈ 𝑷𝑷𝑷𝑷(𝝀𝝀𝑵𝑵 )

Convergencia Binomial-Poisson:
X ∼ B(n, p) con n → ∞ (n ≥ 30) y ⇒ X ∼ Ps (λ=n.p)
p → 0 (p ≤ 0.1)

Uniforme: X ∼U (a,b) (0 ≤ X ≤ ∞)
x−a Media: Varianza:
P(X=
≤ x) a<x≤b 𝑎𝑎 + 𝑏𝑏 (b − a )
2
b−a µ𝑋𝑋 = 𝐸𝐸 (𝑋𝑋) = 2
σX =
2 12
Exponencial: X ∼ Exp (𝝀𝝀) (0 ≤ X ≤ ∞)
Media: Varianza:
−𝜆𝜆𝑥𝑥
𝑃𝑃(𝑋𝑋 ≤ 𝑥𝑥) = 1 − 𝑒𝑒 𝑥𝑥 ≥ 0 1 1
µ𝑋𝑋 = 𝐸𝐸 (𝑋𝑋) = 𝜎𝜎𝑋𝑋2 =
𝜆𝜆 𝜆𝜆2

Normal: X ~ N(m, σ) (-∞ ≤ X ≤ ∞)


Z ~ Normal tipificada Media: Varianza:
µ𝑋𝑋 = 𝐸𝐸 (𝑋𝑋) = µ σ X2 = σ 2
P(Z ≤ z) ⇒ Tabla

𝑋𝑋−µ𝑋𝑋
Normal tipificada: 𝑍𝑍 ~𝑁𝑁(µ𝑍𝑍 = 0, 𝜎𝜎𝑍𝑍 = 1) Si 𝑋𝑋 ~𝑁𝑁(µ𝑋𝑋 , 𝜎𝜎𝑋𝑋 ) ⇒ 𝑍𝑍 =
𝜎𝜎𝑋𝑋
Propiedades:
𝑿𝑿𝟏𝟏 ≈ 𝑵𝑵 �µ𝑿𝑿 , 𝝈𝝈𝑿𝑿𝟏𝟏 �
𝟏𝟏
............... ⇒ 𝒀𝒀 = 𝑿𝑿𝟏𝟏 +. . . +𝑿𝑿𝑵𝑵 ≈ 𝑵𝑵 �µ𝒀𝒀 = µ𝑿𝑿𝟏𝟏 +. . . +µ𝑿𝑿𝑵𝑵 ; 𝝈𝝈𝒀𝒀 = �𝝈𝝈𝟐𝟐𝑿𝑿𝟏𝟏 +. . . +𝝈𝝈𝟐𝟐𝑿𝑿𝑵𝑵 �
𝑿𝑿𝑵𝑵 ≈ 𝑵𝑵 �µ𝑿𝑿𝑵𝑵 , 𝝈𝝈𝑿𝑿𝑵𝑵 �
𝝈𝝈𝟐𝟐𝒀𝒀 = 𝝈𝝈𝟐𝟐𝑿𝑿𝟏𝟏 +. . . +𝝈𝝈𝟐𝟐𝑿𝑿𝑵𝑵

3
FORMULARIO
Matemáticas II – GDIDP – ETSID – DEIOAC

Casos particulares
Si Y= a + b·X ⇒ 𝑌𝑌 ~𝑁𝑁(µ𝑌𝑌 = 𝑎𝑎 + 𝑏𝑏. µ𝑋𝑋 ; 𝜎𝜎𝑌𝑌 = �𝑏𝑏 2 𝜎𝜎𝑋𝑋2 ) Si X ∼ N(µx , σx ) e Y ∼ N(µy , σy ) independientes
Z = X  Y ∼ N (µz = µx  µy , σz2 = σx2 + σy2 )
68,26% de los valores de X ∈ [µ-σ, µ+σ]
Si X ∼ N(µx , σx ) ⇒ 95,44% de los valores de X ∈ [µ-2·σ, µ+2·σ]
99,73% de los valores de X ∈ [µ-3·σ, µ+3·σ]
Aproximaciones normales
Teorema Central del Límite:
𝑋𝑋1 ~𝑔𝑔1 (µ𝑋𝑋1 , 𝜎𝜎𝑋𝑋21 ) Siendo:
⋯⋯⋯⋯⋯ ⇒ 𝑌𝑌 = 𝑋𝑋1 + ⋯ + 𝑋𝑋𝑁𝑁 ~𝑁𝑁(µ𝑌𝑌 = µ𝑋𝑋1 + ⋯ + µ𝑋𝑋𝑁𝑁 ; 𝜎𝜎𝑌𝑌2
g → cualquier distribución
= 𝜎𝜎𝑋𝑋1 + ⋯ + 𝜎𝜎𝑋𝑋2𝑁𝑁 )
2
(Binomial, Poisson, etc.)
𝑋𝑋𝑁𝑁 ~𝑔𝑔𝑁𝑁 (µ𝑋𝑋𝑁𝑁 , 𝜎𝜎𝑋𝑋2𝑁𝑁 )
N → ∞ (N muy grande)
Convergencia Binomial-Normal: Convergencia Poisson-Normal:
X ∼ B(n, p) X ∼ Ps (λ)
Si np > 5 y npq > 5 ⇒ 𝑋𝑋~𝑁𝑁(µ = 𝑛𝑛𝑛𝑛, 𝜎𝜎 2 = 𝑛𝑛𝑛𝑛𝑛𝑛) Si 𝜆𝜆 > 5 ⇒ 𝑋𝑋~𝑁𝑁(µ = 𝜆𝜆, 𝜎𝜎 2 = 𝜆𝜆)

Distribuciones en el muestreo de poblaciones normales


� es la media de una muestra de tamaño N 𝑥𝑥̄ − µ
X ~ N(µ,σ2) y X
𝜎𝜎 ~ 𝑁𝑁(0,1)
√𝑁𝑁
𝑠𝑠 2
X ~ N(µ,σ2) y S2 es la varianza de una muestra de tamaño N (𝑁𝑁 − 1) ~𝜒𝜒 2
𝜎𝜎 2 𝑁𝑁−1
𝑥𝑥 − µ
� y S2 son la media y la varianza de una muestra de tamaño N
X ~ N(µ,σ2) y X 𝑡𝑡 = 𝑠𝑠 ~𝑡𝑡𝑁𝑁−1
√𝑁𝑁

X1 ~ N(µ1,σ21), X2 ~ N(µ2,σ22) independientes. S21 y S22 son las varianzas muestrales s12 σ 12
~ FN1 −1,N2 −1
de X1 y X2 (tamaños N1 y N2) s22 σ 22

Inferencia en poblaciones normales


Intervalo de confianza para la media (ICµ)

𝜎𝜎 𝜎𝜎 𝑧𝑧𝛼𝛼 ⇒ 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡


𝐼𝐼𝐶𝐶µ ⇒ �𝑥𝑥̄ − 𝑧𝑧𝛼𝛼 , 𝑥𝑥̄ + 𝑧𝑧𝛼𝛼 � 2
2 √𝑁𝑁 2 √𝑁𝑁

𝛼𝛼 𝛼𝛼 α

𝐼𝐼𝐶𝐶µ ⇒ �𝑥𝑥̄ − 𝑡𝑡𝑁𝑁−1


2 𝑆𝑆
, 𝑥𝑥̄ + 𝑡𝑡𝑁𝑁−1 2 𝑆𝑆
� tN−21 ⇒ valor en t abla
√𝑁𝑁 √ 𝑁𝑁
Intervalo de confianza para la varianza (IC𝝈𝝈𝟐𝟐 )

(𝑁𝑁−1)𝑆𝑆 2 (𝑁𝑁−1)𝑆𝑆 2 g1 y g2 ⇒ valores en t abla


𝐼𝐼𝐶𝐶𝜎𝜎2 ⇒ � , � α α
𝑔𝑔2 𝑔𝑔1 g1 / P( χN2−1 > g1 ) =−
1 y g2 / P( χN2−1 > g2 ) =
2 2

4
FORMULARIO
Matemáticas II – GDIDP – ETSID – DEIOAC

Tamaño de n
Tamaño de muestra n para un error específico e en la estimación de la media µ (𝜎𝜎 2 conocida)

𝒛𝒛𝜶𝜶� ∙ 𝝈𝝈 𝟐𝟐
𝟐𝟐
𝑋𝑋� ± 𝑒𝑒 → 𝒏𝒏 ≥ � �
𝒆𝒆

Test de hipótesis para la media (µ)

𝑥𝑥−µ0 𝑥𝑥−µ0
Bajo H0 (µ = µ0) → 𝜎𝜎 ~𝑁𝑁(0,1) Bajo H0 (µ = µ0) → 𝑠𝑠 ~𝑡𝑡𝑁𝑁−1
√𝑁𝑁
√𝑁𝑁

Test de hipótesis para la varianza (𝝈𝝈𝟐𝟐 )

𝑠𝑠2
Bajo H0 (𝜎𝜎 2 = 𝜎𝜎02 ) → (𝑁𝑁 − 1) 𝜎𝜎2 ~𝜒𝜒𝑁𝑁−1
2
0

Introducción a los Modelos de Regresión Lineal


Nomenclatura
Modelo E(Y/X1=x1t,....,XI=xIt) es la media de la distribución
E(Y/X1=x1t,....,XI=xIt) = β0 + β1x1t +.... + βIxIt condicional de Y cuando X1=x1t....y XI=xIt

βi = parámetros del modelo


N = nº total de observaciones bi = estimadores de los parámetros SCT = SCE + SCR
I = nº variables explicativas

SCT = SC total glTot = gl totales  (N-1)


SCE = SC Explicada CME = SCE / glExp
glExp = gl asociados a la SC Explicada  I
SCR = SC Residual CMR = SCR / glRes
glRes = gl residuales  (N-1)-I

Test de significación global del ajuste (ANOVA)


H0 : β= β= βI =0
1 2
 CME Si Razón-F ≤ FI,N-1-Iα No rechazar H0 Si Valor-P ≥ α ⇒ No rechazar H0
H1 : ∃βi / βi ≠ 0  F -ratio = CMR Si Valor-P < α ⇒ Rechazar H0
Si Razón-F > FI,N-1-Iα Rechazar H0
Coef. de determinación (R-cuadrada) Varianza residual: Desv. típica residual (Error estándar del est.):
R2 = SCE * 100 S2R = CMR SR = CMR
SCT

Test de significación del efecto de una variable Xi (Test t)

H0 : β i = 0 𝒃𝒃 Si Estadístico_T ≤ tN-1-Iα No rechazar H0 Si Valor-P ≥ α ⇒ No rechazar H0


 𝐄𝐄𝐄𝐄𝐄𝐄𝐄𝐄𝐄𝐄í𝐬𝐬𝐬𝐬𝐬𝐬𝐬𝐬𝐬𝐬_𝐓𝐓 = � 𝒊𝒊 �
𝒔𝒔𝒃𝒃𝒊𝒊
H1 : β i ≠ 0  Si Estadístico_T > tN-1-Iα Rechazar H0 Si Valor-P < α ⇒ Rechazar H0

5
FORMULARIO
Matemáticas II – GDIDP – ETSID – DEIOAC

Predicciones
(Y/X1=x1t,....,XI=xIt ) ~ Normal(µ = E(Y/X1=x1t,....,XI=xIt) ; σ2 = σ2R )

Modelos de Regresión Lineal Simple


Modelo
E(Y/X=xt) = β0 + β1xt E(Y/X=xt) es la media de la distribución condicional de Y cuando X=xt

Estimación Recta de regresión: (Pendiente) (Intercepto)


𝑌𝑌 = 𝑏𝑏0 + 𝑏𝑏1 𝑋𝑋 𝑆𝑆𝑦𝑦 𝑐𝑐𝑐𝑐𝑣𝑣𝑥𝑥𝑥𝑥
𝑏𝑏1 = 𝑟𝑟𝑥𝑥𝑥𝑥 𝑆𝑆 = 𝑏𝑏0 = 𝑌𝑌 − 𝑏𝑏1 . 𝑋𝑋
𝑥𝑥 𝑆𝑆𝑥𝑥2

Coeficiente de determinación: Varianza residual: Residuo:


R2 = (rxy)2 . 100 S2residual = S2y(1-r2xy) ei = yi – (𝑏𝑏0 + 𝑏𝑏1 xi)

Material docente previo de R. Alcover, E Vazquez (DEIOAC - UPV)

Esta obra está bajo una licencia Reconocimiento-No comercial-Compartir bajo la misma licencia 2.5 España de Creative Commons.
Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by-nc-sa/2.5/es/

6
FORMULARIO
Matemáticas II – GDIDP – ETSID – DEIOAC

7
FORMULARIO
Matemáticas II – GDIDP – ETSID – DEIOAC

8
FORMULARIO
Matemáticas II – GDIDP – ETSID – DEIOAC

9
FORMULARIO
Matemáticas II – GDIDP – ETSID – DEIOAC

Grados de libertad del numerador (n1)

NOTA: Los valores de la Fn1,n2 para α son los mismos que los de 1/Fn2,n1 para 1-α.

10
FORMULARIO
Matemáticas II – GDIDP – ETSID – DEIOAC

Grados de libertad del numerador (n1)

NOTA: Los valores de la Fn1,n2 para α son los mismos que los de 1/Fn2,n1 para 1-α

11

También podría gustarte