Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Resumen Teoría
Estadística Resumen Teoría
Estadística
La ESTADÍSTICA es la ciencia de los datos. Implica la recolección, clasificación, síntesis,
organización, análisis e interpretación de dichos datos. Actúa como nexo entre los modelos
matemáticos y los fenómenos reales.
Tipos de Estadística
1-Estadística Descriptiva: es la que se dedica a la organización, síntesis y descripción de
un conjunto de datos.
2-Estadística Inferencial: es la que usa datos de una muestra para inferir algo acerca de
una población
Población y Muestra
La población representa la colección completa de elementos, resultados o individuos de los
que queremos analizar una similar característica. Puede ser finita o infinita.
Dos muestras diferentes de la misma población son diferentes entre sí, fenómeno se
conoce como variación del muestreo.
-Variable: es cualquier característica que varía de una unidad experimental a otra. Una
variable aleatoria es aquella que toma valores de observaciones hechas sobre un conjunto
aleatorio de objetos o individuos.
ESTADÍSTICA
DAEZEGO
Tipos de variables
3~Variables Numéricas: toman valores numéricos. Hoy dos tipos de variables numéricas:
Una medición consiste en darle un número o código a las observaciones hechas mediante
alguna escala adecuada, donde una escala es un instrumento de medición.
ESTADÍSTICA
DAEZEGO
Distribución de frecuencias
Una tabla de distribución de frecuencia nos sirve para organizar los datos y presentarlos de
manera más útil, y así poder obtener cierta información que no se vería tan fácilmente si los
datos no estuviesen ordenados.
Según con el tipo de dato que estemos trabajando podremos realizar distintos tipos de tabla
distribuciones de frecuencia. En esta tabla aparecerán distintos tipos de frecuencias, entre
las cuales tenemos:
-Frecuencia Relativa fr: proporción de veces que ocurre un dato. Se verifica Σfr = 1
Es una tabla que asocia a cada categoría de la variable con el número de veces que se repite
dicha categoría. Entonces en esta tabla tenemos la frecuencia absoluta y la frecuencia
relativa. En la primera columna se coloca la identificación, en la segunda columna las
categorías, en la tercera las frecuencias absolutas y en la cuarta las frecuencias relativas:
Id Categoría f fr
1 Categoría 1 5 5/12
2 Categoría 2 2 2/12
3 Categoría 3 3 3/12
4 Categoría 4 2 2/12
6
5
4
3
f
2
1
0
Categoría 1 Categoría 2 Categoría 3 Categoría 4
ESTADÍSTICA
DAEZEGO
Es una tabla que asocia cada valor que toma la variable numérica con la cantidad de veces
que se repite dicho valor. Así en esta tabla obviamente aparecen nuevamente las
frecuencias absolutas y relativas. Para los datos numéricos podemos agregar dos tipos de
frecuencias mas que son las frecuencias acumuladas:
-Frecuencia Relativa Acumulada Fr: es la suma de las frecuencias relativas de los valores
menores o iguales al valor que se está considerando. Por supuesto que en al ultimo valor de
la tabla le corresponde un valor de Fr = 1.
Por lo tanto nuestra tabla de distribución de frecuencias tendrá 6 columnas ahora, ya que
debemos agregar estas 2 frecuencias.
Id Valor f fr F Fr
1 8 2 2/16 2 2/16
2 9 3 3/16 5 5/16
3 10 6 6/16 11 11/16
4 11 4 4/16 15 15/16
5 12 1 1/16 16 1
En este caso empleamos gráficos de bastones para representar los datos agrupados.
Entonces sería:
7
6
5
4
f
3
2
1
0
8 9 10 11 12
Valor
ESTADÍSTICA
DAEZEGO
Otra manera de agrupar los datos numéricos es mediante una tabla de frecuencias en las que
se agrupan las observaciones en intervalos llamados intervalos de clase, que no es más que
el rango de valores en que se ha decido agrupar parcialmente los datos. Se define el rango
como la diferencia entre el valor máximo y el mínimo que toma la variable. También, la
cantidad de datos que quedan comprendidos dentro del intervalo representa la f del
intervalo. Para determinar la cantidad de intervalos, k, más adecuada para nuestro conjunto
de datos podemos emplear dos ecuaciones:
Sturges Raíz de n
k= √
( )
( )
k=1+
Definimos la amplitud de cada intervalo, h, como el cociente entre el rango del conjunto de
datos y la cantidad de intervalos k
La marca de clase Mc es el punto medio del intervalo de clase, es decir, es la suma de los
extremos del intervalo dividida 2:
Mc =
ESTADÍSTICA
DAEZEGO
( ) ! ! ! !
=
∑
( / )
! ! ! !
" #
Me =
( ) & ! ' ! ! ! !
=
∑ ∗
( / )
& ! ' ! ! ! !
" #
Me =
=
∑ (' ∗
( = + = ( = + ∗
( ! *+ )∗
! ' ! ( ∗
;
/ 0 →2 ' ó =
-
2 ' ó =
.0 3
-
Posición Me =
2 ' ó = +
,
ESTADÍSTICA
DAEZEGO
Medidas de Dispersión
Nos dan idea de la separación de los valores de una variable alrededor de su media
aritmética. Las más usuales son la varianza y el desvío estándar.
El desvío estándar es la raíz de la varianza medida en las unidades del conjunto de datos. Si
es poblacional será σ y si es muestral S.
5 = 5 = 7
∑( * 6) ∑( * 6)
8 = 8 = 7
∑( * ) ∑( * )
* *
8 = 8 = 7
∑((' * ) ∗ ∑((' * ) ∗
* *
Notar que para el cálculo de las varianzas y desvíos muestrales se divide por n-1 y no por
n. Esto es porque estamos trabajando con estadísticos (S2 y S)
Se usa para comparar las dispersiones de dos ó más distribuciones, cuyas observaciones
han sido medidas con escalas de razón únicamente. Se define como el cociente entre la
varianza muestral y la media aritmética:
'9 =
8
Variables Tipificadas
:=
*
8
ESTADÍSTICA
DAEZEGO
Medidas de Asimetría
Nos permiten apreciar la simetría o asimetría de una distribución dada. El modo es la
referencia central. Según estas medidas una distribución puede ser normal, sesgada a la
derecha o sesgada a la izquierda.
Normal: = Me = Mo
ESTADÍSTICA
DAEZEGO
Medidas de Orden
Aquí aparece el concepto de cuantiles que son valores que dividen al conjunto de datos en
partes iguales. Entonces podemos nombrar los siguientes:
Para nuestro estudio emplearemos los Cuartiles, así que veremos como se calculan sus
posiciones y sus respectivos valores:
Las posiciones las indicaremos con letras minúsculas q y los valores de los Cuartiles los
indicaremos con letras mayúsculas Q.
;1 =
(= >)
?
Q1 = Xq1
Q2 = Me
;3 =
A(= >)
?
Q3 = Xq3
ESTADÍSTICA
DAEZEGO
Probabilidad
Este término se usa generalmente para indicar que hay cierta incertidumbre sobre algo que
ya ocurrió, que está ocurriendo o que ocurrirá en el futuro.
Para realizar el estudio de la probabilidad debemos definir algunos conceptos básicos que
son:
Los eventos, ya sean simples o compuestos se suelen representar con letras mayúsculas
distintas de S, por ejemplo:
Sea S={{C, X} x {C, X} x {C, X}} C={C,C,X} ; D={(C, X,C) , (X, C,C)}
ESTADÍSTICA
DAEZEGO
Técnicas de Numeración
- Principio de Multiplicación
- Principio de Adición
- Permutaciones
Pn = n!
- Combinaciones
=
!
! ∗ ( * )!
C(n, x) =
Probabilidad de un evento
A continuación se veremos las teorías de probabilidad:
- Teoría Clásica
- Teoría de Frecuencias Relativas
- Teoría Axiomática
- Teoría Personalista o Subjetiva
Teoría Clásica
2(C) = 0≤ 2(C) ≤1
exactamente nA de esos resultados pertenecen al evento A, entonces la probabilidad del
C
evento A será: 0 ≤ nA≤n
2(C) =
C
ESTADÍSTICA
DAEZEGO
Teoría Axiomática
P(E) : S R+0
1- P(E) ≥ 0 VE
2- P(S) = 1
3- P(E U F) = P(E) + P(F) si (E ∩ F) = Φ ; Φ = conjunto vacío
1- P(Φ) = 0
2- Sea Ac el complemento de A, entonces
P(Ac) = 1 – P(A)
ESTADÍSTICA
DAEZEGO
Probabilidad Marginal
D
exactamente nE de estos resultados pertenecen al evento E, entonces definimos la
probabilidad marginal de E así: P(E) =
Probabilidad Conjunta
( C ∩ F )
Dados dos sucesos A y B de S, la probabilidad de ocurrencia de A y B simultáneamente la
denominamos probabilidad conjunta: P(A∩B) =
Probabilidad Condicionada
P(C⁄F) =
2(C∩F)
Dados dos sucesos A y B de S con P(B) ≠ 0, la probabilidad de ocurrencia de A dado que
2(F)
ocurrió B es:
Regla de Bayes
=∑ = ∑
2(C∩F) 2(C∩F) 2(C).2(F⁄C)
2(F) 2(C∩F) 2(C).2(F⁄C)
P(A/B) =
ESTADÍSTICA
DAEZEGO
La función f(xi) = P(X = xi) es una función de probabilidad de la variable aleatoria discreta
X si para cada xi ϵ Rx , donde Rx = resultados posibles o recorrido, si se cumple que:
2- ∑ ( ) =
1- f(x) ≥ 0 → f(x) es función de probabilidad de la variable aleatoria X
→ (x, f(x)) distribución de la variable aleatoria X
3- P(X = x) = f(x)
Así decimos que f(x) es una función de masa o cuantía cuando X es una variable
aleatoria discreta.
I*J ( )! =
J
1- f(x) ≥ 0 → f(x) es función de probabilidad de la variable aleatoria X
2- → (x, f(x)) distribución de la variable aleatoria X
P(a < X < b) = I ( )!
K
3-
Así decimos que f(x) es una función de densidad cuando X es una variable aleatoria
continua.
+ ( ) = ∑∀ M ( )
ESTADÍSTICA
DAEZEGO
Propiedades:
/ X . ( ) 9. . ! '
- ∀
DV W = J
.
- Y . ( ) 9. . '
,*J
Sea X una variable aleatoria con distribución de probabilidad f(x), la varianza o variancia
de X es:
/ X( − DV W) ( ) = DV W − (DV W) 9. . ! '
- ∀
ZV W = J
.
- Y ( − DV W) ( ) ! = DV W − (DV W) 9. . '
,*J
~ (DV W, ZV W)
Entonces la variable aleatoria, discreta o continua, se distribuye con una función de
parámetros E[X] y V[X]:
Sean dos variables aleatorias X e Y con medias E[X] y E[Y], la covarianza vale:
' 9V , ]W = DV ]W − DV W . DV]W
ESTADÍSTICA
DAEZEGO
:=
*DV W
Supongamos que tenemos una variable aleatoria X ~ g (E[X], V[X]) y queremos emplear la
^ZV W
variable z que se define como sigue:
Ahora necesitamos saber como se distribuye esta variable z, es decir, con que esperanza y
con que varianza. Entonces hacemos lo siguiente:
X − EVXW 1 1
ZV:W = V j k = VfX − EVXWg = VVXW =
^VVXW VVXW VVXW
Entonces z ~ g (0, 1)
Así, f(x, y) proporciona la probabilidad de que los dos resultados ocurran al mismo
tiempo.
( , l) ≥ S ∀( , l)
2- ∑ ∑l ( , l) = o I Il ( , l)! !l =
1-
( , l) = ( ) ∙ (l) ∀(r, s)
ESTADÍSTICA
DAEZEGO
Distribuciones Discretas
Si un S contiene una cantidad finita de posibilidades o una secuencia interminable con
tantos elementos como el total de números enteros, dicho S se llama espacio muestral
discreto y a la variable aleatoria definida en dicho espacio se la llama variable aleatoria
discreta.
Distribución Binomial
Es una de las distribuciones de probabilidad más útiles, se la emplea por ejemplo en control
de calidad, producción, investigación, etc. Tiene que ver con el experimento aleatorio que
produce en cada ensayo o prueba uno de dos resultados posibles mutuamente excluyentes:
ocurrencia de un criterio o característica específico, que llamamos éxito, y no ocurrencia de
éste que llamamos fracaso. Los términos de "éxito y fracaso" son solo etiquetas y su
interpretación puede no corresponder con el resultado positivo o negativo de un
experimento en la realidad.
" # t *
= S, , , … . ,
( ) = 2( = ) = K( , , ) = 3
S
con n entero y 0 ≤ p ≤ 1
DV W =
~ K( , , ) v
ZV W = t
ESTADÍSTICA
DAEZEGO
Distribución Geométrica
Consideramos un experimento donde tiramos una moneda las veces que sea necesario hasta
obtener la primera cruz, donde la probabilidad de obtener una cruz es p. Entonces, cuántos
tiros debemos realizar.
P (X = 1) = p
P (X = 2) = (1 − p)p
P (X = 3) = (1 − p)2 p
P (X = x) = (1 − p)x−1p
2( = ) = ( − ) *
∙ = t *
∙
zVwW = {y
w ~ x(r, y) }
|VwW = {
y
Distribución Hipergeométrica
e€rhe•*€ h
*r
r = S, , , … , ( , €)
~(r, •, , €) = • e h •
S ‚ƒ„‚ …†x‡„
ESTADÍSTICA
DAEZEGO
DV W
~ , ˆ, , • ˆ
ˆQ ˆQ
ZV W t‰ Š ‰ Q Š‰ Š
ˆQ ˆ ˆ ˆQ
Distribución de Poisson
Como consecuencia del teorema central del límite, para valores grandes de λ, una variable
aleatoria de Poisson X puede aproximarse por otra normal dado que el cociente
*‹
∙ ‹
2 ,‹ S, , , … , ∞
!
S
ESTADÍSTICA
DAEZEGO
DISTRIBUCIONES CONTINUAS
Los valores en los dos extremos a y b no son por lo general importantes porque no
afectan el valor de las integrales de f(x) dx sobre el intervalo, ni de x f(x) dx o
expresiones similares. Veamos como se distribuye una variable aleatoria con esta
función de densidad
K
K)
DV W Y !
KQ KQ
KQ
ZV W DV W Q DV W
DISTRIBUCIÓN EXPONENCIAL
ZV W
‹
ESTADÍSTICA
DAEZEGO
DISTRIBUCIÓN NORMAL
La distribución de una variable normal queda perfectamente definida por dos parámetros
que son su media µ y su desviación estándar σ. Entonces se dice que una variable
aleatoria continua X sigue una distribución normal de parámetros µ y σ si su función de
densidad está dada por:
Se llama distribución normal "estándar" a aquélla en la que sus parámetros toman los
valores µ = 0 y σ = 1. En este caso la función de densidad tiene la siguiente expresión:
Debido a que la curva alcanza su mayor altura en torno a la media, mientras que sus colas
se extienden asintóticamente hacia los ejes, cuando una variable siga una distribución
normal, será mucho más probable observar un dato cercano al valor medio que uno que se
encuentre muy alejado de éste.
ESTADÍSTICA
DAEZEGO
pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos
cercanos al valor medio de la distribución.
Así podemos notar que no existe una única distribución normal, sino una familia de
distribuciones con una forma común, diferenciadas por los valores de su media y su
varianza. De entre todas ellas, la más utilizada es la distribución normal estándar, que
corresponde a una distribución de media 0 y varianza 1, entonces resulta:
Es importante tener en cuenta que a partir de cualquier variable X que siga una
distribución normal, se puede obtener otra característica Z con una distribución normal
estándar realizando la siguiente transformación:
a partir de las que se puede obtener de modo sencillo la probabilidad de observar un dato
menor o igual a un cierto valor z, y que permitirán resolver preguntas de probabilidad
acerca del comportamiento de variables de las que se sabe o se asume que siguen una
distribución aproximadamente normal.
~ ˆ 6 , 5
] ~ ˆ 6l , 5l . Si M = X + Y entonces:
Sean dos distribuciones normales, con variables aleatorias independientes e
(~ ˆ 6 ) 6] , 5 ) 5l
Es decir que según esta propiedad podemos sumar algebraicamente las variables aleatorias
independientes para formar otra. Cabe aclarar que en dicha suma los coeficientes que
multiplican a las variables no necesariamente deben ser 1, sino que pueden tomar otros
valores inclusive negativos.
ESTADÍSTICA
DAEZEGO
1- n es grande y S, ≤ ≤ S, Ž
2- n cualquiera y p = 0,5
Distribución Gamma
( ) =
• ‘
> 0, ” > 0 • – > 0
‘ ’( )
Para cuando β=1 la distribución gamma tiene esperanza E[X] = nβ y varianza V[X] = nβ2
ESTADÍSTICA
DAEZEGO
•
’
x>0
" #
~ —( ) , y además DV W = l ZV W =
Sean X1, X2,…,Xn variables aleatorias independientes con distribución χ2 se tiene que:
Distribución t de Student
*
( )= " + # −∞ < › < ∞
’V( )/ W
√ š ’( / )
ESTADÍSTICA
DAEZEGO
Si œ> ~ •(=
Ÿ
ž)
e œŸ ~ •(=
Ÿ
) que son ambas variables aleatorias independientes, entonces la
]{
variable aleatoria + = ]
{
, que resulta del cociente de cada Chi-cuadrada divida por sus
( ) " • #
’¡ ¢‰ Š +
(+) = ( ) ~ +( , )
’e h ’e h ¡ + ¢
ESTADÍSTICA
DAEZEGO
Teoría de Muestras
La teoría del muestreo es el estudio de las relaciones existente entre una población y las
muestras extraídas de la misma. Tiene gran interés en muchos aspectos de la estadística.
Por ejemplo permite estimar cantidades desconocidas de la población a partir del
conocimiento de las correspondientes cantidades muestrales. Las cantidades poblacionales
se conocen comúnmente como parámetros, mientras que las cantidades muestrales
reciben el nombre de estadísticos.
La teoría de muestreo es también útil para determinar si las diferencias que se puedan
observar entre dos muestras son debidas a la aleatoriedad de las mismas o si por el contrario
son solamente significativas.
Entonces en esta parte de nuestro estudio nos fijaremos en los distintos tipos de muestras y
las variables aleatorias asociadas a cada una de ellas.
Para seleccionar una muestra aleatoria de tamaño n de una población f(x), debe definirse
una variable aleatoria Xi, con i = 1, 2, …, n. Las variables Xi formarán así una muestra
aleatoria de la población f(x) con valores numéricos xi si dichas variables son
independientes cada una con la misma distribución de probabilidad f(x). Entonces su
)= ( ) ( )… ( )
distribución de probabilidad conjunta se expresa como:
, ,…,
La función conjunta resulta ser el producto de las funciones marginales
Dijimos que una cantidad muestral se llama estadístico, así que vamos a dar una definición
del mismo. Decimos que cualquier valor calculado a partir de una muestra se llama
estadístico, o también que un estadístico es una variable aleatoria que depende sólo de la
muestra aleatoria observada. Algunos estadísticos importantes de una muestra de tamaño
n son la media muestral y la varianza muestral S2.
Así, la distribución de probabilidad de un estadístico recibe el nombre de distribución
muestral.
A continuación veremos como se distribuyen los estadísticos más empleados para nuestro
estudio.
ESTADÍSTICA
DAEZEGO
Distribución de Medias
∑
Sea X1, X2,…, Xn una muestra aleatoria con media entonces veamos como se
distribuye
DV W D ¡ ¢ ∑ DV W DV W ∑ DV W Es decir que DV W DV W
∑
ZV W | ¡ ¢ ∑ ZV W ZV W ∑ ZV W Es decir que ZV W ZV W
∑
−6
5⁄√ − 6
¤ = = ~
8⁄√
¥,( * )
( − )8
¦
5 ( − )
Se distribuye con (n-1) grados de libertad. Esto es debido a que se trabaja con un
estadístico que es S2, si hubiésemos empleado un estadístico más serían (n-2) grados de
libertad y así sucesivamente.
ESTADÍSTICA
DAEZEGO
Distribución de Varianzas
Si S2 es la varianza de una muestra aleatoria de tamaño n extraída de una población con
Si S>Ÿ y SŸŸ son las varianzas de dos muestras aleatoria independiente de tamaño n1 y n2
Distribución de cociente de varianzas
1- Poblaciones normales
Entonces tenemos dos poblaciones normales de las cuales conocemos sus varianzas
σ>Ÿ y σŸŸ , y extraemos una muestra n1 y n2 respectivamente:
− ~ ˆ "6 − 6 , + #
5 5
Por lo tanto
ESTADÍSTICA
DAEZEGO
Entonces podemos emplear la variable aleatoria z siguiendo el teorema central del límite:
: ~ ˆ(S, )
* * 6 *6
5 5
¦
2- Poblaciones no normales
En el caso de que estemos tratando con poblaciones no normales pero el tamaño de las
muestras es superior a 30, entonces podemos emplear la variable aleatoria z definida
anteriormente:
> 30 → ¶ = ~ ˆ(S, )
( * )* (6 *6 )
5 5
¦
1- Poblaciones normales.
En esta situación suponemos que las varianzas poblacionales son iguales σŸ = σ>Ÿ = σŸŸ y
deberemos emplear una variable aleatoria t cuya distribución se compone del cociente entre
una Normal Estándar y la raíz de una Chi-Cuadrada dividida entre sus grados de libertad, es
decir: ¤ = ~
ˆ(S, )
¥,(9),
7—(9) ⁄9
¤ = ~ * ) donde 8' =7
( * )* (6 *6 ) ( * )8 ( * )8
¥,( ( * )
8' 7
2- Poblaciones no normales
> 30 → ¶ = ~ ˆ(S, )
( * )* (6 *6 )
8 8
¦
ESTADÍSTICA
DAEZEGO
Estimación
La teoría de la Estadística Inferencial (o inferencia estadística) se puede definir como
aquellos métodos que permiten hacer inferencia sobre una población. Para ello se eligen
estimadores de manera que el modelo se ajuste lo mejor posible al comportamiento
observado, para luego estudiar a dichos estimadores como variables aleatorias.
Así lo que tratamos de hacer es emplear un determinado estadístico para que nos estime
un determinado parámetro. Generalmente se busca el estadístico que mejor estime a dicho
parámetro. A estos estadísticos los llamamos estimadores.
Estimación Puntual
»
º , , ¼, … , ) por lo que »(
º = º , , ¼, … , )
».
Queda a la vista que º es función de º
=
∑
»(
= º , , ¼, … , ) → ½ =
Aquí podemos ver que el estimador es función de los valores de la muestra y que tiene un
solo valor, ya que la media aritmética tiene un solo valor.
Si hacemos los cálculos para los diferentes estimadores de µ veremos que el que cumple
con las dos propiedades anteriores es .
ESTADÍSTICA
DAEZEGO
Dada una muestra aleatoria X1, X2,…, Xn de una población con función de densidad (o
cuantía), f(x, θ) con θ desconocido y además cada una de las variables aleatorias tienen
como función fi(xi, θ):
=S
!V (Ã)W
!º
Luego procedemos a encontrar los puntos críticos haciendo:
ESTADÍSTICA
DAEZEGO
construir un intervalo lo que hacemos es tomar un valor inferior º y otro valor superior
La estimación por intervalos nos permite conocer con que error estamos trabajando. Para
º tales que la probabilidad de que dichos valores encierren al valor verdadero de º sea
igual a Q ¥, que es el nivel de confianza del intervalo y ¥ es el error que nos podemos
permitir: 2 º < θ < º Q¥
Variable Fundamental
Una variable aleatoria es una variable fundamental o pivotal si y sólo si:
Por ejemplo: Sea X ~ N(μ, σŸ ) con σŸ conocida, encontrar la variable pivotal para μ
:=5 ~ˆ(S, )
*6
{
√
Veremos como se construye un intervalo para la media poblacional µ según sea el caso
que se nos presente.
El mejor intervalo es el que tiene menor longitud. Para el caso de una distribución
Normal que posee simetría, el intervalo de menor longitud se da cuando los extremos
2 Å −: <5 <: *¥ Æ = −¥
*6
*¥
{
√
ESTADÍSTICA
DAEZEGO
~ ( * )
*6
8{
√
La variable pivotal es
Entonces por ser una distribución simétrica los extremos deben tener la misma posición
pero de signo opuesto, así resulta:
2(− <›< )= −¥
2 Å− <8 < *¥ Æ = −¥
*6
*¥ {
√
2 " − *¥ √ <Ç< + *¥ √ #= −¥
8 8
Una estimación puntual insesgada de la varianza de una población normal está dada por
la varianza muestral S2, es decir que S2 es el estimador de máxima verosimilitud de σ2.
2Å < °Ÿ < Æ= −¥
(=*>)¨ (=*>)¨
È ¥ È ¥
•
2 Ê −: *¥ < < : *¥ Ë = −¥
É*2
Ét
É
7
2 ÅÉ − : *¥ 7 < Ì < É + : *¥ 7 Æ= −¥
Ét
É Ét
É
ESTADÍSTICA
DAEZEGO
Í Í
¦
Ð Ó
2 Ï−: < <: = −¥
( * )*(6 *6 )
*¥ *¥ Ò
Í Í
¦
Î Ñ
Este intervalo también se puede usar en el caso de que las poblaciones no sean normales y
las varianzas poblacionales sean desconocidas, siempre que el tamaño de las muestras sea
mayor a 30. Lo único que hacemos es usar las varianzas muestrales en lugar de las
poblacionales.
= ~ * ) ; 8' = 7
( * )*(6 *6 ) ( * )8 ( * )8
( ( * )
8' 7
La variable pivotal es
Tenemos dos poblaciones normales N(μ> , σ>Ÿ ) y N(μŸ , σŸŸ ). El estadístico que estima a
5 ⁄5 es 8 ⁄8 . Entonces la variable pivotal es: + = 8 ~ +(
8 5
5 * , * )
ESTADÍSTICA
DAEZEGO
Prueba de Hipótesis
Hipótesis estadística: es una afirmación de un conjunto de parámetros de la distribución
poblacional. La aceptación de una hipótesis implica tan sólo que los datos no proporcionan
evidencia suficiente para refutarla. Por otro lado, el rechazo implica que la evidencia de la
muestra la refuta.
Dada una muestra aleatoria X1, X2,…, Xn de tamaño n, definimos la región crítica o de
rechazo C al conjunto de todos los valores del estadístico que hacen que la H0 sea
rechazada.
No rechazar H0 si w , w , … , w ) ∈ Ö
Rechazar H0 si (w , w , … , w ) ∈ Ö
-
-
significancia.
ESTADÍSTICA
DAEZEGO
ÙÚ : Ç ≥ Ü
Ù> : Ç < Ü
Donde k es el valor conocido de µ. Notar que sólo en H0 se coloca el signo igual, y que
la H1 refuta a la H0.
Q6 Q6
2Å < Æ |àá ¥
5⁄√ 5⁄√
Q6
2 Å: < Æ |àá ¥
5⁄√
:¥ 6 ) :¥ .
*6 5
5⁄√ √
Propiedades
- Los errores tipo 1 y 2 están relacionados entre sí. La disminución de probabilidad de
uno resulta en el aumento de la probabilidad del otro.
- Un incremente en el tamaño n de la muestra reduce simultáneamente los valores de
α y β.
- La probabilidad de cometer error de tipo 1 puede reducirse ajustando el o los
valores críticos de la región de rechazo.
ESTADÍSTICA
DAEZEGO
Tamaño de la muestra
Ahora veremos como determinar el tamaño n de una muestra teniendo H0 y H1 así como
los valores de α y β que nos queremos permitir.
ÙÚ : ÇÚ Ü
2 ": < # |× ‘ 6 ) :‘ .
*6 5
5⁄ √ √
Sigue restar miembro a miembro las dos ecuaciones que encontramos y así podremos
hallar el valor de n:
S 6S ) : *¥ . √ Q "6 ) :‘ . #
5 5
√
n: debemos tomar un valor entero
Aquí también supondremos normalidad, por ello y por tratarse de la varianza la variable
pivotal que usaremos será la χ2
ÙÚ : ° < Ü
Ù> : ° > Ü
ESTADÍSTICA
DAEZEGO
- Cociente de varianzas
En este caso tenemos dos poblaciones normales N μ> , σ>Ÿ ) y N(μŸ , σŸŸ ) de las que se toman
dos muestras aleatorias independientes de tamaño n1 y n2 respectivamente. Por lo tanto la
variable pivotal a emplear en este caso es la F, dado que estamos trabajando con cociente
de varianzas.
ÙÚ : °>Ÿ ⁄°ŸŸ = 1
Ý ! Ý: S>Ÿ ⁄SŸŸ < C> o S>Ÿ ⁄SŸŸ > CŸ | P(S>Ÿ ⁄SŸŸ < C> )|ãá + P(S>Ÿ ⁄SŸŸ > CŸ )|ãá = α
P(F < C> )|ãá = ; P(F > CŸ )|ãá = P(F < CŸ )|ãá = 1 −
ç ç ç
Ÿ Ÿ Ÿ
1
C> = Fç (n> − 1, nŸ − 1) =
Ÿ F>*ç (nŸ − 1, n> − 1)
Ÿ
CŸ = F>*ç (n> − 1, nŸ − 1)
Ÿ
- Diferencia de Medias
En este caso tenemos dos poblaciones normales N(μ> , σ>Ÿ ) y N(μŸ , σŸŸ ) de las que se toman
dos muestras aleatorias independientes de tamaño n1 y n2 respectivamente. Supondremos
que las varianzas poblacionales son desconocidas pero que son iguales, entonces la variable
pivotal es una t.
ÙÚ : Ç> − ÇŸ = 0
ESTADÍSTICA
DAEZEGO
P Ôt < ê
ž ž
Õ |ãá α C Qt>*ç Sî 7ížž ) íž
ëì 7
íž í
1 − –(θ> ) ðñ θ> ≠ θ
ï θ> v
ò ðñ θ> = θ
de θ> . Una vez obtenido el valor de β procedemos a usar la ecuación para calcular la
aceptación, tomando el valor de C calculado anteriormente y usando también el valor dado
ESTADÍSTICA
DAEZEGO
Un primer método para saber si existe relación entre las variables es emplear un
Ahora veremos un método para elegir la recta de regresión que se llama método de
mínimos cuadrados.
Este método implica la suma de los cuadrados de las distancias verticales de los puntos yi a
la recta sea lo mas pequeña posible.
0( , K) = XVl − ( + K )W
Para que D sea mínima debemos encontrar sus derivadas parciales y luego las igualaremos
a cero para encontrar los valores de a y b respectivamente. De todo el trabajo algebraico se
obtiene que:
= X − K X =]−K
l
∑ ( − )(l − ]) 8
K= =
l
∑ ( − ) 8
ESTADÍSTICA
DAEZEGO
K=
8 l
8
depende linealmente de las variables yi que se distribuyen normalmente, por lo
tanto b también se distribuye normal. Ahora veamos como se distribuye, tener en cuenta
que sólo colocamos los resultados pasando por alto los desarrollos algebraicos.
K − ‘
: = 5 ~ ˆ(S, )
{
^∑ ( − )
Con esta variable podemos construir intervalos de confianza y pruebas de hipótesis para la
pendiente β de la recta de regresión conociendo la varianza.
EVaW = α y VVaW = σŸ ¡ + ∑í ¢
> a
µ ž (ö÷ *a)
ESTADÍSTICA
DAEZEGO
‡ ) ýrS Q þ ) rS
: ~ ˆ(S, )
Q
5¦ ) S
∑ SQ
εó = Yó − (α + βXó )
Donde εó es una variable aleatoria con EVεó W = 0 y VVεó W = σŸ . Su estimador puntual será
entonces eó = Yó − (a + bXó ), su esperanza es:
1 (xÚ − X)Ÿ
VVeó W = VVYó W + VVα + βXó W = σŸ + σŸ j + µ k
n ∑> (xÚ − X)Ÿ
] −( +K S)
: = ~ ˆ(S, )
( S− )
5¦ + +
∑ ( S− )
Esta variable nos permite hallar los límites de confianza para el valor Y verdadero llamados
límites de predicción. Dichos límites comparados con los obtenidos para ù + PúÚ son más
amplios debido a las fluctuaciones por ser una variable aleatoria. Graficando los límites en
función de x0 tenemos que:
LS límite superior
LI límite inferior
ESTADÍSTICA
DAEZEGO
Estimación de la Varianza
∑=>Vœ − (ù + PO )WŸ
°Ÿ = ¯Ÿ =
”−2
Se demuestra que EV¯ Ÿ W = σŸ entonces ¯ Ÿ es un estimador insesgado de σŸ . Luego
(=*Ÿ)¨
~•(=*Ÿ)
Ÿ
´
podemos emplear la variable para calcular las variables adecuadas para
cuando desconocemos σŸ
∑í
ž( ÷* ) ∑í
ž (a÷ *a)
SŸ = = y SaŸ = =
µ*> µ*> µ*> µ*>
Donde
Intervalos de Confianza
- Para α con σ2 desconocida
~ ˆ(S, ) y que
* ¥ ( * )
: = ~ ( * )
5
5¦
∑ ( • )
Dada una confianza y recordando que t tiene una distribución simétrica, podemos plantear
el intervalo: 2 "− *¥ <›< *¥ # = −¥
Luego hacemos los reemplazos y despejes que corresponden para obtener el intervalo de α.
ESTADÍSTICA
DAEZEGO
~ ˆ(S, )
K* ‘
Procediendo de igual manera y recordando que : = 5
7∑ ( * )
Vamos a emplear nuevamente la variable pivotal t y a realizar los mismos pasos para
obtener el intervalo para β para un nivel de significancia dado.
~ ˆ(S, )
] *( K S)
Todo lo mismo, la variable pivotal sigue siendo una t y : =
e S• h
5¦
∑ ( S• )
Prueba de Hipótesis
Debemos probar si algún parámetro es igual a algún valor hipotético.
- Prueba para β
ÙÚ : – = –Ú
Ù> : – ≠ –Ú
K* ‘
La variable pivotal es la “bendita t”: = ~ ( * )
8 {7∑ ( * )
|K − ‘S | >
8
con la siguiente región de rechazo: ( *¥)
7∑ ( * )
ESTADÍSTICA
DAEZEGO
- Prueba para α
ÙÚ : ò = òÚ
Ù> : ò ≠ òÚ
* ¥
La variable pivotal es la “bendita t”: = ~ ( * )
8 ¦
∑ ( • )
| − ¥S | > e *¥h 8 7 +∑
( * )
con la siguiente región de rechazo:
Regresión Curvilínea
- Función Polinómica
» =
la cual debemos ajustar a l = ] S + + + ¼
¼
+⋯+
- Función Potencial
] C ) K
l .
Vemos que tenemos una función lineal, por lo que podemos aplicar la regresión lineal
teniendo en cuenta que la tabla de datos va a ser con
- Otras funciones
] ¥ ) ] ¥ ) ‘
‘
donde
] ¥ ‘
] ¥ ) ‘ donde ] l
] ] ¥ ) ‘ donde ]
¥ ‘ l
ESTADÍSTICA
DAEZEGO
Correlación Simple
Al realizar una predicción del valor de Y usando la ecuación de mínimos cuadrados, la
misma está sujeta a errores. El grado de exactitud en la predicción depende de la
correlación que existe entre las dos variables. La medida usual es el coeficiente de
correlación ρ (si es poblacional) o r (si es muestral).
8 l
= − ≤ ≤
^8 8ll
Su estimador se define como:
Cuando r = -1 o r = 1, significa que existe un ajuste perfecto. Por otro lado cuando r = 0
significa que no existe correlación lineal (podría ser una relación curvilínea).
Una hipótesis útil es ρ = 0 es decir que no hay relación entre X e Y porque serían
independientes. Entonces: ×S : = S
× : ≠ S
√ −
= = ~ ( * )
√ − ^ − ⁄ −
K
Con esta variable se hace la prueba con la siguiente región de rechazo dado un nivel de
significancia α: | K | > *¥,( * )
ESTADÍSTICA
DAEZEGO
×S : = S
× : ≠ S
e „
•„
h ~ • " " S
• S
#, # entonces resulta
*¼
Partiendo de que:
1 1
2 lne>>* h − 2 ln ">>* SS #
z = ~N(0,1)
7 1
n−3
|z | > ¶>*
ESTADÍSTICA