Está en la página 1de 35

Estadística II

1. Elementos de la Teoría del muestreo

ADMINISTRACIÓ I DIRECCIÓ D'EMPRESES


INTRODUCCION

Ramas de la estadística:

ESTADISTICA DESCRIPTIVA.

INFERENCIA ESTADISTICA:
INTRODUCCION

Cuando en estadística se puede observar todos los


elementos de un colectivo se puede realizar la llamada
observación exhaustiva, entonces la tarea de la estadística se
reduce a describir las características y regularidades. Es la
materia tratada en Estadística Descriptiva.

Esta materia tiene por objeto la organización, presentación y


descripción de un conjunto de datos con el objeto de
analizarla, describirla y hacerla comprensible.
Utiliza métodos numéricos (medidas estadísticas de
posición, forma, concentración) y gráficos que resumen y
presentan la información contenida en ellos.
INTRODUCCION
Pero frecuentemente, la observación de los elementos del
colectivo NO puede ser exhaustiva, ya que No podemos
conocer TODOS los elementos.
1. El estudio de los elementos del colectivo puede implicar la
destrucción del propio elemento, como es el caso de los ensayos
destructivos. Por ejemplo:
estudiar la vida media de una partida de bombillas
la tensión de rotura de un cable
2. Los elementos pueden existir conceptualmente, pero No en la
realidad
población de piezas defectuosas que producirá una máquina
3. Puede ser inviable económicamente (coste) estudiar toda la
Población
Introducción
En estos casos se ha de proceder al estudio de las
características de la Población a través de un
subconjunto representativo del colectivo, Muestra.

La información suministrada por el subconjunto


puede servir para inducir o inferir, con mayor o
menor exactitud, las características de la
Población

Es la materia tratada en Inferencia Estadística.


INTRODUCCION

La muestra ha de ser representativa de la población. Una de las


condiciones para ello es que el muestreo (sistema de elección de la
muestras) sea aleatorio, es decir que cada individuo tenga igual
probabilidad de ser elegido. Este tipo de muestreo se conoce como
muestreo probabilístico o aleatorio y da lugar a muestras aleatorias:

En el muestreo aleatorio los n elementos que forman la muestra se


pueden obtener con o sin reemplazamiento de entre los N elementos
que componen la población:

Con reemplazamiento: cuando el elemento elegido en cada extracción


vuelve a ser incluido en la población antes de extraer el siguiente
elemento. Probabilidad: 1/N. Observaciones independientes.

Sin reemplazamiento: el elemento extraído queda descartado de cara


a la siguiente extracción. Probabilidad: 1/N, 1/(N-1), …1/( N-(n-1)).
NO independientes.
INTRODUCCION

Cuando el tamaño de la población es infinito o tan grande que


pueda considerarse como infinito, ambos métodos llegan a las
mismas conclusiones, ya que el tamaño de la muestra n en
comparación con el tamaño N infinito o muy grande de la
población es prácticamente despreciable.

Métodos de selección de los individuos que componen la


muestra:

•Muestreo aleatorio simple


•Muestreo aleatorio sistemático
•Muestreo aleatorio estratificado
•Muestreo aleatorio por conglomerados
POBLACIÓN ESTADÍSTICA Y MUESTRA ALEATORIA

La población estadística es la colección o conjunto de


datos de los que se puede observar y analizar diferentes
características en función de los objetivos del investigador.

Se llama tamaño de la población al número de elementos


que la componen (N).

Cada observación en una población es un valor de una


variable aleatoria X con una función de probabilidad (variable
discreta) o densidad (variable continua) determinada.
Normalmente, se denomina a las poblaciones con el nombre
de la distribución de la variable, es decir, hablamos de
poblaciones Normales, de Poisson, etc.
POBLACIÓN ESTADÍSTICA Y MUESTRA ALEATORIA

Parámetro poblacional: característica numérica de la


población, valores que la describen de forma resumida.
Estos valores son constantes o fijos y pueden ser
conocidos o no.

Por ejemplo si la población es normal, los parámetros son µ


y σ2, si la población es de Poisson el parámetro es λ, si la
población es de Bernoulli el parámetro es p.
DEFINICION DE MUESTRA ALEATORIA

Sea una población estadística caracterizada por una variable aleatoria


X con una determinada ley de probabilidad, cuyas características
poblacionales son su media, µ, y su varianza, σ2.

Se define muestra aleatoria simple de tamaño n, como:


Sucesión (X1, X2……..X n) de variables aleatorias independientes,
igualmente distribuidas entre sí y con igual distribución de
probabilidad que la población analizada

Es decir, si la población tiene media µ y varianza σ2. y se extrae una


muestra de tamaño n, todas las observaciones muestrales son
variables aleatorias
X1, X2, X3 ………………… X n

E(X1) = µ E(X2) = µ E(X3) = µ ...……. E(X n) = µ


Var(X1) =σ2 Var(X2) =σ2 Var(X3) =σ2 ……. Var(X n) =σ2
DEFINICIÓN DE MUESTRA ALEATORIA

DIFERENCIA ENTRE MUESTRA ALEATORIA SIMPLE Y


REALIZACION MUESTRAL

El número de horas semanales que los adolescentes dedican a


conectarse a redes sociales, se distribuye a nivel poblacional
normalmente con media µ=20 horas y varianza σ2= 4 horas2. De esta
población se extrae una muestra aleatoria simple de tamaño 20.

Población :

Muestra aleatoria es la sucesión de las 20 variables aleatorias con


igual distribución de probabilidad que la población. Si la población es
normal con media 20 y varianza 4, las veinte variables aleatorias son
variables aleatorias normales con media 20 y varianza 4.
DEFINICIÓN DE MUESTRA ALEATORIA

Muestra
(X1, X2, X3, X4, X5, X6, X7, X8, X9, X10, X11, X12, X13, X14, X15,X16, X17,X18, X19,X20),

Variables aleatorias de la muestra:

Se seleccionan 20 adolescentes y una vez realizado el experimento, se


obtienen los siguientes valores:

(12,8,20,16,34,2,7,4,10,12,8,16,20,26,22,10,4,6,3) Esta es UNA


realización muestral, valores concretos observados no son variables
aleatorias.
DEFINICION DE MUESTRA ALEATORIA

La n variables que forman la muestra tienen una función de


probabilidad o densidad llamada función de probabilidad o densidad
conjunta.

Al ser las variables aleatorias que forman la muestra independientes, la


función de probabilidad o densidad conjunta de la muestra es igual al
producto de las funciones de probabilidad o densidad marginales
(funciones de probabilidad o densidad de cada variable X1, X2..Xn).

Es decir:
n
Si la variable aleatoria es discreta: P ( x1 , x2 ,.... xn ) = ∏ P ( xi )
i =1

Si la variable aleatoria es continua: f ( x1 , x2 ,.... xn ) = ∏ f ( xi )


i =1
ESTADÍSTICOS MUESTRALES

De la muestra se obtienen son los estadísticos muestrales

DEFINICIÓN DE ESTADÍSTICO MUESTRAL

Un estadístico muestral es cualquier función real elaborada con las


variables aleatorias de la muestra, en el que no aparecen valores
desconocidos.

El estadístico es una función de las observaciones muestrales y se


simboliza por g(X1, X2...X n).

El estadístico es una variable aleatoria con su correspondiente


distribución de probabilidad, que se denomina distribución muestral de
estadístico.
ESTADÍSTICOS MUESTRALES

POBLACION MUESTRA Para hacer inferencia sobre los


valores de parámetros
PARAMETROS
ESTADISTICOS poblacionales desconocidos se
MUESTRALES
obtienen en la muestra los
CONSTANTES VARIABES ALEATORIAS estadísticos muestrales que
tengan un nexo con aquellos.
Por ejemplo,
- si se hace inferencia sobre la
media de una población, se
puede obtener en la muestra el
estadístico media muestral,
- si se hace inferencia sobre la
proporción poblacional, se
puede obtener en la muestra el
estadístico proporción muestral.
ESTADÍSTICO MEDIA MUESTRAL (variable aleatoria)

Sea (X1, X2……..Xn) una muestra aleatoria simple de tamaño n,


procedente de una población descrita por una variable aleatoria X,
con media E(X) = µ y varianza σ2 .
El estadístico media muestral se simboliza con X y es la media de las
variables aleatorias que integran la muestra, es decir:
n

+ + ..... ∑Xi
X = X1 X 2 X n = i =1
n n
Como variable aleatoria tiene una media y una varianza que
son:
La media o valor esperado del estadístico Media muestral
es igual la media poblacional µ

La varianza del estadístico Media muestral es igual a la


varianza poblacional, σ2 dividida entre el tamaño de la
muestra n

Desviación estándar muestral


ESTADISTICO MEDIA MUESTRAL (variable aleatoria)

VALOR ESPERADO DE LA MEDIA MUESTRAL E ( X) = µ

Propiedades aplicadas a partir de la definición de muestra aleatoria simple: sucesión de variables aleatorias
independientes igualmente distribuidas e igualmente distribuidas que la población, todas tienen la misma media y la
misma varianza

La varianza de la media muestral mide la precisión de esta para estimar la media poblacional. La dispersión del
estadístico media muestral en torno a la media poblacional disminuye a medida que aumenta el tamaño de la
muestra, es decir la precisión de la media muestral para estimar la media poblacional aumenta al hacerlo el tamaño
de la muestra.
ESTADÍSTICO VARIANZA MUESTRAL (variable aleatoria)

Sea (X1, X2……..X n) una muestra aleatoria simple de tamaño n,


procedente de una población Normal descrita por una variable
aleatoria X, con media E(X) = µ y varianza σ2 .
El estadístico varianza muestral se simboliza con S2 y es la Varianza
de las variables aleatorias que integran la muestra, es decir:

∑ (X ) ∑X
n n
2 2
i −X i
2
− nX
S2 = i =1
= i =1

n −1 n −1
Como variable aleatoria tiene una media y una varianza que son:

La media o valor esperado del estadístico


Varianza muestral es igual la Varianza
poblacional, σ2 .
ESTADÍSTICO VARIANZA MUESTRAL (variable aleatoria)

La varianza del estadístico Varianza muestral depende de la


varianza poblacional

Si la población es normal:
ESTADÍSTICO PROPORCIÓN MUESTRAL

Sea una población descrita por una variable aleatoria X que se


distribuye según una Bernoulli con probabilidad de éxito p. Si de esta
población se extrae una muestra aleatoria simple de tamaño n,
(X1, X2……..Xn).

Se define el estadístico Proporción muestral como el número de


éxitos, X, que presenta la muestra, o la proporción de individuos en la
muestra, que presentan la característica de interés y se simboliza por:

X Al ser X el número de éxitos en la muestra, es


pˆ = decir, en n pruebas independientes de sucesos de
n Bernoulli, X se distribuye según una Binomial
X ~ B (n, p).
ESTADÍSTICO PROPORCIÓN MUESTRAL

Entonces, el valor esperado y Varianza del estadístico Proporción


muestral será:

X 1
E ( pˆ ) = E   = ·E ( X ) = ·n· p = p
1
n n n

p·q p·(1 − p )
2
X 1
V ( pˆ ) = V   =   ·V ( X ) = 2 ·n· p·q =
1
=
 n  n n n n
Es decir:
E ( pˆ ) = p El valor esperado del estadístico proporción
muestral es la proporción poblacional p.
La varianza de estadístico proporción muestral es
V ( pˆ ) =
p·q
la varianza poblacional dividida entre el tamaño
n de la muestra.
ESTADÍSTICO DIFERENCIA DE MEDIAS MUESTRALES

Sea (X1, X2……..Xnx) una muestra aleatoria simple de tamaño nx procedente


de una población Normal

Sea (Y1, Y2……..Yny) una muestra aleatoria simple de tamaño nY procedente


de una población Normal

Se define el estadístico diferencia de medias muestrales como:

D = (X −Y )
El valor esperado y Varianza del estadístico diferencia de medias
muestrales:

E ( D) = E ( X − Y ) = E ( X ) − E (Y ) = µ x − µ y

2
σ2x σy
V(D)= V(X − Y) = V(X) + V(Y) = +
nx n y
ESTADISTICO DIFERENCIA DE PROPORCIONES
MUESTRALES
En ocasiones es de interés comparar las proporciones px y py, de dos
poblaciones independientes de Bernoulli Ber(px) y Ber(py).

Sea (X1, X2……..Xnx) una M.A.S. de tamaño nx procedente de una población


X
Bernoulli, en la que se obtiene la proporción muestral pˆ x =
n
Sea (Y1, Y2……..Yny) una M.A.S. de tamaño nY procedente de una
población Bernoulli, en la que se obtiene la proporción muestral
Y
pˆ y =
La diferencia de proporciones muestrales es: n
X Y
pˆ x − pˆ y = −
nx n y
( )
E ( pˆ x − pˆ y ) = E ( pˆ x ) − E pˆ y = p x − p y

V ( pˆ x − pˆ y ) = V ( pˆ x ) + V ( pˆ y ) =
px qx p y q y
+
x n n y
DISTRIBUCION DEL ESTADISTICO MEDIA MUESTRAL
EN POBLACIONES NORMALES

1. VARIANZA POBLACIONAL CONOCIDA


Sea (X1, X2……..Xn) una muestra aleatoria simple de tamaño n,
procedente de una población NORMAL descrita por una variable
aleatoria X, con media E(X) = µ y varianza σ2 , entonces,

 σ2  X −µ
X ≈ N  µ,  ⇒ Z = ≈ N (0,1)
 n σ n

Si la población de partida NO es NORMAL, la expresión anterior se


sigue cumpliendo siempre que el tamaño de la muestra sea
suficientemente grande - mayor o igual a 30 - ya que por aplicación
del Teorema Central del Límite, el estadístico Media Muestral se
aproxima a la distribución normal.
DISTRIBUCION DEL ESTADISTICO MEDIA MUESTRAL
EN POBLACIONES NORMALES
2. VARIANZA POBLACIONAL DESCONOCIDA
Sea (X1, X2……..Xn) una muestra aleatoria simple de tamaño n,
procedente de una población Normal con media E(X) = µ y con varianza
poblacional desconocida σ2
– La varianza poblacional σ2 es desconocida, pero podemos hacer
una estimación de su valor. Para ello tomamos la varianza muestral
como estimación de la varianza poblacional.

X −µ
T= ≈ t n −1
S n
Si la población de partida No es normal siempre y cuando que el
tamaño de la muestra sea suficientemente grande (n >30), y por
aplicación del Teorema Central del Límite, el estadístico T se
distribuirá normalmente
DISTRIBUCION DEL ESTADISTICO DIFERENCIA DE MEDIAS
MUESTRALES EN POBLACIONES NORMALES

VARIANZAS POBLACIONALES CONOCIAS


Sea (X1, X2……..Xnx) una muestra aleatoria simple de tamaño nx
procedente de una población Normal X ≈ N (µ x , σ 2x )

Sea (Y1, Y2……..Yny) una muestra aleatoria simple de tamaño nY procedente


de una población Normal Y ≈ N(µ y , σ2y)

La distribución de probabilidad del estadístico diferencia de medias


muestrales será:

 σ
2
σ
2 
D = X - Y ≈ N µ x − µ y , +  ⇒ Z =
x y
(X - Y )− µx − µy ( )
≈ N (0,1)
 nx ny   2 2
 σx + σy
nx ny
DISTRIBUCION DEL ESTADISTICO DIFERENCIA DE MEDIAS
MUESTRALES EN POBLACIONES NORMALES

Si las poblaciones de partida No son Normales pero los tamaños de


las muestras nx y ny, son suficientemente grandes (mayores o iguales
a 30), en aplicación del Teorema Central del Límite, la aproximación
normal para es buena
 σ x 
2
X si n x > 30 ⇒ X ≈ N µ x , 
 nx 
 σ
2 
Y si n y > 30 ⇒ Y ≈ N µ y , 
y
 n 
 y 

 σ
D = X - Y ≈ N µx − µy , +
2
x σ
2 
y
 ⇒Z=
( )
(X - Y ) − µ x − µ y
≈ N (0,1)
 n x n y  2 2
 σx + σy
nx ny
DISTRIBUCION DEL ESTADISTICO DIFERENCIA DE MEDIAS
MUESTRALES EN POBLACIONES NORMALES

VARIANZAS POBLACIONALES DESCONOCIDAS E IGUALES


Sea (X1, X2……..Xnx) una M.A.S. simple de tamaño nx, procedente de una
población Normal con media E(X) = µx y con varianza poblacional
desconocida σ2x
Sea (Y1, Y2……..Yny) una M.A.S. ny, procedente de una población Normal con
media E(Y) = µy y con varianza poblacional desconocida σ2y

Pero de las cuales podemos suponer que sus Varianzas poblacionales aun
siendo desconocidas son iguales, podemos utilizar como estimación de las
mismas la Varianza muestral ponderada.


 σ
D = X - Y ≈ N µx − µy , +
2
x σ
2 
y
 ⇒t =
(
(X - Y ) − µ x − µ y )
≈ t( nx + n y − 2)
   1
 nx ny  1 
S p2 · + 
n 
 x ny 

(n x − 1)S2x + (n y − 1)S2y
Varianza muestral ponderada, S = 2

nx + ny − 2
p
DISTRIBUCION DEL ESTADISTICO DIFERENCIA DE MEDIAS
MUESTRALES EN POBLACIONES NORMALES

Si las poblaciones de partida No son Normales pero los tamaños de


las muestras nx y ny, son suficientemente grandes (mayores o iguales
a 30), en aplicación del Teorema Central del Límite, la aproximación
normal para es buena
 σ
2

X si n x > 30 ⇒ X ≈ N µ x , x 
 nx 
 σ
2 
Y si n y > 30 ⇒ Y ≈ N µ y , 
y
 n y 


 σ
D = X - Y ≈ N µx − µy , +
2
x σ
2 
y
 ⇒t =
(X - Y ) − µ x − µ y ( )
≈ N (0,1)
  
 nx ny 
2  1 1 
S p· +
n 
 x ny 
(n x − 1)S2x + (n y − 1)S2y
Varianza muestral ponderada, S =
2

nx + ny − 2
p
DISTRIBUCION DEL ESTADISTICO DIFERENCIA DE MEDIAS EN
POBLACIONES NORMALES (MUESTRAS GRANDES)

VARIANZAS POBLACIONALES DESCONOCIDAS Y DISTINTAS


Sea (X1, X2……..Xnx) una M.A.S. simple de tamaño nx, procedente de una
población Normal con media E(X) = µx y con varianza poblacional
desconocida σ2x
Sea (Y1, Y2……..Yny) una M.A.S. ny, procedente de una población Normal con
media E(Y) = µy y con varianza poblacional desconocida σ2y
Pero de las cuales podemos suponer que sus Varianzas poblacionales son
desconocidas y distintas.
Cuando los tamaños muestrales son grandes nx > 30 y ny > 30, el estadístico
T se distribuye normalmente:


 σ
D = X - Y ≈ N µx − µy , +
2
x σ
2 
y
 ⇒Z =
(
(X - Y ) − µ x − µ y)≈ N (0,1)
 nx ny   2 2
 Sx + Sy
nx ny
DISTRIBUCION DEL ESTADISTICO VARIANZA MUESTRAL EN
POBLACIONES NORMALES

Para hacer inferencia la distribución del estadístico varianza muestral


no es de gran utilidad pues tiene pocas aplicaciones prácticas en
estadística, sin embargo si lo es la siguiente transformación:

( )
i =n

(n − 1) S2 ∑ i
X − X
2

2
= i =1 ~
2
σ σ
Sea (X1, X2……..XnX) una M.A.S. de tamaño nx procedente de una población
Normal descrita por una variable aleatoria X, con media E(X) = µ
desconocida y con varianza poblacional σ2, entonces la anterior
transformación:

( )
i =n

(n − 1) S 2 ∑ i
X − X
2
~ χ 2
n −1
2
= i =1
2
σ σ
DISTRIBUCION DEL ESTADISTICO COCIENTE DE VARIANZAS
MUESTRALES EN POBLACIONES NORMALES

En ocasiones interesa comparar la dispersión de dos poblaciones Normales


independientes entre sí.

Sea (X1, X2……..Xnx) una M.A.S. de tamaño nx procedente de una población


Normal descrita por una variable aleatoria X, con media E(X) = µx
desconocida y con varianza poblacional σ2x X ≈ N (µ , 2 )
x σx
Sea (Y1, Y2……..Yny) una M.A.S. de tamaño nY procedente de una población
Normal descrita por una variable aleatoria Y, con media E(Y) = µy
desconocida y con varianza poblacional σ2y
Y ≈ N(µ y , σ y)
2

Entonces cada una de las varianzas muestrales tiene el siguiente


comportamiento probabilístico:

(n x − 1)S x2
≈χ 2 (n − 1)S y2
≈ χ n2y −1
y
n x −1
σ 2
x σ y2
DISTRIBUCION DEL ESTADISTICO COCIENTE DE VARIANZAS
MUESTRALES EN POBLACIONES NORMALES

Recordando que la variable F de Snedecor con nx y ny grados de libertad se


define como el cociente entre dos variables aleatorias χ2 (chi cuadrado)
independientes divididas entre sus grados de libertad tendremos:

(nx − 1)S x2
χ n2xx −1 σ x2 S x2

F=
(nx − 1) = (nx − 1) =
σ x2 σ y2 S x2
= 2 2
χ n2y −1 (n y − 1)S y2 S y2 σ x Sy
(n y − 1) σ y2 σ y2
(n y −1)
Por tanto, el estadístico F se distribuye según una F de Snedecor con grados
de libertad:

S 2
σ 2

· 2 ≈ F(n −1;n −1)


x y

S σx
2
y
x y
DISTRIBUCION DEL ESTADISTICO PROPORCION MUESTRAL
(MUSTRAS GRANDES)

Sea una población descrita por una variable aleatoria X que se


distribuye según una Bernoulli con probabilidad de éxito p.

Cuando el tamaño muestral sea elevado (n≥30), por aplicación de


Teorema Central de Límite, la distribución muestral del estadístico
proporción muestral es Normal, al aproximarse la distribución binomial
a la distribución normal.

 p·q  pˆ − p
pˆ ≈ N  p, ⇒Z = ≈ N (0,1)
 n  p·q n
DISTRIBUCION DEL ESTADÍSTICO DIFERENCIA DE
PROPORCIONES MUESTRALES (MUESTRAS GRANDES)

En ocasiones es de interés comparar las proporciones px y py, de dos


poblaciones independientes de Bernoulli Ber(px) y Ber(py).

Sea (X1, X2……..Xnx) una M.A.S de de tamaño nx procedente de una


población Bernoulli B(px).

Sea (Y1, Y2……..Yny) una M.A.S.de tamaño ny procedente de una


población Bernoulli B(py)

Entonces la distribución del estadístico diferencia de proporciones


muestrales se aproxima a la distribución normal (para muestras
grandes en aplicación del Teorema Central de Límite) con media y
varianza :

 p q  (
pˆ x − pˆ y − p x − p y )
pˆ x − pˆ y ~ N  p x − p y , p x q x + y y 
de donde

px qx py qy ~ N(0,1)
 nx ny  ´+
nx ny

También podría gustarte