Está en la página 1de 13

4 Teoría de muestras

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


Versión: 13 de septiembre de 2019

El estudio de determinadas características de una población se efectúa a través de diversas muestras que pueden
extraerse de ella. Antes de abordar este problema propiamente, necesitamos conocer el comportamiento de
algunas variables aleatorias asociadas a las muestras.

En este Tema, vamos a suponer que conocemos (lo que no es habitual) los parámetros de la población a estudiar
y queremos deducir consecuencias sobre las muestras, presentando la distribución muestral de algunas variables
aleatorias que utilizaremos en los temas siguientes para la Inferencia Estadística.

4.1 Tipos de muestreo


El proceso mediante el cual se extrae una muestra de una población se llama muestreo. Existen numerosos
métodos de obtener una muestra aleatoria. Para elegir entre ellos uno u otro, hay que tener en cuenta muchos
factores que intervienen en el objeto de estudio, por ejemplo el tamaño de la población, el tipo de población,
preguntas que se deben responder, tiempo y recursos disponibles, etc. Es claro que un procedimiento diseñado
para hacer un muestreo de los ficheros del archivo en un hospital, no sería válido para obtener muestras de los
árboles de un parque nacional o una especie de ballenas del océano Pacífico, en peligro de extinción.
Por ejemplo, últimamente se utiliza con mucha frecuencia la realización de sondeos de opinión llamando por
teléfono. Está claro que este tipo de muestreo da más oportunidades a aquellas personas que tienen más de un
teléfono. Una muestra como ésta, obtenida por un procedimiento que no contempla que todos los individuos
de la población tengan la misma oportunidad de ser elegidos se denomina muestra sesgada. Las conclusiones
obtenidas a partir de ella son poco fiables.

4.1.1 Muestreo aleatorio simple

Dpto. EDAN
El muestreo aleatorio simple funciona bien en muchos casos, y es fácil de utilizar y de comprender; en general
acude a la mente cuando una persona oye el término muestra. En el muestreo aleatorio simple los elementos se
seleccionan «al azar», en el sentido de que la elección de los elementos de la muestra es controlada por algún
mecanismo aleatorio. Cada elemento tiene la misma probabilidad de ser elegido para el estudio que cualquier
otro. El mecanismo aleatorio utilizado podría ser tan simple como sacar nombres de un sombrero, o tan complejo
como utilizar un generador electrónico de números aleatorios.

Ejemplo 4.1

Para realizar una encuesta sobre la intención de voto en una ciudad se elige, al azar, una muestra formada por
1000 personas.

1
4. Teoría de muestras 2

4.1.2 Muestreo aleatorio estratificado


En el muestreo aleatorio estratificado la población se divide en grupos homogéneos que llamamos estratos,
y, posteriormente, se extrae una muestra aleatoria simple de cada estrato.

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


Ejemplo 4.2

En una ciudad de sabe que el 60 % son mujeres y el 40 % hombres. Se quiere realizar una encuesta sobre la
intención de voto escogiendo una muestra de 1000 personas. Para ello, previamente se divide la población en
dos estratos: mujeres y hombres, y luego, se extrae de cada estrato una muestra proporcional, es decir, en este
caso, 600 mujeres y 400 hombres.

4.1.3 Muestreo aleatorio sistemático


En el muestreo aleatorio sistemático se selecciona al azar un elemento de la población, y a partir de él, se
seleccionan de k en k los siguientes elementos.

Ejemplo 4.3

En una carretera se va a hacer un control de alcoholemia. Se elige al azar al conductor de un vehículo y se le


hace pasar el control, a continuación, se seleccionan de 50 en 50 los siguientes conductores (aquí se ha elegido
k = 50).

4.1.4 Muestreo por conglomerados y áreas


En el muestreo por conglomerados y áreas se divide la población en secciones o conglomerados. Se eligen
luego al azar algunas de estas secciones y se toman todos los elementos de las secciones elegidas para formar la
muestra.

Ejemplo 4.4

Para realizar una encuesta entre los alcaldes de España, se consideran las provincias de España. Se eligen al azar
algunas provincias y la muestra estará formada por todos los alcaldes de las provincias elegidas (claramente
en este ejemplo las secciones son todas las provincias de España).

4.1.5 Distribución muestral de las medias


Dpto. EDAN
Supongamos que estamos estudiando una característica de una población (a la cual representaremos por la
variable aleatoria X), como puede ser, por ejemplo, su talla. Vamos a denotar la media poblacional por µ y la
desviación típica por σ.
Para generar una distribución muestral de la media, elegimos una muestra aleatoria de n elementos de dicha
población y calculamos la media de este grupo que llamamos x1 (media muestral) y la desviación típica s1
(desviación típica muestral). Lógicamente esta media no tiene porque coincidir con la media de la población. Se
escogen otras muestras de tamaño n para las que tendremos las medias muestrales x2 , x3 , . . . y las desviaciones
típicas muestrales s2 , s3 , . . .
Los diferentes valores de xi , que varían de una muestra a otra, dan lugar a una variable aleatoria (estadístico)
que se representa por X que asigna a cada muestra su media con su correspondiente distribución de probabilidad
que recibe el nombre de distribución muestral de medias o distribución en el muestreo de la media.

Matemática Aplicada y Estadística Dpto. EDAN - Univ. de Sevilla


4. Teoría de muestras 3

Ejemplo 4.5

Los fabricantes de envasado de espárragos desean saber la longitud media de los espárragos. La longitud media
la representamos por µ y por σ la desviación típica. Elegimos una muestra aleatoria formada por 40 espárragos,

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


y se obtiene que la longitud media muestral es x1 = 17.3 cm y la desviación típica muestral es s1 = 0.8 cm.
Si elegimos otras muestras de tamaño 40 y calculamos sus medias y desviaciones típicas, obtenemos: x2 , x3 ,. . . y
s2 , s3 ,. . . .
Los distintos valores de xi dan lugar a una variable aleatoria que representamos por X. La distribución de X
se llama distribución muestral de medias.

No es necesario constriur la distribución muestral de las medias en todos los casos ya que tienen su propia
distribución muestral conocida en cada caso. Para describir su comportamiento damos el Teorema Central
del Límite en la siguiente versión:

Teorema Central del Límite: Dada una población de media µ y desviación típica σ (cualquiera que sea
su distribución), la distribución de las √medias de las muestras de tamaño n, tiene la misma media que la
población, µ, su desviación típica es σ/ n y cuando n es «grande» es prácticamente Normal.

Se puede demostrar también que cuando la distribución de partida es Normal, la distribución de las medias es
Normal.

El término n «grande» es relativo y puede depender de la población considerada pero es bastante común tomarlo
como n ≥ 30. Se observa que cuánto más grande sea n, más pequeña es la desviación típica de la distribución
de las medias muestrales.

El resumen de lo dicho anteriormente se presenta en lo que sigue:

Distribución muestral de la media: σ conocido.


Sean X la variable aleatoria que describe una población de media µ y desviación típica σ y X que describe
las medias de las muestras de tamaño n. Se verifica:

1. Si la población sigue una distribución Normal, entonces X sigue también una distribución Normal de
media igual a la media poblacional µ y desviación típica √σn , es decir
 
σ

Dpto. EDAN
X ∼ N (µ, σ) ⇒ X∼N µ, √
n

2. Si la población sigue una distribución cualquiera (no necesariamente Normal), entonces a medida que el
tamaño de muestra, n, crece, la variable aleatoria X se aproxima a la Normal de media µ y desviación
típica √σn , es decir
 
σ
X cualquiera y n es «grande» ⇒ X∼N µ, √
n

X −µ
En ambos casos, el estadístico Z = √ sigue una distribución Normal estándar, es decir Z ∼ N (0, 1).
σ/ n

Matemática Aplicada y Estadística Dpto. EDAN - Univ. de Sevilla


4. Teoría de muestras 4

Ejemplo 4.6

Se supone que la distribución de la temperatura del cuerpo humano tiene de media µ = 37 grados y de
desviación típica σ = 0.85 grados. Se eligen muestras de 105 personas.

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


a) ¿Cuál es la probabilidad de que la media muestral sea menor o igual que 36.9?

b) Calcular la probabilidad de que la media muestral esté comprendida entre 36.5 y 37.5.

Solución: En este caso, la población, X, es la temperatura del cuerpo humano y no sabemos si sigue o no la
distribución Normal. El tamaño de la muestra es n = 105 > 30. Luego, podemos aproximar la distribución la
media muestral, X por la Normal
   
σ 0.85
X ∼ N µ, √ = N 37, √ = N (37, 0.083)
n 105
Apartado a): Tenemos que calcular P (X ≤ 39.9). Tipificando la variable, tenemos que

X −µ X − 37
Z= √ = ∼ N (0, 1)
σ/ n 0.083
 
36.9 − 37
P (X ≤ 36.9) = P Z ≤ = P (Z ≤ −1.2) = 1 − P (Z ≤ 1.2) = 1 − 0.8849 = 0.115
0.083
Apartado b): Se trata de calcular ahora

 
36.5 − 37 37.5 − 37
P (36.5 ≤ X ≤ 37.5) = P ≤Z≤ = P (−6.02 ≤ Z ≤ 6.02) = 2P (Z ≤ 6.02) − 1 = 1
0.083 0.083

Ejemplo 4.7

El peso de vacas de una determinada ganadería se distribuye según una Normal de media µ = 495 Kg. y
desviación típica σ = 44 Kg. Se toman muestras de 35 vacas de esa ganadería. Calcular la probabilidad de que
la media muestral:

a) Sea mayor o igual que 500 Kg.


b) Sea menor o igual que 480 Kg.

Solución: Como la distribución de partida es Normal, la distribución de las medias muestrales sigue también
Dpto. EDAN
una distribución Normal, cualquiera que sea n, es decir
   
σ 44
X ∼ N µ, √ = N 495, √ = N (495, 7.44)
n 35
X −µ X − 495
Tipificando la variable, tenemos Z = √ = ∼ N (0, 1)
σ/ n 7.44
Apartado a):
 
500 − 495
P (X ≥ 500) = P Z ≥ = P (Z ≥ 0.67) = 1 − P (Z ≤ 0.67) = 1 − 0.7486 = 0.2514
7.44

Apartado b):
 
480 − 495
P (X ≤ 480) = P Z≤ = P (Z ≤ −2.02) = 1 − P (Z ≤ 2.02) = 1 − 0.9783 = 0.0217
7.44

Matemática Aplicada y Estadística Dpto. EDAN - Univ. de Sevilla


4. Teoría de muestras 5

X−µ
√ ∼ N (0, 1) sólo se puede usar en los casos en los que conocemos la desviación típica
El estadístico Z = σ/ n
poblacional, σ, lo que no sucede habitualmente.

Cuando no se conoce la desviación típica poblacional, σ, no podemos usar la variable aleatoria tipificada Z,
entonces es habitual tomar como aproximación de σ la cuasidesviación típica, ŝ calculada a partir de una

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


muestra extraída de la población:

Cuasidesviación típica de una muestra de n elementos xi , i = 1, . . . , n y con la media x, se define como


v
u n
u 1 X
ŝ = t (xi − x)2
n − 1 i=1

Se recuerda que la desviación típica muestral viene dada por


v
u n
u1 X
s=t (xi − x)2
n i=1

Es claro que la cuasidesviación típica y la desviación típica se relacionan mediante la expresión


r
n
ŝ = s (4.1)
n−1

Distribución muestral de la media: σ desconocido.


Si X sigue una distribución Normal de media µ (la desviación típica σ no se conoce), entonces la variable
aleatoria

X −µ
T = √ ∼ tn−1 (4.2)
ŝ/ n
sigue una distribución t de Student de n − 1 grados de libertad, donde ŝ es la cuasidesviación típica muestral
dada por (4.1) y n es el tamaño de la muestra.

Se observa que T dada por (4.2) relaciona la media poblacional µ y la media muestral X. Sabemos que cuando
n crece, la distribución t de Student se comporta como una normal tipificada.
X −µ
Dpto. EDAN
Observando la analogía entre las expresiones de Z = √ ∼ N (0, 1) y de T ∼ tn−1 , vemos que la única
σ/ n
diferencia es que en vez de σ en Z, hemos tomado su «estimador», la cuasidesviación típica ŝ.

Matemática Aplicada y Estadística Dpto. EDAN - Univ. de Sevilla


4. Teoría de muestras 6

Ejemplo 4.8

El cociente intelectual de unos universitarios se distribuye normalmente con media 100 y desviación típica 11.

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


a) Se elige una persona al azar. Hallar la probabilidad de que su cociente intelectual esté entre 100 y 103.

b) Para muestras elegidas al azar de 25 universitarios, encontrar la probabilidad de que la media de sus
cocientes intelectuales esté entre 100 y 103.
c) Obtener la probabilidad anterior suponiendo que, en las mismas condiciones, se desconoce el valor de la
desviación típica poblacional, σ, pero se sabe el valor de la desviación típica muestral, s = 10.

Solución:
Apartado a): Sea X la variable aleatoria que describe el cociente intelectual de unos universitarios. La
distribución de partida es N (100, 11).
 
100 − 100 103 − 100
P (100 ≤ X ≤ 103) = P ≤Z≤ = P (0 ≤ Z ≤ 0.27) = 0.1064.
11 11

Apartado b): Según el Teorema Central de Límite, la distribución de media muestral, X, como procede de
una población de partida Normal, es Normal cualquiera que sea el valor de n, es decir
   
σ 11
X ∼ N µ, √ = N 100, √ = N (100, 2.2)
n 25
Por tanto,
 
100 − 100 103 − 100
P (100 ≤ X ≤ 103) = P ≤Z≤ = P (0 ≤ Z ≤ 1.36) = 0.4131.
2.2 2.2

X −µ
Apartado c): Ahora, la variable aleatoria que hemos de usar es T = √ ∼ tn−1 que se distribuye según
ŝ/ n
una t de Student de n = 25 − 1 = 24 grados de libertad. Además,
ŝ s 10
√ =√ = √ = 2.04
n n−1 24
Luego,

 
100 − 100 103 − 100
P (100 ≤ X ≤ 103) = P ≤T ≤ = P (0 ≤ T ≤ 1.47) = P (T ≤ 1.47) − P (T ≤ 0).

Dpto. EDAN
2.04 2.04

Es claro que P (T ≤ 0) = 0.5 ya que la distribución t de Student es simétrica respecto al cero. Para calcular
P (T ≤ 1.47), de la tabla de t de Student tenemos que para n = 24: 1.47 está entre los valores 1.3178
(correspondiente a la probabilidad 0.9) y 1.7109 (correspondiente a la probabilidad 0.95). Como son valores
alejados uno del otro, construimos la recta que interpola los valores (1.3178, 0.9) y (1.7109, 0.95):
0.95 − 0.9
y = 0.9 + (x − 1.378)
1.7109 − 1.3178)
La probabilidad que buscamos se obtiene tomando en esta recta la ordenada correspondiente a x = 1.47
0.95 − 0.9 0.05
y = 0.9 + (1.47 − 1.378) = 0.9 + 0.0920 = 0.9117,
1.7109 − 1.3178 0.3931
de donde

P (100 ≤ X ≤ 103) = P (T ≤ 1.47) − P (T ≤ 0) = 0.9117 − 0.5 = 0.4117

Matemática Aplicada y Estadística Dpto. EDAN - Univ. de Sevilla


4. Teoría de muestras 7

4.1.6 Distribución muestral de la proporción


Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino en la proporción en
una muestra. Por ejemplo, la proporción en una muestra de personas hipertensas, o la proporción de artículos
defectuosos, personas sin teléfono móvil, etc. La distribución muestral de proporciones es la adecuada para dar

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


respuesta a estas situaciones.
Esta distribución se genera de igual manera que la distribución muestral de medias, ahora, en vez de calcular
las medias de cada muestra extraída de la población, se calcula la proporción muestral, P̂ .
Más concretamente, consideramos una población en la que la probabilidad (o proporción) de que un elemento
posea cierta característica (probabilidad de éxito) es p. Consideramos muestras de n elementos. Sea X el
número de individuos que presentan la característica a estudiar (sabemos X sigue una distribución binomial de
parámetros n y p,py que si n es grande, dicha distribución seppuede aproximar por la Normal con media np y
desviación típica np(1 − p), es decir X ∼ B(n, p) ≈ N (np, np(1 − p))).
Sea pi la proporción de individuos en la muestra i que presentan la característica que estamos estudiando
(proporción muestral), es decir

xi número de éxitos en la muestra (observaciones de interés)


pi = =
n tamaño de la muestra
Los valores de la proporción muestral varían de una muestra a otra, P̂ es una variable aleatoria y su distribución
de probabilidad de llama distribución muestral de la proporción.
La distribución muestral de proporciones está estrechamente ligada con la distribución binomial; una distribución
binomial es una distribución del total de éxitos en las muestras, mientras que una distribución de proporciones
es la distribución del número de éxitos dividido por el tamaño de la muestra.

Ejemplo 4.9

Los fabricantes de una determinada marca de chinchetas fabrican cajas de 100 unidades quieren saber cuántas
salen defectuosas. Sea p la proporción de chinchetas buenas, es decir, las que no presentan defectos en las
mencionadas cajas.
Si se toma una muestra aleatoria de n = 100 chinchetas y se observa que 86 de ellas están bien, al valor 86/100
lo denotamos p1 . Si consideramos otra muestra de 100 elementos, obtendremos otro valor p2 y sucesivamente
p3 , p4 ,. . . Los distintos valores de pi dan lugar a una variable aleatoria que denotamos P̂ que representa la
proporción o probabilidad de éxito de que se presente la característica que estudiamos (en este caso chinchetas
buenas) en muestras de tamaño n (en este caso, 100).

La distribución muestral de la proporción tiene las siguientes características:

Dpto. EDAN
Distribución muestral de la proporción:
Consideramos en una población en la que la probabilidad de que un individuo muestre una cierta característica
es p. Entonces, la variable aleatoria, P̂ , que da la proporción de individuos que presentan dicha característica
en muestras de tamaño n, tiene las siguientes propiedades:

1. Su media es p, es decir es igual a la proporción poblacional.


r
p(1 − p)
2. Su desviación típica es .
n
3. Cuando n es grande, y p no sea próximo ni a cero ni a 1, P̂ se aproxima a la Normal correspondiente, es
decir
r !
p(1 − p)
P̂ ∼ N p, (4.3)
n

Matemática Aplicada y Estadística Dpto. EDAN - Univ. de Sevilla


4. Teoría de muestras 8

Este resultado puede justificarse intuitivamente recordando la definición de variable aleatoria Binomial y su
aproximación a una Normal. En efecto, por definición, si X representa el número de individuos que tienen la
característica
p mencionada en un conjunto de n elementos, seguirá una B(n, p), de media np y desviación típica
np(1 − p). Así pues, puede considerarse que la proporción P̂ , sigue aproximadamente
q una distribución como
p(1−p)
la de X, dividida por n. Su media y desviación típica son respectivamente, p y y cuando n es grande,

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


n
se hace una aproximación por una distribución Normal.

Ejemplo 4.10

Se sabe que un nuevo fármaco ha curado al 85 % de los enfermos a los que se les ha aplicado. Calcular la
distribución muestral de la proporción para muestras de tamaño 30, 100 y 1000.
Solución. La proporción de enfermos curados es p = 85/100 = 0.85 (la proporción poblacional). Por tanto, la
variable aleatoria P̂ que representa la proporción muestral tiene la media p = 0.85. Discutamos el valor de la
desviación típica y la ley que sigue la distribución muestral según el valor de n en cada muestra:

Tenemos n = 30, p = 0.85. La media proporcional es p = 0.85 y la desviación típica es


r r
p(1 − p) 0.85 × 0.15
= = 0.0652
n 30

Luego P̂ ∼ N (0.85, 0.0652).


q q
p(1−p) 0.85×0.15
Para n = 100, la desviación típica es n = 100 = 0.036. Además, P̂ ∼ N (0.85, 0.036).
q q
p(1−p) 0.85×0.15
Para n = 1000, la desviación típica es n = 1000 = 0.0113.
Además, P̂ ∼ N (0.85, 0.0113).

Ejemplo 4.11

En unas elecciones a alcalde el 56 % de los votantes optó por el candidato A, mientras que el 44 % lo hizo por
el candidato B.
a) Hallar la distribución de probabilidad de la proporción de muestras de tamaño 50 extraídas de la pobla-
ción.
b) Calcular la probabilidad de que la proporción, en muestras de 50 votantes sea, al menos de 30 votos
favorables al candidato A.
Dpto. EDAN
Solución. Apartado a): La característica que estudiamos es «votantes al candidato A». Se trata de distri-
bución de proporciones, P̂ , en muestras de tamaño n = 50. Tenemos que p = 0.56, n = 50. Entonces
r ! r ! r !
p(1 − p) 0.56(1 − 0.56) 0.56 × 0.44
P̂ ∼ N p, = N 0.56, = N 0.56, = N (0.56, 0.07)
n 50 50

P̂ − 0.56
Tipificando la variable, tenemos Z = ∼ N (0, 1)
0.07
Apartado b):

   
30 0.6 − 0.56
P P̂ ≥ = P (P̂ ≥ 0.6) = P Z≥ = P (Z ≥ 0.57) = 1 − P (Z ≤ 0.57) = 1 − 0.7157 = 0.2843
50 0.07

Matemática Aplicada y Estadística Dpto. EDAN - Univ. de Sevilla


4. Teoría de muestras 9

4.1.7 Distribución muestral de la diferencia de medias


Supongamos que tenemos dos grupos de poblaciones A y B de los que queremos estudiar una característica (por
ejemplo, su peso o su altura). Supongamos que las poblaciones A y B tienen, con respecto a esta característica,
las medias µ1 , µ2 y las desviaciones típicas σ1 , σ2 respectivamente, y que las variables aleatorias que describen

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


dichas poblaciones son X1 y X2 respectivamente.
Tomamos una muestra de tamaño n1 de la población A y una muestra de tamaño n2 de la población B. Para
comparar los dos grupos poblaciones, vamos a considerar la diferencia de sus medias: x1 − x2 . Si se realiza el
mismo proceso para otros n1 elementos de A y n2 elementos de B para cada una de ella obtenemos sus medias
y las diferencias de dichas medias: x01 − x02 . Así sucesivamente, si elegimos otras muestras de tamaños n1 y n2
respectivamente y calculamos sus medias y las diferencias de las medias obtenemos:

x1 − x2 , x01 − x02 , x001 − x002 , x000 000


1 − x2 , . . .

Esta diferencia de medias da lugar a una variable aleatoria, llamada diferencia muestral de las medias, que
representamos por X 1 − X 2 . La distribución de X 1 − X 2 se llama distribución muestral de la diferencia
de las medias.

Se puede demostrar que:

Distribución muestral de s la diferencia de las medias: La variable aleatoria X 1 − X 2 tiene la media


σ12 σ2
µ1 −µ2 , la desviación típica + 2 , y cuando n1 y n2 son grandes se aproxima a la Normal correspondiente.
n1 n2
También se aproxima a la Normal si las poblaciones de partida son Normales, independiente del tamaño de
las mismas. Así,
 s 
2 2
σ1 σ
X 1 − X 2 ∼ N µ1 − µ2 , + 2
n1 n2

Ejemplo 4.12

Supongamos que los salarios de dos poblaciones, una de hombres y otra de mujeres, siguen una distribución
Normal N (914, 42) y N (883, 30), respectivamente. Escojamos al azar una muestra de 40 hombres y una muestra
de 30 mujeres.
¿Cuál es la probabilidad de que el sueldo medio de los hombres supere al de las mujeres en 36 euros? Dpto. EDAN
Solución: Como X 1 y X 2 siguen una distribución Normal, la variable aleatoria X 1 − X 2 sigue también una
distribución Normal:
r !
422 302
X 1 − X 2 ∼ N 914 − 883, + = N (31, 8.61)
40 30
Por tanto, tipificando la variable, tenemos
 
36 − 31
P (X 1 − X 2 ≥ 36) = P Z ≥ = P (Z ≥ 0.58) = 1 − P (Z ≤ 0.58) = 1 − 0.72 = 0.28.
8.61

Cuando se desconoce el valor de las desviaciones típicas de las poblaciones, σ1 y σ2 , es necesario testar si éstas
son iguales o no y dependiendo de ello, se elige la variable aleatoria, T , para tomar decisiones sobre la diferencia
de medias.

Matemática Aplicada y Estadística Dpto. EDAN - Univ. de Sevilla


4. Teoría de muestras 10

Distribución muestral de la diferencias de las medias: σ1 y σ2 desconocidos.


Sean ŝ1 y ŝ2 las cuasidesviaciones típicas muestrales respectivas de X 1 y X 2 .

Si se asume que las varianzas poblacionales son iguales, se define la cuasivarianza conjunta como

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


(n1 − 1)ŝ21 + (n2 − 1)ŝ22
ŝ2p = ,
n1 + n2 − 2
entonces la variable aleatoria

(X̄1 − X̄2 ) − (µ1 − µ2 )


T = q ∼ tn1 +n2 −2 (4.4)
ŝ2p ( n11 + n12 )

sigue una t-Student de n1 + n2 − 2 grados de libertad.

Si se asume que las varianzas poblacionales no son iguales, entonces la variable

(X̄1 − X̄2 ) − (µ1 − µ2 )


T = q 2 ∼ tγ (4.5)
ŝ1 ŝ22
n1 + n2

sigue una t-Student de γ grados de libertad, donde


2
ŝ21 ŝ22

n1 + n2
γ=  2 2  2 . (4.6)
ŝ1 ŝ2
2
n1 n2

n1 −1 + n2 −1

Dpto. EDAN

Matemática Aplicada y Estadística Dpto. EDAN - Univ. de Sevilla


4. Teoría de muestras 11

Ejemplo 4.13

Consideramos los datos del Ejemplo 4.12. Supongamos que los salarios de dos poblaciones, una de hombres
y otra de mujeres, siguen una distribución Normal de media µ1 = 914 y µ2 = 883 respectivamente. No se

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


conocen las desviaciones típicas poblacionales, pero se tienen las desviaciones típicas muestrales, ŝ1 = 35 y
ŝ2 = 33. Calcular la probabilidad de que el sueldo medio de los hombres supere al de las mujeres en 36 euros
en el caso de que

a) las desviaciones típicas poblacionales se pueden suponer iguales,


b) se desconoce si las desviaciones típicas son iguales.

Solución: En primer caso, usamos la variable aleatoria T dada por (4.4), con la cuasivarianza conjunta dada
por

(n1 − 1)ŝ21 + (n2 − 1)ŝ22 39 × 352 + 29 × 332


ŝ2p = = = 1167
n1 + n2 − 2 68
La variable aleatoria T sigue una distribución t de Student de n1 + n2 − 2 = 40 + 30 − 2 = 68 grados de
libertad. Se mira en la tabla para el número de grados de libertad más próximo, que es 70. Tipificando la
variable, tenemos:

P (X 1 − X 2 ≥ 36) = P (T ≥ 0.6060) = 1 − P (T ≤ 0.6060) = 1 − 0.72 = 0.28.


En el segundo caso, la variable aleatoria T dada por (4.5) sigue una distribución t de Student de γ grados de
libertad, siendo γ dado por (4.6):
2
ŝ21 ŝ22

n1 + n2 (30.625 + 36.3)2
γ=  2 2 2 = 30.6252 2 = 64.4
+ 36.3

ŝ1 ŝ2
2
n1 n2 39 29
n1 −1 + n2 −1

Luego,

 
36 − 31
P (X 1 − X 2 ≥ 36) = P T ≥ q  = P (T ≥ 0.6) = 1 − P (T ≤ 0.6) = 1 − 0.72 = 0.28.
30.6252 36.32
39 + 29 )

Dpto. EDAN

Matemática Aplicada y Estadística Dpto. EDAN - Univ. de Sevilla


Bibliografía

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.


[1] B. Pateiro López, ESTADÍSTICA ingeniería química USC,
http://eio.usc.es/pub/pateiro/files/IQ0809Pateiro.pdf
[2] J. Susan Milton, Estadística para Biología y Ciencias de la Salud, MCGRAW-HILL, 2001.

Dpto. EDAN

12
Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.
Índice de Tema 4

4. Teoría de muestras 1
4.1. Tipos de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
4.1.1. Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
4.1.2. Muestreo aleatorio estratificado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
4.1.3. Muestreo aleatorio sistemático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
4.1.4. Muestreo por conglomerados y áreas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
4.1.5. Distribución muestral de las medias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
4.1.6. Distribución muestral de la proporción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4.1.7. Distribución muestral de la diferencia de medias . . . . . . . . . . . . . . . . . . . . . . . 9

Bibliografía 11

Dpto. EDAN

13

También podría gustarte