Está en la página 1de 11

TEORÍA DEL MUESTREO

TAREA No. 3

Notas:
1. Esta tarea es para la 1ª. sección del grupo (del No. 1 al No. 25 de la lista)
2. Si algún alumno no aparece en la lista que les comparto, entonces puede escoger cualquiera de
las dos versiones de esta tarea.

3. Aparentemente esta tarea es extensa (porque el documento tiene 11 páginas), pero es sólo en
apariencia, porque de manera resumida van a realizar lo siguiente:

a) Capturar dos conjuntos de datos en un paquete estadístico, por ejemplo, Excel:


a.1) Uno con 50 valores para la Media de la muestra ( y )
a.2) Otro con 50 valores para la Varianza muestral ( S2)

b) En cada conjunto de datos:


b.1) Ordenar los datos por magnitud de forma ascendente
b.2) Pedirle al paquete estadístico que obtenga las Medidas Descriptivas: de ellas rescatar la
media, la amplitud (o el rango), la varianza y la desviación estándar de la población
b.3) Elaborar sus Tablas de frecuencias, para las cuales yo les proporciono los límites de clase y sus
valores medios o marcas de clase.
b.4) Hacer en cada caso un Histograma y un Polígono de Frecuencias (de preferencia en
computadora).

Con la información de la primera columna sobre la media muestral ( y ) y de la segunda columna


de la varianza muestral ( S2) referente a 50 muestras y, por tanto, con 50 datos de cada una de
ellas, elabora sus respectivas Tablas de Distribución de Frecuencias.

Nota: les sugiero que primero capturen los 50 datos en un paquete estadístico y los ordenen de
forma ascendente, es decir de menor a mayor valor, para que se te facilite contabilizar el número
de datos por clase o sea la frecuencia que pertenece a cada una de ellas.

A) Tabla de frecuencias de la variable aleatoria Media de la muestra ( y ):

Cálculo de la Anchura de clase:


'
y(50)− y(1)
Ac =
k
a) y (1 ) = 33.760
'
b) y (1 ) = y (1 ) - 0.001 = 33.760 - 0.001 = 33.759

c) y (50) = 68.100

1
d) k = 7 clases

68.1−33.759 34.341
⇒ Ac = = = 4.9058… ≃ 4.906
7 7
Nota: Cabe mencionar que, si el valor resultante de la Anchura de clase es un número irracional
(lo cual ocurre con mucha frecuencia), entonces siempre se debe redondear hacia arriba para
garantizar que el valor o los valores más grandes queden incluidos en la última clase. Asimismo,
vamos a redondear hasta con tres decimales como están originalmente los datos.

Valor medio Frecuencia1 Frecuencia2


Límites de clase (V i ) absoluta ( f i) relativa ( pi ) V i p i3
(33.759, 38.665] 36.212 2 0.04 1.44848
(38.665, 43.571] 41.118 3 0.06 2.46708
(43.571, 48.477] 46.024 7 0.14 6.44336
(48.477, 53.383] 50.838 ? ? ?
(53.383, 58.289] 55.836 ? ? ?
(58.289, 63.195] 60.742 ? ? ?
(63.195, 68.101] 65.646 ? ? ?
∑ i = 50 = m
f ∑ V i pi = ?
Notas:
1/ Posiblemente los valores de las frecuencias (absolutas) no son los correctos porque hice un
conteo a la ligera, pero ustedes tienen la oportunidad de hacerlo con absoluta exactitud
basándose en la información ordenada por magnitud.
2/ Si el tercer decimal de las frecuencias relativas es igual a cero, entonces elimina este decimal
3/ También calcula la sumatoria de los valores de la última columna, o sea ∑ V i pi (considerando
todos los decimales que resulten de dicho producto)

Donde

m: en esta tarea representa el número total de datos referentes a la Media muestral o también,
es el número total de muestras analizadas. Véase que el número de medias es igual a 50 y, por
tanto, se deduce que se levantaron previamente 50 muestras aleatorias.

Nota: obviamente debes calcular los valores cuyas celdas están vacías.

1. Elabora un Histograma (cuyo título debe decir: “Histograma de la Media Muestral ( y )”,
graficando en el eje de las abscisas los valores de los límites de clase y en el de las ordenadas los
valores de la frecuencia relativa, utilizando la información que aparece en la siguiente tabla y
desde luego, completando la información faltante sobre la frecuencia relativa ( pi) y redondeada a
dos decimales:

Frecuencia relativa1 (
Límites de clase pi)
(33.7, 38.7] 0.04
(38.7, 43.6] 0.06
(43.6, 48.5] 0.14

2
(48.5, 53.4] ?
(53.4, 58.3] ?
(58.3, 63.2] ?
(63.2, 68.1] ?
1/ Posiblemente los valores de las frecuencias relativas no son los correctos

2. Elabora un Polígono de Frecuencias (cuyo título debe decir: “Polígono de Frecuencias de la


Media Muestral ( y )”, graficando en el eje de las abscisas las marcas de clase o los valores medios
de clase (V i ) y en el de las ordenadas los valores de la frecuencia relativa (redondeada a dos
decimales), utilizando la información que aparece en la siguiente tabla. Pero recuerda que es una
gráfica cerrada por ambos lados por lo que hay que agregar los siguientes dos pares ordenados: (
LI 1, cero) y ( LS7 , cero), o sea en esta tarea: (33.7, 0) y (68.1, 0); también de preferencia hazlo en
computadora:

Valor medio Frecuencia relativa1


(V i ) ( pi )
33.7 0
36.2 0.04
41.1 0.06
46.0 0.14
50.8 ?
55.8 ?
60.7 ?
65.6 ?
68.1 0
1/ Posiblemente los valores de estas frecuencias son incorrectos

3. Preguntas y comentarios:

a) ¿El histograma y el polígono de frecuencias son “aproximadamente simétricos” o son


“claramente asimétricos”? Responde esta pregunta.

b) Cabe subrayar que el Polígono de Frecuencias es una aproximación de la gráfica de la


Distribución de Probabilidad de la variable aleatoria Media muestral.

c) En el paquete estadístico pide el cálculo de las Medidas Descriptivas:

De tal manera que, si la media aritmética de estas 50 Medias muestrales se obtuviera


manualmente, entonces se debería aplicar el siguiente procedimiento:
50

c.1) Promedio de dichas Medias muestrales =


∑ yi =
y 1+¿ y
2+ ...+ y 50
¿
i=1
m
m
56.020+ 53.650+. ..+56.731
= =?
50

3
Cabe mencionar, que dicho promedio es una buena aproximación de la E ( y ) o μ y , pero en este
ejercicio no son iguales porque únicamente se están analizando 50 muestras y no todas las
muestras posibles, cuyo número asciende al valor resultante de la combinatoria 100C20. Si esto se
pudiera constatar en la práctica, es decir, si pudiéramos levantar todas estas muestras, estaríamos
corroborando que la variable aleatoria Media de la muestra ( y ) es un Estimador Insesgado (este
concepto lo estudiaremos posteriormente) de la Media poblacional ( μ), o sea que: E ( y ) = μ o E (
y) = μy

c.2) ¿la Media aritmética de estas 50 medias es un valor cercano de la Media de la población ( μ y
)? (responde sí o no), cuyo valor de μ y en los datos del Cuadro Anexo de la tarea aparece con el
valor de μ = 52.575 (véase la última columna). Si dicho resultado se observa que es casi igual a μ,
entonces es un indicador que la variable aleatoria Media (aritmética) muestral ( y ) es un
Estimador Insesgado del Parámetro Media poblacional ( μ y ). Es decir, si analizáramos todas las
muestras posibles obtendríamos que E ( y ) = μ y

c.3) La varianza de esas 50 medias muestrales es una aproximación de la Varianza de la Media


2
muestral (σ y ). Anota en la tarea su valor (cuyo valor en el paquete estadístico aparece con el título
de varianza de la población).

2
c.4) Obtén la raíz cuadrada de σ y , misma que ya sabemos que representa el Error (la desviación)
Estándar de la Media muestral (σ y ). También se puede obtener directamente del paquete
estadístico cuyo título es desviación estándar de la población. Cuyo valor de conocerlo nos
permitiría calcular, en términos probabilísticos, los valores de la variable aleatoria Error de
Muestreo (ε ), porque: ε = Z α σ y . Por ejemplo, si deseamos un 95% de probabilidad o
2
confiabilidad, entonces: ε = 1.96σ y .

B. Obtén los 50 errores de muestreo (ε ) de la variable aleatoria media muestral ( y ):

Nota: Te sugiero que calcules este Error con base en la información de la media muestral cuando
ya esté ordenada de manera ascendente, de tal suerte que vas a obtener dichos Errores también
ordenados, apareciendo primero los errores más pequeños (con signo negativo) y al final los más
grandes (con signo positivo), lo cual te facilitará generar su Tabla de Frecuencias, por lo que los
datos serán distintos a como lo expreso en la siguiente Tabla en la que dichos Errores aparecen
desordenados. (porque los obtengo como están los datos de la v. a. y en la información original):

No. v. a. y μ = μy v. a. ε = y - μ y
1 56.020 52.575 3.445
2 53.650 52.575 1.075

4
3 60.052 52.575 7.477
4 49.350 52.575 -3.225
5 49.082 52.575 -3.493
6 52.575
7 52.575
8 52.575
9 52.575
10 52.575
11 52.575
12 52.575
13 52.575
14 52.575
15 52.575
16 52.575
17 52.575
18 52.575
19 52.575
20 52.575
21 52.575
22 52.575
23 52.575
24 52.575
25 52.575
26 52.575
27 52.575
28 52.575
29 52.575
30 52.575
31 52.575
32 52.575
33 52.575
34 52.575
35 52.575
36 52.575
37 52.575
38 52.575
39 52.575
40 52.575
41 52.575
42 52.575
43 52.575
44 52.575
45 52.575
46 57.694 52.575 5.119
47 63.771 52.575 11.196
48 48.835 52.575 -3.740

5
49 66.375 52.575 13.800
50 56.731 52.575 4.156
↑ ↑ ↑
valor variable valor fijo valor variable ⇒ ε es una variable aleatoria (v. a.)

La Media muestral ( y ) sea una variable aleatoria!!

1. Genera la Tabla de frecuencias del Error de Muestreo (ε ) con 7 clases y hasta con tres
decimales como lo establecí en la tabla de la media muestral, o sea debes calcular previamente la
Anchura de clase (considera que si obtienes un número irracional entonces debes redondear su
valor siempre hacia arriba) y expresa en dicha tabla: los límites de clase, los valores medios, las
frecuencias (absolutas) y las frecuencias relativas.

Nota: te voy a ayudar en la elaboración de la Tabla de frecuencias del Error de Muestreo (ε )

ε (50 )−ε '


Ac = (1)

a) ε (1) = y (1 ) - μ y = 33.760 - 52.575 = -18.815

'
b) ε (1) = ε (1)- 0.001 = -18.815 - 0.001 = -18.816

c) ε (50) = y (50) - μ y = 68.100 - 52.575 = 15.525

d) k = 7 clases

ε (50 )−ε ' 15.525−(−18.815) 15.525+ 18.815 34.34


⇒ Ac = (1)
= = = = 4.9057… ≃ 4.906
k 7 7 7

Valor medio Frecuencia1 Frecuencia1


Límites de clase (V i ) absoluta ( f i) relativa ( pi ) V i pi
(-18.816, -13.910] -16.363 2 0.04 -0.65452
(-13.910, -9.004] -11.457 3 0.06 -0.68742
(-9.004, -4.098] -6.551 7 0.14 -0.91714
(-4.098, 0.808] -1.645 ? ? ?
(0.808, 5.714] 3.261 ? ? ?
(5.714, 10.620] 8.167 ? ? ?
(10.620, 15.526] 13.073 ? ? ?
∑ f i = 50 = m ∑ V i pi = ?
1/ Posiblemente los valores de las frecuencias absolutas y relativas son incorrectos.

Nota: debes obtener valores de las frecuencias absolutas y relativas exactamente iguales a las
obtenidas en la Tabla de la Media de la muestra. (verifícalo antes de continuar).

6
2. En la variable aleatoria Error de Muestreo (ε ) calcula su Media aritmética (como una
aproximación de la E (ε ) o με ). También te sugiero que le solicites al paquete estadístico las
Medidas Descriptivas.

50

Desde luego, tú podrías calcular manualmente dicho Promedio =


∑ εi = ε1 +ε 2+. . .+ε 50 ≃ E(ε ) o
i=1
50
m
με

3. ¿El valor de esta media es aproximadamente igual a cero, o sea με ≃ 0? Contesta sí o no. Si se
aproxima a cero, entonces también es un indicador que la variable aleatoria Media muestral ( y )
es un Estimador Insesgado de la Media de la población ( μ y ). O sea, se debe obtener: με = 0
(cuando se analizan todas las muestras posibles).

4. Registra el valor de la Desviación Estándar del Error de Muestreo (σ ε ), cuyo valor en el paquete
estadístico aparece como desviación estándar de la población. Compara este resultado con el
Error (la desviación) Estándar de la Media de la muestra (σ x ).

Pregunta: El valor de σ ε es ¿igual o distinto al valor del Error Estándar de la Media muestral (σ x )?
Contesta esta pregunta y expresa explícitamente: ¿son iguales o diferentes?

5. Elabora un Histograma cuyo título debe decir: “Histograma del Error de Muestreo (ε ) para la
Media”; graficando en el eje de las abscisas los valores de los límites de clase (redondeados a un
decimal) y en el eje de las ordenadas, los valores de la frecuencia relativa ( pi) y redondeadas a
dos decimales, como se los pedí en el caso de la media muestral. De preferencia hazlo en
computadora.

Frecuencia relativa1 (
Límites de clase pi)
(-18.9, -13.9] 0.04
(-13.9, -9.0] 0.06
(-9.0, -4.1] 0.14
(-4.1, 0.8] ?
(0.8, 5.7] ?
(5.7, 10.6] ?
(10.6, 15.6] ?
1/ Probablemente estos valores son inexactos

6. Elabora un Polígono de Frecuencias cuyo título debe decir: “Polígono de Frecuencias del Error
de Muestreo (ε ) para la Media”, graficando en el eje de las abscisas los valores medios de clase (
V i ) redondeados a un decimal y en el de las ordenadas los valores de la frecuencia relativa
(redondeados a dos decimales). Pero recuerda que es una gráfica cerrada por ambos lados por lo

7
que hay que incorporar los siguientes dos pares ordenados: ( LI 1, cero) = (-18.9, 0) y ( LS7 , cero) =
(15.6, 0)

Valor medio Frecuencia relativa1


(V i ) ( pi )
-18.9 0
-16.4 0.04
-11.5 0.06
-6.6 0.14
-1.6 ?
3.3 ?
8.2 ?
13.1 ?
15.6 0
1/ Posiblemente sus valores son incorrectos

7. Preguntas y comentarios:

a) Cabe resaltar que este Polígono de Frecuencias es una aproximación de la gráfica de la


Distribución de Probabilidades de la variable aleatoria Error de Muestreo (ε ).

b) Compara la forma del Polígono de Frecuencias del Error de Muestreo (que es una
aproximación de su Distribución de Probabilidades) con el de la Media Muestral (que es a su vez
una aproximación de su Distribución de Probabilidades). ¿dichas Distribuciones de Probabilidad
son semejantes o son diferentes? Contesta si son: semejantes o diferentes.

8. Calcula el valor de la Anchura (o el Rango) del Error de Muestreo (ε ):

A ε = ε (50) - ε (1) = 15.525 - (-18.815) = 15.525 + 18.815 =? u obtenla directamente de los resultados
que arroja el paquete.

9. Registra y compara los valores de las diferentes Medidas Descriptivas de las v. a. Media
muestral ( y ) y del Error de Muestreo (ε ) llenando las 2 últimas columnas del siguiente cuadro:

No. Medida descriptiva v. a. Media muestral ( y ) v. a. Error de Muestreo (ε )


1 Esperanza o Media E( y ) = μ y = ? E (ε ) = με = ?
2 Varianza V ( y ) = σ 2y = ? V (ε ) = σ 2ε = ?
3 Error Estándar σy=? σε = ?
4 Amplitud Ay = ? Aε = ?

Pregunta: Expresa ¿cuáles medidas descriptivas son iguales en ambas variables ( y ) y (ε )?; y si
algunas son iguales, ¿qué te sugiere en cuanto a las similitudes o diferencias de ambas Gráficas
de Distribución de Probabilidades (o sea de los Polígonos de Frecuencias)?

8
C) Tabla de frecuencias de la variable aleatoria Varianza muestral ( S2) que aparece en la 2ª.
columna de los datos del Cuadro Anexo:

Cálculo de la Anchura de clase:


2 2'
S(50)−S(1)
Ac =
k
2
a) S(1 ) = 586.996
2' 2
b) S(1 ) = S(1 ) – 0.001 = 586.996 – 0.001 = 586.995
2
c) S(50) = 1,333.015

d) k = 7 clases

1,333.015−586.995 746.02
⇒ Ac = = = 106.5742… = 106.575 (redondeando a 3 decimales)
7 7

Nota: También te sugiero que ordenes los datos de los 50 valores de la Varianza muestral.

Valor medio Frecuencia1 Frecuencia1


Límites de clase (V i ) absoluta ( f i) relativa ( pi) V i pi
(586.995, 693.570] 640.283 9 0.18 115.25094
(693.570, 800.145] 749.858 11 0.22 164.30876
(800.145, 906.720] ? ? ? ?
(906.720, 1013.295] ? ? ? ?
(1013.295, 1119.870] ? ? ? ?
(1119.870, 1226.445] ? ? ? ?
(1226.445, 1333.020] ? ? ? ?
∑ f i = 50 = m ∑ V i pi = ?
1/ Posiblemente los valores de las frecuencias absolutas y relativas pudieran ser incorrectos

1. Elabora un Histograma (cuyo título debe decir: “Histograma de la Varianza Muestral ( S2)”,
graficando en el eje de las abscisas los valores de los límites de clase (expresados sin decimales) y
en el eje de las ordenadas los valores de la frecuencia relativa ( pi), redondeando sus valores a
dos decimales (de preferencia elabóralo en computadora):

Frecuencia relativa
Límites de clase ( pi )
(586, 694] 0.18

9
(694, 800] 0.22
(800, 907] ?
(907, 1013] ?
(1013, 1120] ?
(1120, 1226] ?
(1226, 1334] ?
1/ Posiblemente los valores de las frecuencias relativas pudieran ser incorrectos

2. Elabora un Polígono de Frecuencias (cuyo título debe decir: “Polígono de Frecuencias de la


Varianza Muestral ( S2)”, graficando en el eje de las abscisas los valores medios de clase (V i ) y en
el de las ordenadas los valores de la frecuencia relativa (redondeada a dos decimales), y ya
hemos dicho que debemos agregar los siguientes dos pares ordenados: ( LI 1, cero) y ( LS7 , cero),
que en este caso son (586, 0) y (1334, 0) para que la gráfica sea cerrada por ambos extremos:

Valor medio Frecuencia relativa


(V i ) ( pi )
586 0
640 0.18
747 0.22
? ?
? ?
? ?
? ?
? ?
1334 0
1/ Posiblemente los valores de las frecuencias relativas pudieran ser incorrectos

3. Preguntas y comentarios:

a) El Histograma y el Polígono de Frecuencias son “aproximadamente simétricos” o son


“claramente asimétricos”.

b) También como en la media muestral ( y ), el Polígono de Frecuencias es una aproximación de la


gráfica de la Distribución de Probabilidades de la variable aleatoria Varianza Muestral ( S2).

c) ¿A cuál gráfica de las Distribuciones de Probabilidad estudiadas en el curso de Estadística y


Probabilidad se parece? (si ya no te acuerdas, revisa v. a. continuas en el capítulo 6 del Libro de
Infante y Zárate).

d) En el paquete estadístico también pide el cálculo de las Medidas Descriptivas.

d.1) De tal manera que, si la media aritmética de estas 50 varianzas se obtuviera manualmente,
entonces se debería aplicar el siguiente procedimiento:

10
50

Promedio de dichas varianzas muestrales =


∑ S 2i =
S 21+ S 22+ .. .+ S250
i=1
m
m
1047.629+ 973.679+. ..+1070.385
= =?
50

Cabe mencionar, que dicho promedio es una buena aproximación de la E ( S2) o μS . No es igual al
2

valor de la E ( S2) porque, como ya lo hemos subrayado, en este ejercicio no se están analizando
todas las muestras posibles sino únicamente 50 muestras. Si pudiéramos levantar todas las
muestras posibles, entonces encontraríamos que la E ( S2) es exactamente igual a la varianza de
2 2
la población (σ y ), o sea obtendríamos que E ( S2) = σ y , con lo cual estaríamos demostrando que el
2
Estimador Varianza de la Muestra ( S2) es un Estimador Insesgado de σ y .

d.2) También anota en la tarea el valor obtenido para la Varianza de la Varianza muestral, es
2
decir: σ S (que aparece en el paquete estadístico como varianza de la población).
2

d.3) Obtén el Error (la desviación) Estándar de la Varianza muestral (σ S ), es decir calcula la raíz
2

2
cuadrada positiva de σ S
2 u obtenlo directamente de los resultados arrojados en el paquete
estadístico cuyo título es desviación estándar de la población.

d.4) Calcula la Anchura (o el Rango) de la v. a. Varianza muestral ( S2):

A S = S2(50) - S2(1 ) = 1,333.015 - 586.996 = ? (también puedes obtenerla directamente del paquete
2

estadístico)

e) ¿Por qué crees que, en esta tarea, es imposible calcular el Error de Muestreo (ε ) de la Varianza
muestral ( S2)? Porque recuerda que en el caso de la Media muestral ( y ) si lo pudimos hacer.
Contesta esta pregunta.

11

También podría gustarte