Está en la página 1de 19

U.C.A.B. Tema 1.

Técnicas de muestreo

Tema 1.
Técnicas de
muestreo

1.1. Conceptos básicos

Tres conceptos son fundamentales: Universo, Población y Muestra. Se entenderá por


universo a cualquier conjunto de seres o cosas sobre las cuales se desea realizar una
investigación. El término población se reserva para indicar a un conjunto de números
obtenidos midiendo o contando cierta característica de los elementos del universo. De este
modo podrán obtenerse varias poblaciones uni o pluridimensionales de un solo universo,
según la característica o características que se midan.

Así, p.ej., del universo de los estudiantes de la UCAB podría obtenerse la población
unidimensional constituida por los números que expresan sus edades, o la tridimensional
de sus edades, tallas y pesos. Corrientemente cuando no hay peligro de confusión, se usa
el término población en cualquiera de los dos sentidos anteriores. Una muestra es un
subconjunto del universo o población. En la práctica se seleccionan elementos del
universo para construir una muestra de personas o cosas y luego al medir u observar la(s)
característica(s) de estudio se tendrá(n) la(s) muestra(s) poblacional(es)
correspondiente(s). El proceso mediante el cual se seleccionan los elementos para
constituir la muestra se denomina muestreo.

José Luis Quintero Análisis de Datos 1


U.C.A.B. Tema 1. Técnicas de muestreo

1.2. Tipos de muestreo

Hay dos tipos de muestreo: el probabilístico y el no probabilístico. El muestreo es


probabilístico cuando puede calcularse de antemano cuál es la probabilidad de obtener
cada una de las muestras que sea posible seleccionar. Obviamente, que cuando esto no
sea posible, el muestreo se denomina no probabilístico. A su vez, dentro de cada uno de
estos tipos generales de muestreo, existen particularidades que definen las muy variadas
clases de muestreo que se presentan en la práctica. El siguiente esquema muestra
algunas de las más comunes.

  Aleatorio Simple
 Sistemático
 
 Estratificado
 Pr obabilístico 
 Conglomerados
 Bietápico - Polietápico
 
 Periódico - Control de Calidad

 Opinático o Intencional
No Pr obabilístico Circuns tan cial - Estudio de Casos
 

1.3. Inferencia estadística

Se llamará inferencia al paso de lo particular a lo general, no en el sentido de la


inducción completa utilizada en matemáticas, sino tal como se emplea en las ciencias de
la naturaleza.

Nunca una inferencia permitirá tener plena seguridad de lo afirmado con relación a
la población en estudio; sin embargo, se puede estimar el error y grado de confiabilidad
que merece nuestras estimaciones, siempre y cuando el muestreo sea probabilístico.

José Luis Quintero Análisis de Datos 2


U.C.A.B. Tema 1. Técnicas de muestreo

En el muestreo no probabilístico esta posibilidad no está presente y en consecuencia


dichos muestreos carecen del rigor científico que presentan las muestras probabilística;
esto no quiere decir en ningún caso que no se usen muestras no probabilísticas, ya que las
mismas aún de carecer del rigor científico del que se mencionó, en algunos casos
representan la única posibilidad de acción, y si están bien controladas, tratando de
acercarse a la representatividad deseada, producen buenos resultados.

1.4. Conveniencia del muestreo

Puesto que la inferencia supone riesgo, es útil indicar en qué casos conviene obtener
muestras, en lugar de censos o investigaciones exhaustivas, de todos los elementos del
universo. La decisión óptima consiste en emplear recursos mínimos para obtener
determinada información. O bien en conseguir máxima información mediante recursos
prefijados. También puede decirse que se trata de minimizar la pérdida total, en la que se
incluyen, por una parte los recursos empleados (medidos si es posible en unidades
monetarias, e incluyendo tiempo, equipo, esfuerzos), y por otra, el “error” (alguna medida
de la desviación absoluta promedio esperada entre el valor verdadero desconocido y el
estimado) y la probabilidad de cometerlo.

Habrá que tomar muestras en las siguientes situaciones:


a) cuando el universo sea infinito, o tan grande, que el censo exceda de las
posibilidades del investigador.
b) cuando el universo sea lo suficientemente uniforme con relación a la variable o
característica principal objeto de la investigación, para que cualquier muestra
dé una buena representación de la población asociada y carezca de sentido
examinar a la población completa.
c) cuando el proceso de medida o investigación de las características de cada
elemento sea destructivo, como ocurre al consumir un artículo para juzgar su
calidad, o al determinar una dosis letal o un punto de ruptura.

José Luis Quintero Análisis de Datos 3


U.C.A.B. Tema 1. Técnicas de muestreo

Hay situaciones menos extremas, pero que se aproximan a las anteriores. Sin ser
estrictamente imposible el estudio de una población, puede serlo prácticamente por el
número de sus elementos. O bien puede ocurrir que la población sea aceptablemente
homogénea. O que los elementos investigados en las muestras no lleguen a inutilizarse,
pero si a disminuir su valor. Así ocurrirá siempre que haya que someter el elemento
estudiado a operaciones que puedan viciar su utilidad, o surgen inconvenientes de otros
géneros, como el desagrado de personas a los que se somete a excesivas encuestas. Aparte
de las expuestas anteriormente en dichos tres casos, existen otras razones que pueden
hacer ventajoso el muestreo. (1) Economía, (2) Mayor rapidez en la obtención de los
resultados.

1.5. Limitaciones del muestreo

Además del riesgo que lleva consigo toda muestra, conviene destacar otras
limitaciones del muestreo. Es obvio que no será posible utilizar muestras cuando se
necesita información sobre todos los elementos del universo. Tal es el caso de una elección
presidencial.

Tampoco resulta conveniente cuando el universo es muy pequeño, ya que al ser


fácilmente comprobable la diferencia entre el estimado y el valor real, puede generarse
desconfianza en el público, especialmente en personas carentes de preparación estadística
adecuada, aunque los resultados de las muestras sean aceptables. Otra limitación es la
dificultad que supone el empleo de un instrumento delicado y complejo, como lo es la
teoría del muestreo. El muestreo exige, en comparación con la realización de censos y
estudios exhaustivos, menos cantidad de trabajo bruto, pero mayor refinamiento y
preparación. No solamente cierta base estadístico-matemática en los diseñadores, y a ser
posible una buena experiencia de trabajos sobre el terreno, sino también un buen
entrenamiento de los agentes, inspectores y supervisores.

José Luis Quintero Análisis de Datos 4


U.C.A.B. Tema 1. Técnicas de muestreo

1.6. Elementos para una investigación


por muestreo

1. Finalidad
Referido al uso que se dará a la información que se obtenga una vez cuantificados los
objetivos específicos de la investigación. Es decir, responde a la pregunta ¿para qué?

2. Objetivos
Los objetivos generales indican el alcance del estudio en forma global. Los objetivos
específicos corresponden al desarrollo de los objetivos generales señalando sin
ambiguedades las características poblacionales a ser estimadas.

3. Cobertura
La cobertura horizontal se refiere al alcance geográfico donde se realizará el estudio.
La cobertura vertical fija los niveles de desagregación deseada de la información.

4. Período de Referencia
La mayoría de las investigaciones comprenden variables que cambian en el tiempo,
por ello es importante señalar el período en el cual fueron observadas las mismas.

5. Variables en Estudio
Deben definirse las variables a ser observadas en la investigación, indicando las
variables claves del diseño que servirán para los cálculos de los tamaños muestrales.

6. Antecedentes
Es de suma importancia disponer de investigaciones ya realizadas iguales o
similares a las que nos proponemos llevar a cabo ya que nos servirán para la
reducción de errores y estrategias computacionales y administrativas.

7. Recursos disponibles
Técnicos, físicos, financieros, de tiempo, marcos muestrales.

José Luis Quintero Análisis de Datos 5


U.C.A.B. Tema 1. Técnicas de muestreo

1.7. Muestreo aleatorio simple

El muestreo aleatorio sin reemplazamiento en universos finitos, llamado también


muestreo irrestrictamente aleatorio o, más sencillamente, muestreo aleatorio simple
(cuando no existe posibilidad de confusión entre éste y el muestreo con reemplazamiento),
consiste en la selección de n elementos entre los N que constituyen el universo, de modo
que todas las muestras posibles de tamaño n (tantas como combinaciones de N elementos
N
de n en n) tengan la misma probabilidad 1   de ser obtenidas.
n 

Con este supuesto, por ser equiprobables todas las muestras de n elementos, la
probabilidad de que un elemento del universo u forma parte de la muestra se puede
calcular así:

N −1
 
Número de Muestras de tamaño n que contienen a u  n − 1  n
= =
Número total de Muestras de tamaño n N N
 
n 

Por ejemplo, en una clase de 20 personas, si se quiere obtener una muestra de 5


para estudiar la estatura media, el número posible de combinaciones que se podrán
obtener es de
 20  20!
 = = 15504 .
 5  5!15!

Son 15504 combinaciones de muestras posibles, de las que la estatura media que se
obtenga pueda variar.

José Luis Quintero Análisis de Datos 6


U.C.A.B. Tema 1. Técnicas de muestreo

1.8. Selección de una muestra


aleatoria simple

Existen varios procedimientos para seleccionar una muestra aleatoria simple sin
reemplazo de tamaño n de un universo que contiene N elementos. Basta con garantizar
que cada elemento del universo tiene la misma probabilidad de ser seleccionado. En
primer lugar habrá que numerar todos los elementos del universo en forma consecutiva
desde el 1 hasta el N.

Método 1. El método más intuitivo de todos es el de elaborar una especie de lotería o


bingo formada por fichas numeradas (bolitas) de igual peso y forma (para garantizar la
equiprobabilidad) y luego proceder a extraer de manera completamente aleatoria, n de
tales fichas.

Método 2. Mediante el uso de una tabla de números aleatorios. El objeto de las tablas de
números aleatorios es facilitar la obtención de los elementos que han de constituir la
muestra, sin tener que usar bombos, cajas para bolas u otros utensilios más o menos
complicados, pero consiguiendo que el procedimiento de selección asigne a cada elemento
de la población la misma probabilidad de ser seleccionado. En todas estas tablas lo que se
trata de representar es el resultado de un experimento aleatorio, o muestreo aleatorio con
reemplazamiento, de una población constituida por los diez dígitos desde el cero hasta el
nueve. Claro es que por la reunión de cifras contiguas en las columnas y en las filas de la
tabla se obtendrían inmediatamente sucesiones de números que pudieran considerarse
como muestras de una población constituida por los cien números de dos cifras que van
del 00 al 99, por los mil de tres cifras del 000 al 999, etc.

La disposición de las diferentes tablas de números aleatorios consiste en presentar


grupos de dígitos en filas y columnas, p. ej., de cuatro en cuatro, de cinco en cinco, etc., de
modo que la vista pueda seguir cómodamente los grupos de números.

José Luis Quintero Análisis de Datos 7


U.C.A.B. Tema 1. Técnicas de muestreo

Una vez numerados los N elementos del universo que van a ser objeto de selección
aleatoria para constituir la muestra de tamaño n, se toma una página cualquiera de la
tabla sin mirarla previamente para que no exista tendencia o sesgo en su designación, y
luego en dicha página, se toma, también a ciegas, un dígito cualquiera que servirá de
origen. Si hubiera que tomar varias muestras, se aconsejano partir siempre del mismo
origen. A continuación se van siguiendo las filas o columnas y se anotan los n primeros
números inferiores a N.

Ejemplo ilustrativo 1.8.1.


Seleccionar una muestra aleatoria sin reemplazamiento de n=18 en una población de
tamaño N=86.

Los elementos de la población se enumeran desde el 00 hasta el 85. A continuación se


seleccionan dígitos de dos cifras que sean inferiores a 86, descartándose los repetidos,
hasta obtener los 18 números requeridos.

Mediante el uso de alguna tabla anexa, se seleccionó arbitrariamente la página 2 y dentro


de élla el dígito que ocupaba la 6ta. Fila con la 13ra. Columna. De esta manera
moviéndonos de manera vertical obtuvimos el siguiente resultado: 61, 50, 21, 67, 25, 31,
16, 10, 29, 91, 80, 02, 42, 83, 57, 11,52

Método 3. Mediante la selección de un número aleatorio en el intervalo (0,1) que


corresponde al valor de una variable uniformemente distribuida en dicho intervalo. Si x
representa el valor que toma una variable uniforme continua en el intervalo (0,1),
entonces un elemento de la población asociado a x viene dado por y = [ x N ] + 1

Método 4. Mediante el concurso de un paquete computacional: Excel, SPSS, Minitab,


Statistics, etc.

José Luis Quintero Análisis de Datos 8


U.C.A.B. Tema 1. Técnicas de muestreo

1.9. Muestreo aleatorio estratificado

En el muestreo estratificado, la población de N unidades se divide primero en


subpoblaciones de N1 , N 2 , ..., N L unidades, respectivamente. Estas subpoblaciones, no se
traslapan y en su conjunto comprenden a toda la población. En tal sentido
N1 + N 2 + ... + N L = N .

Las subpoblaciones se denominan estratos. Para obtener todo el beneficio de la


estratificación, los valores de los N H deben ser conocidos. Una vez determinados los
estratos, se extrae una muestra de cada uno. Las extracciones deben hacerse
independientemente en los diferentes estratos. Los tamaños de muestra dentro de los
estratos se denotan con n1 , n2 , ..., n L , respectivamente.

Si se toma una muestra aleatoria simple en cada estrato, el procedimiento total se


describe como un muestreo aleatorio estratificado. La estratificación es una técnica
común. Para esto hay muchas razones; las principales son las siguientes:

a. Si los datos deseados deben tener una precisión conocida en algunas subdivisiones
de la población, es aconsejable tratar cada subdivisión como una “población” por
derecho propio
b. Por conveniencia administrativa, puede ser necesario el uso de la estratificación;
así, por ejemplo, la agencia que realiza una encuesta, podría tener sucursales en el
campo, cada una de las cuales supervisaría la encuesta de una parte de la
población
c. Los problemas de muestreo pueden tener marcadas diferencias en diversas partes
de la población. Con poblaciones humanas, las personas que viven en instituciones
(como hoteles, hospitales, cárceles) se colocan en un estrato diferente de las que
viven en casas ordinarias, ya que otro método de muestreo es el apropiado para
cada una de estas dos situaciones. Al muestrear negocios, se podría tener una lista
de las grandes firmas que se deben colocar en un estrato diferente.Quizá algún tipo
de muestreo por áreas debe usarse para las firmas más pequeñas

José Luis Quintero Análisis de Datos 9


U.C.A.B. Tema 1. Técnicas de muestreo

d. La estratificación puede dar lugar a una ganancia en la precisión de las


estimaciones de características de la población total. Quizá sea posible dividir una
población heterogénea en subpoblaciones, en las que cada una sea internamente
homogénea. Esto es lo que sugiere el nombre de estratos, con su implicación de una
división en capas.

1.10. Etapas principales en una


encuesta por muestreo

Los pasos principales en una encuesta están agrupados bajo 11 encabezados y se


citan a continuación:

a. Objetivos de la encuesta. Una exposición clara de los objetivos es lo más útil.

b. Población bajo muestreo. La población que se muestrea (población muestreada)


debe coincidir con la población sobre la cual se desea información (la población
objetivo). En ocasiones, por razones de factibilidad o simple conveniencia, la
población muestreada es más restringida que la población objetivo. De ser así, debe
recordarse que las conclusiones extraídas de la muestra son aplicables a la
población muestreada.

c. Los datos recogidos. Es conveniente cerciorarse que todos los datos son
pertinentes a la encuesta y que no se omiten datos esenciales. Particularmente en
presencia de poblaciones humanas, existe la tendencia a hacer un número excesivo
de preguntas que no se analizan posteriormente.

José Luis Quintero Análisis de Datos 10


U.C.A.B. Tema 1. Técnicas de muestreo

d. Grado de precisión deseado. Los resultados de una encuesta por muestreo


están siempre sujetos a cierta incertidumbre porque solo se mide una parte de la
población, y por los errores en las mediciones realizadas. Esta falta de certeza se
puede reducir al tomar muestras más grandes y emplear mejores dispositivos de
medición.

e. Métodos de medición. Puede existir la posibilidad de escoger el método de


medición y el método de inspección de la población. Los datos acerca del estado de
salud de una persona se pueden obtener de sus declaraciones, o de un examen
médico. La encuesta puede emplear un cuestionario autoadministrado, o un
proceso de entrevistas en las que los entrevistadores simplemente leen un
cuestionario prescrito, o bien, un proceso en el que se permite mucha libertad en la
forma y el orden de las preguntas.

f. El marco. Antes de seleccionar la muestra, la población puede ser dividida en


partes llamadas unidades de muestreo o unidades. En el muestreo de los
residentes de una ciudad, la unidad puede ser una persona, los miembros de una
familia o las personas que viven en una manzana. Frecuentemente, la construcción
de esta lista de unidades de muestreo, llamada marco, es uno de los principales
problemas prácticos.

g. Selección de la muestra. Existe, actualmente, una gran variedad de planes para


seleccionar una muestra. Por cada plan considerado, se pueden hacer estimaciones
del tamaño de la muestra, partiendo de un conocimientodel nivel de precisión
deseado.

h. La encuesta piloto. Es de gran utilidad probar el cuestionario y los métodos de


campo en pequeña escala. Esto casi siempre da por resultado mejoras al
cuestionario y puede evitar otros problemas que serían serios a mayor escala.

José Luis Quintero Análisis de Datos 11


U.C.A.B. Tema 1. Técnicas de muestreo

i. Organización del trabajo de campo. En encuestas extensas se encuentran


muchos problemas de oden administrativo. El personal debe recibir un
entrenamiento sobre el propósito de la encuesta y los métodos de medición que se
emplearán. Un procedimiento de verificación anticipado sobre la calidad de las
respuestas es de incalculable valor

j. Resumen y análisis de los datos. El primer paso después de realizar la


encuesta es el editar los cuestionarios obtenidos, con la esperanza de corregir
errores o cuando menos desechar los datos que obviamente están equivocados.
Después se realizarán los cálculos que conduzcan a las estimaciones. Una práctica
aconsejable en la presentación de los datos es informar la magnitud esperada de
error en las estimaciones más importantes.

k. Información conseguida para encuestas futuras. Cuanta más información de


una población se tenga inicialmente, más fácil será el diseño de una muestra que
proporcione estimaciones exactas. Toda muestra obtenida es una guía potencial de
futuros muestreos, por los datos que revela sobre las medias, las desviaciones
estándar y la naturaleza de la variabilidad de las medidas principales, así como
sobre los costos de obtención de los datos.

1.11. Determinación de estimadores

Estimación de la media poblacional.


El estimador insesgado de la media poblacional viene dado por la media muestral
n

x=
1
n ∑
i =1
xi .

Como x es una variable aleatoria, cabe preguntarse cuál es su distribución:

José Luis Quintero Análisis de Datos 12


U.C.A.B. Tema 1. Técnicas de muestreo

a. Si la población objetivo es normal, por ser x una combinación lineal de variables


aleatorias normales, también será normal.
b. Si la población objetivo no es normal, por el Teorema Central del Límite se
supondrá que es asintóticamente normal.
c. En tal sentido,
Población infinita:
 σ 
x ∼ N  µ, .
 n
Población finita:
 σ n  1 1 
x ∼ N  µ, 1 −  ⇒ x ∼ N  µ, σ − .
 n N   n N 
 

Estimación del total poblacional.


El total poblacional viene dado por
N

T=
∑i =1
xi .

El estimador insesgado del total poblacional viene dado por


n

τ = Nx =
N
n ∑
i =1
xi .

Al igual que con la media muestral, se puede asimilar que la distribución del
estimador del total poblacional sigue una distribución normal dada por:
 Nσ n  1 1 
τ ∼ N  Nµ, 1 −  ⇒ τ ∼ N  Nµ,Nσ − .
 n N   n N 
 

José Luis Quintero Análisis de Datos 13


U.C.A.B. Tema 1. Técnicas de muestreo

1.12. Tamaño óptimo de la muestra en


un muestreo aleatorio simple

Estimación de la media poblacional.


Población infinita.
Intervalo de confianza para la media poblacional:
σ σ
x− Zα 2 ≤ µ ≤ x + Zα 2
n n

Manipulando se tiene que


σ σ σ
− Zα 2 ≤ µ − x ≤ Zα 2 ⇒ µ − x ≤ Zα 2
n n n

Si se denota a e (error aleatorio) como


σ
e=
Zα 2 ,
n
se tiene que µ − x ≤ e . Si se desconoce σ , entonces se sustituye por su estimador

insesgado dado por


n

Sc = +
1
n −1 ∑ i =1
(x − x i )2 .

En tal sentido
2
Sc S2c 2  Sc Zα 2 
e= Zα 2 ⇒e =
2
Zα 2 ⇒ n =   .
n n  e 

Población finita.
Intervalo de confianza para la media poblacional:
1 1 1 1
x−σ − Zα 2 ≤ µ ≤ x + σ − Zα 2
n N n N

Manipulando se tiene que

José Luis Quintero Análisis de Datos 14


U.C.A.B. Tema 1. Técnicas de muestreo

1 1 1 1 1 1
−σ − Zα 2 ≤ µ − x ≤ σ − Zα 2 ⇒ µ − x ≤ σ − Zα 2
n N n N n N

Si se denota a e (error aleatorio) como


1 1
e=σ − Zα 2 ,
n N
se tiene que µ − x ≤ e . Si se desconoce σ , entonces se sustituye por su estimador

insesgado dado por


n

Sc = +
1
n −1 ∑i =1
(x − x i )2 .

En tal sentido
S2c Z2α 2 N
1 1 21 1 2
e = Sc − Z α 2 ⇒ e = Sc  −  Z α 2 ⇒ n = 2
2
.
n N n N e N + S2c Z2α 2

Estimación del total poblacional.


Intervalo de confianza para el total poblacional:
1 1 1 1
τ − Nσ − Zα 2 ≤ T ≤ τ + Nσ − Zα 2
n N n N

Manipulando se tiene que


1 1 1 1 1 1
−Nσ − Zα 2 ≤ T − τ ≤ Nσ − Zα 2 ⇒ T − τ ≤ Nσ − Zα 2
n N n N n N

Si se denota a e (error aleatorio) como


1 1
e = Nσ
− Zα 2 ,
n N
se tiene que µ − x ≤ e . Si se desconoce σ , entonces se sustituye por su estimador

insesgado dado por


n

Sc = +
1
n −1 ∑(x − x ) .
i =1
i
2

En tal sentido

José Luis Quintero Análisis de Datos 15


U.C.A.B. Tema 1. Técnicas de muestreo

S2c Z2α 2 N 2
1 1 2 21 1 2
e = NSc − Z α 2 ⇒ e = Sc N  −  Z α 2 ⇒ n = 2
2
.
n N n N e + S2c Z2α 2 N

1.13. Ejemplo ilustrativo 1

Se recabaron firmas para una petición en 676 hojas. Cada hoja tenía espacio suficiente
para 42 firmas, pero en muchas de las hojas se recabó un número menor. Se contó el
número de firmas por hoja en una muestra al azar de 50 hojas (muestra del 7%
aproximadamente). Los resultados se muestran en la tabla 1.

xi 42 41 36 32 29 27 23 19 16 15
fi 23 04 01 01 01 02 01 01 02 02
yx 14 11 10 09 07 06 05 04 03 Total
fi 01 01 01 01 01 03 02 01 01 50
Tabla 1. Resultados para una muestra de 50 hojas de petición
donde xi es el número de firmas y fi es la frecuencia

a. Estime promedio de firmas por hojas con un intervalo de confianza del 90%.
Solución.
50

n = 50,
∑i =1
x i = 1471, x =
1471
50
≈ 29.42,

50

S2c =
1
n −1 ∑i =1
fi (x i − x)2 = 229 ⇒ Sc ≈ 15.13

El intervalo de confianza viene dado por


1 1 1 1
x − Sc − Zα 2 ≤ µ ≤ x + Sc − Zα 2
n N n N
De modo que
1 1 1 1
29.42 − (15.13) − (1.64) ≤ µ ≤ 29.42 + (15.13) − (1.64)
50 676 50 676
29.42 − 3.38 ≤ µ ≤ 29.42 + 3.38 ⇒ 26.04 ≤ µ ≤ 32.80
El intervalo anterior al 90% de confianza viene dado por [26.04,32.80].

José Luis Quintero Análisis de Datos 16


U.C.A.B. Tema 1. Técnicas de muestreo

b. Estime el número total de firmas para la petición con un intervalo de confianza del
80%.
Solución.
50

n = 50,
∑i =1
x i = 1471, τ = Nx =
(676)(1471)
50
≈ 19888,

50

S2c =
1
n −1 ∑i =1
fi (x i − x)2 = 229 ⇒ Sc ≈ 15.13

El intervalo de confianza viene dado por


1 1 1 1
τ − NSc − Zα 2 ≤ T ≤ τ + NSc − Zα 2
n N n N
De modo que
1 1 1 1
19888 − (676)(15.13) − (1.28) ≤ T ≤ 19888 + (676)(15.13) − (1.28)
50 676 50 676
19888 − 1781.66 ≤ T ≤ 19888 + 1781.66 ⇒ 18106 ≤ T ≤ 21670
El intervalo anterior al 80% de confianza viene dado por [18106,21670]. Una
numeración completa demostró que había 21045 firmas.
c. Para los dos casos anteriores, estime el error cometido.
Solución.
Estimación del error para la media poblacional:
1 1 1 1
e = Sc − Zα 2 = (15.13) − (1.64) = 3.38
n N 50 676
Estimación del error para el total poblacional:
1 1
e = NSc − Zα 2 = 1781.66
n N
d. Para los dos casos anteriores, grafique el tamaño de la muestra en función del error
cometido.
Solución.
Estimación del error para la media poblacional:
S2c Z2α 2 N (229)(1.64)2 (676) 416360.84
n(e) = 2 = ⇒ n(e) =
e N + Sc Z α 2 e (676) + (229)(1.64)
2 2 2 2
676e2 + 615.92

José Luis Quintero Análisis de Datos 17


U.C.A.B. Tema 1. Técnicas de muestreo

Estimación del error para el total poblacional:


S2c Z2α 2 N 2 (229)(1,28)2 (676)2 171454470.55
n(e) = 2 = ⇒ n(e) = 2
e + Sc Z α 2 N e + (229)(1.28) (676)
2 2 2 2
e + 253630.87

José Luis Quintero Análisis de Datos 18


U.C.A.B. Tema 1. Técnicas de muestreo

1.14. Ejemplo ilustrativo 2

La tabla 2 muestra el número de personas (tamaño), el ingreso semanal de la familia y


los gastos semanales en comida en una muestra aleatoria simple de 33 familias de bajos
ingresos. Se pide estimar el promedio de gastos semanales en alimentos por familia, el
gasto semanal en alimentos por persona y el porcentaje de ingreso que se gasta en
alimento.

Familia Tamaño Ingreso Costo de Familia Tamaño Ingreso Costo de


alimentos alimentos
1 2 62 14.3 18 4 83 36.0
2 3 62 20.8 19 2 85 20.6
3 3 87 22.7 20 4 73 27.7
4 5 65 30.5 21 2 66 25.9
5 4 58 41.2 22 5 58 23.3
6 7 92 28.2 23 3 77 39.8
7 2 88 24.2 24 4 69 16.8
8 4 79 30.0 25 7 65 37.8
9 2 83 24.2 26 3 77 34.8
10 5 62 44.4 27 3 69 28.7
11 3 63 13.4 28 6 95 63.0
12 6 62 19.8 29 2 77 19.5
13 4 60 29.4 30 2 69 21.6
14 4 75 27.1 31 6 69 18.2
15 2 90 22.2 32 4 67 20.1
16 5 75 37.7 33 2 63 20.7
17 3 69 22.6 Total 123 2394 907.2

Tabla 2. Tamaño, ingreso semanal y costo de alimentos de 33 familias

Solución.
Promedio de gastos semanales en alimentos por familia. Media muestral:
907.2
x= = 27.49 u.m.
33
Gasto semanal en alimentos por persona.
907.2
R̂1 = = 7.38 u.m. por persona
123
Porcentaje de ingreso que se gasta en alimento.
907.2
R̂ 2 = × 100 = 37.9%
2394
José Luis Quintero Análisis de Datos 19

También podría gustarte