Está en la página 1de 45

UNIVERSIDAD DE ORIENTE

NUCLEO MONAGAS
ESCUELA DE CIENCIAS SOCIALES Y ADMINSTRATIVAS
DEPARTAMENTO DE CONTADURÍA PÚBLICA
ASIGNATURA: ESTADÍSTICA II (0913863)
PROFA.: JEZABEL FERMÍN

UNIDAD I: TEORIA DE MUESTREO Y ESTIMACIÓN

Anteriormente en la asignatura Estadística I se les enseño como organizar y presentar


los datos a través de las tablas de frecuencias y gráficos, para luego determinar las
diferentes medidas de tendencia central (media, mediana, moda), posición, dispersión
(varianza, desviación típica o estándar, coeficiente de variación), asimetría (forma de la
curva) y curtosis. Por lo que en estos contenidos se destacó la descripción de la condición de
los datos, es decir, se hizo uso de la estadística descriptiva. Al comenzar el estudio de la
probabilidad se estableció el fundamento de la inferencia estadística, es decir, la estadística
inferencial, la cual tiene por objetivo determinar algo sobre una población a partir sólo de una
muestra. Para luego culminar con las distribuciones de probabilidad, específicamente, la
distribución normal.
Para la asignatura Estadística II el estudiante debe tener dominio de lo antes
mencionado, pues en esta se trabajará con la estadística inferencial, es decir, se realizarán
inferencias a la población a partir de muestras extraídas de dicha población. Por lo que en
esta Unidad I daremos comienzo con la teoría de muestreo, el cual consiste en estudiar una
población tomando muestras, y a través del estudio de las mismas poder hacer inferencias
acerca de toda la población. Por lo que primero veremos cuáles son las razones del
muestreo, como determinar las muestras de una población, cuales son los métodos para
seleccionar una muestra de una población, construir la distribución muestral del estimador
(media muestral y proporción muestral) para entender la forma en que los estimadores
(media y proporción muestral) tienden a acumularse en torno al parámetro (media y
proporción poblacional), y por último, demostrar que, para cualquier población, la forma de
esta distribución de muestreo tiende a seguir la distribución de probabilidad normal.
Al culminar con la teoría de muestreo se continuara con las estimaciones, en donde se
estimará al parámetro poblacional (media, proporción, varianza y desviación típica o
estándar) a través de los estimadores puntuales y los intervalos de confianza, además se
determinará el tamaño de muestra necesario para estimar los parámetros poblacionales
(media y proporción).
A continuación se dará inicio a la Unidad I, comenzando con la Teoría de Muestreo y
luego con las estimaciones.
1.1TEORÍA DE MUESTREO
En el proceso de tomar decisiones, tanto en el quehacer diario de las personas como
de las empresas, se requiere disponer de la mayor información posible sobre el tema en
cuestión. Por lo que generalmente, la información que se requiere está referida a un universo
de unidades de análisis que tiene un tamaño muy grande (población).

Supóngase que se desea realizar un estudio total, completo y exhaustivo de una


población, para realizar dicho estudio se tendría que invertir mucho tiempo y recursos. Para
poder resolver estos problemas surgió la teoría de muestreo, que es un capítulo de la
estadística y de la teoría aplicada de las probabilidades.

Esta teoría trata sobre los fundamentos probabilísticos, las distribuciones estadísticas,
los métodos o técnicas de selección, las fórmulas para el cálculo de los errores de muestreo
y determinación del tamaño de la muestra de la población, y los métodos de estimación de
los parámetros poblacionales a partir de los estadísticos muéstrales. Por lo que:

La Teoría del muestreo es el estudio de las relaciones existentes entre una población
y las muestras extraídas de la misma. Esta teoría indica los procedimientos o técnicas para
extraer una parte o muestra del colectivo o población que se quiere estudiar o analizar, y del
resultado del análisis se pueden estimar o inferir datos de la población, como por ejemplo su
media (µ), varianza (σ2), etc., llamados parámetros poblacionales a partir de los valores
obtenidos de la muestra, tales como la media muestral ( ̅), varianza muestral (s2), etc.,
llamados estadísticos.

Una Población: Es cualquier conjunto de unidades o elementos claramente definido, en


el espacio y el tiempo, donde los elementos pueden ser personas, granjas, hogares,
manzanas, condados, escuelas, hospitales, empresas, y cualquier otro, siempre y cuando
tengan una característica en común. Las poblaciones pueden ser finitas e infinitas. Una
población es finita cuando es posible enumerar (contar) los elementos que pertenecen a
ella, mientras que una población es infinita cuando no es posible enumerar (contar) los
elementos que pertenecen a dicha población, es decir, cuando los elementos de la población
son ilimitados.

La Muestra: Es un subconjunto representativo de la población a partir del cual se


pretende realizar inferencias respecto a la población de donde procede. Los elementos
seleccionados con cierta técnica reúnen ciertas características que la hacen ser
representativa, significativa y confiable y que en base a ella se pueden hacer inferencias
respecto a la población.

Parámetro: Es cualquier valor característico de la población. Ejemplo: la media de la


población, la desviación típica de la población. Sin embargo estos valores son desconocidos
porque no siempre podemos tener todos los datos de la población para calcularlos.
Estadístico: es el valor calculado en base a los datos que se obtienen sobre una
muestra y por lo tanto es una estimación de los parámetros. Entre los más usados se tiene la
media muestral y la desviación estándar muestral.

Muestreo: Es un conjunto de métodos y procedimientos estadísticos destinados a la


selección de una o más muestras, con el objetivo de inferir con respecto a toda la población.
El propósito principal de un diseño de muestreo es proporcionar procedimientos para la
selección de muestras que sean representativas de la población en estudio.

Razones para efectuar un Muestreo

Las razones para efectuar un muestreo a una población, en lugar de estudiarla


directamente, son:

✔ Costos reducidos. Si los datos se obtienen únicamente de una pequeña fracción del
total, los gastos son menores que los que se realizarían para toda la población.
✔ Mayor rapidez para obtener resultados. Los datos pueden ser recolectados y
resumidos más rápidamente con una muestra que con toda la población.
✔ Mayor exactitud o mejor calidad de la información. Pues reduce el volumen de
trabajo, lo cual permite emplear personal más capacitado, mejor preparado y
entrenado. Los procesos de supervisión y el procesamiento de datos están mejor
controlados, lo que redunda en una mejor calidad del trabajo y una disminución de
errores.
✔ Factibilidad de hacer el estudio cuando la toma de datos implica técnicas
destructivas.

Tipos de Muestreo

Dentro de los tipos de muestreos se tiene: los muestreos no probabilísticos o no


aleatorios y los muestreos probabilísticos o aleatorios, los cuales se detallaran a
continuación:

1. Muestreos No probabilísticos (No Aleatorios)

Cuando el método de extracción de las muestras no asegure a cada individuo de la


población o del estrato, igual probabilidad de ser elegido, entonces la muestra obtenida no es
aleatoria. A veces esto se realiza por razones de practicidad en el sentido del costo o del
tiempo. Es decir, en este tipo de muestreo los elementos o individuos de la muestra se eligen
sin tomar en cuenta su probabilidad de ocurrencia, por lo que es imposible determinar el
grado de representatividad de la muestra. Estos pueden ser:
a. Muestreo por Juicio: También conocido como muestreo por selección experta o
selección intencional. El investigador toma la muestra seleccionando los elementos que a él
le parecen representativos o típicos de la población. Además puede basarse en la
experiencia de otros estudios anteriores o en su conocimiento sobre la población y el
comportamiento de esta frente a las características que se estudian.
Por ejemplo, se desea realizar una investigación sobre el comportamiento de los padres
con sus hijos. En este caso, el investigador selecciona como muestra a personas que tengan
hijos, ya que las considera aptas de conocimiento para formar parte de la investigación.

b. Muestreo Casual o fortuito (Accidental): Se utiliza en los casos en que no es


posible seleccionar los elementos, y deben sacarse conclusiones con los elementos que
estén disponibles.

Por ejemplo, en una investigación sobre comportamiento emocional de las personas


ante una crisis, si el investigador está presente en el momento de un accidente de tránsito
puede tomar como referencia a los sujetos que se encuentren directa e indirectamente
involucrados en el hecho y observar su comportamiento emocional.

Otro ejemplo, en un estudio de mercado un investigador que está estudiando el


comportamiento de los compradores, se encuentra en una tienda en el momento en que se
anuncia la rebaja de un producto determinado a la mitad de su precio. Puede tomar como
referencia los sujetos que se encuentran en la tienda y observar su comportamiento ante
este acontecimiento.

c. Muestreo de Cuota: Mediante este método los investigadores se encargan de incluir


en la muestra solo a un grupo determinado de sujetos que cumplen con ciertos requisitos o
condiciones específicas.

Por ejemplo, se debe realizar una investigación acerca de personas con algún problema
de salud en una empresa que posee 1.000 empleados (población), por lo que el investigador
decide separar a las personas en estratos, según su rango de edad, de la siguiente manera:
Estrato Edad Cantidad Porcentaje

1 18 – 29 600 60%

2 30 – 59 300 30%

3 60 – 100 100 10%

Con los estratos ya segmentados, el investigador debe conformar una muestra que sea
proporcional al total de la población, por lo que selecciona una muestra estadística de 100
personas para realizar su investigación.

Dentro de ellas, el investigador decide tomar 60 empleados de entre 18 y 29 años


(60%), 30 empleados de entre 30 a 59 años (30%) y 10 empleados de entre 60 a 100 años
(10%). Asimismo, define su criterio de selección a conveniencia, pues elige para la muestra
aquellos empleados que más confianza y relación tienen con él.

De esta manera quedaría conformado el muestreo por cuotas de 100 personas, de


manera proporcional a la población. A partir de esta muestra, el investigador podrá realizar
su investigación sobre los problemas de salud de los empleados de la empresa.

d. Muestreo de Poblaciones Móviles: En este tipo de muestreo se utiliza métodos de


captura, marca y recaptura. Se utiliza mucho en el estudio de migración de poblaciones de
animales y otras características.

2. Muestreos Probabilísticos (Aleatorios)

Los elementos de la muestra son seleccionados siguiendo un procedimiento que brinde


a cada uno de los elementos de la población una probabilidad conocida de ser incluidos en la
muestra. Los tipos más comunes de técnicas de muestreo aleatorios son:

a. Muestreo Aleatorio Simple (M.A.S): Es seleccionado de tal manera que cada


muestra posible del mismo tamaño tiene igual probabilidad de ser seleccionado de la
población.

Para seleccionar los elementos de la muestra se procede de la siguiente forma:

1) Se debe enumerar a cada uno de los elementos que componen la población,


comenzando con 1, 2,…, y así sucesivamente hasta llegar al último elemento que
conforma la población (N).

Por ejemplo se tiene una población que consta de 845 empleados de una empresa
manufacturera (N = 845 empleados), se procede a enumerar a cada elemento de la
población:
001 002 003 004 …… 845
2) Luego se selecciona la muestra por algún procedimiento aleatorio, como sigue:

✔ La manera clásica es colocar papeletas numeradas o con los nombres de los


participantes en una bolsa, urna o caja, revolver y sacar una por una las mismas
sin mirar, hasta conformar la muestra deseada. Por ejemplo: en las loterías, el
bingo, el Kino, etc., utilizan este tipo de muestreo, en donde se colocan unas
peloticas enumeradas en un maquinita y las van moviendo para ir extrayendo los
números sorteados.

✔ En estadística se utiliza la Tabla de Números Aleatorios (T.N.A), la cual consiste


en una serie de números generados al azar por diversos métodos, como
lanzamientos de monedas, dados, ruletas, sorteos, simulaciones, calculadora u
ordenador. La probabilidad de 0, 1, 2, 3,…,9 es la misma para cada dígito de un
número. Por consiguiente, la probabilidad de que se seleccione al elemento 011 es
la misma que tienen los elementos 722 o 383.

Para trabajar con la T.N.A se debe seleccionar al azar (con los ojos cerrados) un
número que será nuestro punto de partida, y a partir de allí elegir una dirección (filas o
columnas) por la cual nos vamos a desplazar para escoger a los elementos que van a
conformar a la muestra de la población. Por lo que en esta tabla no se trabaja de forma
salteada, sino que se elige una dirección, ya sea por filas o por columnas, como se muestra
en la siguiente figura.

Figura N° 1: Fragmento de la Tabla de Números Aleatorios (T.N.A)

Fuente: Autor (2021)

Como se puede observar en la Figura N° 1, los números que se encuentran dentro de la


tabla constan de 5 dígitos cada uno, por lo que, para realizar la selección de la muestra se
debe comenzar por el primer digito de los números, y se debe tomar en cuenta el número de
dígitos que contiene la población para poder trabajar con la tabla. Por ejemplo, si la población
tiene dos dígitos (N = 50) se escogen los dos primeros dígitos de los números de la tabla, si
la población es de tres dígitos, se escogen los tres primeros dígitos de los números, y así
sucesivamente, ahora si la población tiene más de 5 dígitos se unifican dos columnas, y se
toman los 5 primeros dígitos de la primera columna seguido con los otros dígitos de la otra
columna.

Ejemplo: Supóngase que una empresa manufacturera tiene 845 empleados y el gerente
general desea realizar un estudio. Para ello selecciona una muestra de 15 empleados.
¿Cuáles empleados conformaran la muestra aplicando un muestreo aleatorio simple? Utilice
la tabla de números aleatorios (Ver archivo de tablas)

Primero se identifica a cada empleado de la empresa con un número:

001 002 003 004 005… 845

Luego procedemos a trabajar con la Tabla de Números Aleatorios.

En la siguiente figura aparece un fragmento de la tabla de números aleatorios. Para


seleccionar la muestra de empleados se elige primero cual va hacer nuestro punto de partida
en la tabla, por lo que cerramos los ojos y señalamos un numero en la tabla, supongamos
que el número seleccionado fue el 97636 el cual se encuentra ubicado en la segunda
columna con la cuarta fila., este número va a representar nuestro punto de partida. (97636)

FILAS

C
O
L
U
M
N
A
S

Como la población está conformada por 845 empleados, es decir, tiene tres dígitos, se
toman los tres primeros dígitos del número aleatorio de cinco dígitos seleccionado en la
tabla, por lo que sería 976, pero fíjense que este número es mayor que el tamaño de la
población (N = 845), por lo que este valor se omite y se sigue con el siguiente, de acuerdo a
la dirección por la cual nos vamos a desplazar (fila o columna) para seleccionar a los
elementos que van a conformar la muestra.
Dirección del desplazamiento por fila:

Si se desplaza por fila para escoger la muestra de la población, se tiene:

El punto de partida que se seleccionó al azar (cerrando los ojos y colocando la mano en
una parte de la tabla) es 97636, como la población consta de tres (3) dígitos se toman los 3
primeros dígitos del número, es decir, 976, como este valor es mayor que el tamaño de la
población se omite y se continua con el siguiente y así sucesivamente hasta completar los
elementos de la muestra que se desean obtener de la población, como se muestra a
continuación:
97636 = 976 punto de partida, se omite (976 > 845)
37397 = 373 este se toma porque se encuentra dentro del rango (001 al
845) 93379 = 933 se omite
56454 = 564 se toma y así sucesivamente hasta completar la muestra

En la figura N° 2 se encuentran marcados cuáles son los elementos que van a


conformar la muestra si la dirección del desplazamiento es por fila.

Figura N° 2: Fragmento de la T.N.A seleccionando la muestra por fila

Fuente: Autor (2021)

Observe que la fila donde se encuentra el punto de partida se terminó con el número
46977, pero todavía no se ha completado la muestra que se desea buscar, por lo que se
pasa a la fila siguiente que se encuentra debajo y así sucesivamente hasta completar la
muestra que se desea obtener. Por lo que la muestra seleccionada sería:

373 564 598 458 741 716 469 615


008 367 491 017 196 218 171 n = 15

Dirección del desplazamiento por columna:

Se realiza el mismo procedimiento como se desplaza por fila, la diferencia es que ahora
la dirección del desplazamiento es por columna. Como se puede visualizar en la siguiente
figura N° 3, en donde se seleccionan cuáles son los elementos que van a conformar la
muestra que se desea obtener.

Figura N° 3: Fragmento de la T.N.A seleccionando la muestra por


columna

Fuente: Autor (2021)

97636 = 976 punto de partida seleccionado al azar, se omite (976 >


845) 00835 = 008
19519 = 195
04742 = 047 y así sucesivamente hasta completar la muestra

Por lo que la muestra seleccionada sería:


008 195 047 148 574 813 269 251
671 229 196 721 761 365 477 n = 15

✔ Otro procedimiento que se utiliza en el muestreo aleatorio simple (M.A.S) para


seleccionar la muestra al azar es la calculadora. Con ella podemos disponer de
cuantos números aleatorios queramos y con determinadas cifras y condiciones.
Por lo que existen diferentes formas de cómo generar números aleatorios en las
calculadoras, según su modelo. (Revisar Manual de su calculadora)

Las calculadoras científicas disponen de la tecla RAND, RAN# ó RANDOM que al


activarla, genera un número al azar comprendido entre 0 y 1, llamado número aleatorio.
A continuación se muestran dos procedimientos de cómo generar números aleatorios
con cualquier modelo de calculadora para obtener la muestra:
- Procedimiento 1: Primero se coloca en la calculadora el tamaño de la población
(N) luego se presiona la tecla de la multiplicación ( ) seguido de la tecla ( ) y la
tecla ( ) (arriba dice ) después se presiona la tecla ( ) y te va a parecer en la
pantalla un valor entero con decimales, se toma la parte entera del número
generado sin aproximar y es el elemento que se va a incluir en la muestra.

Ejemplo: Una empresa manufacturera que tiene 845 empleados y se desea extraer una
muestra de 15 empleados. ¿Cuáles empleados van a conformar la muestra? Aplique un
M.A.S utilizando la calculadora
Se tiene que:
Tamaño de la población: N = 845
Tamaño de la muestra: n = 15
Aplicando el procedimiento se tiene:
N Ran#
X • 810,355 295
845
X • 92,105
845
X • 703,885
845
X • 147,875
845
• 233,22
845
• 32,11
845 SHIFT
• 801,06
845 SHIFT
• 228,995
845 SHIFT
796,835
845 SHIFT
163,93
845 SHIFT =
354,055
845 SHIFT =
295,75
845 SHIFT =

845 SHIFT =
≈≈≈≈≈≈≈≈
845 SHIFT =
≈≈≈≈≈≈≈

845 SHIFT =

SHIFT =

SHIFT =
X
SHIFT =
X
SHIFT =
X
SHIFT =
X
=
X
=
X •
=
X •
=
X •

X •

X • 243,36

X • 354,32

• 780,78
La muestra estaría conformada por los siguientes empleados: 243 354 780 810

092 703 147 233

032 801 228 796 163 354 295


n = 15

- Procedimiento 2: Primero se presiona la tecla ( ) seguido de la tecla ( ) que arriba


dice , en la pantalla de la calculadora va aparecer un valor que va a estar
comprendido entre 0 y 0,9999 (este valor es el número aleatorio o la probabilidad),
luego presione la tecla de la multiplicación ( ) y coloque el tamaño de la población
(N) presione la tecla de la suma ( ) y la tecla número (1) después presione la tecla
igual ( ) en la pantalla va a parecer un valor entero
con decimales, se toma la parte entera del número que aparece en la pantalla sin
aproximar y es el elemento que se va a incluir en la muestra.

Ejemplo: Una empresa manufacturera que tiene 845 empleados y se desea extraer una
muestra de 5 empleados. ¿Cuáles empleados van a conformar la muestra? Aplique un M.A.S
utilizando la calculadora

Se tiene que:
Tamaño de la población: N = 845
Tamaño de la muestra: n = 5
Utilizando la calculadora se tiene:

Ran# Valor N

399
SHIFT ≈≈≈≈≈
• 0,927 X 845 + 1 = 789,315
789
SHIFT • 0,055 X 845 + 1 = 47,475
047
SHIFT • 0,211 X 845 + 1 = 179,295
179
SHIFT • 0,621 X 845 + 1 = 525,745
525
SHIFT • 0,472 X 845 + 1 = 399,84

La muestra estaría conformada por los siguientes empleados:

789 047 179 525 399


n=5

b. Muestreo Sistemático (M.S): Este tipo de muestreo se obtiene cuando los


elementos son seleccionados en una manera ordenada. La manera de selección depende
del número de elementos incluidos en la población (N) y el tamaño de la muestra (n). El
número de elementos en la población es dividido por el número deseado en la muestra y el
cociente (resultado) se redondea al entero más cercano, el cual indicará si cada décimo,
cada onceavo, o cada centésimo elemento en la población va a ser seleccionado.

Sea N el tamaño de una población y n el tamaño de la muestra que deseamos elegir,


por lo que:

Donde, m es el cociente (resultado) que se redondea al entero más cercano.


El primer elemento de la muestra (h) es seleccionado al azar entre los m primeros de
una lista de todos los elementos poblacionales. Este valor h no puede ser mayor que el valor
de m.

Por ende, un muestreo sistemático de n elementos consiste en seleccionar la muestra


formada por los elementos ( )

Se debe tener en cuenta que la muestra depende de los valores h y m. Por lo que dada
una población y un tamaño de muestra, m representa un valor fijo que indica la separación
entre los elementos sucesivos de la muestra en la población y que permite obtener la
muestra del tamaño deseado. El valor de h se debe elegir aleatoriamente (M.A.S) e indica el
punto de inicio para seleccionar los elementos de la muestra. Vea los siguientes ejemplos
para que pueda entender mejor:

Ejemplo 1: Se acercan las Navidades y cierta empresa de turrones cree que no va a


poder entregar todos los pedidos a tiempo, a no ser que aumente la plantilla. La empresa
dispone de un listado ordenado alfabéticamente de 20 personas con las mismas
características para el puesto y que actualmente están en paro. Puesto que el tiempo
apremia y no es posible realizar una entrevista para seleccionar al personal, se decide elegir
a cinco trabajadores de forma aleatoria usando el muestreo sistemático. ¿Cuáles
trabajadores conformarán la muestra?

Enumeramos a la población:

Como hay que elegir 5 trabajadores sistemáticamente de un total de 20, se debe de


elegir uno de cada valor de m, donde:

Luego de obtener el valor de m, se elige el punto de partida (h) aleatoriamente entre un


valor de 1 a 4, puesto que h no puede ser mayor que el valor de m. Supongamos que se
eligió al azar (M.A.S utilizando la T.N.A o la calculadora) y el resultado obtenido fue h = 3, por
lo que los elementos de la muestra serán:

()

3 3 + 4 3 + 2(4) 3 + 3(4) 3 + 4(4)


3 7 3 + 8 3 + 12 3 + 16
3 7 11 15 19

Entonces, los trabajadores que conformaran la muestra son:


03 07 11 15 19

Ejemplo 2: En el caso de la empresa manufacturera que tiene una población de 845


empleados y el gerente desea seleccionar una muestra de 15 empleados para realizar un
estudio. ¿Cuáles empleados van a conformar la muestra si se aplica un muestreo
sistemático?

Enumeramos a la población:

Después se determina el valor de m:

Fíjense en este caso, el valor de m se redondea por abajo, es decir, m = 56. Esto se
debe hacer así, porque si se redondea hacia el entero siguiente, no habría elementos
suficientes en la población para extraer la muestra.

Luego, determinamos el punto de partida (h) de manera aleatoria entre un valor de 1 a


56, supongamos que se elige al azar (M.A.S)

Utilizando la calculadora:

Como se necesita un valor entre 1 y 56, entonces:



56 X SHIFT • = 36,634 36
h = 36

36 36 + 56 36 + 2(56) 36 + 3(56) 36 + 4(56) 36 + 5(56) …… 36 + 14(56) 36 92 36 + 112 36


+ 168 36 + 224 36 + 280 …… 36 + 784 36 92 148 204 260 316 …… 820

Los 15 empleados que van a conformar la muestra serian:

036 092 148 204 260 316 372 428 484 540 596 652 708 764 820

c. Muestreo Estratificado: Para este tipo de muestreo se divide la población en


grupos, llamados estratos, que son más homogéneos que la población como un todo. Los
elementos de la muestra son seleccionados al azar o por un método sistemático de cada
estrato. El número de elementos seleccionado de cada estrato puede ser proporcional al
tamaño del estrato en relación con la población.

Dónde:
NT: Tamaño de la población total
NE: Tamaño de la población de cada estrato o grupo
n: Tamaño de la muestra que se desea buscar
nE: Tamaño de la muestra de cada estrato o grupo

Ejemplo: Suponga que una empresa manufacturera se encuentra distribuida de la


siguiente manera: Departamento A 265 empleados, departamento B 190 empleados,
departamento C 225 empleados y departamento D 165 empleados. Se desea seleccionar
una muestra de 20 empleados. ¿Cuáles empleados conformarían la muestra si se aplica un
muestreo estratificado proporcional?
Departamento N° de Empleados

A 265

B 190

C 225

D 165

Total (N) 845

Luego de que se obtiene el tamaño de las muestras de cada estrato o grupo se debe
aplicar un muestreo aleatorio simple (M.A.S) o un muestreo sistemático (MS) para obtener
las muestras de cada estrato o grupo.

Aplicando el muestreo sistemático:

Para el Dpto. A, se tiene que la población (NA) es 265 empleados y el tamaño de


muestra (nA) es 6.
Primero enumeramos a la población:

001 002 003 004 005……… 265

Luego se calcula el valor de m, el cual sería:

Se toma un valor h aleatoriamente comprendido entre 1 y 44, el cual será nuestro punto
de partida, supóngase que se escoge al azar (M.A.S)

Utilizando la calculadora:

Como se necesita un valor entre 1 y 44, entonces:



X SHIFT • = 12,183
12
44

h = 12, por lo que se procede a determinar la muestra del Dpto. A de forma


sistemáticamente:

12 12 + 44 12 + 2(44) 12 + 3(44) 12 + 4(44) 12 + 5(44)

12 56 12 + 88 12 + 132 12 + 176 12 + 220 12 56 100 144 188 232

Por lo que la muestra del Dpto. A quedaría conformada por los siguientes empleados:
012 056 100 144 188 232

Y el mismo procedimiento se aplicaría para obtener las muestras de cada uno de los
Departamento

d. Muestreo Por Conglomerado: Es un procedimiento de muestreo probabilístico en el


que se seleccionan aleatoriamente varios grupos (llamados conglomerados, cúmulos o
áreas) conformados por elementos heterogéneos de la población, pero que tienen algo en
común. Este tipo de muestreo se aplica cuando no se pueden estudiar todos los elementos
de la población porque esta es muy grande o se encuentra dispersa en un área geográfica
muy extensa, por lo que los costos de la investigación serían relativamente elevados.

Por lo que el muestreo por conglomerados requiere de elegir una muestra aleatoria
simple de unidades heterogéneas entre sí de la población llamadas conglomerados. Cada
elemento de la población pertenece exactamente a un conglomerado, y los elementos dentro
de cada conglomerado son usualmente heterogéneos o disímiles (distintos o diferentes).

Ejemplo 1: Suponga que una compañía de servicio de televisión por cable está
pensando en abrir una sucursal en una ciudad grande; la compañía planea realizar un
estudio para determinar el porcentaje de familias que utilizarían sus servicios, como no es
práctico preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al
azar, la cual forma un conglomerado.

Ejemplo 2: Si un equipo de investigación de mercados está tratando de determinar por


muestreo el número promedio de televisores por familia en una gran ciudad, podrán utilizar
un mapa de la ciudad para dividir el territorio en manzanas, luego seleccionar cierto número
de manzanas (conglomerados) para realizar entrevistas. Cada familia que habita en esas
manzanas será encuestada.

Calculo del tamaño de la muestra

El tamaño de la muestra depende de los siguientes elementos:

1. Tamaño de la población (N)


2. Nivel de confianza adoptado (1- α): Es la probabilidad de que el valor deseado se
encuentre dentro del margen establecido.

Por ejemplo, ¿cuál sería el valor de Zα/2 si se tiene un 95% de confianza?


Se tiene que:

Se despeja el valor de α, quedando que:

Se divide el valor de α entre 2:

Se recuerda que la curva completa tiene un área igual a 1 y es simétrica, es decir que si
se divide en dos partes iguales, se tiene 0,5 para un lado y 0,5 para el otro lado.

Como se conoce la probabilidad (1 – ) = 0,95 y también se sabe que la mitad de la


curva es 0,5, además el valor de entonces a la mitad de la curva que es 0,5 se le
resta el valor de α/2 = 0,025 por lo que se tiene:

Este valor de 0,475 representa el área (probabilidad) dentro de la curva que nos va a
ayudar a determinar el valor de Z, por lo que esta área se ubica dentro de la tabla de la
distribución normal como se puede apreciar en la figura N° 4
Figura N° 4: Fragmento de la Tabla Z (Distribución Normal)

0,475

Fuente: Autor (2021)


Luego de ubicar el área (probabilidad) dentro de la tabla como ya se observó en la
figura N° 4 se procede a obtener el valor de ⁄ como se muestra a continuación en la siguiente
figura.

Figura N° 5: Fragmento de la Tabla Z para obtener el valor de Z α/2 Paso a Paso

Fuente: Autor (2021)


Por lo que
⁄( )

Este valor de ⁄ representa la semidistancia estandarizada en términos de


desviaciones típicas que definen ambos extremos del intervalo.
3. Margen de error permitido (e): Se refiere a la diferencia entre la media muestral y la
media poblacional. Por lo que se trata de un margen de error que el investigador esté
dispuesto a tolerar.
4. Proporción en que se encuentre en el universo la característica estudiada (p).
Cuando no es posible estimar la característica mediante un ensayo piloto (p en %)
adoptará la suposición de que dicho porcentaje es igual al 50%.

La población se considera finita cuando no pasa de 100.000 elementos (N ≤ 100.000) e infinita


cuando supera esa cantidad (N > 100.000).

Fórmulas para determinar el tamaño de la muestra:

Para Poblaciones Finitas: ( ) Para Poblaciones Infinitas: ( )

⁄ () ⁄

Dónde: n = Tamaño de la muestra


()⁄ e = Margen de error permitido
p = Proporción de la característica estudiada
Zα/2 = Valor crítico de corte de una distribución
N = Tamaño de la población normal para lograr un nivel de confianza
adoptado

Ejemplo 1: Suponga que se tiene una población de 10.000 estudiantes universitarios y


se desea realizar un estudio para estimar el gasto promedio de los estudiantes. ¿Cuál sería
el tamaño de muestra necesario con un 98% de confianza y un error de 2,5%?

Datos:
Tamaño de la población:

Nivel de Confianza:
Margen de error permitido:
Tamaño de muestra:

Como se aplica la fórmula para poblaciones finitas:

()
⁄ ()
()⁄
Para aplicar la formula se tiene el error (e) y el tamaño de la población (N), nos falta la
proporción (p) y el valor crítico ( ⁄ ), pero la teoría nos dice que si no se conoce la
característica de la proporción, esta se debe de asumir en un 50%, es decir, p = 0,5. Nos
falta el valor de ⁄ . Este se puede obtener con el nivel de confianza. Despejando el valor de ,
se tiene:

Se divide el valor de entre 2:

Por lo tanto:

Este valor (área dentro de la curva = 0,49) se ubica en la tabla de la distribución normal
(Tabla Z) para determinar el valor de ⁄
Figura N° 6: Fragmento de la Tabla Z para obtener el valor de Z α/2

���� �������� �� ���� ����


�������� �� ����

Fuente: Autor (2021)

Como se puede observar en la figura el área bajo la curva ( ) no se encuentra, por lo


tanto, se debe de tomar un valor que este por debajo ( ) y otro que esté por encima
( ) del valor que se está buscando. Seguidamente se procede a determinar el valor de ⁄ de la
siguiente manera:

Luego se procede a determinar el tamaño de la muestra, sustituyendo los valores en la


fórmula:
()
⁄ ()⁄
( ) ( ) ( )( )( ) ( ) ( ) ( ) ( )( )

( )( )( )( )
( )( ) ( )( )( )

El tamaño de muestra necesario para realizar el estudio con un 98% de confianza y un


error de 2,5% es de aproximadamente 1778 estudiantes.

Ejemplo 2: Suponga que se quiere realizar un estudio de mercado para ver las
preferencias que tienen 350.000 clientes por un determinado producto, se sabe que en
estudios anteriores el 60% de los clientes tenían preferencia por un determinado producto.
¿Cuál sería el tamaño de muestra necesario con un 90% de confianza y un error del 8%?

Datos:
Tamaño de la población:

Proporción:
Nivel de Confianza:
Margen de error permitido:
Tamaño de muestra:
Como se aplica la fórmula para poblaciones infinitas: ( )

Para aplicar la formula se tiene el error (e) y la proporción (p), pero nos falta el valor
crítico ( ⁄ ).

Se despeja el valor de :

Se divide el valor de entre 2:

Por lo tanto:

Este valor (0,45) se ubica dentro de la tabla de la distribución normal (Tabla

Z)

Como en el ejemplo anterior el área bajo la curva ( ) no se encuentra, se toma un


valor que se encuentre por debajo ( ) y otro por encima ( ). Luego se procede a determinar
el valor de ⁄ :


Se determinar el tamaño de la muestra, sustituyendo los valores en la fórmula:

()
( ) ( )( )

()

( )( )( )

El tamaño de muestra necesario para realizar el estudio con un 90% de confianza y un


margen de error de 8% es de aproximadamente 101 clientes o 102 clientes.

Distribuciones Muéstrales

La estadística inferencial involucra el uso de un estadístico para sacar una conclusión


o inferencia sobre el parámetro correspondiente.

El estadístico es una medida usada para describir alguna característica de una


muestra, tal como una media aritmética, una desviación típica o estándar de una muestra.

El parámetro es una medida usada para describir alguna característica de una


población, tal como una media aritmética, una desviación típica o estándar de una población.

Los símbolos utilizados para representar los estadísticos y los parámetros son los
siguientes:
Medida Parámetro Estadístico

Media Aritmética ̅

Varianza

Desviación Típica o Estándar

Proporción

Nº de Elementos
El estadístico se utiliza como estimador del parámetro.
Distribución en el muestreo

Cuando el tamaño de la muestra (n) es más pequeño que el tamaño de la población


(N), dos o más muestras pueden ser extraídas de la misma población. Un cierto estadístico
puede ser calculado para cada una de las muestras posibles extraídas de la población.

La distribución muestral es una lista de todos los valores posibles para un estadístico
y la probabilidad relacionada con cada valor.

Error muestral o error de muestreo: Es la diferencia entre el parámetro poblacional y


el estadístico de la muestra utilizado para estimar el parámetro. Un error de muestreo
usualmente ocurre cuando no se lleva a cabo la encuesta completa de la población, sino que
se toma una muestra para estimar las características de la población.

Media muestral o gran media: La distribución muestral de las medias muéstrales es


una lista de todas las medias muéstrales posibles. Estas medias muéstrales al igual que
cualquier lista de números, tienen una media denominada media muestral o gran media.
Esta media muestral se obtiene aplicando la siguiente fórmula:

̿ ̅

De una población que contiene “N” elementos, podemos extraer o seleccionar “k”
muestras diferentes de igual tamaño “n”.

Se recuerda que las fórmulas de la Media Poblacional o Promedio Poblacional ( ) y

Varianza Poblacional ( ) son:


√∑( )

La varianza en las medias muéstrales mide la dispersión de las observaciones


individuales (medias muéstrales) alrededor de su media (la gran media).

̅
̅∑ ( )

El error estándar de la distribución muestral es una medida de la dispersión de las


medias muéstrales alrededor de la media poblacional ( ). Por tanto, el error estándar ( )̅ mide
la tendencia a sufrir del error de muestreo en el esfuerzo por estimar . Este se obtiene de la
raíz cuadrada de la varianza de la distribución de las medias muéstrales.
̅
̅ √∑ ( )
̅√

Uso de la distribución muestral esta es importante porque se pueden tomar


decisiones con base en los resultados muéstrales.

Una aplicación de la distribución muestral es la de determinar la probabilidad de que


una media muestral clasifique dentro de un rango dado. Dado que la distribución muestral
estará distribuida normalmente si la muestra se toma de una población normal, o y el
teorema del límite central garantiza la normalidad en el proceso de muestreo, mientras que la
desviación normal puede utilizarse para ganar información esencial para el proceso de toma
de decisiones.

Anteriormente, en la asignatura estadística I, específicamente, en la distribución normal,


se determinaba la probabilidad de seleccionar una observación que estuviera dentro de un
rango dado, y para obtener ese resultado se utilizaba la fórmula de la distribución normal
estandarizada (Z):

En donde X es una observación única de interés y es la desviación estándar


poblacional,

Sin embargo, muchas decisiones en los negocios, dependen de una muestra completa,
no sólo de una observación. Por lo tanto, la formula Z debe de alterarse para explicar el
hecho en el cual se está interesado, no solo en una observación X sino en la media de varias
observaciones X. por lo tanto, cuando se realiza el muestreo, la formula Z viene dada por:

̅
̅ ( ̅)

Si la población o proceso del cual se toma una muestra tiene una distribución normal,
también la distribución de muestreo de la media tendrá distribución normal, sin importar el
tamaño de la muestra.

El teorema de límite central establece que cuando el tamaño de la muestra se


incrementa la distribución de muestreo de la media así como de otros estadísticos
muéstrales se aproxima en cuanto a su forma a la distribución normal, independientemente
de la forma de la distribución de la población de la que fue tomada la muestra.

Ahora bien, si a cada una de las k muestras posibles, le calculamos un estimador como
la media o la proporción, obtenemos una variable aleatoria cuya distribución denominamos
distribución muestral del estimador.
La distribución muestral del estimador se define como la distribución del estimador
de todas las posibles muestras del mismo tamaño, que pueden ser extraídas de una
población. Por lo tanto, el estimador es una variable aleatoria, porque su valor cambia de
muestra a muestra. Esto significa que si tomamos una segunda muestra aleatoria de una
población, es casi imposible esperar el mismo valor para el estimador.

Si un estimador, es por ejemplo la media aritmética, entonces podemos hablar de la


distribución muestral de la media, pero si el estimador es la proporción, hablaremos de la
distribución muestral de la proporción.

Distribución muestral de la Media

Supongamos que se elige una primera muestra de tamaño n de una población, esta
dará un promedio ( ̅
) de la variable que se esté estudiando (pesos, salarios, estaturas, etc.),
otra muestra diferente elegida dará otro promedio ( ̅
) y así sucesivamente. Si consideramos
todas las muestras posibles de tamaño n que se puedan extraer de esa población, la variable
aleatoria que a cada una de esas muestras le hace corresponder su media (promedio) se
̿
llama media muestral o gran media y se representa por . Dicha variable tomará los valores:

̿ ̅̅̅
* +

Esquema de la Distribución Muestral de la Media

̿
Al ser una variable aleatoria se puede estudiar su distribución, a la que llamaremos
distribución de la media muestral.

Propiedades:

1. La media muestral coincide con la media de la población. Es decir:

̅
2. La desviación estándar o error estándar:


Cuando se conoce la población (Población finita) y el tamaño muestral no es una
fracción pequeña del tamaño poblacional se debe verificar la siguiente condición:

Si esta se cumple al error estándar se le debe aplicar un factor de corrección, el cual


es: √

Por lo tanto, el error estándar con el fdc:

√ (√ )

3. Si las observaciones se distribuyen según una ( ), la distribución de las muestras de


tamaño n se distribuyen según una normal ( ̅)

Por lo tanto:
̅
̅ ( ̅)

Esta fórmula se aplica si la desviación estándar ( ) es conocida, cuando no se


conoce el valor de la desviación estándar ( ) se puede reemplazar por la desviación
estándar de la muestra (S), siempre y cuando el tamaño de la muestra sea grande
( ):
̅
̅ ( ̅)

4. En el caso de que la población no se distribuya según una normal, la distribución de


las muestras si lo hace cuando el tamaño de estas sea por lo menos de 30
observaciones. Esto queda establecido por el teorema del límite central que dice: Si
una muestra aleatoria de tamaño n procede de una población con media ( ) y
desviación estándar ( ) y el tamaño de la muestra es , las medias muestrales se
distribuyen según una normal de media ( ) y error estándar ( ̅); ( ̅)

Como el teorema del límite central garantiza la normalidad de la distribución,


entonces:
̅
̅( )
̅

Ejemplo: El gasto medio total semanal de los jóvenes de una ciudad es de 25$ con
desviación estándar de 3$. Si se eligen al azar una muestra de 49 jóvenes:
a) ¿Cuál es la probabilidad de que el gasto medio se encuentre entre 24 y 26$?
b) ¿Cuál es la probabilidad de que el gasto medio supere los 26,25$?
c) Suponga que en la ciudad hay un total de 250 jóvenes ¿Cuál es la probabilidad de
que el gasto medio de los 49 jóvenes elegidos al azar sea inferior a 24$?

Datos:

a) ( ̅ )

( ̅ ) ( ̅ ̅) ( )
Como no se conoce el tamaño de la población se determina el error estándar, para
luego sustituirlo en la fórmula de Z
̅


Sustituyendo:
̅

Para buscar el área de se busca en la tabla de la distribución normal (Tabla Z)

Se busca el área de en la tabla de la distribución normal (Tabla Z)

Luego se ubican las dos áreas en la curva para poder determinar la probabilidad que se
desea buscar:
0,4901
0,4901

24 25 26
-3 -2 -1 0 1 2 3 Z
Esta es el área o la probabilidad que

se está buscando

���� �� ���� ���� �� ����

La probabilidad que se desea buscar es el área que se encuentra marcada, por lo


tanto:
(̅)()()
(̅)
(̅)

Existe un 98,02% de probabilidad que el gasto medio de los 49 jóvenes elegidos al


azar se encuentre entre 24 y 26$
b) ( ̅ )
̅
(̅)( ̅ ̅) ( )̅
Sustituyendo:
̅

Se busca el área de en la tabla de la distribución normal (Tabla Z) para luego ubicarlo


en la curva y poder determinar la probabilidad:

Esta es el área o la
�� �� ����
0,4982 probabilidad que se está buscando

25 26,25

-3 -2 -1 0 1 2 3 Z
Como la distribución normal es simétrica al dividirla en dos partes iguales se tiene un
área de 0,5 para el lado izquierdo y el otro 0,5 para el lado derecho y la tabla da el valor del
área que va desde la media ( ) o desde Z = 0 hasta el valor de (0,4982) pero se está
buscando la probabilidad de que el gasto medio de los jóvenes sea mayor que 26,25$ o que
2,91. Por lo tanto, a la mitad de la curva (0,5) se le resta el área de Z (0,4982) para obtener la
probabilidad que se desea buscar:

( ̅ ) ( )̅ ( )
(̅)
(̅)
Existe un 0.18% de probabilidad que el gasto medio de los 49 jóvenes elegidos al azar
sea superior a 26,25$

c) ( ̅ )
Para este caso como se conoce el tamaño de la población se debe verificar si se
cumple la condición para aplicar el factor de corrección al error estándar.
()
Por lo tanto, al error estándar hay que aplicarle el factor de

corrección: ̅

√√
√ √ ( )√

̅( )√ ( )( )

̅
(̅)( ̅ ̅) ( )̅
Sustituyendo:
̅

Se busca el área de en la tabla de la distribución normal (Tabla Z)

Este valor se ubica en la curva para poder determinar la

probabilidad Esta es el área o la


probabilidad que se desea buscar 24 25

0,4821
-3 -2 -1 0 1 2 3 Z

�� �� ����

Al igual que en el caso anterior a la mitad de la curva (0,5) se le resta el área de Z


(0,4821) para obtener la probabilidad que se desea buscar:

( ̅ ) ( )̅ ( )
(̅)
(̅)
Existe el 1,79% de probabilidad que el gasto medio de los 49 jóvenes elegidos al azar
sea inferior a 24$
Distribución de la proporción muestral:

Suponga que se quiere estudiar si los individuos de una población tienen o no una
determinada característica. Habrá una proporción de individuos que si la tienen y el resto de
los individuos 1 – que no la tienen. Si se toma distintas muestras de tamaño n, la primera nos
dará una proporción , la segunda una proporción y así sucesivamente.

De manera parecida a lo hecho con las medias muéstrales, se puede considerar todas
las posibles muestras de tamaño n y considerar las proporciones muéstrales p como una
variable aleatoria. A la distribución de la variable p descrita la llamaremos distribución
muestral de las proporciones.

Esquema de la Distribución de la Proporción Muestral

Propiedades:
1. El valor esperado de las proporciones muéstrales será igual a la proporción de la
población.
()
Dónde:

El valor esperado (media) de la distribución muestral de la proporción:


()∑
2. El error estándar:

√()

Cuando se conoce la población (Población finita) al error estándar se le aplica fdc,


siempre y cuando se cumpla la condición

Si esta se cumple al error estándar se le aplica un factor de corrección, por lo tanto, el


error estándar con el fdc:

(√ ( )

)(√ )

3. Al igual que en la distribución de la media muestral el teorema del límite central


también se cumple en la distribución de las proporciones muéstrales. Por lo tanto:

()

Ejemplo: Un proceso industrial genera el 8% de unidades defectuosas. Usted


selecciona una muestra aleatoria de 100 unidades.
a) ¿Cuál es la probabilidad de que menos del 10% sean defectuosas?
b) ¿Cuál es la probabilidad de que las unidades defectuosas se encuentren entre el 9%
y 12%?

Datos:

a) Probabilidad de que menos del 10% sean defectuosas:

()()( ) ( ) Se debe calcular el error estándar de la proporción, por


lo tanto:
√()

√()

√()

Sustituyendo, se tiene:

Se ubica el valor de Z = 0,74 en la tabla de la distribución normal (tabla Z) para buscar


el área dentro de la curva normal:

Este valor se ubica en la curva para poder


determinar la probabilidad

0,08 0,10
-3 -2 -1 0 1 2 3 Z
Esta es el área o la probabilidad que

�� �� ����
se desea buscar

Obsérvese que la tabla me da el valor del área de la curva que va desde la proporción
poblacional o cuando Z = 0 hasta el valor de (área = 0,2704) pero se quiere la probabilidad
de que menos del 10% o la proporción de 0,10 sean defectuosa. Por lo tanto, al área
(0,2704) de Z = 0,74 se le suma la mitad de la curva que queda al lado izquierdo, es decir,
0,5, por lo tanto, la probabilidad sería:

()()()

()()

Existe un 77,04% de probabilidad de que menos del 10% de las unidades salgan
defectuosas.

b) Probabilidad de que las unidades defectuosas se encuentren entre el 9% y 12%:


()()( ) ()()( ) ()()()

Ahora vamos a calcular cada uno de los valores de Z por separado, para luego ubicar
las áreas en la curva normal y poder obtener la probabilidad que se desea determinar:

Las áreas de y se ubican en la curva para poder


determinar la probabilidad que se desea:

0,4306

0,08 0,09 0,12


-3 -2 -1 0 1 2 3 Z

���� �� ���� Esta es el área o la


probabilidad que se desea
buscar

���� �� ����

Para este caso la tabla Z me da un área de (0,1443) que va desde la proporción


poblacional o cuando Z es igual a cero “0” hasta el valor de y otra área de (0,4306) que va
desde la proporción poblacional hasta el valor de . Por lo tanto, para determinar la
probabilidad que se desea, al área de que tiene el tamaño más grande se le resta el área de
que es más pequeña.

()()()

()()()

()()

()

Existe un 28,63% de posibilidad o probabilidad de que las unidades defectuosas se


encuentren entre el 9% y 12%.
OBSERVACIONES IMPORTANTES DEL TEMA TEORIA DE MUESTREO:
1. Cuando se trabaja con números aleatorios, como su nombre lo indica son
números al azar (aleatorios), ya sea por la tabla o la calculadora no les va a
generar los mismos números a todos, es decir, es raro que cuando realicen los
ejercicios y la evaluación todos vayan a tener las mismas muestras.
2. Se les recuerda que las probabilidades o proporciones no pueden ser
negativas ni mayores que 1, es decir, pertenece a un intervalo cerrado que va
desde 0 hasta 1. ( )
3. Para calcular las probabilidades de los estadísticos (distribución de la media
muestral o de la proporción muestral) se les recomienda siempre realizar el
gráfico de la curva para que sepan cual es el área que se está buscando,
porque a través del gráfico se puede visualizar cuando van a sumar o restar.
Además, se les recuerda que el área que se marca en la gráfica de la curva es
lo que se desea determinar o calcular.
1.2 ESTIMACIONES

Debido al coste, al tiempo y a la viabilidad, se suelen estimar los parámetros de la


población a partir de los estadísticos de una muestra. Por consiguiente, el objetivo principal
de la estadística inferencial es la estimación, esto es que mediante el estudio de una muestra
se quiere generalizar las conclusiones al total de la población.

Normalmente los parámetros poblacionales no son conocidos y se han de estimar a


partir de los estadísticos muéstrales.

Un estimador de un parámetro poblacional es una variable aleatoria que depende de la


información de la muestra y cuyas realizaciones proporcionan aproximaciones al valor
desconocido del parámetro. Por ejemplo, la media muestral es un estimador de la media
poblacional, la proporción observada en la muestra es un estimador de la proporción en la
población.

Existen dos formas diferentes de realizar las estimaciones, estas son: estimaciones
puntuales o estimaciones por intervalos.

Estimación Puntual

Un estimador puntual de un parámetro poblacional es una función de la muestra que


da como resultado un único valor. Por ejemplo, la media muestral (X)es un estimador puntual
de la media poblacional (μ)

Formulas:

Media Muestral: √

̅∑ Para datos agrupados:

Desviación estándar o típica muestral: √∑( ̅) Media Muestral:


̅∑
Varianza Muestral:

∑( ̅)
Varianza Muestral:

Proporción muestral: ∑ ( ̅)

Dónde: es la frecuencia absoluta simple


Ejemplo: Los siguientes datos representan las bonificaciones (expresados en miles de
$) de una muestra de empleados en base a la categoría y productividad de los mismos:
1,5 1,8 1,6 1,3 1,5 1,9
1,6 1,5 1,2 2,2 1,2 2,4
Determine:
a) La bonificación media de los empleados:

̅∑

b) La varianza y desviación estándar de las bonificaciones de los empleados


Bonificacion ( )̅
( ̅)
es ( )

1,5 -0,14 0,0196

1,8 0,16 0,0256

1,6 -0,04 0,0016

1,3 -0,34 0,1156

1,5 -0,14 0,0196

1,9 0,26 0,0676

1,6 -0,04 0,0016

1,5 -0,14 0,0196

1,2 -0,44 0,1936

2,2 0,56 0,3136

1,2 -0,44 0,1936

2,4 0,76 0,5776


∑( ̅)
∑( ̅)
()()()()

()()()()

√∑( ̅)
√ √
c) ¿Cuál es la proporción de empleados que tienen una bonificación superior a 1700 $?

X = Empleados con bonificaciones mayores que 1,7 mil $


1,5 1,8 1,6 1,3 1,5 1,9
1,6 1,5 1,2 2,2 1,2 2,4

Entonces, X = 4 empleados que tienen bonificaciones mayores que 1,7


$ Por lo tanto,

La proporción de empleados que tienen una bonificación superior a los 1700 $ es de


0,3333 que representan un 33,33% de los empleados

Propiedades de un estimador

Un buen estimador debe tener las siguientes propiedades:


a) Insesgado. Un estimador es “insesgado”, cuando el valor promedio de las
estimaciones para todas las posibles muestras de igual tamaño, es igual al verdadero
parámetro poblacional. Por ejemplo, la media muestral, la varianza muestral y la proporción
muestral son estimadores insesgado de sus correspondientes parámetros poblacionales:
b) Consistente. Se dice que un estimador es “consistente”, cuando la magnitud de los
errores de estimación, se pueden reducir a medida que se aumenta el tamaño de la muestra,
hasta eliminarlos completamente cuando el tamaño de la muestra iguala al tamaño de la
población.
Cuando se hace una estimación, necesariamente se genera un ERROR que aspiramos
sea mínimo. En cualquier investigación, es necesario especificar con anticipación el nivel
máximo de error que estamos dispuestos a aceptar en la estimación. El tamaño de la
muestra, depende en buena parte del error que estemos dispuestos a tolerar en la
estimación. Si estamos dispuestos a aceptar un mínimo error en la estimación, entonces el
tamaño de la muestra deberá ser muy grande. Entre mayor sea el error que estamos
dispuestos a tolerar, más pequeña será la muestra necesaria para la respectiva estimación
ahorrando con esto tiempo y dinero, además los errores no muéstrales serán menores.
c) Eficiente. La raíz cuadrada positiva de la varianza del estimador, se denomina
“ERROR ESTÁNDAR”, el cual es una medida de la variabilidad del estimador. Cuando el
error estándar es menor para un estimador que para otro, se dice que el primero es más
eficiente que el segundo. Por ejemplo, si se trata de estimar un promedio, la media aritmética
es un estimador más eficiente que la mediana.

Los estimadores puntuales tienen un valor diferente según la muestra elegida y no se


puede conocer el grado de precisión de la estimación que se está realizando, por lo tanto, la
estimación realizada puede resultar un poco fiable.

Para evitar este problema, se puede estimar un posible rango de valores o intervalo, en
el que se encontrará el parámetro con una probabilidad o nivel de confianza establecido, a
esto se le llama intervalo de confianza.

Estimación con Intervalos de Confianza

Una forma de estimar un parámetro poblacional consiste en estimar con algún grado de
confianza, un intervalo que incluya un límite inferior y un límite superior dentro de los cuales
esperamos que se encuentre el verdadero valor del parámetro. Con esto, estamos
admitiendo que existe una probabilidad de que esto no ocurra y por consiguiente una
probabilidad de que ello si ocurra. Es decir, es la probabilidad de fallar en la estimación y es
la confiabilidad que merece la estimación.

Un intervalo de confianza o estimación por intervalo denota un rango dentro del cual
puede encontrarse el parámetro, y el nivel de confianza que el intervalo contiene del
parámetro. Este tiene un límite inferior de confianza (LIC) y un límite superior de confianza
(LSC). Estos límites se determinan calculando primero al estadístico (la media muestral ( )̅ , la
varianza o la proporción) luego se suma una cierta cantidad al estadístico para obtener el
límite superior de confianza (LSC), y la misma cantidad se resta del estadístico para obtener
el límite inferior de confianza (LIC).

El nivel de confianza es la probabilidad de que el intervalo calculado contenga al


verdadero valor del parámetro y se denota por ( ) y normalmente se da en términos de
porcentaje ( ) . Se le llama nivel de confianza y no probabilidad porque una vez extraída una
muestra, el intervalo de confianza puede contener o no al verdadero valor del parámetro.

El nivel de significación se denota por y representa la probabilidad de equivocarnos al


estimar que el parámetro se encuentre en ese intervalo de confianza. Por lo tanto, es la
proporción de las colas de la distribución que queda fuera del intervalo de confianza, donde
cola
se tiene que la proporción en la cola superior de la distribución es ⁄ y la proporción en la
inferior que queda fuera del intervalo de confianza también es
⁄.
Ni
vel de Confianza

Nivel de

Significación
Nivel de Significación

Podemos calcular intervalos de confianza para estimar algunos parámetros


poblacionales tales como: la media, la proporción, la diferencia de medias, la diferencia de
proporciones y para la desviación estándar. Para tal efecto, nos basaremos en los conceptos
estudiados sobre distribuciones muéstrales vistos anteriormente:

Intervalos de confianza para la media de una población con varianza ( ) o


desviación estándar poblacional ( ) conocida y desconocida

Comúnmente en una población se desconoce la media poblacional ( ), pero esta se


puede estimar a partir de la media muestral ( )̅ con un nivel de confianza ( ).
̿
Se recuerda que la distribución de medias muéstrales ( ) sigue una distribución normal
̿
cuya media coincide con la de la población ( ) y cuya desviación estándar es ( ̅). Por lo tanto,
la variable normalizada:

̅
̅( )̅

- Intervalo de confianza para estimar la media poblacional con conocida


Consideremos una muestra aleatoria de n observaciones extraídas de una población

que sigue una distribución normal de media y varianza . Si la media muestral es ̅, entonces el
intervalo de confianza al ( ) de la media poblacional, cuando la varianza es conocida, viene
dado por:
̅ ⁄

̅ ⁄

̅ ⁄

- Intervalo de confianza para estimar la media poblacional con desconocida


Si el tamaño de la muestra es mayor que 30 (n > 30) y el valor de es desconocida,
entonces, la desviación estándar de la muestra “S”, puede reemplazar al valor de . Por lo
tanto,
̅ ⁄

̅ ⁄

̅ ⁄

Se puede observar en ambos casos que para estimar el parámetro poblacional, se está
creando un intervalo cuyo límite inferior corresponde al lado izquierdo de la fórmula, mientras
que el límite superior corresponde al lado derecho de la fórmula. Esto quiere decir, que para
la referida estimación, aceptamos un margen de error por defecto o por exceso máximo de
⁄ cuando es conocida y ⁄
√ √ cuando es desconocida.
Por lo tanto, entre mayor nivel confianza ( ) queramos tener en la estimación, mayor
amplitud presentará el intervalo, por cuanto mayor será el valor de Z y como consecuencia
más débil será la estimación, a menos que aumentemos el tamaño de la muestra “n”.

Tamaño de la muestra para estimar la media poblacional ( )


Para resolver cualquier problema de estimación de intervalo de confianza o de prueba
de hipótesis, es necesario calcular previamente el tamaño de la muestra sobre la cual se va a
basar la inferencia. El tamaño de la muestra depende en buena parte del propósito del
estudio.
Para poder conocer el tamaño de la muestra adecuado, es necesario conocer la mitad
de la amplitud del intervalo de confianza, es decir el error por defecto o por exceso que
estamos dispuestos a aceptar en la estimación.
Partiendo de la base de que las medias muéstrales se distribuyen normalmente, la
fórmula para el tamaño de la muestra puede ser obtenida del valor que toma Z en la
distribución de las medias muéstrales así:

̅ ̅
̅ √ ( ̅ )√

El error que estamos dispuestos a aceptar en la estimación, es la diferencia entre la


media de la muestra (estimador) y la verdadera media poblacional (parámetro), es decir la
̅
mitad de la amplitud del intervalo, lo cual es:
En consecuencia, reemplazando ̅ por y despejando a “n” en la expresión anterior
tenemos:
( ̅ )√

√ ( )
Esta fórmula es cuando es conocida.
Para desconocida se aplica:

( )

NOTA:
Es evidente, que en la estimación por intervalos de confianza un dato importante
es el tamaño de la muestra. Parece claro que, a igual nivel de confianza, cuanto mayor
sea el tamaño de la muestra menor será el margen de error cometido del intervalo de
confianza, puesto que el valor obtenido en la muestra se acercará más al valor real de
la población y por tanto el margen de error cometido se hará más pequeño. Además, si
el tamaño de la muestra permanece constante y variamos el nivel de confianza, el
margen de error cometido del intervalo será más grande cuanto mayor sea dicho nivel.
Es decir, el margen de error será más grande cuanto mayor sea la precisión exigida.

Distribución t de Student
Cuando debe tomarse una muestra pequeña, la distribución normal puede no aplicarse.
El teorema del límite central asegura normalidad en el proceso de muestreo solo si la
muestra es grande. Cuando se utiliza una muestra pequeña, puede ser necesaria una
distribución alternativa, la distribución t de Student. Esta se utiliza cuando se cumple las tres
(3) condiciones siguientes:
1. La muestra es pequeña (n < 30)
2. La desviación estándar poblacional es desconocida
3. La población proviene de una distribución normal o casi normal

Si la desviación poblacional es conocida la distribución normal se usa inclusive si la


muestra es pequeña.
Al igual que la distribución normal estándar, la distribución t tiene forma de campana,
presenta una media igual a cero, es simétrica con respecto a la media y oscila entre . Sin
embargo, mientras que la distribución Z tiene una varianza igual a 1 ( ), la varianza de la
distribución t es mayor que 1, por tanto, la distribución es platicurtica o más plana y más
dispersa que la distribución Z.
Aunque sólo hay una distribución normal estándar, hay una distribución t distinta por
cada tamaño muestral n. Sin embargo, a medida que n se hace más grande, la distribución t
se aproxima a la distribución normal estándar hasta que, cuando , son aproximadamente
iguales.
El estadístico t se calcula en gran parte como el estadístico Z.
̅ ̅
̅

La distribución t de Student utiliza una tabla de probabilidad especial, cuyo uso sugiere
como compensación el cálculo previo de los grados de libertad (g.l),
Los grados de libertad (g,l) se definen como el tamaño de la muestra “n”, al cual se le
ha restado tantas unidades como parámetros de la población halla que estimar a partir de la
muestra.

Intervalo de confianza para la media de una población con varianza poblacional (


) desconocida y muestra pequeña (n < 30)

̅( ⁄)
√ ̅( ⁄)
√ ̅( ⁄)

Intervalo de confianza para la proporción de una población

Sea p la proporción observada de éxito en una muestra aleatoria de n observaciones


procedentes de una población con una proporción de éxitos. Se sabe que las proporciones
con tamaños muestrales siguen distribuciones normales con media poblacional y error
estándar , entonces la variable tipificada:
√()

Por lo tanto, si n es grande, un intervalo de confianza del ( ) para la proporción


poblacional viene dado por:


√()

√()

√()

A la expresión:


√()

Se le denomina margen de error y se expresa en porcentaje (%).

Tamaño de la muestra requerido para la estimación de la proporción poblacional (


):

Antes de recolectar la muestra, el tamaño de muestra mínimo requerido puede


determinarse especificando el nivel de confianza y el error de muestreo o error de estimación
aceptable y haciendo una estimación inicial de la proporción poblacional desconocida.

√()

El error que estamos dispuestos a aceptar en la estimación, es la diferencia entre la


proporción de la muestra y la verdadera proporción poblacional, es decir la mitad de la
amplitud del intervalo, lo cual es:
En consecuencia, reemplazando por y despejando a “n” en la expresión anterior se
tiene:


()

Si no es posible determinar un estimado inicial de la proporción poblacional ( ) se le


deberá estimar en 50% (0,5). Esta estimación representa el valor para el que se requeriría
del tamaño de muestra mayor.

Distribución Ji cuadrada e intervalos de confianza para la varianza y desviación


estándar

Dada una población de valores con distribución normal, puede demostrarse que la

distribución ji cuadrada ( ) son las distribuciones de probabilidad adecuada para la razón:


()

Hay una distribución ji cuadrada diferente según el valor de n – 1, lo cual representa los
grados de libertad.
Dado que la varianza muestral es un estimador in sesgado de la varianza poblacional,
el valor esperado a largo plazo de la razón anterior es igual a los grados de libertad (n – 1).
Sin embargo, en cualquier muestra dada por lo general la varianza muestral no es idéntica en
valor a la varianza poblacional.
Las distribuciones ji cuadrada no son simétricas, en consecuencia, un intervalo de
confianza de dos extremos para una varianza o desviación estándar implica el uso de dos
valores diferentes de ji cuadrado.

Intervalo de confianza para la varianza poblacional

()
()

Dónde:

Intervalo de confianza para la desviación


poblacional √( )

√( )

También podría gustarte