Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NUCLEO MONAGAS
ESCUELA DE CIENCIAS SOCIALES Y ADMINSTRATIVAS
DEPARTAMENTO DE CONTADURÍA PÚBLICA
ASIGNATURA: ESTADÍSTICA II (0913863)
PROFA.: JEZABEL FERMÍN
Esta teoría trata sobre los fundamentos probabilísticos, las distribuciones estadísticas,
los métodos o técnicas de selección, las fórmulas para el cálculo de los errores de muestreo
y determinación del tamaño de la muestra de la población, y los métodos de estimación de
los parámetros poblacionales a partir de los estadísticos muéstrales. Por lo que:
La Teoría del muestreo es el estudio de las relaciones existentes entre una población
y las muestras extraídas de la misma. Esta teoría indica los procedimientos o técnicas para
extraer una parte o muestra del colectivo o población que se quiere estudiar o analizar, y del
resultado del análisis se pueden estimar o inferir datos de la población, como por ejemplo su
media (µ), varianza (σ2), etc., llamados parámetros poblacionales a partir de los valores
obtenidos de la muestra, tales como la media muestral ( ̅), varianza muestral (s2), etc.,
llamados estadísticos.
✔ Costos reducidos. Si los datos se obtienen únicamente de una pequeña fracción del
total, los gastos son menores que los que se realizarían para toda la población.
✔ Mayor rapidez para obtener resultados. Los datos pueden ser recolectados y
resumidos más rápidamente con una muestra que con toda la población.
✔ Mayor exactitud o mejor calidad de la información. Pues reduce el volumen de
trabajo, lo cual permite emplear personal más capacitado, mejor preparado y
entrenado. Los procesos de supervisión y el procesamiento de datos están mejor
controlados, lo que redunda en una mejor calidad del trabajo y una disminución de
errores.
✔ Factibilidad de hacer el estudio cuando la toma de datos implica técnicas
destructivas.
Tipos de Muestreo
Por ejemplo, se debe realizar una investigación acerca de personas con algún problema
de salud en una empresa que posee 1.000 empleados (población), por lo que el investigador
decide separar a las personas en estratos, según su rango de edad, de la siguiente manera:
Estrato Edad Cantidad Porcentaje
1 18 – 29 600 60%
2 30 – 59 300 30%
Con los estratos ya segmentados, el investigador debe conformar una muestra que sea
proporcional al total de la población, por lo que selecciona una muestra estadística de 100
personas para realizar su investigación.
Por ejemplo se tiene una población que consta de 845 empleados de una empresa
manufacturera (N = 845 empleados), se procede a enumerar a cada elemento de la
población:
001 002 003 004 …… 845
2) Luego se selecciona la muestra por algún procedimiento aleatorio, como sigue:
Para trabajar con la T.N.A se debe seleccionar al azar (con los ojos cerrados) un
número que será nuestro punto de partida, y a partir de allí elegir una dirección (filas o
columnas) por la cual nos vamos a desplazar para escoger a los elementos que van a
conformar a la muestra de la población. Por lo que en esta tabla no se trabaja de forma
salteada, sino que se elige una dirección, ya sea por filas o por columnas, como se muestra
en la siguiente figura.
Ejemplo: Supóngase que una empresa manufacturera tiene 845 empleados y el gerente
general desea realizar un estudio. Para ello selecciona una muestra de 15 empleados.
¿Cuáles empleados conformaran la muestra aplicando un muestreo aleatorio simple? Utilice
la tabla de números aleatorios (Ver archivo de tablas)
FILAS
C
O
L
U
M
N
A
S
Como la población está conformada por 845 empleados, es decir, tiene tres dígitos, se
toman los tres primeros dígitos del número aleatorio de cinco dígitos seleccionado en la
tabla, por lo que sería 976, pero fíjense que este número es mayor que el tamaño de la
población (N = 845), por lo que este valor se omite y se sigue con el siguiente, de acuerdo a
la dirección por la cual nos vamos a desplazar (fila o columna) para seleccionar a los
elementos que van a conformar la muestra.
Dirección del desplazamiento por fila:
El punto de partida que se seleccionó al azar (cerrando los ojos y colocando la mano en
una parte de la tabla) es 97636, como la población consta de tres (3) dígitos se toman los 3
primeros dígitos del número, es decir, 976, como este valor es mayor que el tamaño de la
población se omite y se continua con el siguiente y así sucesivamente hasta completar los
elementos de la muestra que se desean obtener de la población, como se muestra a
continuación:
97636 = 976 punto de partida, se omite (976 > 845)
37397 = 373 este se toma porque se encuentra dentro del rango (001 al
845) 93379 = 933 se omite
56454 = 564 se toma y así sucesivamente hasta completar la muestra
Observe que la fila donde se encuentra el punto de partida se terminó con el número
46977, pero todavía no se ha completado la muestra que se desea buscar, por lo que se
pasa a la fila siguiente que se encuentra debajo y así sucesivamente hasta completar la
muestra que se desea obtener. Por lo que la muestra seleccionada sería:
Se realiza el mismo procedimiento como se desplaza por fila, la diferencia es que ahora
la dirección del desplazamiento es por columna. Como se puede visualizar en la siguiente
figura N° 3, en donde se seleccionan cuáles son los elementos que van a conformar la
muestra que se desea obtener.
Ejemplo: Una empresa manufacturera que tiene 845 empleados y se desea extraer una
muestra de 15 empleados. ¿Cuáles empleados van a conformar la muestra? Aplique un
M.A.S utilizando la calculadora
Se tiene que:
Tamaño de la población: N = 845
Tamaño de la muestra: n = 15
Aplicando el procedimiento se tiene:
N Ran#
X • 810,355 295
845
X • 92,105
845
X • 703,885
845
X • 147,875
845
• 233,22
845
• 32,11
845 SHIFT
• 801,06
845 SHIFT
• 228,995
845 SHIFT
796,835
845 SHIFT
163,93
845 SHIFT =
354,055
845 SHIFT =
295,75
845 SHIFT =
845 SHIFT =
≈≈≈≈≈≈≈≈
845 SHIFT =
≈≈≈≈≈≈≈
845 SHIFT =
SHIFT =
SHIFT =
X
SHIFT =
X
SHIFT =
X
SHIFT =
X
=
X
=
X •
=
X •
=
X •
X •
X • 243,36
X • 354,32
• 780,78
La muestra estaría conformada por los siguientes empleados: 243 354 780 810
Ejemplo: Una empresa manufacturera que tiene 845 empleados y se desea extraer una
muestra de 5 empleados. ¿Cuáles empleados van a conformar la muestra? Aplique un M.A.S
utilizando la calculadora
Se tiene que:
Tamaño de la población: N = 845
Tamaño de la muestra: n = 5
Utilizando la calculadora se tiene:
Ran# Valor N
399
SHIFT ≈≈≈≈≈
• 0,927 X 845 + 1 = 789,315
789
SHIFT • 0,055 X 845 + 1 = 47,475
047
SHIFT • 0,211 X 845 + 1 = 179,295
179
SHIFT • 0,621 X 845 + 1 = 525,745
525
SHIFT • 0,472 X 845 + 1 = 399,84
Se debe tener en cuenta que la muestra depende de los valores h y m. Por lo que dada
una población y un tamaño de muestra, m representa un valor fijo que indica la separación
entre los elementos sucesivos de la muestra en la población y que permite obtener la
muestra del tamaño deseado. El valor de h se debe elegir aleatoriamente (M.A.S) e indica el
punto de inicio para seleccionar los elementos de la muestra. Vea los siguientes ejemplos
para que pueda entender mejor:
Enumeramos a la población:
()
Enumeramos a la población:
Fíjense en este caso, el valor de m se redondea por abajo, es decir, m = 56. Esto se
debe hacer así, porque si se redondea hacia el entero siguiente, no habría elementos
suficientes en la población para extraer la muestra.
Utilizando la calculadora:
036 092 148 204 260 316 372 428 484 540 596 652 708 764 820
Dónde:
NT: Tamaño de la población total
NE: Tamaño de la población de cada estrato o grupo
n: Tamaño de la muestra que se desea buscar
nE: Tamaño de la muestra de cada estrato o grupo
A 265
B 190
C 225
D 165
Luego de que se obtiene el tamaño de las muestras de cada estrato o grupo se debe
aplicar un muestreo aleatorio simple (M.A.S) o un muestreo sistemático (MS) para obtener
las muestras de cada estrato o grupo.
Se toma un valor h aleatoriamente comprendido entre 1 y 44, el cual será nuestro punto
de partida, supóngase que se escoge al azar (M.A.S)
Utilizando la calculadora:
Por lo que la muestra del Dpto. A quedaría conformada por los siguientes empleados:
012 056 100 144 188 232
Y el mismo procedimiento se aplicaría para obtener las muestras de cada uno de los
Departamento
Por lo que el muestreo por conglomerados requiere de elegir una muestra aleatoria
simple de unidades heterogéneas entre sí de la población llamadas conglomerados. Cada
elemento de la población pertenece exactamente a un conglomerado, y los elementos dentro
de cada conglomerado son usualmente heterogéneos o disímiles (distintos o diferentes).
Ejemplo 1: Suponga que una compañía de servicio de televisión por cable está
pensando en abrir una sucursal en una ciudad grande; la compañía planea realizar un
estudio para determinar el porcentaje de familias que utilizarían sus servicios, como no es
práctico preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al
azar, la cual forma un conglomerado.
Se recuerda que la curva completa tiene un área igual a 1 y es simétrica, es decir que si
se divide en dos partes iguales, se tiene 0,5 para un lado y 0,5 para el otro lado.
Este valor de 0,475 representa el área (probabilidad) dentro de la curva que nos va a
ayudar a determinar el valor de Z, por lo que esta área se ubica dentro de la tabla de la
distribución normal como se puede apreciar en la figura N° 4
Figura N° 4: Fragmento de la Tabla Z (Distribución Normal)
0,475
⁄ () ⁄
Datos:
Tamaño de la población:
Nivel de Confianza:
Margen de error permitido:
Tamaño de muestra:
()
⁄ ()
()⁄
Para aplicar la formula se tiene el error (e) y el tamaño de la población (N), nos falta la
proporción (p) y el valor crítico ( ⁄ ), pero la teoría nos dice que si no se conoce la
característica de la proporción, esta se debe de asumir en un 50%, es decir, p = 0,5. Nos
falta el valor de ⁄ . Este se puede obtener con el nivel de confianza. Despejando el valor de ,
se tiene:
Por lo tanto:
⁄
Este valor (área dentro de la curva = 0,49) se ubica en la tabla de la distribución normal
(Tabla Z) para determinar el valor de ⁄
Figura N° 6: Fragmento de la Tabla Z para obtener el valor de Z α/2
( )( )( )( )
( )( ) ( )( )( )
Ejemplo 2: Suponga que se quiere realizar un estudio de mercado para ver las
preferencias que tienen 350.000 clientes por un determinado producto, se sabe que en
estudios anteriores el 60% de los clientes tenían preferencia por un determinado producto.
¿Cuál sería el tamaño de muestra necesario con un 90% de confianza y un error del 8%?
Datos:
Tamaño de la población:
Proporción:
Nivel de Confianza:
Margen de error permitido:
Tamaño de muestra:
Como se aplica la fórmula para poblaciones infinitas: ( )
Para aplicar la formula se tiene el error (e) y la proporción (p), pero nos falta el valor
crítico ( ⁄ ).
Se despeja el valor de :
Por lo tanto:
⁄
Z)
⁄
Se determinar el tamaño de la muestra, sustituyendo los valores en la fórmula:
()
( ) ( )( )
⁄
()
( )( )( )
Distribuciones Muéstrales
Los símbolos utilizados para representar los estadísticos y los parámetros son los
siguientes:
Medida Parámetro Estadístico
Media Aritmética ̅
Varianza
Proporción
Nº de Elementos
El estadístico se utiliza como estimador del parámetro.
Distribución en el muestreo
La distribución muestral es una lista de todos los valores posibles para un estadístico
y la probabilidad relacionada con cada valor.
̿ ̅
∑
De una población que contiene “N” elementos, podemos extraer o seleccionar “k”
muestras diferentes de igual tamaño “n”.
√∑( )
̅
̅∑ ( )
Sin embargo, muchas decisiones en los negocios, dependen de una muestra completa,
no sólo de una observación. Por lo tanto, la formula Z debe de alterarse para explicar el
hecho en el cual se está interesado, no solo en una observación X sino en la media de varias
observaciones X. por lo tanto, cuando se realiza el muestreo, la formula Z viene dada por:
̅
̅ ( ̅)
Si la población o proceso del cual se toma una muestra tiene una distribución normal,
también la distribución de muestreo de la media tendrá distribución normal, sin importar el
tamaño de la muestra.
Ahora bien, si a cada una de las k muestras posibles, le calculamos un estimador como
la media o la proporción, obtenemos una variable aleatoria cuya distribución denominamos
distribución muestral del estimador.
La distribución muestral del estimador se define como la distribución del estimador
de todas las posibles muestras del mismo tamaño, que pueden ser extraídas de una
población. Por lo tanto, el estimador es una variable aleatoria, porque su valor cambia de
muestra a muestra. Esto significa que si tomamos una segunda muestra aleatoria de una
población, es casi imposible esperar el mismo valor para el estimador.
Supongamos que se elige una primera muestra de tamaño n de una población, esta
dará un promedio ( ̅
) de la variable que se esté estudiando (pesos, salarios, estaturas, etc.),
otra muestra diferente elegida dará otro promedio ( ̅
) y así sucesivamente. Si consideramos
todas las muestras posibles de tamaño n que se puedan extraer de esa población, la variable
aleatoria que a cada una de esas muestras le hace corresponder su media (promedio) se
̿
llama media muestral o gran media y se representa por . Dicha variable tomará los valores:
̿ ̅̅̅
* +
̿
Al ser una variable aleatoria se puede estudiar su distribución, a la que llamaremos
distribución de la media muestral.
Propiedades:
̅
2. La desviación estándar o error estándar:
√
Cuando se conoce la población (Población finita) y el tamaño muestral no es una
fracción pequeña del tamaño poblacional se debe verificar la siguiente condición:
√ (√ )
Por lo tanto:
̅
̅ ( ̅)
Ejemplo: El gasto medio total semanal de los jóvenes de una ciudad es de 25$ con
desviación estándar de 3$. Si se eligen al azar una muestra de 49 jóvenes:
a) ¿Cuál es la probabilidad de que el gasto medio se encuentre entre 24 y 26$?
b) ¿Cuál es la probabilidad de que el gasto medio supere los 26,25$?
c) Suponga que en la ciudad hay un total de 250 jóvenes ¿Cuál es la probabilidad de
que el gasto medio de los 49 jóvenes elegidos al azar sea inferior a 24$?
Datos:
a) ( ̅ )
( ̅ ) ( ̅ ̅) ( )
Como no se conoce el tamaño de la población se determina el error estándar, para
luego sustituirlo en la fórmula de Z
̅
√
√
Sustituyendo:
̅
Luego se ubican las dos áreas en la curva para poder determinar la probabilidad que se
desea buscar:
0,4901
0,4901
24 25 26
-3 -2 -1 0 1 2 3 Z
Esta es el área o la probabilidad que
se está buscando
Esta es el área o la
�� �� ����
0,4982 probabilidad que se está buscando
25 26,25
-3 -2 -1 0 1 2 3 Z
Como la distribución normal es simétrica al dividirla en dos partes iguales se tiene un
área de 0,5 para el lado izquierdo y el otro 0,5 para el lado derecho y la tabla da el valor del
área que va desde la media ( ) o desde Z = 0 hasta el valor de (0,4982) pero se está
buscando la probabilidad de que el gasto medio de los jóvenes sea mayor que 26,25$ o que
2,91. Por lo tanto, a la mitad de la curva (0,5) se le resta el área de Z (0,4982) para obtener la
probabilidad que se desea buscar:
( ̅ ) ( )̅ ( )
(̅)
(̅)
Existe un 0.18% de probabilidad que el gasto medio de los 49 jóvenes elegidos al azar
sea superior a 26,25$
c) ( ̅ )
Para este caso como se conoce el tamaño de la población se debe verificar si se
cumple la condición para aplicar el factor de corrección al error estándar.
()
Por lo tanto, al error estándar hay que aplicarle el factor de
corrección: ̅
√√
√ √ ( )√
̅( )√ ( )( )
̅
(̅)( ̅ ̅) ( )̅
Sustituyendo:
̅
0,4821
-3 -2 -1 0 1 2 3 Z
�� �� ����
( ̅ ) ( )̅ ( )
(̅)
(̅)
Existe el 1,79% de probabilidad que el gasto medio de los 49 jóvenes elegidos al azar
sea inferior a 24$
Distribución de la proporción muestral:
Suponga que se quiere estudiar si los individuos de una población tienen o no una
determinada característica. Habrá una proporción de individuos que si la tienen y el resto de
los individuos 1 – que no la tienen. Si se toma distintas muestras de tamaño n, la primera nos
dará una proporción , la segunda una proporción y así sucesivamente.
De manera parecida a lo hecho con las medias muéstrales, se puede considerar todas
las posibles muestras de tamaño n y considerar las proporciones muéstrales p como una
variable aleatoria. A la distribución de la variable p descrita la llamaremos distribución
muestral de las proporciones.
Propiedades:
1. El valor esperado de las proporciones muéstrales será igual a la proporción de la
población.
()
Dónde:
√()
(√ ( )
)(√ )
()
Datos:
√()
√()
Sustituyendo, se tiene:
0,08 0,10
-3 -2 -1 0 1 2 3 Z
Esta es el área o la probabilidad que
�� �� ����
se desea buscar
Obsérvese que la tabla me da el valor del área de la curva que va desde la proporción
poblacional o cuando Z = 0 hasta el valor de (área = 0,2704) pero se quiere la probabilidad
de que menos del 10% o la proporción de 0,10 sean defectuosa. Por lo tanto, al área
(0,2704) de Z = 0,74 se le suma la mitad de la curva que queda al lado izquierdo, es decir,
0,5, por lo tanto, la probabilidad sería:
()()()
()()
Existe un 77,04% de probabilidad de que menos del 10% de las unidades salgan
defectuosas.
Ahora vamos a calcular cada uno de los valores de Z por separado, para luego ubicar
las áreas en la curva normal y poder obtener la probabilidad que se desea determinar:
0,4306
���� �� ����
()()()
()()()
()()
()
Existen dos formas diferentes de realizar las estimaciones, estas son: estimaciones
puntuales o estimaciones por intervalos.
Estimación Puntual
Formulas:
Media Muestral: √
∑( ̅)
Varianza Muestral:
Proporción muestral: ∑ ( ̅)
̅∑
∑
∑( ̅)
∑( ̅)
()()()()
()()()()
√∑( ̅)
√ √
c) ¿Cuál es la proporción de empleados que tienen una bonificación superior a 1700 $?
Propiedades de un estimador
Para evitar este problema, se puede estimar un posible rango de valores o intervalo, en
el que se encontrará el parámetro con una probabilidad o nivel de confianza establecido, a
esto se le llama intervalo de confianza.
Una forma de estimar un parámetro poblacional consiste en estimar con algún grado de
confianza, un intervalo que incluya un límite inferior y un límite superior dentro de los cuales
esperamos que se encuentre el verdadero valor del parámetro. Con esto, estamos
admitiendo que existe una probabilidad de que esto no ocurra y por consiguiente una
probabilidad de que ello si ocurra. Es decir, es la probabilidad de fallar en la estimación y es
la confiabilidad que merece la estimación.
Un intervalo de confianza o estimación por intervalo denota un rango dentro del cual
puede encontrarse el parámetro, y el nivel de confianza que el intervalo contiene del
parámetro. Este tiene un límite inferior de confianza (LIC) y un límite superior de confianza
(LSC). Estos límites se determinan calculando primero al estadístico (la media muestral ( )̅ , la
varianza o la proporción) luego se suma una cierta cantidad al estadístico para obtener el
límite superior de confianza (LSC), y la misma cantidad se resta del estadístico para obtener
el límite inferior de confianza (LIC).
Nivel de
Significación
Nivel de Significación
̅
̅( )̅
√
que sigue una distribución normal de media y varianza . Si la media muestral es ̅, entonces el
intervalo de confianza al ( ) de la media poblacional, cuando la varianza es conocida, viene
dado por:
̅ ⁄
̅ ⁄
√
̅ ⁄
√
√
̅ ⁄
√
̅ ⁄
√
√
Se puede observar en ambos casos que para estimar el parámetro poblacional, se está
creando un intervalo cuyo límite inferior corresponde al lado izquierdo de la fórmula, mientras
que el límite superior corresponde al lado derecho de la fórmula. Esto quiere decir, que para
la referida estimación, aceptamos un margen de error por defecto o por exceso máximo de
⁄ cuando es conocida y ⁄
√ √ cuando es desconocida.
Por lo tanto, entre mayor nivel confianza ( ) queramos tener en la estimación, mayor
amplitud presentará el intervalo, por cuanto mayor será el valor de Z y como consecuencia
más débil será la estimación, a menos que aumentemos el tamaño de la muestra “n”.
̅ ̅
̅ √ ( ̅ )√
√ ( )
Esta fórmula es cuando es conocida.
Para desconocida se aplica:
( )
NOTA:
Es evidente, que en la estimación por intervalos de confianza un dato importante
es el tamaño de la muestra. Parece claro que, a igual nivel de confianza, cuanto mayor
sea el tamaño de la muestra menor será el margen de error cometido del intervalo de
confianza, puesto que el valor obtenido en la muestra se acercará más al valor real de
la población y por tanto el margen de error cometido se hará más pequeño. Además, si
el tamaño de la muestra permanece constante y variamos el nivel de confianza, el
margen de error cometido del intervalo será más grande cuanto mayor sea dicho nivel.
Es decir, el margen de error será más grande cuanto mayor sea la precisión exigida.
Distribución t de Student
Cuando debe tomarse una muestra pequeña, la distribución normal puede no aplicarse.
El teorema del límite central asegura normalidad en el proceso de muestreo solo si la
muestra es grande. Cuando se utiliza una muestra pequeña, puede ser necesaria una
distribución alternativa, la distribución t de Student. Esta se utiliza cuando se cumple las tres
(3) condiciones siguientes:
1. La muestra es pequeña (n < 30)
2. La desviación estándar poblacional es desconocida
3. La población proviene de una distribución normal o casi normal
La distribución t de Student utiliza una tabla de probabilidad especial, cuyo uso sugiere
como compensación el cálculo previo de los grados de libertad (g.l),
Los grados de libertad (g,l) se definen como el tamaño de la muestra “n”, al cual se le
ha restado tantas unidades como parámetros de la población halla que estimar a partir de la
muestra.
̅( ⁄)
√ ̅( ⁄)
√ ̅( ⁄)
√
Intervalo de confianza para la proporción de una población
⁄
√()
⁄
√()
⁄
√()
A la expresión:
⁄
√()
√()
⁄
()
Dada una población de valores con distribución normal, puede demostrarse que la
Hay una distribución ji cuadrada diferente según el valor de n – 1, lo cual representa los
grados de libertad.
Dado que la varianza muestral es un estimador in sesgado de la varianza poblacional,
el valor esperado a largo plazo de la razón anterior es igual a los grados de libertad (n – 1).
Sin embargo, en cualquier muestra dada por lo general la varianza muestral no es idéntica en
valor a la varianza poblacional.
Las distribuciones ji cuadrada no son simétricas, en consecuencia, un intervalo de
confianza de dos extremos para una varianza o desviación estándar implica el uso de dos
valores diferentes de ji cuadrado.
()
()
Dónde:
√( )