Está en la página 1de 42

ESTADÍSTICA

INFERENCIAL
ESTADÍSTICA INFERENCIAL

Permite elaborar conclusiones probabilísticas


acerca de una población en base a la información
obtenida a partir de una muestra de dicha
población.

Las conclusiones probabilísticas no son


definitivas, es decir al repetir el estudio pueden
obtenerse resultados diferentes.
ESTADÍSTICA INFERENCIAL
 Distribuciones muestrales
 Media de las medias muestrales
 Varianza y error estándar de las medias
muestrales

 Teorema del límite central

 Usos de la distribución muestral

 Distribución de las proporciones muestrales


Introducción
Generalmente las poblaciones son demasiado grandes como para
ser estudiadas en su totalidad.
Es necesario seleccionar una muestra representativa de un tamaño
manejable; luego esta muestra se utiliza para sacar conclusiones
sobre la población.
Ejemplo: calcular la media muestral, el estadístico Ẋ, y utilizarlo
como un estimado de la media poblacional μ.
El estadístico se utiliza como estimador del parámetro.
Estadística inferencial: involucra el uso de
un estadístico para sacar una conclusión o
inferencia sobre el parámetro
correspondiente.

De cualquier población de tamaño N, es posible


obtener muchas muestras diferentes de tamaño n.

N
Cn
Cada muestra puede también tener una media
diferente.
Distribuciones muestrales
En un estudio de 600 firmas que aparecen en la revista
Fortune, sobre los negocios más grandes de los U. S. A. se
puede tomar una muestra de n = 60
Con la muestra se puede calcular la tasa de rendimiento
promedio Ẋ para las 60 firmas.
Esa media muestral serviría como un estimado del
parámetro μ, la tasa promedio de rendimiento de la
población para las 600 firmas.
De las 600 firmas, ¿cuántas muestras diferentes de
tamaño 60 se pueden obtener?

Se obtienen 600C60 muestras diferentes de tamaño n


= 60

Para simplificar el estudio, supongamos que se tiene


una población de N = 4 ingresos para cuatro
estudiantes universitarios.
Los ingresos son 100, 200, 300 y 400, todos US$
 Como se conoce la población y es pequeña podemos calcular
el ingreso promedio, μ = (100 + 200 + 300 + 400)/4 = US$250

Para simplificar más aún, suponga que calcular


la media poblacional de cuatro estudiantes
requiere mucho esfuerzo.
Entonces, seleccione una muestra de n = 2
observaciones para determinar el μ
“desconocido”
¿Cuántas muestras de tamaño n = 2 podríamos
seleccionar aleatoriamente?
C = 6 posibles muestras.
4 2
La tabla muestra las seis distintas muestras y sus medias
correspondientes.
Tabla:
Muestras posibles de tamaño n = 2 de una población N = 4
Muestra Elementos muestrales, Xi Medias muestrales,

1 100, 200 (100 + 200)/2 = 150
2 100, 300 (100 + 300)/2 = 200
3 100, 400 250
4 200, 300 250
5 200, 400 300
6 300, 400 350

Observe que las muestras 3 y 4 tienen la misma media


muestral de 250
Asumiendo que cada muestra tiene la misma
probabilidad de ser elegida, la probabilidad de
seleccionar la muestra que de una Ẋ igual a la media
poblacional, μ, de 250 es: 2/6 = 0.333  33.3%
Las cuatro muestras restantes resultan con algún error
en el proceso de estimación.
Este error de muestreo es la diferencia entre la media
poblacional μ y la media muestral Ẋ que se utiliza para
estimarlo, entonces:

ERROR DE MUESTREO: Es la diferencia entre el


parámetro poblacional y el estadístico de la muestra
utilizado para estimar el parámetro; μ ─ Ẋ
Ejemplo: Suponga que al azar se selecciona
una muestra de n = 2 y resultan elegidos los
ingresos US$100 y US$300.
La media resultante es Ẋ = US$200; esta
selección produce un error de muestreo de
US$250 ─ US$200 = US$50
Recuerde que el tamaño del error de muestreo
nunca se puede calcular, debido a que la media
poblacional sigue siendo desconocida; sin
embargo, debemos estar conscientes de que es
probable de que ocurra algún error de muestreo.
Distribución muestral: es una lista de todos los valores
posibles para un estadístico y la probabilidad
relacionada con cada valor.
Tabla
Distribución muestral para muestras de tamaño n = 2, de una
población de N = 4
Media Número de muestras Probabilidad de P(Ẋ)
muestral, Ẋ que dan Ẋ
150 1 1/6
200 1 1/6
250 2 2/6
300 1 1/6
350 1 1/6
Σ=6 Σ=1
Asociada a la distribución muestral se puede representar su
histograma

Histograma: Distribución muestral para muestras


de tamaño n = 2 en una población de N 0 4 ingresos
La media de las medias muestrales.
La distribución muestral de las medias es
simplemente una lista de todas las media
muestrales posibles.
Estas medias muestrales al igual que cualquier
lista de números, tienen una media muestral
llamada
“La media de las medias muestrales o
La gran media”.
Esta media de las medias se calcula de la
forma usual,
“Las medias muestrales se suman y el
resultado se divide por el número de muestras.
El símbolo de
la gran media es Ẍ.
La media de las medias muestrales es
Ẍ = (ΣẊ)/K
⸫ K es el número de muestras en la
distribución muestral.
Continuando con nuestro ejemplo:

Ẍ = (150 + 200 + 250 + 250 + 300 + 350)/6 =


Ẍ = 250

Aquí observamos que la media de la distribución


muestral Ẍ, es igual a la media de la población
original μ = 250
Lo anterior no es coincidencia, por lo que la media
de la distribución muestral, la gran media Ẍ, siempre
será igual a la media poblacional μ, Ẍ = μ
Nota: no debe confundir n, el tamaño de la muestra, con K, el número de
muestras en la observación.
La Varianza y el error estándar de las medias
muestrales
La varianza en las medias muestrales es como cualquier
otra varianza; mide la dispersión de las observaciones
individuales (medias muestrales) alrededor de su media
(la gran media). Además esta varianza se calcula como
cualquier otra varianza.
Varianza de la distribución muestral de las medias
muestrales es:
De nuestro ejemplo, dadas las medias muestrales
anteriores,

2 2 2 2 2
(150-250) + (200-250) + 2*(250-250) + (300-250) + (350-250)

4166.667 = 4167 US$2


Al sacar la raíz cuadrada a la varianza en la distribución de estas
medias muestrales, se obtiene el error estándar de la distribución
muestral,σẊ

Error estándar de la distribución


muestral de las medias muestrales,

De nuestro ejemplo:
1/2
(4167) = 64.55 US$

El error estándar de la distribución muestral (o error estándar) es una


medida de la dispersión de las medias muestrales alrededor de μ.
Es un análogo de la desviación estándar, que medía la dispersión de las
observaciones individuales alrededor de su media.
Debido a que la diferencia entre Ẋ y μ es el error de
muestreo, toda medida de la tendencia de la media
muestral a desviarse de μ se le denomina acertadamente
error estándar. Por tanto, el error estándar σẊ mide la
tendencia a sufrir del error de muestreo en el esfuerzo
por estimar μ
Ejemplo: Las ventas en miles de dólares para la Fábrica de la Costa del Este
durante los últimos5 meses fueron 68, 73, 65, 80 y 72. Asumiendo que estos cinco
meses constituyen la población, la media claramente es μ = 71.6. Como director de
mercadeo de la empresa, desea estimar la μ “desconocida” tomando una muestra de
tamaño n = 3. Se espera que el error de muestreo que es probable que ocurra sea
relativamente pequeño. Realice la distribución muestral y haga comentarios sobre
el posible error de muestreo.
Solución: Total de muestras =5C3 = 10 muestras en la distribución muestral
Tabla: Muestras tamaño n = 3, elementos de la muestra y medias muestral
Número de Elementos de la Media muestral, Número de Elementos de la Media muestral,
la muestra muestra Ẋ la muestra muestra Ẋ

1 68, 73, 65 68.67 6 68, 80, 72 73.33

2 68, 73, 80 73.67 7 73, 65, 80 72.67

3 68,73, 72 71.00 8 73, 65, 72 75.00

4 68, 65, 80 71.00 9 73, 80, 72 70.00

5 68, 65, 72 68.33 10 85, 80, 72 72.33


Tabla: Distribución muestral

Media muestral, Ẋ Probabilidad, P(Ẋ) Media muestral, Ẋ Probabilidad, P(Ẋ)


68.67 1/10 73.33 1/10
73.67 1/10 72.67 1/10
71.00 2/10 75.00 1/10
71.00 1/10 70.00 1/10
68.33 1/10 72.33 1/10

La gran media o la media de la distribución muestral: Ẍ = ΣẊ/K


68.67+73.67+2*71+68.33+73.33+72.67+70.00+75.00+72.33
10

Ẍ = 71.6 = μ
La varianza de la distribución muestral es:

= (68.67-71.6)2 + (73.67-71.6)2 + 2*(71-71.6)2 + (68.33-71.6)2 . 10


.
+ (73.33-71.6)2 + (70-71.6)2 + (75-71.6)2 + (72.33-71.6)2
3 2
4.31*10 US$
El error estándar de la distribución muestral es:

4.31 = 2.08*103 US$

El error estándar muestra el grado de dispersión de las 10 medias


muestrales alrededor de la μ, indica en cuanto puede variar la
media muestral de la media poblacional.
La fórmula de la varianza

Requiere aritmética simple y tediosa para su cálculo, por lo que una


aproximación cercana se puede obtener mediante:

Obviamente esto supone que la varianza poblacional σ 2 es conocida.

La fórmula anterior es apropiada sólo si el muestreo se realiza con


reemplazo, o si la muestra se toma de una población muy grande
(virtualmente infinita). Si el muestreo se realiza sin reemplazo y se el
tamaño de la muestra es más del 5% de la población, n > 0.05N, debe
aplicarse el factor de corrección para poblaciones finitas (fcp).
La fórmula apropiada para el error estándar utilizando el fpc es:

Donde es el factor de corrección para muestras finitas, fpc.

Si n es pequeño respecto a N, menos del 5%, el fcp se aproxima a 1 y


por tanto es innecesario.

De una población N = 1000, ¿se obtendría un estimado más preciso


de la media poblacional con una muestra de tamaño n = 100 o con
De una población N = 1000, ¿se obtendría un estimado más preciso
de la media poblacional con una muestra de tamaño n = 100 o con
una muestra más grande de n = 900?

A medida que n aumenta, el disminuye, por lo que


indiscutiblemente es probable un estimado más exacto con
una muestra más grande.
Teorema del límite central, TLC.

Ya establecimos que es posible tomar muchas muestras de un


tamaño dado de cualquier población.

Si la población original está distribuida normalmente, la distribución


de las medias muestrales también estará distribuida normalmente; es
decir que todas las medias muestrales se graficarán como una
distribución normal.
Teorema del límite central, TLC.
La gráfica muestra que la distribución de las observaciones
individuales Xi en la población está normalmente distribuida y
centrada en una media μ = 500 y σ = 50.
Observe que las observaciones individuales Xi están medidas en el
eje horizontal.
La gráfica muestra que la distribución de las medias muestrales que
resultarán si se toman todas las muestras de tamaño n = 25.
Las medias muestrales también están distribuidas normalmente están
centradas en la media poblacional debido a que Ẍ = μ = 500. La
dispersión de las medias muestrales es menor que la dispersión de la
población original; ¿esto es por ?
Las medias muestrales Ẋ se miden en el eje horizontal.
Si mostramos ambas gráficas observamos que la dispersión de la
población original σ = 50 es mayor que la dispersión de las
medias muestrales:
1/2 1/2
σẊ = σ/(n ) = 50/(25) = 10.
1/2
Las Xi están más dispersas que las Ẋ debido a que σẊ = σ/(n )
Teorema del Límite Central:
A medida que n se vuelve más grande, la
distribución de las medias muestrales se
aproximará a una distribución normal con una
media Ẍ = μ y un error estándar de
σẊ = σ/(n ).
1/2
En esta gráfica la población no está distribuida normalmente

La distribución de las En esta gráfica la distribución de las medias muestrales está


medias muestrales (n = 50) normalmente distribuida y centrada en Ẍ = μ = 1000.
La dispersión de las medias muestrales la mide el error
estándar.

La distribución de las
medias muestrales (n = 100) Esta gráfica muestra lo que sucede a la distribución
de las medias muestrales si el tamaño de n aumenta.
Si n = 100 el error estándar es = 10 y por tanto las
medias muestrales están compactadas más
estrechamente alrededor de la μ = 1000.

El error estándar que se obtiene en el esfuerzo por


estimar μ es menor; por esto es probable que las
muestras más grandes produzcan estimados más
precisos de la media poblacional.
Uso de la distribución muestral.
Un ingeniero de producción tomará una muestra de un producto para
determinar si cumple con ciertas especificaciones de producción.
Un asistente tributario tomará una muestra de los residentes para
decidir si cierto plan tributario o programa de bienestar social
producirá los resultados deseados.
Los docentes toman muestras de estudiantes para evaluar el impacto
de los esfuerzos de instrucción.
Los ejemplos anteriores nos recuerdan que muchas decisiones se toman
con base en los resultados muestrales.

Generalmente las muestras tienen un impacto directo y consecuencial en


las decisiones que se tomen.
Una aplicación muy común y de gran utilidad en una distribución
muestral es la de determinar la probabilidad de que una media muestral
clasifique dentro de un rango dado.
Como la distribución muestral estará distribuida normalmente debido
a:
La muestra se toma de una población normal, o
n > = 30 y el TLC garantiza la normalidad en el proceso de muestreo,
entonces,
La desviación normal puede utilizarse para ganar información
esencial para el proceso de toma de decisiones.
Si la Cía. TelCom ha determinado que las llamadas telefónicas de sus
clientes promediaron 150 segundos, con una desviación estándar de 15
segundos; desea determinar la probabilidad de que una sola llamada
durará entre 125 y 150 segundos. Entonces, empleando

en la cual X es una observación única y σ es la desviación estándar


poblacional.
Muchas decisiones en los negocios dependen de una muestra
completa, no solo de una observación. Como se está interesado, no
solo en una observación X sino en la medida de varias observaciones
X, por tanto cuando se hace el muestreo, la fórmula de conversión o
tipificación se modifica así:

Donde: Ẋ = la media de las observaciones


σẊ = error estándar de la distribución muestral

Con la ecuación anterior en lugar de determinar la


probabilidad de la duración de una sola llamada, se
puede calcular la probabilidad de que la media de n
llamadas dure un cierto período de tiempo.
Ejemplo:
Si TelCom desea determinar la probabilidad de que una sola llamada dure
entre 150 y 155 segundos, con una media de 150 segundos y desviación
estándar de 15 segundos:
155 ─ 150 => 0.33
15

Entonces P(150 ≤ X ≤ 155) = 0.1293

Ahora, si TelCom ahora desea determinar la probabilidad de


que la media de n = 50 llamadas esté entre 150 y 155
segundos:
= = = 2.36

Por tanto P(150 ≤ Ẋ ≤ 155) = 0.4909


Observe la diferencia significativa en las probabilidades.
En la gráfica se observa que la gran diferencia de las probabilidades se
debe al hecho de que las medias muestrales están menos dispersas que
las observaciones individuales y a que las Ẋ están más compactas
alrededor de μ = 150

P(150 ≤ Ẋ ≤ 155)
Si se pudiera predecir la probabilidad de que un
cierto estadístico esté dentro de un rango dado, la
toma de decisiones se vuelve más precisa y
científica.
Ejemplo. Determine la probabilidad de error considerando una población con
una media μ = 150 y una desviación estándar σ = 8.5. Si la muestra es n =
50 y se presenta un error de muestreo de 2 o más si la media muestral es 27 o
más, o 23 o menos.
Solución: P(error) = P(Ẋ ≥ 27) + P(Ẋ ≤ 23)
=

P(error) = P(Ẋ ≥ 27) + P(Ẋ ≤ 23) = 2*0.0485 = 0.097 = 9.7%


Ejemplo. La Casa del Papel vende productos de papelería para ocasiones festivas.
Se asume que las horas semanales promedio que trabajan los empleados en la tienda
es de μ = 36.7, con una desviación estándar σ = 3.5. La propietaria de La Casa del
Papel, desea por lo menos un 90% de confiabilidad en que su estimado de las horas
promedio trabajadas por empleado cada semana esté dentro de 1 hora de la media
poblacional real. Se selecciona una muestra es n = 36 semanas. ¿Cuál es la
probabilidad de que la propietaria no esté desilusionada con el estimado?
Solución: P(error ≤ 1) = P(35.7 ≤ Ẋ ≤ 37.7)

P(error ≤ 1) = P(35.7 ≤ Ẋ ≤ 37.7) = 2*0.4564 = 0.9128 = 91.28%


Interpretación: existe 91.28% de probabilidad de que el estimado de
la propietaria este dentro de un error tolerable de 1 h.
La distribución de las proporciones muestrales
Muchos asuntos de negocios tratan la proporción de la población .
Una firma de mercadeo quiere averiguar si un cliente (1) compra o (2) no
compra el producto.
Un banco con frecuencia debe determinar si un cuentahabiente (1) pedirá o
(2) no pedirá un préstamo para adquirir un automóvil.
En estos casos se utiliza la proporción muestral p para estimar el
parámetro desconocido .

De cualquier población es posible obtener muchas muestras diferentes de un


tamaño dado. Cada muestra tendrá su propia proporción de “éxitos”, p.
Sin embargo, al igual que la medias, el valor esperado de la
distribución muestral de las proporciones muestrales será igual a la
proporción de éxitos en al población: E(p) = .
El valor esperado de la E(p) = Σp = 
distribución muestral es:
K
donde  es la proporción de éxitos de la población.
1/2
El error estándar es: σp = ()(1 – )

De igual manera que con las medias, si n > 0.05N, se requiere


el fpc y el error estándar se vuelve:

Las herramientas desarrolladas para las proporciones muestrales


permiten determinar las probabilidades que pueden ser muy útiles en
la toma de decisiones importantes. Para lograrlo aplicar la
desviación normal a la distribución de proporciones muestrales:

También podría gustarte