Está en la página 1de 16

UNIVERSIDAD NACIONAL AUTONOMA DE HONDURAS EN EL

VALLE DE SULA

• Asignatura: Analisis Cuantitativo II

• Catedrático: Lic. Alexi Sevilla

• Alumna: Lesly Karina Herrera H.

• Cuenta: # 20142000633

• Sección: 20.00

• Fecha de elaboración: 01-02-23


Índice

Error estándar……………………………………………………………………………………………………………Pag.01

Distribuciones de muestreo y muestreo de poblaciones normales ……………………………Pag.02

Estimación…………………………………………………………………………………………………………………Pag.07

Estimación de intervalos con la distribución t …….……………………………….……………………Pag.13


Error estándar
La desviación estándar de la distribución de las proporciones de la muestra se abrevia como
error estándar de la proporción. El término error estándar se utiliza porque da a entender un
significado específico.
Supongamos que deseamos saber algo sobre la estatura de los alumnos de nuevo ingreso de
una gran universidad estatal. Podríamos tomar una serie de muestras y calcular la estatura
media de cada muestra. Es altamente improbable que todas estas medias de muestra fueran
iguales; es de esperar alguna variabilidad en las medias observadas. Esta variabilidad en las
estadísticas de muestras proviene de un error de muestreo debido al azar; es decir; hay
diferencias entre cada muestra y la población, y entre las diversas muestras, debido
únicamente a los elementos que decidimos escoger para las muestras.

La tabla 6-7 indica el uso adecuado del término error estándar.

La desviación estándar de la distribución de una estadística de muestra se conoce como error


estándar de la estadística. El error estándar indica no sólo el tamaño del error al azar que se
ha cometido, sino también la probable precisión que puede obtenerse al utilizar una
estadística de muestra para estimar un parámetro de población.

1
Ejercicio de autoevaluación
EA 6-4 El presidente de la Asociación Dental Norteamericana (ADE) desea determinar el número
promedio de veces que cada paciente de cada dentista usa el hilo dental por día. Con ese fin, pide a
100 dentistas seleccionados al azar que encuesten de manera aleatoria a sus pacientes y
comuniquen a la ADN el número medio de veces que usan hilo dental por día. Estos números se
calculan y se envían al presidente de la asociación. ¿Recibe el presidente una muestra de la
población de pacientes o de alguna otra distribución?

R// La información reunida se refiere a las veces que se usa el hilo dental por día para grupos de 50
pacientes, no para pacientes individuales, de modo que es una muestra de una distribución muestral
de las medias de las muestras de tamaño 50, sacadas de la población de pacientes. No es una muestra
tomada de la población de pacientes.

Distribuciones de muestreo a detalle

En la terminología estadística, la distribución de muestreo que obtendríamos al tomar todas las


muestras de un tamaño dado constituye una distribución teórica de muestreo, pero en la práctica, el
tamaño y el carácter de la mayor parte de las poblaciones impiden que los responsables de las
decisiones tomen todas las muestras posibles de una distribución de población. En casi todos los casos,
los responsables de las decisiones sólo toman una muestra de la población, calculan estadísticas para
esa muestra y de éstas infieren algo sobre los parámetros para toda la población.

Muestreo de poblaciones normales


Supongamos ahora que extraemos muestras de una población normalmente distribuida con una
media de 100 y una desviación estándar de 25, y que comenzamos por extraer muestras de cinco
elementos cada una y calculamos sus medias.

2
3
El teorema del límite central asegura que la distribución de muestreo de la media se aproxima a la
normal al incrementarse el tamaño de la muestra. La importancia del teorema del límite central es
que nos permite usar estadísticas de muestra para hacer inferencias con respecto a los parámetros
de población, sin saber sobre la forma de la distribución de frecuencia de esa población más que lo
que podamos obtener de la muestra.

Ejemplo:

La distribución de los ingresos anuales de todos los cajeros de un banco con cinco años de experiencia
está sesgada de manera negativa, como la gráfica (a) de la figura 6-8 lo muestra. Esta distribución
tiene una media de $19,000 y una desviación estándar de $2,000. Si extraemos una muestra aleatoria
de 30 cajeros, ¿cuál es la probabilidad de que sus ganancias promedien más de $19,750 anualmente?

Estamos frente a una distribución de muestreo, ahora debemos


utilizar la ecuación 6-2 y la distribución de probabilidad normal
estándar.

Esto nos da un área de 0.4798 para un valor de z de 2.05. Mostramos esta área en la
figura 6-8 como el área entre la media y $19,750. Puesto que la mitad, o 0.5000, del área
bajo la curva cae entre la media y la cola de la derecha, el área sombreada debe ser:

Por tanto, hemos determinado que hay ligeramente más del 2% de probabilidad de que los ingresos
promedio sean mayores que $19,750 anualmente en un grupo de 30 cajeros.

4
Una consideración operacional en el muestreo: la relación entre el tamaño de muestra y el
error estándar
Si la dispersión disminuye, entonces los valores tomados por la media de la muestra tienden a
agruparse más cercanamente alrededor de μ. Por el contrario, si la dispersión se incrementa (si
x , se hace más grande), los valores tomados por la media de la muestra tienden a agruparse menos
cercanamente alrededor de μ.

Podemos concebir esta relación así: al disminuir el error estándar, el valor de cualquier media de
muestra probablemente se acercará al valor de la media de población.

. Los especialistas en estadística describen este fenómeno de otra manera: al disminuir el error
estándar, se incrementa la precisión con la que se puede usar la media de muestra para estimar la
media de población. Si nos remitimos a la ecuación 6-1, podemos ver que, al aumentar n, σx,
disminuye. Esto sucede porque en la ecuación 6-1 un denominador grande (en la parte derecha)
produciría una σx, menor (en la parte izquierda). Dos ejemplos mostrarán esta relación; ambos
suponen la misma desviación estándar de población de 100.

Al aumentar nuestro tamaño de muestra de 10 a 100 (un incremento de 10 veces), el error estándar
disminuyó de 31.63 a 10, lo que es sólo aproximadamente un tercio de su valor inicial. Nuestros
ejemplos muestran que, debido al hecho de que σx, varía inversamente con la raíz cuadrada de n, hay
una utilidad decreciente en el muestreo.

Muchas de las poblaciones que examinan los responsables de las decisiones son finitas, es decir, de
tamaño establecido o limitado. Ejemplos de éstas incluyen a los empleados de una compañía dada, a
los clientes de una agencia de servicios sociales de una ciudad, a los estudiantes de una clase específica
y a la producción de un día en una determinada planta de manufactura. Ninguna de estas poblaciones
es infinita, así que necesitamos modificar la ecuación 6-1 para trabajar con ellas.

La fórmula diseñada para encontrar el error


estándar de la media cuando la población es 1
finita y el muestreo se hace sin reemplazo, es: 1

5
En la que:

N es tamaño de la población

n es tamaño de la muestra

Este nuevo término que aparece del lado derecho de la ecuación y que multiplica a nuestro error
estándar original se conoce como multiplicador de población finita:

2
1

Unos cuantos ejemplos nos ayudarán a familiarizarnos con la interpretación y el uso de la ecuación
1. Supongamos que estamos interesados en una población de 20 compañías textiles del mismo
tamaño, todas estas fábricas experimentan una producción excesiva de trabajo. Nuestro estudio
indica que la desviación estándar de la distribución de la producción anual es igual a 75 empleados.
Si muestreamos cinco de estas compañías textiles, sin reemplazo, y deseamos calcular el error
estándar de la media, usaríamos la ecuación 1 de la siguiente manera:

1
1

En este ejemplo, un multiplicador de población finita de 0.888 redujo el error estándar de 33.54 a
29.8. En casos en los que la población es muy grande en relación con el tamaño de la muestra, este
multiplicador de población finita adquiere un valor cercano a 1 y tiene poco efecto sobre el cálculo
del error estándar. Digamos que tenemos una población de 1,000 elementos y que hemos tomado
una muestra de 20. Si utilizamos la ecuación 2 para calcular el multiplicador de población finita, el
resultado sería:

2
1

El uso de este multiplicador de 0.99 tendría poco efecto en el cálculo del error estándar de la media.

Este último ejemplo pone de manifiesto que cuando muestreamos una pequeña fracción de la
población entera (es decir, cuando el tamaño de la población N es muy grande en relación con el
tamaño de la muestra n), el multiplicador de población finita toma un valor cercano a 1.0. Los
especialistas en estadística se refieren a la fracción n/N como la fracción de muestreo, porque es la
fracción de la población N contenida en la muestra.

6
Estimación
Los administradores utilizan estimaciones porque, hasta en los asuntos más triviales, deben tomar
decisiones racionales sin contar con la información pertinente completa y con una cuota de
incertidumbre de lo que el futuro pueda deparar. La inferencia estadística está basada en la estimación
y en las pruebas de hipótesis.

Tipos de estimaciones
Podemos hacer dos tipos de estimaciones concernientes a una población: una estimación puntual y
una estimación de intervalo. Una estimación puntual es un solo número que se utiliza para estimar un
parámetro de población desconocido, mientras que una estimación de intervalo es un conjunto de
valores que se utiliza para estimar un parámetro de la población.

Estimador y estimaciones
Cualquier estadístico de la muestra que se utilice para estimar un parámetro poblacional se conoce
como estimador, es decir, un estimador es un estadístico de la muestra utilizado para estimar un
parámetro poblacional. En otras palabras, una estimación es un valor específico observado de un
estadístico. Hacemos una estimación si tomamos una muestra y calculamos el valor que toma nuestro
estimador en esa muestra.

Ejemplo:

Suponga que calculamos la lectura media de un odómetro (kilometraje) a partir de una muestra de
taxis en servicio y encontramos que es 156,000 kilómetros. Si utilizamos este valor específico para
estimar el kilometraje de la flotilla de taxis completa, el valor obtenido de 156,000 kilómetros sería
una estimación.

Ilustración de los parámetros de interés en una población, las estadísticas de la muestra que se usan
para estimar los resultados de la estimación (cálculo) de cada uno.

7
Criterios para seleccionar un buen estimador
Algunos estadísticos son mejores estimadores que otros. Afortunadamente, podemos evaluar la
calidad de un estadístico como estimador mediante el uso de cuatro criterios:

• Insesgado
• Eficiencia
• Consistencia
• Suficiencia

Estimaciones puntuales
La media de la muestra x es el mejor estimador de la media de la población μ. Es insesgada,
consistente, el estimador más eficiente y, siempre y cuando la muestra sea suficientemente grande,
su distribución muestral puede ser aproximada por medio de la distribución normal.

Ejemplo

La tabla 7-2 ilustra los resultados. Utilizando los conceptos del capítulo 3, podemos obtener la media
de la muestra, x , sumando todos los resultados, x, y dividiendo esta suma entre n, el número de cajas
muestreadas:

Utilizando esta ecuación para resolver el problema, tenemos:

Así, al usar la media de la muestra, x como estimador, la estimación puntual de la media de la


población, μ, es 102 jeringas por caja. El precio de fabricación de cada jeringa hipodérmica desechable
es bastante bajo (alrededor de 25 centavos), de modo que tanto el comprador como el vendedor
aceptarían esta estimación puntual como base para la facturación, y el fabricante puede ahorrarse el
tiempo y el gasto de contar las jeringas contenidas en las cajas.

8
Estimaciones de intervalo: conceptos básicos

El propósito de tomar muestras es conocer más acerca de una población. Podemos calcular esta
información a partir de las muestras como estimaciones puntuales, que acabamos de analizar, o como
estimaciones de intervalo. Una estimación de intervalo describe un conjunto o rango de valores
dentro del cual es posible que esté un parámetro de la población.

Estimaciones de intervalo e intervalos de confianza


Al utilizar estimaciones de intervalo no nos estamos limitando a +- 1, 2 y 3 errores estándar. De
acuerdo con la tabla 1 del apéndice, +-1.64 errores estándar, por ejemplo, incluyen aproximadamente
90% del área bajo la curva y, así, 0.4495 del área a ambos lados de la media en una distribución normal.
De manera parecida, +-2.58 errores estándar incluyen alrededor de 99% del área o 49.51% a cada lado
de la media. En estadística, la probabilidad que asociamos con una estimación de intervalo se conoce
como nivel de confianza.

El intervalo de confianza es el rango de la estimación que estamos haciendo.

Ejemplo:
Si informamos que tenemos el 90% de confianza de que la media de la población de ingresos de las
personas que viven en una cierta comunidad está entre $8,000 y $24,000, entonces el rango $8,000-
$24,000 es nuestro intervalo de confianza. A menudo, sin embargo, expresaremos el intervalo de
confianza en términos de errores estándar, más que con valores numéricos. Así, expresaremos los
intervalos de confianza de esta forma: donde

Cálculo de estimaciones de intervalo de la media a partir de muestras grandes


Un mayorista de refacciones automotrices necesita una estimación de la vida media en meses que
puede esperar de los limpiadores de parabrisas en condiciones normales de manejo. La administración
de la empresa ya ha determinado que la desviación estándar de la vida útil de la población es 6 meses.
Suponga que seleccionamos una sola muestra aleatoria de 100 limpiadores, tomamos los datos
referentes a su vida útil y obtenemos los siguientes resultados:

9
Como el distribuidor utiliza decenas de miles de limpiadores al año, nos pide que encontremos una
estimación de intervalo con un nivel de confianza del 95%. El tamaño de la muestra es mayor que 30,
de modo que el teorema central del límite nos permite usar la distribución normal como distribución
de muestreo, aun cuando nuestra población no tenga distribución normal. Calculamos el error
estándar de la media con la ecuación 6-1:

A continuación, consideraremos el nivel de confianza con el cual estamos trabajando. Como un nivel
del 95% de confianza incluirá 47.5% del área que se encuentra a ambos lados de la media de la
distribución de muestreo, podemos buscar en el cuerpo de la tabla 1 del apéndice el valor
correspondiente a 0.475. Descubrimos que 0.475 del área bajo la curva normal está contenida entre
la media y un punto situado a 1.96 errores estándar a la derecha de la media. Por consiguiente,
sabemos que (2)(0.475) = 0.95 del área está localizada entre +1.96 errores estándar de la media y que
nuestros límites de confianza son:

Luego sustituimos valores numéricos en estas dos expresiones:

Ahora podemos informar que estimamos la vida media de la población de limpiadores de parabrisas
entre 19.82 y 22.18 meses con 95% de confianza.

10
Cálculo de estimaciones de intervalo de la proporción a partir de muestras
grandes

Estas son las dos fórmulas para derivar la media y la desviación estándar de la distribución binomial:

Teóricamente, la distribución binomial es la distribución correcta a utilizar en la construcción de


intervalos de confianza para estimar una proporción de población. Debido a que el cálculo de
probabilidades binomiales puede ser largo, el uso de la distribución binomial para elaborar
estimaciones de intervalo de la proporción de una población es una proposición complicada.
Afortunadamente, conforme aumenta el tamaño de la muestra, la distribución binomial puede
aproximarse por una distribución normal apropiada, que podemos utilizar para aproximar la
distribución muestral.

Se recomienda que, en la estimación, n sea lo suficientemente grande para que tanto np como nq
sean al menos 5 cuando se utiliza la distribución normal como sustituto de la binomial.

Denotemos la proporción de éxitos en una muestra con pˆ (se lee p gorro). Luego modifiquemos la
ecuación 5-2 de manera que podamos utilizarla para derivar la media de la distribución de muestreo
de la proporción de éxitos. En palabras, np muestra que la media de la distribución binomial es igual
al producto del número de ensayos, n, por la probabilidad de obtener un éxito, p; esto es, np es igual
al número medio de éxitos. Para cambiar este número de éxitos a la proporción de éxitos, dividimos
np entre n y obtenemos sólo el valor de p. La media, que se encuentra al lado izquierdo de la ecuación
se convierte en pˆ, es decir, en la media de la distribución de muestreo de la p.

11
y se conoce como el error estándar de la proporción. Podemos ilustrar cómo utilizar estas fórmulas si,
para una organización muy grande, hacemos la estimación de qué proporción de sus empleados
prefieren planificar sus propios beneficios de retiro en lugar de seguir un plan patrocinado por la
compañía. Primero, tomamos una pequeña muestra aleatoria de 75 empleados y encontramos que el
0.4 de ellos están interesados en seguir sus propios planes de retiro. Nuestros resultados son:

A continuación, la administración solicita que utilicemos esta muestra para encontrar un intervalo en
el que puedan tener 99% de confianza de que contiene a la proporción verdadera de la población.
Pero, para la población, ¿qué son pˆ y qˆ? Podemos estimar los parámetros de la población mediante
la sustitución de los estadísticos correspondientes de la muestra, pˆ y qˆ (p gorro y q gorro) en la
fórmula del error estándar de la proporción. * Al hacer esto obtenemos:

12
Estimaciones de intervalos con la distribución t

¿Cómo podríamos tratar estimaciones en las que la distribución normal no es la distribución de


muestreo adecuada, es decir, cuando se estima la desviación estándar de la población y el tamaño de
muestra es 30 o menos?

Afortunadamente, existe otra distribución que sí es apropiada para estos casos. Se conoce como
distribución t. Debido a que se usa cuando el tamaño de la muestra es 30 o menos, los especialistas
en estadística, suelen asociar la distribución t con estadísticas de muestras pequeñas.

El uso de la distribución t para hacer estimaciones se requiere siempre que el tamaño de la muestra
sea menor o igual que 30 y la desviación estándar de la población no se conozca. Además, al utilizar la
distribución t, suponemos que la distribución poblacional es normal o aproximada mente normal.

Se afirmó que existe una distribución t diferente para cada tamaño de muestra. En un lenguaje
estadístico apropiado, diríamos: “existe una distribución t distinta para cada uno de los grados de
libertad posibles”. ¿Qué son los grados de libertad? Podemos definirlos como el número de valores
que podemos escoger libremente.

Suponga que incluye dos elementos, a y b en una muestra y sabemos que tiene una media de 18. En
símbolos, la situación es:

¿Cómo podemos encontrar los valores que a y b pueden tomar en esta situación? La respuesta es que
a y b pueden ser cualesquiera dos valores cuya suma sea 36, ya que 36
2 18. Suponga que sabemos que el valor de a es 10. Ahora b ya no es libre de tomar cualquier valor,
sino que debe ser 26, ya que:

13
Este ejemplo nos muestra que cuando hay dos elementos en una muestra y conocemos la media
muestral de esos dos elementos, entonces somos libres de especificar sólo uno de los elementos,
porque el otro estará determinado por el hecho de que los dos elementos suman el doble de la media
de la muestra. En un lenguaje estadístico decimos que “tenemos un grado de libertad”. Veamos otro
ejemplo. Existen siete elementos en nuestra muestra y sabemos que la media de estos elementos es
16. En símbolos tenemos la siguiente situación:

En este caso, los grados de libertad o el número de variables que podemos especificar libremente es
7 - 1 =6. Tenemos la libertad de asignar valores a seis variables, y luego ya no tenemos libertad de
especificar el valor de la séptima variable; ésta queda determinada automáticamente. Con dos valores
de muestra tenemos un grado de libertad (2 -1 = 1), y con siete valores de muestra tenemos seis
grados de libertad (7 - 1 = 6). Entonces, en cada uno de estos dos ejemplos tenemos n - 1 grados de
libertad, si n es el tamaño de la muestra. Similarmente, una muestra de 23 elementos nos daría 22
grados de libertad. Utilizaremos los grados de libertad cuando elijamos una distribución t para estimar
una media de población, y utilizaremos n- 1 grados de libertad, cuando n es igual al tamaño de la
muestra. Por ejemplo, si utilizamos una muestra de 20 para estimar una media de población, usaremos
19 grados de libertad para elegir la distribución t apropiada.

14

También podría gustarte