Estimación de Parámetros

Licenciatura en Administración de Empresas
Estadística aplicada
Estimación de parámetros
Sesión
1 3
Contenido
Objetivo general................................................................................................................. 2
Subtema 1. Estimaciones por punto y estimaciones por intervalo ...................................... 2
Subtema 2. Error de muestreo y errores que no son de muestreo ..................................... 4
Subtema 3. Propiedades de los estimadores ..................................................................... 7
Subtema 4. Estimación de una media con muestras pequeñas ....................................... 16
Subtema 5. Estimación de una media con muestras grandes .......................................... 18
Subtema 6. Estimación de una proporción....................................................................... 18
Conclusiones ................................................................................................................................... 16
Bibliografía ....................................................................................................................... 22
2
Objetivo general: Calcular estimadores por medio de muestra con el
fin de estimar un parámetro poblacional.
En esta sesión abordaremos los siguientes subtemas:
1. Estimaciones por punto y estimaciones por intervalo;
2. Error de muestreo y errores que no son de muestreo;
3. Propiedades de los estimadores;
4. Estimación de una media con muestras pequeñas;
5. Estimación de una media con muestras grandes;
6. Estimación de una proporción.
Subtema 1. Estimaciones por punto y estimaciones por

intervalo
Analizar una población implica mucho tiempo y recursos por lo que es común
hacer un muestreo, cuando estudiamos una población a través de una muestra y
sólo tomamos un valor o punto se le conoce como una estimación por punto, de
manera formal se define así:
3
Estimador puntual: es un estadístico único para calcular un parámetro
poblacional (Lind, 2012, p. 298).
Ejemplo:
Si se necesita calcular la edad media de quienes compran un modelo de
automóvil, se selecciona una muestra aleatoria de 100 compradores, se obtienen
sus edades y se calcula la edad media de la muestra, a la media de esa muestra se
le llama estimador puntual de la media poblacional.
El estimador puntual se aproxima al parámetro poblacional, pero es
necesario medir cuán próximo está. Para eso se utiliza el intervalo de confianza.
Intervalo de confianza: Conjunto de valores que se forma a partir de una
muestra de datos de forma que exista la posibilidad de que el parámetro poblacional
ocurra dentro de dicho conjunto con una probabilidad específica, por ejemplo, del
95%. La probabilidad específica recibe el nombre de nivel de confianza (Lind, 2012,
p. 299).
4
Ejemplo:
Se estima que el ingreso anual medio de los empleados en el área de la
frontera es de $15,000. Un intervalo de este valor aproximado puede oscilar entre
$11 000 y $19 000. Para describir cuánto es posible confiar en que el parámetro
poblacional se encuentre en el intervalo se debe generar un enunciado
probabilístico. Por ejemplo: se cuenta con 90% de seguridad1 de que el ingreso
anual medio de los empleados en la frontera se encuentra entre $11 000 y $19 000.
El grado de confianza es la probabilidad 1-∝ [uno, que equivale al 100%,
menos alfa] de que el intervalo de confianza contiene el verdadero valor del
parámetro de población,
Los valores del grado de confianza que se usan con frecuencia son el 90%
(con ∝=0.10), 95% (con ∝=0.05), y 99%.(con ∝=0.01).
1
Esto implica que, si el experimento lo repito de tal forma que el número de experimentos tiende a infinito,
en el 90% de los casos el parámetro poblacional se encontrará dentro de dicho intervalo.
5
Subtema 2. Error de muestreo y errores que no son de
muestreo
En un proceso de muestreo, aunque esté bien planeado y aplicado, es
posible que existan errores de los siguientes dos tipos:
Error de muestreo es la diferencia entre el resultado de una muestra y el
verdadero resultado de la población; tal error es consecuencia de las posibles
fluctuaciones de las muestras (Triola, 2004, p.26).
Error no de muestreo ocurre cuando los datos de una muestra se obtienen,
registran o analizan de forma incorrecta (como cuando se selecciona una muestra
sesgada o predispuesta, cuando se usa un instrumento de medición defectuoso o
cuando se cometen errores al copiar los datos) (Triola, 2004, p.26).
Ejemplo: en un hotel de Campeche, la población se refiere al número de
habitaciones ocupadas durante los 30 días de noviembre de 2018. Se determina la
media de la población, se seleccionan tres muestras aleatorias de cinco días. Se
6
calcula la media de cada muestra y se compara con la media poblacional ¿Cuál es
el error de muestreo en cada caso?
Durante el mes se rentaron un total de 96 habitaciones. Por lo tanto, la media
de las unidades que se rentaron por noche es de 3.2. Ésta es la media de la
población. Este valor se designa con la letra griega μ.
μ = ∑𝑁𝑋 = 0+3+2+…+4
30 = 96
30 = 3.2
La primera muestra aleatoria de cinco noches dio como resultado el siguiente
número de habitaciones rentadas: 4, 7, 4, 3 y 1. La media de esta muestra de cinco
noches es de 3.8 habitaciones, que se representa como. 𝑋̅, recuerda que se trata
de una media muestral, y el subíndice 1 indica que se trata de la media de la primera
muestra.
𝑋̅1 = ∑𝑛𝑋 = 4 + 7 + 4 + 3 +1
5
= 19
5
= 3.80
El error de muestreo de la primera muestra es la diferencia entre la media
poblacional (3.2) y la media muestral (3.80). De ahí que el error muestral sea:
7
(𝑋1 − μ = 3.80 − 3.2 = 0.6).
La segunda muestra aleatoria de cinco días de la población arrojó el siguiente
número de habitaciones rentadas: 3, 3, 2, 3 y 6. La media de estos cinco valores es
de 3.4, que se calcula de la siguiente manera:
𝑋2 = 𝐸𝑋
𝑛 =
3 + 3 + 2 + 3 +6
5
= 3.4
El error de muestreo es (𝑋2 − μ = 3.4 − 3.2 = 0.2).
En la tercera muestra aleatoria, la media fue de 1.8, y el error de muestreo
fue de -1.4.
Cada una de estas diferencias, 0.6, 0.2 y -1.4, representa el error de muestreo
al calcular la media de la población. A veces estos errores son:
 Valores positivos, lo cual indica que la media muestral sobreexcedió la media
poblacional.
8
 Valores negativos, lo cual indica que la media muestral resultó menor a la
media poblacional.
En el ejemplo con una población de 30 valores y muestras de 5 valores, existe
una gran cantidad de muestras posibles, 142 506, para ser exactos. Para calcular
este valor se aplica la fórmula de las combinaciones. Cada una de las 142 506
diferentes muestras cuentan con las mismas posibilidades de que se le seleccione.
Cada muestra puede tener una media muestral diferente y, por consiguiente,
un error de muestreo distinto. El valor del error de muestreo se basa en el valor
particular de las 142 506 muestras posibles seleccionadas. Por lo tanto, los errores
de muestreo son aleatorios y se presentan al azar. Si calculara la suma de estos
errores de muestreo en una gran cantidad de muestras, el resultado se aproximaría
mucho a cero. Sucede así porque la media de la muestra constituye un estimador
sin sesgo de la media de la población (Lind, 2012).
Subtema 3. Propiedades de los estimadores
9
Los estadísticos muestrales, como la media muestral 𝑋̅, la desviación
estándar muestral s y la proporción muestral p sirven como estimadores puntuales
de sus correspondientes parámetros poblacionales. Antes de usar un estadístico
muestral como estimador puntual, se revisa si el estimador puntual tiene las
siguientes propiedades de un buen estimador puntual: insesgadez, eficiencia y
consistencia (Anderson, 2008, p.285).
Para explicar se usará la notación general siguiente:
θ = el parámetro poblacional de interés
𝜃̂ = el estadístico muestral o estimador puntual de θ
En general, θ representa cualquier parámetro poblacional como, por ejemplo,
la media poblacional, la desviación estándar poblacional, la proporción poblacional,
etc.; 𝜃̂ representa el correspondiente estadístico muestral, por ejemplo, la media
muestral, la desviación estándar muestral y la proporción muestral.
10
Se puede evaluar que tan bueno es un estadístico como estimador de
acuerdo a las siguientes propiedades:
1. Insesgado (o no sesgado): se refiere al hecho de que una media de la
muestra es un estimador no sesgado de una media de la población porque la media
de la distribución muestral de las medias de las muestras tomadas de la misma
población es igual a la media de la población misma. Podemos decir que un
estadístico es un estimador insesgado si, en promedio, tiende a tomar valores que
están arriba del parámetro de la población que se está estimando con la misma
frecuencia y la misma extensión con la que tiende a asumir valores abajo del
parámetro poblacional que se está estimando (Levin, 2004, p.276).
Si el valor esperado del estadístico muestral es igual al parámetro poblacional
que se estudia, se dice que el estadístico muestral es un estimador insesgado del
parámetro poblacional.
El estadístico muestral 𝜃̂ es un estimado insesgado del parámetro
poblacional θ si
E (𝜃̂) = θ
11
Donde E (𝜃̂ ) = valor esperado del estadístico muestral 𝜃̂
Por tanto, el valor esperado, o media, de todos los posibles valores de un
estadístico muestral insesgado es igual al parámetro poblacional que se estudia.
En la figura 1 se muestran los casos de los estimadores puntuales sesgados
e insesgado. En la gráfica A de la figura 1 en que se muestra el estimador insesgado,
la media de la distribución muestral es igual al valor del parámetro poblacional. En
este caso los errores de estimación se equilibran, ya que algunas veces el valor del
estimador puntual 𝜃̂ puede ser menor que θ y otras veces sea mayor que θ.
En el caso del estimador sesgado, la media de la distribución muestral es
menor o mayor que el valor del parámetro poblacional. En la gráfica B de la figura
1, E(𝜃̂) es mayor que θ; así, la probabilidad de que los estadísticos muestrales
sobreestimen el valor del parámetro poblacional es grande.
12
Figura 1 Amplitud del sesgo del estimador
Fuente: Anderson (2008, p.286).
2. Eficiencia: se refiere al tamaño del error estándar del estadístico. Si
comparamos dos estadísticos de una muestra del mismo tamaño y tratamos de
decidir cuál de ellas es un estimador más eficiente, escogeríamos la estadística que
tuviera el menor error estándar o la menor desviación estándar de la distribución
muestral.
Ejemplo:
13
Suponga que escogemos una muestra de un tamaño determinado y
debemos decidir si utilizamos la media de la muestra o la mediana de la muestra
para estimar la media de la población. Si calculamos el error estándar de la media
de la muestra y encontramos que es 1.03, y luego calculamos el error estándar de
la mediana de la muestra y tenemos que éste es 1.7, diríamos que la media de la
muestra es un estimador más eficiente de la media poblacional ya que su error
estándar es menor. Tiene sentido pensar que un estimador con un error estándar
menor (con menos variación) tendrá mayor oportunidad de producir una estimación
más cercana al parámetro poblacional que se está considerando (Levin, 2004,
p.276).
En la figura 2 se presentan las distribuciones muestrales de dos estimadores
puntuales insesgados, 𝜃̂1 y 𝜃̂2 Observe que el error estándar de 𝜃̂1 es menor que
el error estándar de 𝜃̂2.; por tanto, los valores de 𝜃̂1 tienen más posibilidades de
estar cerca del parámetro θ que los valores de 𝜃̂2. Como el error estándar del
estimado puntual 𝜃̂1 es menor que el error estándar del estimado puntual 𝜃̂2, 𝜃̂1
es relativamente más eficiente que 𝜃̂2 y se prefiere como estimador puntual
(Anderson, 2008, p.287).
14
Figura 2 Distribuciones muestrales de dos estimadores puntuales insesgados
Fuente: Anderson (2008, p.287).
3. Consistencia: un estimador puntual es consistente si el valor del
estimador puntual tiende a estar más cerca del parámetro poblacional a medida que
el tamaño de la muestra aumenta. En otras palabras, una muestra grande tiende a
proporcionar mejor estimación puntual que una pequeña. Observe que en el caso
de la media muestral 𝑥̅ , el error estándar de 𝑥̅ está dado por σ𝑥̅ =σ/√𝑛. Puesto que
σ𝑥̅ está vinculado con el tamaño de la muestra, de manera que muestras mayores
dan valores menores de σ𝑥̅ , entonces muestras de tamaño grande tienden a
proporcionar estimadores puntuales más cercanos a la media poblacional μ.
(Anderson, 2008, p.287).
15
4. Suficiencia: un estimador es suficiente si utiliza tanta información de la
muestra que ningún otro estimador puede extraer información adicional acerca del
parámetro de población que se está estimando (Levin, 2004, p.276).
Subtema 4. Estimación de una media con muestras

pequeñas
Para estimar una media de población 𝜇 cuando el tamaño de la muestra 𝑛 es
pequeño (con un tamaño igual o menor a 30), se debe considerar lo siguiente:
 Para muestras pequeñas, la media de muestras 𝑥̅ .es el mejor estimado
puntual de la media de la población 𝜇.
 Se pueden construir intervalos de confianza usando la distribución normal
siempre que la población original tenga una distribución normal y se conozca
la desviación estándar 𝜎 de la población, que casi nunca se cumple en
situaciones reales.
Si se desea construir un intervalo de confianza y tenemos una muestra
pequeña y además se desconoce la desviación estándar 𝜎 de la población,
16
podemos usar la distribución 𝑡 de Student creada por William Gothe quien publicó
bajo el seudónimo de Student (Triola, 2004).
Como no se conoce el valor de σ, se estima con el valor de la desviación
estándar muestral s, lo cual introduce otra fuente de falta de confiabilidad, que se
compensa haciendo más ancho el intervalo de confianza.
𝑋̅ −𝜇
Distribución t de Student 𝑡= 𝑠
√𝑛
Se utiliza para calcular valores críticos con ayuda de una tabla de esa
distribución2 y con el número de grados de libertad.
Grado de libertad: El número de grados de libertad para un conjunto de
datos muestrales que se recolectaron es el número de valores muestrales que
pueden variar tras haber impuesto ciertas restricciones a todos los valores de los
datos (Triola, 2004, p. 332).
Grados de libertad=n-1
2
Estas tablas se encuentran en Internet o en libros de texto de Estadística.
17
Subtema 5. Estimación de una media con muestras
grandes
El valor de la media de una población se aproxima con un estimador puntual
y un intervalo de confianza, conceptos mencionados anteriormente.
Una muestra aleatoria es considerada grande si 𝑛 ≥ 30
La media muestral 𝑥̅ es el estimador puntual de la media de la población 𝜇,
porque es un estimador consistente y sin sesgo.
Se utiliza la distribución normal como la distribución de las medias
muestrales.
Subtema 6. Estimación de una proporción para una gran

población
Proporción: Fracción, razón o porcentaje que indica la parte de la muestra
de la población que posee un rasgo de interés particular (Lind, 2012, p. 314).
18
Ejemplo: una encuesta indicó que 73 de cada 100 entrevistados consumía carne
de cerdo. La proporción de la muestra es de 73/100, o 0.73, o 73%.
Si p representa la proporción de la muestra,
X el número de éxitos
n el número de elementos de la muestra
Se determina una proporción muestral de la siguiente forma:
𝑋
𝑝=
𝑛
Si se desea estimar una proporción de una población con un solo valor, el
mejor estimado es p. Porque consiste en un solo valor se llama un estimado puntual.
El desarrollo del estimador puntual de la proporción de la población y el
intervalo de confianza de una proporción de población es similar a hacerlo para una
media.
19
Para calcular el intervalo de confianza de una proporción de población se
aplica la siguiente fórmula:
𝑝(1 − 𝑝)
𝑝 ± 𝑧√
𝑛
Ejemplo:
Los trabajadores de una empresa automotriz consideran la propuesta de
cambio de turnos fijos a rolarlos, por lo menos tres cuartas partes de los empleados
deben estar de acuerdo. Una muestra aleatoria de 2,000 empleados revela que
1,600 planean aceptar la propuesta.
Primero se calcula la proporción de la muestra de acuerdo con la fórmula:
𝑋 1600
𝑝= = = .80
𝑛 2000
Por lo que se infiere que el 80% de la población favorece la propuesta de
cambio. Después se debe determinar el intervalo de confianza de 95% con la
fórmula. El valor z3 correspondiente al nivel de confianza de 95% es de 1.96.
3
Consultar tabla Z en Internet o en libros de texto de Estadística.
20
𝑝(1 − 𝑝) . 80(1 − .80)
𝑝 ± 𝑧√ = .80 ± 1.96√ = .80 ± .018
𝑛 2000
Los puntos extremos del intervalo de confianza son 0.782 y 0.818. El punto
extremo más bajo es mayor que 0.75. Así, es probable que se apruebe la
propuesta, pues el estimador del intervalo incluye valores superiores a 75% de los
empleados.
Conclusiones:
Para realizar estudios estadísticos de poblaciones se realizan generalmente
tomando muestras de la población completa, por lo que es necesario conocer
conceptos como el de estimador puntual e intervalos de confianza, también que los
estimadores tienen características que ayudan a saber que tan buenos son y que
en el proceso de muestreo es posible calcular el error.
21
Es importante saber que, dependiendo del tamaño de la muestra, si es
pequeña o grande el método de calcular la media es diferente, utilizando la
distribución normal o la t de Student.
Bibliografía
 Levin, R. & Rubin, D. (2004). Estadística Para Administración y Economía,

séptima edición. México: Pearson Educación.
 Lind, D., Marchal, W. & Wathen, S. (2012). Estadística Aplicada a los
Negocios y la Economía, decimoquinta edición. México: McGraw-Hill
Educación.
 Triola, M. (2004). Estadística Novena Edición. México: Pearson Educación.
 Anderson, D., Sweeney, D. & Williams, T. (2008). Estadística Para
Administración y Economía, décima edición. México: Cengage Learning
Editores.
22

Estimación de Parámetros

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estimación de Parámetros

Cargado por

Copyright:

Formatos disponibles

Licenciatura en Administración de Empresas

En esta sesión abordaremos los siguientes subtemas:

1. Estimaciones por punto y estimaciones por intervalo;

2. Error de muestreo y errores que no son de muestreo;

3. Propiedades de los estimadores;

4. Estimación de una media con muestras pequeñas;

5. Estimación de una media con muestras grandes;

6. Estimación de una proporción.

Subtema 1. Estimaciones por punto y estimaciones por

hacer un muestreo, cuando estudiamos una población a través de una muestra y

manera formal se define así:

poblacional (Lind, 2012, p. 298).

Si se necesita calcular la edad media de quienes compran un modelo de

automóvil, se selecciona una muestra aleatoria de 100 compradores, se obtienen

sus edades y se calcula la edad media de la muestra, a la media de esa muestra se

le llama estimador puntual de la media poblacional.

El estimador puntual se aproxima al parámetro poblacional, pero es

Intervalo de confianza: Conjunto de valores que se forma a partir de una

muestra de datos de forma que exista la posibilidad de que el parámetro poblacional

95%. La probabilidad específica recibe el nombre de nivel de confianza (Lind, 2012,

Se estima que el ingreso anual medio de los empleados en el área de la

frontera es de $15,000. Un intervalo de este valor aproximado puede oscilar entre

poblacional se encuentre en el intervalo se debe generar un enunciado

probabilístico. Por ejemplo: se cuenta con 90% de seguridad1 de que el ingreso

El grado de confianza es la probabilidad 1-∝ [uno, que equivale al 100%,

menos alfa] de que el intervalo de confianza contiene el verdadero valor del

(con ∝=0.10), 95% (con ∝=0.05), y 99%.(con ∝=0.01).

En un proceso de muestreo, aunque esté bien planeado y aplicado, es

posible que existan errores de los siguientes dos tipos:

Error de muestreo es la diferencia entre el resultado de una muestra y el

verdadero resultado de la población; tal error es consecuencia de las posibles

fluctuaciones de las muestras (Triola, 2004, p.26).

Error no de muestreo ocurre cuando los datos de una muestra se obtienen,

registran o analizan de forma incorrecta (como cuando se selecciona una muestra

sesgada o predispuesta, cuando se usa un instrumento de medición defectuoso o

cuando se cometen errores al copiar los datos) (Triola, 2004, p.26).

Ejemplo: en un hotel de Campeche, la población se refiere al número de

habitaciones ocupadas durante los 30 días de noviembre de 2018. Se determina la

media de la población, se seleccionan tres muestras aleatorias de cinco días. Se

el error de muestreo en cada caso?

Durante el mes se rentaron un total de 96 habitaciones. Por lo tanto, la media

de las unidades que se rentaron por noche es de 3.2. Ésta es la media de la

población. Este valor se designa con la letra griega μ.

La primera muestra aleatoria de cinco noches dio como resultado el siguiente

número de habitaciones rentadas: 4, 7, 4, 3 y 1. La media de esta muestra de cinco

de una media muestral, y el subíndice 1 indica que se trata de la media de la primera

El error de muestreo de la primera muestra es la diferencia entre la media

La segunda muestra aleatoria de cinco días de la población arrojó el siguiente

número de habitaciones rentadas: 3, 3, 2, 3 y 6. La media de estos cinco valores es

de 3.4, que se calcula de la siguiente manera:

El error de muestreo es (𝑋2 − μ = 3.4 − 3.2 = 0.2).

En la tercera muestra aleatoria, la media fue de 1.8, y el error de muestreo

al calcular la media de la población. A veces estos errores son:

 Valores positivos, lo cual indica que la media muestral sobreexcedió la media

En el ejemplo con una población de 30 valores y muestras de 5 valores, existe

diferentes muestras cuentan con las mismas posibilidades de que se le seleccione.

un error de muestreo distinto. El valor del error de muestreo se basa en el valor

de muestreo son aleatorios y se presentan al azar. Si calculara la suma de estos

errores de muestreo en una gran cantidad de muestras, el resultado se aproximaría

mucho a cero. Sucede así porque la media de la muestra constituye un estimador

sin sesgo de la media de la población (Lind, 2012).

Subtema 3. Propiedades de los estimadores

estándar muestral s y la proporción muestral p sirven como estimadores puntuales