Está en la página 1de 22

Licenciatura en Administración de Empresas

Estadística aplicada

Estimación de parámetros

Sesión
1 3
Contenido

Objetivo general................................................................................................................. 2
Subtema 1. Estimaciones por punto y estimaciones por intervalo ...................................... 2
Subtema 2. Error de muestreo y errores que no son de muestreo ..................................... 4
Subtema 3. Propiedades de los estimadores ..................................................................... 7
Subtema 4. Estimación de una media con muestras pequeñas ....................................... 16
Subtema 5. Estimación de una media con muestras grandes .......................................... 18
Subtema 6. Estimación de una proporción....................................................................... 18
Conclusiones ................................................................................................................................... 16
Bibliografía ....................................................................................................................... 22

2
Objetivo general: Calcular estimadores por medio de muestra con el
fin de estimar un parámetro poblacional.

En esta sesión abordaremos los siguientes subtemas:

1. Estimaciones por punto y estimaciones por intervalo;

2. Error de muestreo y errores que no son de muestreo;

3. Propiedades de los estimadores;

4. Estimación de una media con muestras pequeñas;

5. Estimación de una media con muestras grandes;

6. Estimación de una proporción.

Subtema 1. Estimaciones por punto y estimaciones por


intervalo

Analizar una población implica mucho tiempo y recursos por lo que es común

hacer un muestreo, cuando estudiamos una población a través de una muestra y

sólo tomamos un valor o punto se le conoce como una estimación por punto, de

manera formal se define así:

3
Estimador puntual: es un estadístico único para calcular un parámetro

poblacional (Lind, 2012, p. 298).

Ejemplo:

Si se necesita calcular la edad media de quienes compran un modelo de

automóvil, se selecciona una muestra aleatoria de 100 compradores, se obtienen

sus edades y se calcula la edad media de la muestra, a la media de esa muestra se

le llama estimador puntual de la media poblacional.

El estimador puntual se aproxima al parámetro poblacional, pero es

necesario medir cuán próximo está. Para eso se utiliza el intervalo de confianza.

Intervalo de confianza: Conjunto de valores que se forma a partir de una

muestra de datos de forma que exista la posibilidad de que el parámetro poblacional

ocurra dentro de dicho conjunto con una probabilidad específica, por ejemplo, del

95%. La probabilidad específica recibe el nombre de nivel de confianza (Lind, 2012,

p. 299).

4
Ejemplo:

Se estima que el ingreso anual medio de los empleados en el área de la

frontera es de $15,000. Un intervalo de este valor aproximado puede oscilar entre

$11 000 y $19 000. Para describir cuánto es posible confiar en que el parámetro

poblacional se encuentre en el intervalo se debe generar un enunciado

probabilístico. Por ejemplo: se cuenta con 90% de seguridad1 de que el ingreso

anual medio de los empleados en la frontera se encuentra entre $11 000 y $19 000.

El grado de confianza es la probabilidad 1-∝ [uno, que equivale al 100%,

menos alfa] de que el intervalo de confianza contiene el verdadero valor del

parámetro de población,

Los valores del grado de confianza que se usan con frecuencia son el 90%

(con ∝=0.10), 95% (con ∝=0.05), y 99%.(con ∝=0.01).

1
Esto implica que, si el experimento lo repito de tal forma que el número de experimentos tiende a infinito,
en el 90% de los casos el parámetro poblacional se encontrará dentro de dicho intervalo.

5
Subtema 2. Error de muestreo y errores que no son de
muestreo

En un proceso de muestreo, aunque esté bien planeado y aplicado, es

posible que existan errores de los siguientes dos tipos:

Error de muestreo es la diferencia entre el resultado de una muestra y el

verdadero resultado de la población; tal error es consecuencia de las posibles

fluctuaciones de las muestras (Triola, 2004, p.26).

Error no de muestreo ocurre cuando los datos de una muestra se obtienen,

registran o analizan de forma incorrecta (como cuando se selecciona una muestra

sesgada o predispuesta, cuando se usa un instrumento de medición defectuoso o

cuando se cometen errores al copiar los datos) (Triola, 2004, p.26).

Ejemplo: en un hotel de Campeche, la población se refiere al número de

habitaciones ocupadas durante los 30 días de noviembre de 2018. Se determina la

media de la población, se seleccionan tres muestras aleatorias de cinco días. Se

6
calcula la media de cada muestra y se compara con la media poblacional ¿Cuál es

el error de muestreo en cada caso?

Durante el mes se rentaron un total de 96 habitaciones. Por lo tanto, la media

de las unidades que se rentaron por noche es de 3.2. Ésta es la media de la

población. Este valor se designa con la letra griega μ.

μ = ∑𝑁𝑋 = 0+3+2+…+4
30 = 96
30 = 3.2

La primera muestra aleatoria de cinco noches dio como resultado el siguiente

número de habitaciones rentadas: 4, 7, 4, 3 y 1. La media de esta muestra de cinco

noches es de 3.8 habitaciones, que se representa como. 𝑋̅, recuerda que se trata

de una media muestral, y el subíndice 1 indica que se trata de la media de la primera

muestra.

𝑋̅1 = ∑𝑛𝑋 = 4 + 7 + 4 + 3 +1
5
= 19
5
= 3.80

El error de muestreo de la primera muestra es la diferencia entre la media

poblacional (3.2) y la media muestral (3.80). De ahí que el error muestral sea:

7
(𝑋1 − μ = 3.80 − 3.2 = 0.6).

La segunda muestra aleatoria de cinco días de la población arrojó el siguiente

número de habitaciones rentadas: 3, 3, 2, 3 y 6. La media de estos cinco valores es

de 3.4, que se calcula de la siguiente manera:

𝑋2 = 𝐸𝑋
𝑛 =
3 + 3 + 2 + 3 +6
5
= 3.4

El error de muestreo es (𝑋2 − μ = 3.4 − 3.2 = 0.2).

En la tercera muestra aleatoria, la media fue de 1.8, y el error de muestreo

fue de -1.4.

Cada una de estas diferencias, 0.6, 0.2 y -1.4, representa el error de muestreo

al calcular la media de la población. A veces estos errores son:

 Valores positivos, lo cual indica que la media muestral sobreexcedió la media

poblacional.

8
 Valores negativos, lo cual indica que la media muestral resultó menor a la

media poblacional.

En el ejemplo con una población de 30 valores y muestras de 5 valores, existe

una gran cantidad de muestras posibles, 142 506, para ser exactos. Para calcular

este valor se aplica la fórmula de las combinaciones. Cada una de las 142 506

diferentes muestras cuentan con las mismas posibilidades de que se le seleccione.

Cada muestra puede tener una media muestral diferente y, por consiguiente,

un error de muestreo distinto. El valor del error de muestreo se basa en el valor

particular de las 142 506 muestras posibles seleccionadas. Por lo tanto, los errores

de muestreo son aleatorios y se presentan al azar. Si calculara la suma de estos

errores de muestreo en una gran cantidad de muestras, el resultado se aproximaría

mucho a cero. Sucede así porque la media de la muestra constituye un estimador

sin sesgo de la media de la población (Lind, 2012).

Subtema 3. Propiedades de los estimadores

9
Los estadísticos muestrales, como la media muestral 𝑋̅, la desviación

estándar muestral s y la proporción muestral p sirven como estimadores puntuales

de sus correspondientes parámetros poblacionales. Antes de usar un estadístico

muestral como estimador puntual, se revisa si el estimador puntual tiene las

siguientes propiedades de un buen estimador puntual: insesgadez, eficiencia y

consistencia (Anderson, 2008, p.285).

Para explicar se usará la notación general siguiente:

θ = el parámetro poblacional de interés

𝜃̂ = el estadístico muestral o estimador puntual de θ

En general, θ representa cualquier parámetro poblacional como, por ejemplo,

la media poblacional, la desviación estándar poblacional, la proporción poblacional,

etc.; 𝜃̂ representa el correspondiente estadístico muestral, por ejemplo, la media

muestral, la desviación estándar muestral y la proporción muestral.

10
Se puede evaluar que tan bueno es un estadístico como estimador de

acuerdo a las siguientes propiedades:

1. Insesgado (o no sesgado): se refiere al hecho de que una media de la

muestra es un estimador no sesgado de una media de la población porque la media

de la distribución muestral de las medias de las muestras tomadas de la misma

población es igual a la media de la población misma. Podemos decir que un

estadístico es un estimador insesgado si, en promedio, tiende a tomar valores que

están arriba del parámetro de la población que se está estimando con la misma

frecuencia y la misma extensión con la que tiende a asumir valores abajo del

parámetro poblacional que se está estimando (Levin, 2004, p.276).

Si el valor esperado del estadístico muestral es igual al parámetro poblacional

que se estudia, se dice que el estadístico muestral es un estimador insesgado del

parámetro poblacional.

El estadístico muestral 𝜃̂ es un estimado insesgado del parámetro

poblacional θ si

E (𝜃̂) = θ

11
Donde E (𝜃̂ ) = valor esperado del estadístico muestral 𝜃̂

Por tanto, el valor esperado, o media, de todos los posibles valores de un

estadístico muestral insesgado es igual al parámetro poblacional que se estudia.

En la figura 1 se muestran los casos de los estimadores puntuales sesgados

e insesgado. En la gráfica A de la figura 1 en que se muestra el estimador insesgado,

la media de la distribución muestral es igual al valor del parámetro poblacional. En

este caso los errores de estimación se equilibran, ya que algunas veces el valor del

estimador puntual 𝜃̂ puede ser menor que θ y otras veces sea mayor que θ.

En el caso del estimador sesgado, la media de la distribución muestral es

menor o mayor que el valor del parámetro poblacional. En la gráfica B de la figura

1, E(𝜃̂) es mayor que θ; así, la probabilidad de que los estadísticos muestrales

sobreestimen el valor del parámetro poblacional es grande.

12
Figura 1 Amplitud del sesgo del estimador

Fuente: Anderson (2008, p.286).

2. Eficiencia: se refiere al tamaño del error estándar del estadístico. Si

comparamos dos estadísticos de una muestra del mismo tamaño y tratamos de

decidir cuál de ellas es un estimador más eficiente, escogeríamos la estadística que

tuviera el menor error estándar o la menor desviación estándar de la distribución

muestral.

Ejemplo:

13
Suponga que escogemos una muestra de un tamaño determinado y

debemos decidir si utilizamos la media de la muestra o la mediana de la muestra

para estimar la media de la población. Si calculamos el error estándar de la media

de la muestra y encontramos que es 1.03, y luego calculamos el error estándar de

la mediana de la muestra y tenemos que éste es 1.7, diríamos que la media de la

muestra es un estimador más eficiente de la media poblacional ya que su error

estándar es menor. Tiene sentido pensar que un estimador con un error estándar

menor (con menos variación) tendrá mayor oportunidad de producir una estimación

más cercana al parámetro poblacional que se está considerando (Levin, 2004,

p.276).

En la figura 2 se presentan las distribuciones muestrales de dos estimadores

puntuales insesgados, 𝜃̂1 y 𝜃̂2 Observe que el error estándar de 𝜃̂1 es menor que

el error estándar de 𝜃̂2.; por tanto, los valores de 𝜃̂1 tienen más posibilidades de

estar cerca del parámetro θ que los valores de 𝜃̂2. Como el error estándar del

estimado puntual 𝜃̂1 es menor que el error estándar del estimado puntual 𝜃̂2, 𝜃̂1

es relativamente más eficiente que 𝜃̂2 y se prefiere como estimador puntual

(Anderson, 2008, p.287).

14
Figura 2 Distribuciones muestrales de dos estimadores puntuales insesgados

Fuente: Anderson (2008, p.287).

3. Consistencia: un estimador puntual es consistente si el valor del

estimador puntual tiende a estar más cerca del parámetro poblacional a medida que

el tamaño de la muestra aumenta. En otras palabras, una muestra grande tiende a

proporcionar mejor estimación puntual que una pequeña. Observe que en el caso

de la media muestral 𝑥̅ , el error estándar de 𝑥̅ está dado por σ𝑥̅ =σ/√𝑛. Puesto que

σ𝑥̅ está vinculado con el tamaño de la muestra, de manera que muestras mayores

dan valores menores de σ𝑥̅ , entonces muestras de tamaño grande tienden a

proporcionar estimadores puntuales más cercanos a la media poblacional μ.

(Anderson, 2008, p.287).

15
4. Suficiencia: un estimador es suficiente si utiliza tanta información de la

muestra que ningún otro estimador puede extraer información adicional acerca del

parámetro de población que se está estimando (Levin, 2004, p.276).

Subtema 4. Estimación de una media con muestras


pequeñas

Para estimar una media de población 𝜇 cuando el tamaño de la muestra 𝑛 es

pequeño (con un tamaño igual o menor a 30), se debe considerar lo siguiente:

 Para muestras pequeñas, la media de muestras 𝑥̅ .es el mejor estimado

puntual de la media de la población 𝜇.

 Se pueden construir intervalos de confianza usando la distribución normal

siempre que la población original tenga una distribución normal y se conozca

la desviación estándar 𝜎 de la población, que casi nunca se cumple en

situaciones reales.

Si se desea construir un intervalo de confianza y tenemos una muestra

pequeña y además se desconoce la desviación estándar 𝜎 de la población,

16
podemos usar la distribución 𝑡 de Student creada por William Gothe quien publicó

bajo el seudónimo de Student (Triola, 2004).

Como no se conoce el valor de σ, se estima con el valor de la desviación

estándar muestral s, lo cual introduce otra fuente de falta de confiabilidad, que se

compensa haciendo más ancho el intervalo de confianza.

𝑋̅ −𝜇
Distribución t de Student 𝑡= 𝑠
√𝑛

Se utiliza para calcular valores críticos con ayuda de una tabla de esa

distribución2 y con el número de grados de libertad.

Grado de libertad: El número de grados de libertad para un conjunto de

datos muestrales que se recolectaron es el número de valores muestrales que

pueden variar tras haber impuesto ciertas restricciones a todos los valores de los

datos (Triola, 2004, p. 332).

Grados de libertad=n-1

2
Estas tablas se encuentran en Internet o en libros de texto de Estadística.

17
Subtema 5. Estimación de una media con muestras
grandes

El valor de la media de una población se aproxima con un estimador puntual

y un intervalo de confianza, conceptos mencionados anteriormente.

Una muestra aleatoria es considerada grande si 𝑛 ≥ 30

La media muestral 𝑥̅ es el estimador puntual de la media de la población 𝜇,

porque es un estimador consistente y sin sesgo.

Se utiliza la distribución normal como la distribución de las medias

muestrales.

Subtema 6. Estimación de una proporción para una gran


población

Proporción: Fracción, razón o porcentaje que indica la parte de la muestra

de la población que posee un rasgo de interés particular (Lind, 2012, p. 314).

18
Ejemplo: una encuesta indicó que 73 de cada 100 entrevistados consumía carne

de cerdo. La proporción de la muestra es de 73/100, o 0.73, o 73%.

Si p representa la proporción de la muestra,

X el número de éxitos

n el número de elementos de la muestra

Se determina una proporción muestral de la siguiente forma:

𝑋
𝑝=
𝑛

Si se desea estimar una proporción de una población con un solo valor, el

mejor estimado es p. Porque consiste en un solo valor se llama un estimado puntual.

El desarrollo del estimador puntual de la proporción de la población y el

intervalo de confianza de una proporción de población es similar a hacerlo para una

media.

19
Para calcular el intervalo de confianza de una proporción de población se

aplica la siguiente fórmula:

𝑝(1 − 𝑝)
𝑝 ± 𝑧√
𝑛

Ejemplo:

Los trabajadores de una empresa automotriz consideran la propuesta de

cambio de turnos fijos a rolarlos, por lo menos tres cuartas partes de los empleados

deben estar de acuerdo. Una muestra aleatoria de 2,000 empleados revela que

1,600 planean aceptar la propuesta.

Primero se calcula la proporción de la muestra de acuerdo con la fórmula:

𝑋 1600
𝑝= = = .80
𝑛 2000

Por lo que se infiere que el 80% de la población favorece la propuesta de

cambio. Después se debe determinar el intervalo de confianza de 95% con la

fórmula. El valor z3 correspondiente al nivel de confianza de 95% es de 1.96.

3
Consultar tabla Z en Internet o en libros de texto de Estadística.

20
𝑝(1 − 𝑝) . 80(1 − .80)
𝑝 ± 𝑧√ = .80 ± 1.96√ = .80 ± .018
𝑛 2000

Los puntos extremos del intervalo de confianza son 0.782 y 0.818. El punto

extremo más bajo es mayor que 0.75. Así, es probable que se apruebe la

propuesta, pues el estimador del intervalo incluye valores superiores a 75% de los

empleados.

Conclusiones:

Para realizar estudios estadísticos de poblaciones se realizan generalmente

tomando muestras de la población completa, por lo que es necesario conocer

conceptos como el de estimador puntual e intervalos de confianza, también que los

estimadores tienen características que ayudan a saber que tan buenos son y que

en el proceso de muestreo es posible calcular el error.

21
Es importante saber que, dependiendo del tamaño de la muestra, si es

pequeña o grande el método de calcular la media es diferente, utilizando la

distribución normal o la t de Student.

Bibliografía

 Levin, R. & Rubin, D. (2004). Estadística Para Administración y Economía,


séptima edición. México: Pearson Educación.
 Lind, D., Marchal, W. & Wathen, S. (2012). Estadística Aplicada a los
Negocios y la Economía, decimoquinta edición. México: McGraw-Hill
Educación.
 Triola, M. (2004). Estadística Novena Edición. México: Pearson Educación.
 Anderson, D., Sweeney, D. & Williams, T. (2008). Estadística Para
Administración y Economía, décima edición. México: Cengage Learning
Editores.

22

También podría gustarte