Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
INDICE
2.1 Introducción. Página 3
Conclusión Página 26
Glosario Página 28
2
2.1 INTRODUCCIÓN
Antes de comenzar con los contenidos específicos de la estimación es conveniente
recordar cuál es la situación habitual con la que nos encontramos en un proceso de
inferencia.
Nuestro interés se centra en el estudio de una característica determinada de una
población. Dicha característica puede denotarse por una variable aleatoria X
definida sobre la población y con función de densidad f(x). Si conocemos f(x)
tendremos caracterizada a la variable aleatoria X y el problema queda resuelto. Sin
embargo, la mayoría de las veces no ocurre eso. En principio, es habitual disponer
solo de cierta información a priori sobre el comportamiento de la variable aleatoria
X (dicha información, normalmente proviene de las conclusiones de un estudio
previo de esa variable realizado sobre la misma población u otra diferente).
Por ejemplo, podemos conocer que la variable aleatoria X sólo puede tomar dos
valores, éxito o fracaso, y que además la probabilidad de éxito es muy baja. Según
esta información podemos suponer que X se distribuye como una Poisson. No
obstante, nos falta información para poder definir esa distribución (función de
densidad de la variable aleatoria X) puesto que desconocemos el valor de su media.
1. Obtención de la muestra.
3
3. Utilización del estadístico calculado en el
apartado previo como estimador del parámetro poblacional que desconocemos.
De lo anterior se deduce que un estimador no es más que una función de los datos
muestrales que se utiliza como valor de un parámetro poblacional. O, dicho de otra
manera, un estimador no es más que un estadístico asociado a un valor poblacional.
Por ejemplo, podríamos decir que la media muestral es el estimador de la media
poblacional.
El estadístico media muestral se calcula a través de la siguiente función.
4
D. Métodos disponibles para la estimación de intervalos de confianza de un
parámetro poblacional.
5
2.2 CARACTERÍSTICAS DE UN ESTIMADOR
Se dice que un estimador es insesgado si la Media de la distribución del estimador
es igual al parámetro.
Estimadores insesgados son la Media muestral (estimador de la Media de la
población) y la Varianza (estimador de la Varianza de la población):
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho
un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras= 100)
y hallan que la Media de las Medias muestrales es igual a 5.09, (la media
poblacional y la media de las medias muestrales coinciden). En cambio, la Mediana
de la población es igual a 5 y la Media de las Medianas es igual a 5.1 esto es, hay
diferencia ya que la Mediana es un estimador sesgado.
La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas
obtenidas con la Varianza
la Media de las Varianzas muestrales es igual a 9.5, esto es, coincide con la
Varianza de la población ya que la Cuasi varianza es un estimador insesgado.
6
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho
tres muestreos aleatorios (número de muestras= 100) con los siguientes resultados:
vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el
mismo valor que la Media de la población.
7
Nombramos estos dos por ser los más sencillos, pero en estadística existen muchos
más. Ahora bien, volviendo a la definición, ¿Qué entendemos por ciertas
condiciones para que puedan calcular con ciertas garantías ciertos parámetros?
8
2.3 ESTIMACION PUNTUAL
Una estimación puntual de un parámetro poblacional es cuando se utiliza un único
valor para estimar ese parámetro, es decir, se usa un punto en concreto de la
muestra para estimar el valor deseado.
Cuando estimamos un parámetro de forma puntual, podemos saber con certeza,
cuál es ese valor. Imaginemos una población de 30 personas de las que
seleccionamos una muestra de 20 para las que conocemos sus edades. Estimar de
forma puntual la media de edad, sería tan sencillo como sumar esos 20 datos y
dividirlos entre el total de la muestra estadística.
Propiedades deseables de un estimador
Las propiedades deseables de un estimador son las siguientes:
Para obtener una estimación puntual se usa un estadístico que recibe el nombre de
estimador o función de decisión. Algunos ejemplos de estadísticos son:
9
La desviación típica muestral que sirve de estimación para la desviación típica de
la población.
10
2.4 ESTIMACION POR INTERVALOS
Intervalo de confianza
El intervalo de confianza es una expresión del tipo [θ1, θ2] o θ1 ≤ θ ≤ θ2, donde θ
es el parámetro por estimar. Este intervalo contiene al parámetro estimado con un
determinado nivel de confianza. Pero a veces puede cambiar este intervalo cuando
la muestra no garantiza un axioma o un equivalente circunstancial.
11
medida de esta variabilidad la desviación típica poblacional y se denota σ.
Error de la estimación
Es una medida de. su precisión que se corresponde con la amplitud del intervalo de
confianza. Cuanta más precisión se desee en la estimación de un parámetro, más
estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el
error, más observaciones deberán incluirse en la muestra estudiada. En caso de no
incluir nuevas observaciones para la muestra, más error se comete al aumentar la
precisión. Se suele llamar E, según la fórmula E = (θ2 - θ1) /2.
Límite de Confianza
Valor α
Valor crítico
12
de la distribución de la población. Por ejemplo, para una distribución normal, de
media 0 y desviación típica 1, el valor crítico para α = 0,1 se calcularía del siguiente
modo: se busca en la tabla de la distribución ese valor (o el más aproximado), bajo
la columna "Área"; se observa que se corresponde con -1,28. Entonces Zα/2 = 1,64.
Si la media o desviación típica de la distribución normal no coinciden con las de la
tabla, se puede realizar el cambio de variable t =(X-μ)/σ para su cálculo.
Con estas definiciones, si tras la extracción de una muestra se dice que "3 es una
estimación de la media con un margen de error de 0,6 y un nivel de confianza del
99%", podemos interpretar que el verdadero valor de la media se encuentra entre
2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando
y sumando, respectivamente, la mitad del error, para obtener el intervalo de
confianza según las definiciones dadas.
Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza van
relacionados. Si admitimos un error mayor, esto es, aumentamos el tamaño del
intervalo de confianza, tenemos también una mayor probabilidad de éxito en nuestra
estimación, es decir, un mayor nivel de confianza
13
2.4.1 INTERVALOS DE CONFIANZA PARA LA MEDIA
Un intervalo de confianza es una técnica de estimación utilizada en inferencia
estadística que permite acotar un par o varios pares de valores, dentro de los cuales
se encontrará la estimación puntual buscada (con una determinada probabilidad).
Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una
media muestral (uno superior y otro inferior). Estos valores van a acotar un rango
dentro del cual, con una determinada probabilidad, se va a localizar el parámetro
poblacional.
14
Vemos como en el intervalo a la izquierda y derecha de la desigualdad tenemos la
cota inferior y superior respectivamente. Por tanto, la expresión nos dice, que la
probabilidad de que la media poblacional se sitúe entre esos valores es de 1-alfa
(nivel de confianza).
15
2.4.2 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS.
Si S12 y s22 son las medias y las varianzas de dos muestras aleatorias de tamaño
n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes
con varianzas desconocidas pero iguales, entonces un intervalo de confianza del
16
2.4.3 INTERVALOS DE CONFIANZA PARA PROPORCION
Un estimador puntual de la proporción P en un experimento binomial está dado por
la estadística P=X/N, donde X representa el número de éxitos en N pruebas.
Por tanto, la proporción de la muestra p=x/n se utilizará como estimador puntual del
parámetro P.
Si no se espera que la proporción P desconocida este demasiado cerca de 0 o de
1, se puede establecer un intervalo de confianza para P al considerar la distribución
muestral de proporciones.
Pero ¿Cómo podemos encontrar P si también está del lado derecho de la ecuación?
Lo que haremos es aproximar la proporción de la población por la de la muestra, es
decir, sustituir P por la proporción de la muestra P siempre y cuando el tamaño de
muestra no sea pequeño.
17
2.4.4 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE
PROPORCIONES
Los limites para el intervalo de una diferencia de proporciones correspondientes a
dos muestras independientes son:
Donde el símbolo Za/n es el mismo valor critico que antes, prob(Z>Za/2) = a/2,
corresponde a un intervalo de confianza 1 – a %.
• Este intervalo puede utilizarse de manera alternativa al contraste de hipótesis
para decidir (con nivel de significación a %) si hay igualdad de los dos grupos.
Se decidirá por la igualdad de los grupos si el valor 0 queda incluido en
cualquier posición en el intervalo.
• Aunque se haga el contraste de dos proporciones, en primer lugar, es
aconsejable obtener el intervalo de confianza de la diferencia de medias, si
este ha resultado significativo, puesto que ayudara a interpretar si existe
significación aplicada además de la estadística.
• Si se dispone de alguna información previa y solo quiere calcularse algunos
de los intervalos unilaterales, bastara sustituir Za/2 y descartar el límite
superior o inferior según el caso. Por ejemplo, el intervalo unilateral derecho
corresponde a:
18
2.4.5 INTERVALOS DE CONFIANZA PARA LA VARIANZA.
Un intervalo de confianza al nivel 1 − α para la varianza de una distribución
gaussiana (cuyos parámetros desconocemos) lo obtenemos como σ 2 ∈ " (n − 1)Sˆ2
χ 2 n−1,1−α/2 , (n − 1)Sˆ2 χ 2 n−1,α/2 # Ejemplo Se estudia la altura de los individuos
de una ciudad, obteniéndose en una muestra de tamaño 25 los siguientes valores:
x = 170 cm S = 10 cm Calcular un intervalo de confianza con α = 0, 05 para la
varianza σ 2 de la altura de los individuos de la ciudad. Solución: σ 2 ∈ [63, 45; 201,
60] Por tanto, para el valor poblacional de la desviación típica tenemos que
Antes de realizar un estudio de inferencia estadística sobre una variable, lo primero
es decidir el número de elementos, n, a elegir en la muestra aleatoria. Para ello
consideremos que el estudio se basara en una variable de distribución normal, y
nos interesa obtener para un nivel de significación α dado, una precisión (error) d.
Para ello, recordemos que un intervalo de confianza para una media en el caso
general se escribe como: µ = X ± tn−1,1−α/2 · Sˆ √ n | {z} precisión d Si n es
suficientemente grande, la distribución t de Student se aproxima a la distribución
normal. Luego una manera de obtener la precisión buscada consiste en elegir n con
el siguiente criterio: n ≥ z 2 1−α/2 d 2 Sˆ2 Donde Sˆ2 es una estimación puntual a
priori de la varianza de la muestra. Para obtenerla nos podemos basar en una cota
superior conocida por nuestra experiencia previa, o simplemente, tomando una
muestra piloto que sirve para dar una idea previa de los parámetros que describen
una población.
19
2.4.6 INTERVALOS DE CONFIANZA PARA LA RELACIÓN DE
VARIANZAS
Si queremos comparar, en vez de las medias, las desviaciones típicas (para ver
si una población tiene mayor variabilidad que otra), utilizaremos el cociente de
varianzas σ22/σ21.σ22/σ21. Una estimación puntual de este cociente es el que
se obtiene dividiendo las cuasi varianzas muestrales, y el intervalo de confianza
para el cociente de las varianzas es:
(Fn−1, m−1,1−α/2ˆS2m−1ˆS2n−1, Fn−1, m− 1, α/2ˆS2m−1ˆS2n−1),
siendo Fn−1, m−1, α/2 el valor de una F de Snedecor con n−1 y $ m-1$ grados
de libertad que deja a la derecha α/2 de área.
20
2.5 DETERMINACION DEL TAMAÑO DE MUESTRAS.
Decidir cuál es el mejor tamaño para una muestra es una de las preocupaciones
principales relativas al muestreo. El primer aviso es que no existe un tamaño bueno
para todo, según el tipo de muestreo que se vaya a realizar, los objetivos que se
persigan, las características de la población y las condiciones en las que se van a
realizar las estimaciones serán aconsejables unos tamaños u otros.
El tamaño muestral dependerá de decisiones estadísticas y no estadísticas, pueden
incluir por ejemplo la disponibilidad de los recursos, el presupuesto o el equipo que
estará en campo.
21
La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de
la población es la siguiente:
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)
En donde,
N = tamaño de la población
Z = nivel de confianza
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (Error máximo admisible en términos de proporción).
22
2.5.1 DETERMINACIÓN DEL TAMAÑO DE MUESTRA BASADO EN
LA MEDIA DE LA POBLACIÓN
El determinar el tamaño de una muestra representa una parte esencial del método
científico para poder llevar a cabo una investigación. Al muestreo lo podemos definir
como el conjunto de observaciones necesarias para estudiar la distribución de
determinadas características en la totalidad de una población, a partir de la
observación de una parte o subconjunto de una población denominada muestra.
.
23
2.5.2 DETERMINACIÓN DEL TAMAÑO DE MUESTRA BASADO EN
LA PROPORCIÓN DE LA POBLACIÓN
En poblaciones dicotómicas con una proporción de éxitos el estimador puntual del
Analizar
Estadísticos Descriptivos
Explorar
Analizar
24
Comparar medias
Utilizando este criterio los resultados numéricos no coinciden exactamente con los que
se obtendrían aplicando la expresión del error típico de la proporción; no obstante, la
discrepancia es despreciable si el número de observaciones es suficientemente grande.
25
CONCLUSIÓN:
Estimar qué va a ocurrir respecto a algo (o qué está ocurriendo, o qué ocurrió), a pesar
de ser un elemento muy claramente estadístico, está muy enraizado en nuestra
cotidianidad. Dentro de ello, además hacemos estimaciones dentro de un intervalo de
posibilidades. Por ejemplo: “creo que terminaré la tarea en unos 5-6 días”. Lo que
hacemos en el terreno del análisis de datos es aplicar matizaciones técnicas a este
hábito. Vamos a dedicar este documento al concepto de estimación, comenzando con la
estimación puntual. Después nos ocuparemos de desarrollar un modelo de estimación
por intervalo donde identificaremos los elementos fundamentales, con su significado y
símbolo. Y, por último, habrá que desarrollar cómo se calculan esos elementos. Estimar
puede tener dos significados interesantes. Significa querer e inferir. Desde luego, el
primer significado es más trascendente. Pero no tiene ningún peso en la estadística,
disciplina que no se ocupa de los asuntos del amor. El segundo significado es el
importante aquí. Una estimación estadística es un proceso mediante el que establecemos
qué valor debe tener un parámetro según deducciones que realizamos a partir de
estadísticos. En otras palabras, estimar es establecer conclusiones sobre características
poblacionales a partir de resultados muestrales. Vamos a ver dos tipos de estimaciones:
puntual y por intervalo. La segunda es la más natural. Y verás que forma parte habitual
de nuestro imaginario como personas sin necesidad de una formación estadística. La
primera, la estimación puntual, es la más sencilla y, por ese motivo, vamos a comenzar
por ella. Ocurre, además, que la estimación por intervalo surge, poco más o menos, de
construir un intervalo de posibles valores alrededor de la estimación puntual. Una
estimación puntual consiste en establecer un valor concreto (es decir, un punto) para el
parámetro. El valor que escogemos para decir “el parámetro que nos preocupa vale X”
es el que suministra un estadístico concreto. Como ese estadístico sirve para hacer esa
estimación, en lugar de estadístico suele llamársele estimador. Así, por ejemplo,
utilizamos el estadístico “media aritmética de la muestra” como estimador del parámetro
“media aritmética de la población”. Esto significa: si quieres conocer cuál es el valor de la
media en la población, estimaremos que es exactamente el mismo que en la muestra que
hemos manejado. Los estimadores siempre suministran dispersión aleatoria. Como
26
sabemos del monográfico sobre muestreo, el conjunto de todas las muestras de un
mismo diseño que provienen de una misma población suministra valores diferentes. Esta
circunstancia indica que existe una variación aleatoria con la que hay que vivir porque es
inevitable. Pero todavía sería peor. Es posible que el estimador escogido tenga sesgo,
es decir, que no solo esté variando alrededor de un punto, sino que el punto sobre el que
varía no es el valor poblacional, verdadero u objetivo de nuestro interés. Esto si es
evitable. Así que los estimadores que utilizamos intentamos que sean insesgados, es
decir, que carezcan de sesgo. El recurso que utilizamos para ello es el valor esperado,
es decir, la media aritmética de la distribución muestral del estimador. Ya lo viste en el
monográfico sobre muestreo. El valor esperado es, como dice la expresión, el valor que
esperamos. Cabe elegir un estimador tal que el valor esperado coincida con el parámetro.
Esto ocurre si utilizamos la media aritmética de la muestra como estimador de la media
aritmética de la población, pues E (X̄) =μ. También ocurre con las proporciones, pues
E(p) = π. Pero no ocurre así con la varianza (y, por tanto, tampoco con la desviación tipo)
pues E (S 2) ≠ σ 2. Esto ya lo hemos abordado en el monográfico sobre muestreo. Lo
que hacemos entonces es escoge otro estimador. En el muestreo aleatorio simple donde
las poblaciones son de gran tamaño, es la cuasi varianza el estadístico escogido como
estimador de la varianza poblacional, pues E (Ŝ 2) = σ 2, es decir, la cuasi varianza es
un estimador insesgado de la varianza poblacional.
27
GLOSARIO:
Estadística Descriptiva: Trata de los estudios que se hacen sobre el total de individuos
de una población con el fin de establecer las principales características de interés para el
investigador.
Estadística Inferencial: Se refiere a los estudios que se hacen sobre una parte de la
población (muestra), con el fin de obtener (inferir) conclusiones sobre las características
de interés de toda la población. Es un camino de deducción con riesgo, con probabilidad
de error.
28
BIBLIOGRAFÍA:
Anderson D., Sweeney D., Williams T. Estadística para la administración y economía. Décima
edición. Cengage Learning. 2008 https://economipedia.com/definiciones/estimacion-puntual.html
Berenson M., Levine D., Krehbiel T. Estadística para administración. Segunda edición. Prentice
Hall. 2000 https://economipedia.com/definiciones/estimacion-puntual.html
https://www.google.com/search?q=2.4.6+Intervalos+de+confianza+para+la+relaci%C3%B3n+de
+varianzas&source=lmns&bih=632&biw=1242&hl=es&sa=X&ved
https://www.google.com/search?q=2.4.6+Intervalos+de+confianza+para+la+relaci%C3%B3n
29