Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ndice general
1 Muestreo (estadstica) 1
1.1 Tcnicas de muestreo estadstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Muestreo no probabilstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Vase tambin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Poblacin estadstica 5
2.1 Poblacin en epidemiologa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Muestra estadstica 6
3.1 Otras deniciones relacionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.1 Espacio muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.2 Parmetro o Estadstico muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.3 Estimacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.4 Nivel de conanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.5 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2 Ventajas de la eleccin de una muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3 Descripcin matemtica de una muestra aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.4 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4 Estimacin estadstica 9
4.1 Estimador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.2 Estimacin puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.3 Estimacin por intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.1 Intervalo de conanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.2 Variabilidad del Parmetro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.3 Error de la estimacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.4 Lmite de Conanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.5 Valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.6 Valor crtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.3.7 Otros usos del trmino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.4 Vase tambin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
i
ii NDICE GENERAL
4.5 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
5 Estimador 12
5.1 Propiedades de los estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.1.1 Sesgo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.1.2 Eciencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.1.3 Consistencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.1.4 Robustez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.1.5 Suciencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.1.6 Invarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.2 Vase tambin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
7 Tamao de la muestra 19
7.1 Objetivos de la determinacin del tamao adecuado de una muestra . . . . . . . . . . . . . . . . . 19
7.1.1 Estimacin de parmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
7.1.2 Contraste de hiptesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
7.2 Notas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
7.3 Text and image sources, contributors, and licenses . . . . . . . . . . . . . . . . . . . . . . . . . . 23
7.3.1 Text . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
7.3.2 Images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
7.3.3 Content license . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Captulo 1
Muestreo (estadstica)
En estadstica se conoce como muestreo a la tcnica para la seleccin de una muestra a partir de una poblacin.
Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a la poblacin. Este proceso
permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzaran si se realizase un estudio de
toda la poblacin.
Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio adecuado (que consienta no solo
hacer estimaciones de la poblacin sino estimar tambin los mrgenes de error correspondientes a dichas estimacio-
nes), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra
representativa, pero s podemos actuar de manera que esta condicin se alcance con una probabilidad alta.
En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin, se puede extraer dos o
ms muestras de la misma poblacin. Al conjunto de muestras que se pueden obtener de la poblacin se denomina
espacio muestral. La variable que asocia a cada muestra su probabilidad de extraccin, sigue la llamada distribucin
muestral.
Forman parte de este tipo de muestreo todos aquellos mtodos para los que se puede calcular la probabilidad de
extraccin de cualquiera de las muestras posibles. Este conjunto de tcnicas de muestreo es el ms aconsejable,
aunque en ocasiones no es posible optar por l.
Tipos
Sin reposicin de los elementos : Cada elemento extrado se descarta para la subsiguiente extraccin. Por ejemplo,
si se extrae una muestra de una poblacin de bombillas para estimar la vida media de las bombillas que la integran,
no ser posible medir ms que una vez la bombilla seleccionada.
Con reposicin de los elementos: Las observaciones se realizan con remplazo de los individuos, de forma que la
poblacin es idntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extraccin
es tan pequea que el muestreo puede considerarse con reposicin aunque, realmente, no lo sea.
1
2 CAPTULO 1. MUESTREO (ESTADSTICA)
Con reposicin mltiple: En poblaciones muy grandes, la probabilidad de repetir una extraccin es tan pequea que
el muestreo puede considerarse con reposicin.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til la extraccin de nmeros aleatorios
mediante ordenadores, calculadoras o tablas construidas al efecto.
Muestreo sistemtico
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo. Primero hay que
identicar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que
se denomina coeciente de elevacin:
K= N/n
Donde N es el tamao del universo y n el tamao de la muestra.
Para determinar en qu fecha se producir la primera extraccin, hay que elegir al azar un nmero entre 1 y K;
de ah en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la
periodicidad del fenmeno.
Esto quiere decir que si tenemos un determinado nmero de personas que es la poblacin (N) y queremos escoger de
esa poblacin un nmero ms pequeo el cual es la muestra (n), dividimos el nmero de la poblacin por el nmero
de la muestra que queremos tomar y el resultado de esta operacin ser el intervalo, entonces escogemos un nmero
al azar desde uno hasta el nmero del intervalo, y a partir de este nmero escogemos los dems siguiendo el orden.
Muestreo estraticado
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos con respecto
a alguna caracterstica de las que se van a estudiar. A cada uno de estos estratos se le asignara una cuota que de-
terminara el nmero de miembros del mismo que compondrn la muestra. Dentro de cada estrato se suele usar la
tcnica de muestreo sistemtico, una de las tcnicas de seleccin ms usadas en la prctica.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos tcnicas
de muestreo estraticado:
Asignacin proporcional: el tamao de la muestra dentro de cada estrato es proporcional al tamao del estrato
dentro de la poblacin.
Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que tengan ms variabilidad. Para
ello es necesario un conocimiento previo de la poblacin.
Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las opiniones de hombres y
mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. En la asignacin
proporcional, si la poblacin est compuesta de un 55% de mujeres y un 45 % de hombres, se tomara una muestra
que contenga tambin esos mismos porcentajes de hombres y mujeres. En la asignacin ptima, si todos los hombres
piensan igual, pero las mujeres son impredecibles, se tomara una muestra con ms del 55% de mujeres.
Para una descripcin general del muestreo estraticado y los mtodos de inferencia asociados con este procedimiento,
suponemos que la poblacin est dividida en h subpoblaciones o estratos de tamaos conocidos N1 , N2 ,..., N tal
que las unidades en cada estrato sean homogneas respecto a la caracterstica en cuestin. La media y la varianza
desconocidas para el i-simo estrato son denotadas por mi y s2 , respectivamente.
Esta tcnica es la nica opcin cuando no se dispone de lista completa de la poblacin de referencia o bien cuando
por medio de la tcnica de muestreo simple o estraticado se obtiene una muestra con unidades distribuidas de tal
forma que resultan de difcil acceso. En el muestreo a estadios mltiples se subdivide la poblacin en varios niveles
ordenados que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla en
varias fases o extracciones sucesivas para cada nivel.
1.1. TCNICAS DE MUESTREO ESTADSTICO 3
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un pas determinado, stos pueden
subdividirse en unidades primarias representadas por circunscripciones didcticas y unidades secundarias que seran
los propios profesores. En primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener
la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra de unidades secundarias
de cada una de las primarias seleccionadas en la primera extraccin.
Se utiliza cuando la poblacin se encuentra dividida, de manera natural, en grupos que se supone que contienen
toda la variabilidad de la poblacin, es decir, la representan elmente respecto a la caracterstica a elegir, pueden
seleccionarse slo algunos de estos grupos o conglomerados para la realizacin del estudio.
Dentro de los grupos seleccionados se ubicarn las unidades elementales, por ejemplo, las personas a encuestar, y
podra aplicrsele el instrumento de medicin a todas las unidades, es decir, los miembros del grupo, o slo se le
podra aplicar a algunos de ellos, seleccionados al azar. Este mtodo tiene la ventaja de simplicar la recogida de
informacin muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la muestra, el diseo
se llama muestreo bietpico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer mtodo funciona mejor cuanto ms
homognea es la poblacin respecto del estrato, aunque ms diferentes son stos entre s. En el segundo, ocurre lo
contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos entre s.
Homogneo signica, en el contexto de la estraticacin, que no hay mucha variabilidad. Los estratos funcionan mejor
cuanto ms homogneos son cada uno de ellos respecto a la caracterstica a medir. Por ejemplo, si se estudia la estatura
de una poblacin, es bueno distinguir entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya
menos variabilidad, es decir, sean menos heterogneos. Dicho de otro modo, no hay tantas diferencias entre unas
estaturas y otras dentro del estrato que en la poblacin total.
Por el contrario, la heterogeneidad hace intil la divisin en estratos. Si se dan las mismas diferencias dentro del
estrato que en toda la poblacin, no hay por qu usar este mtodo de muestreo. En los casos en los que existan
grupos que contengan toda la variabilidad de la poblacin, lo que se construyen son conglomerados, que ahorran
algo del trabajo que supondra analizar toda la poblacin. En resumen, los estratos y los conglomerados funcionan
bajo principios opuestos: los primeros son mejores cuanto ms homogneo es el grupo respecto a la caracterstica a
estudiar y los conglomerados, si representan elmente a la poblacin, esto es, contienen toda su variabilidad, o sea,
son heterogneos.
Es aqul para el que no se puede calcular la probabilidad de extraccin de una determinada muestra. Por tal motivo,
se busca seleccionar a individuos que tienen un conocimiento profundo del tema bajo estudio y se considera que la
informacin aportada por esas personas es vital para la toma de decisiones.
Es la tcnica ms difundida sobre todo en estudios de mercado y sondeos de opinin. En primer lugar es necesario
dividir la poblacin de referencia en varios estratos denidos por algunas variables de distribucin conocida (como
el gnero o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es decir, la parte proporcional
de poblacin que representan. Finalmente se multiplica cada peso por el tamao de n de la muestra para determinar
la cuota precisa en cada estrato. Se diferencia del muestreo estraticado en que una vez determinada la cuota, el
investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato.
4 CAPTULO 1. MUESTREO (ESTADSTICA)
Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en contacto entre s. Consiste
en identicar sujetos que se incluirn en la muestra a partir de los propios entrevistados. Partiendo de una pequea
cantidad de individuos que cumplen los requisitos necesarios, servirn como localizadores de otros con caractersticas
anlogas.
En este caso las unidades de la muestra se eligen en funcin de algunas de sus caractersticas de manera racional y no
casual. Una variante de esta tcnica es el muestreo compensado o equilibrado, en el que se seleccionan las unidades
de tal forma que la media de la muestra para determinadas variables se acerque a la media de la poblacin. La cual
funciona en base a referencias o por recomendacin despus se reconoce por medio de la estadstica.
estrategias de muestreo
muestra estadstica
tamao de la muestra
Captulo 2
Poblacin estadstica
Poblacin estadstica, en estadstica, tambin llamada universo, es el conjunto de elementos de referencia sobre el
que se realizan las observaciones. Tambin es el conjunto sobre el que estamos interesados en obtener conclusiones
(inferir). Normalmente es demasiado grande para poder abarcarla, motivo por el cual se puede hacer necesaria la
extraccin de una muestra de sta.
2.2 Referencias
[1] http://www.monografias.com/trabajos15/estadistica/estadistica.shtml#ixzz2JQRrbdXw Monografa sobre la estadistica
5
Captulo 3
Muestra estadstica
3.1.3 Estimacin
Una estimacin es cualquier tcnica para conocer un valor aproximado de un parmetro referido a la poblacin, a
partir de los estadsticos muestrales calculados a partir de los elementos de la muestra. Si se estima el suciente
nmero de parmetros puede aproximarse de manera razonable la distribucin de probabilidad de la poblacin para
ciertas variables aleatorias.
6
3.2. VENTAJAS DE LA ELECCIN DE UNA MUESTRA 7
bien p-valores que miden la probabilidad de errores de tipo I (probabilidad de rechazar una cierta hiptesis siendo
que esta era correcta).
3.1.5 Ejemplo
Se tiene una poblacin de 222.222 habitantes y se quiere conocer cuantos de ellos son hombres y cuantos de ellos son
mujeres. Se conjetura que cerca del 50% son mujeres y el resto hombres, pero se quiere seleccionar una muestra para
determinar cuantos hombres y mujeres hay en la muestra y a partir de ah inferior el porcentaje exacto de hombres y
mujeres en la poblacin total. La descripcin de una muestra, y los resultados obtenidos sobre ella, puede ser del tipo
mostrado en el siguiente ejemplo:
La interpretacin de esos datos sera la siguiente:
1. La poblacin a investigar tiene 222.222 habitantes y queremos saber cuntos son hombres o mujeres.
2. Estimamos en un 50% para cada sexo y para el propsito del estudio es suciente un 90% de seguridad con un
nivel entre 90 - 5 y 90 + 5.
3. Generamos una tabla de 280 nmeros al azar entre 1 y 222.222 y en un censo numerado comprobamos el
gnero para los seleccionados.
1. Si la poblacin es muy grande (en ocasiones, innita, como ocurre en determinados experimentos aleatorios)
y, por tanto, imposible de analizar en su totalidad.
2. Las caractersticas de la poblacin varan si el estudio se prolonga demasiado tiempo.
3. Reduccin de costos: al estudiar una pequea parte de la poblacin, los gastos de recogida y tratamiento de
los datos sern menores que si los obtenemos del total de la poblacin.
4. Rapidez: al reducir el tiempo de recogida y tratamiento de los datos, se consigue mayor rapidez.
5. Viabilidad: la eleccin de una muestra permite la realizacin de estudios que seran imposible hacerlo sobre
el total de la poblacin.
6. La poblacin es sucientemente homognea respecto a la caracterstica medida, con lo cual resultara intil
malgastar recursos en un anlisis exhaustivo (por ejemplo, muestras sanguneas).
7. El proceso de estudio es destructivo o es necesario consumir un artculo para extraer la muestra (ejemplos: vida
media de una bombilla, carga soportada por una cuerda, precisin de un proyectil, etc.).
3.4 Referencias
[1] Samuel S. Wilks, Mathematical Statistics, John Wiley, 1962, Section 8.1
Captulo 4
Estimacin estadstica
En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar un valor aproximado de un
parmetro de una poblacin a partir de los datos proporcionados por una muestra. Por ejemplo, una estimacin de la
media de una determinada caracterstica de una poblacin de tamao N podra ser la media de esa misma caracterstica
para una muestra de tamao n.[1]
La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos mtodos que se usan en funcin
de las caractersticas y propsitos del estudio:
Estimacin puntual:[2]
Estimacin bayesiana.
4.1 Estimador
Un estimador es una regla que establece cmo calcular una estimacin basada en las mediciones contenidas en una
muestra estadistica.
9
10 CAPTULO 4. ESTIMACIN ESTADSTICA
o densidad f(x), la probabilidad de que ocurra una realizacin x1, ..., xn viene dada por: L(x1, ..., xn) = Yn i=1
f(xi)
A L(x1, ..., xn) se le llama funcin de verosimilitud.(credibilidad de la muestra observada). Buscamos entonces el
valor de que maximice la funcin de verosimilud, y al valor obtenido se le llama estimacin por mxima verosi-
militud de . Nota: si la variable X es discreta, en lugar de f(xi ) consideramos la funcin masa de probabilidad
p(xi).
Ejemplo 7.1: Sea X N(, ), con desconocido. Seleccionada una m.a.s. X1, ..., Xn, con realizacin x1, ..., xn,
estimamos el parmetro por ambos mtodos. Segn el mtodo de los momentos: E(X) = Xn i=1 Xi n = X, y al
ser = E(X) se obtiene que = x. Por el mtodo de mxima verosimilitud: L(x1, ..., xn) = Yn i=1 f(xi ) = =
Yn i=1 1 2 e (xi) 2 2
Estimacin por Intervalos de conanza 109 y maximizamos en tal funcin; en este caso resulta ms fcil maximizar
su logaritmo: lnL(x1, ..., xn) = 1 2 2 Xn i=1 (xi ) 2 n ln( 2) lnL(x1, ..., xn) = 1 2 Xn i=1 (xi
) = n x n 2 = 0 =
El intervalo de conanza es una expresin del tipo [1 , 2 ] 1 2 , donde es el parmetro a estimar. Este
intervalo contiene al parmetro estimado con un determinado nivel de conanza. Pero a veces puede cambiar este
intervalo cuando la muestra no garantiza un axioma o un equivalente circunstancial.
Si no se conoce, puede obtenerse una aproximacin en los datos aportados por la literatura cientca o en un estudio
piloto. Tambin hay mtodos para calcular el tamao de la muestra que prescinden de este aspecto. Habitualmente
se usa como medida de esta variabilidad la desviacin tpica poblacional y se denota .
Es una medida de su precisin que se corresponde con la amplitud del intervalo de conanza. Cuanta ms precisin
se desee en la estimacin de un parmetro, ms estrecho deber ser el intervalo de conanza y, si se quiere mantener
o disminuir el error, ms observaciones debern incluirse en la muestra estudiada. En caso de no incluir nuevas
observaciones para la muestra, ms error se comete al aumentar la precisin. Se suele llamar E, segn la frmula E
= (2 - 1 )/2.
Es la probabilidad de que el verdadero valor del parmetro estimado en la poblacin se site en el intervalo de conanza
obtenido. El nivel de conanza se denota por (1-), aunque habitualmente suele expresarse con un porcentaje ((1-
)100%). Es habitual tomar como nivel de conanza un 95% o un 99%, que se corresponden con valores de 0,05
y 0,01 respectivamente.
4.3.5 Valor
Tambin llamado nivel de signicacin. Es la probabilidad (en tanto por uno) de fallar en nuestra estimacin, esto
es, la diferencia entre la certeza (1) y el nivel de conanza (1-). Por ejemplo, en una estimacin con un nivel de
conanza del 95%, el valor es (100-95)/100 = 0,05
4.4. VASE TAMBIN 11
Intervalo de conanza.
Muestra estadstica.
Muestreo estadstico.
Tamao de la muestra.
4.5 Referencias
[1] Wackerly, Dennis D; Mendenhall, William; Scheaer, Richard L. (2002). 8. Estimacin. Estadstica matemtica con
aplicaciones (6 edicin). Cengage Learning Editores. p. 364. ISBN 9706861947.
[2] Caldern C., Bernardo A. Mtodos de estimacin. Estadstica Matemtica I. Universidad de Antioquia. Consultado el 21
de abril de 2009.
'Introduccin a la Estadstica Econmica y Empresarial. Teora y Prctica.' de Fco. Javier Martn-Pliego Lpez,
Editorial Thomson, 2007 (Madrid).
'Manual de Estadstica Empresarial con ejercicios resueltos de Eva Ropero, Mara Eleftheriou, Luana Gava y
Eva Romero. Editorial Delta Publicaciones. 2008 (Madrid).
Captulo 5
Estimador
En estadstica, un estimador es un estadstico (esto es, una funcin de la muestra) usado para estimar un parmetro
desconocido de la poblacin. Por ejemplo, si se desea conocer el precio medio de un artculo (el parmetro desco-
nocido) se recogern observaciones del precio de dicho artculo en diversos establecimientos (la muestra) y la media
aritmtica de las observaciones puede utilizarse como estimador del precio medio.
Para cada parmetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que posea
mejores propiedades que los restantes, como insesgadez, eciencia, convergencia y robustez (consistencia).
El valor de un estimador proporciona lo que se denomina en estadstica una estimacin puntual del valor del par-
metro en estudio. En general, se suele preferir realizar una estimacin mediante un intervalo, esto es, obtener un
intervalo [a,b] dentro del cual se espera est el valor real del parmetro con un cierto nivel de conanza. Utilizar un
intervalo resulta ms informativo, al proporcionar informacin sobre el posible error de estimacin, asociado con la
amplitud de dicho intervalo. El nivel de conanza es la probabilidad de que a priori el verdadero valor del parmetro
quede contenido en el intervalo.
En la prctica, los intervalos de estimadores con distribuciones simtricas suelen indicarse dando el valor del estimador
puntual utilizado como centro del intervalo y un valor que debe sumarse y restarse para obtener el lmite superior e
inferior; por ejemplo:
5.1.1 Sesgo
Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado) del estimador y el verdadero
valor del parmetro a estimar. Es deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea
nulo por ser su esperanza igual al parmetro que se desea estimar.
Por ejemplo, si se desea estimar la media de una poblacin, la media aritmtica de la muestra es un estimador insesgado
de la misma, ya que su esperanza (valor esperado) es igual a la media de la poblacin.
En efecto, si una muestra X=(X1 ,X2 ,...,Xn)t procede de una poblacin de media , quiere decir que:
[ ]
= E 1 n Xi =
E[X] n i=1
n n
= n1 E [ i=1 Xi ] = n1 i=1 E [Xi ] =
n
= n1 i=1 = n1 n =
12
5.1. PROPIEDADES DE LOS ESTIMADORES 13
5.1.2 Eciencia
Diremos que un estimador es ms eciente o ms preciso que otro estimador, si la varianza del primero es menor que
la del segundo. Por ejemplo, si 1 y 2 son ambos estimadores de y
diremos que 1 es ms eciente que 2 . Un estimador es ms eciente (ms preciso), por tanto, cuanto menor es su
varianza.
La eciencia de los estimadores est limitada por las caractersticas de la distribucin de probabilidad de la muestra de
la que proceden. El teorema de Cramr-Rao determina que la varianza de un estimador insesgado de un parmetro
es, como mnimo,
( )
var b [ 1
2
]
E [
log f (X;)]
5.1.3 Consistencia
Si no es posible emplear estimadores de mnima varianza, el requisito mnimo deseable para un estimador es que a
medida que el tamao de la muestra crece, el valor del estimador tienda a ser el valor del parmetro, propiedad que se
denomina consistencia. Existen diversas deniciones de consistencia, ms o menos restrictivas, pero la ms utilizada
es la denominada consistencia en media cuadrtica que exige que:
cuando n
1. E[]
0 cuando n
2. V ar()
5.1.4 Robustez
El estimador ser un estimador robusto del parmetro si la violacin de los supuestos de partida en los que se basa
la estimacin (normalmente, atribuir a la poblacin un determinado tipo de funcin de distribucin que, en realidad,
no es la correcta), no altera de manera signicativa los resultados que ste proporciona.
5.1.5 Suciencia
Se dice que un estimador es suciente cuando resume toda la informacin relevante contenida en la muestra, de forma
que ningn otro estimador pueda proporcionar informacin adicional sobre el parmetro desconocido de la poblacin.
Por ejemplo, la media muestral sera un estimador suciente de la media poblacional, mientras que la moda no lo
sera.
5.1.6 Invarianza
Se dice que un estimador es invariante cuando el estimador de la funcin del parmetro coincide con la funcin del
estimador del parmetro, [f ()] = f ( ).
Ejemplo.- Si para estimar la varianza poblacional utilizamos la varianza muestral, entonces para estimar la desviacin
tpica poblacional ser razonable utilizar la desviacin tpica muestral.
14 CAPTULO 5. ESTIMADOR
En estadstica, el error cuadrtico medio (ECM) de un estimador mide el promedio de los errores al cuadrado, es
decir, la diferencia entre el estimador y lo que se estima. El ECM es una funcin de riesgo, correspondiente al valor
esperado de la prdida del error al cuadrado o prdida cuadrtica. La diferencia se produce debido a la aleatoriedad
o porque el estimador no tiene en cuenta la informacin que podra producir una estimacin ms precisa.[1]
El MSE es el segundo momento (sobre el origen) del error, y por lo tanto incorpora tanto la varianza del estimador as
como su sesgo. Para un estimador insesgado, el ECM es la varianza del estimador. Al igual que la varianza, el EMC
tiene las mismas unidades de medida que el cuadrado de la cantidad que se estima. En una analoga con la desviacin
estndar, tomando la raz cuadrada del EMC produce el error de la raz cuadrada de la media o la desviacin de la raz
cuadrada media (RMSE o RMSD), que tiene las mismas unidades que la cantidad que se estima; para un estimador
insesgado, el RMSE es la raz cuadrada de la varianza, conocida como la desviacin estndar.
Si Y es un vector de n predicciones y Y es el vector de los verdaderos valores, entonces el (estimado) ECM del
predictor es:
n
ECM = n1 i=1 (Yi Yi )2 .
Esta es una cantidad conocida, calculado dada una muestra particular (y por lo tanto es dependiente de la muestra).
El MSE de un estimador con respecto al parmetro desconocido se dene como
[ ]
= E ( )2 .
ECM()
Esta denicin depende del parmetro desconocido, y el MSE en este sentido es una propiedad de un estimador (de
un mtodo de obtencin de una estimacin).
El MSE es igual a la suma de la varianza y el cuadrado sesgo del estimador o de las predicciones. En el caso de la
MSE de un estimador, [2]
( )2
= Var()
ECM() + Bias(,
) .
As pues, el ECM evala la calidad de un estimador o conjunto de predicciones en cuanto a su variacin y el grado
de sesgo.
Desde MSE es una expectativa, no es tcnicamente una variable aleatoria, pero va a estar sujeto a error de estima-
cin cuando se calcula para un estimador particular de con valor verdadero desconocido. Por lo tanto, cualquier
estimacin de la MSE sobre la base de un parmetro estimado es de hecho una variable aleatoria.
15
16 CAPTULO 6. ERROR CUADRTICO MEDIO
6.2 Demostracin
[( )2 ]
E(( )2 ) = E
MSE() E()
+ E()
[( )2 ( ) ( )2 ]
= E E() + 2 ( E())(E() ) + E()
[( )2 ] [ ] [( )2 ]
= E E()
+ 2E ( E())(E() ) + E E()
=E()E(
)=0
[( )2 ] z }| { [( )2 ]
= E E()
+ 2(E() ) E( E()) +E E()
[( )2 ] [( )2 ]
= E E()
+ E E()
+ Bias(,
= Var() )2
6.3 Regresin
En el anlisis de regresin, el trmino de error cuadrtico medio se utiliza a veces para referirse a la estimacin
insesgada de la varianza del error: la suma residual de cuadrados, dividida por el nmero de grados de libertad. Esta
denicin para una cantidad calculada conocida, diere de la denicin anterior para el ECM calculado para un
predictor en que se utiliza un denominador diferente. El denominador es el tamao reducido de la muestra por el
nmero de parmetros del modelo estimado a partir de los mismos datos, (np) para p regresores o (np-1) si se utiliza
una intercepcin.[3] Para ms detalles, ver los errores y los residuos en las estadsticas. Tenga en cuenta que, aunque
el ECM no es un estimador insesgado de la varianza del error, es coherente, dada la consistencia del predictor.
Tambin en el anlisis de regresin, error cuadrtico medio, se reere a menudo al error medio de prediccin
cuadrado o fuera de la media muestral de error al cuadrado, puede referirse a la media de las desviaciones al
cuadrado de las predicciones de los verdaderos valores, a lo largo un espacio fuera de la muestra de ensayo, generado
por un modelo estimado durante un espacio de muestra particular. Esto tambin es una, cantidad calculada conocida,
y vara por muestra y por espacio de ensayo fuera de la muestra.
6.4 Ejemplos
6.4.1 Media
Supongamos que tenemos una muestra aleatoria de tamao n de una poblacin, X1 , . . . , Xn . Supongamos que las
unidades de muestra se eligieron con el reemplazo. Es decir, las n unidades se seleccionan uno a la vez, y las unidades
previamente seleccionadas siguen siendo elegibles para ser seleccionados para todo n empates. El estimador usual de
la media es el promedio de la muestra
1
n
X= Xi
n i=1
el cual tiene un valor esperado igual a la media real (por lo que es imparcial) y un error cuadrtico medio de
( )2
2
ECM(X) = E((X )2 ) = =
n n
6.4.2 Varianza
El estimador usual para la varianza es la corregida varianza de la muestra :
( )
1 ( )2
n n
1 2
2
Sn1 = Xi X = Xi2 nX .
n 1 i=1 n1 i=1
Esto es imparcial (su valor esperado es 2 ), Por lo tanto, tambin llamada la varianza de la muestra no sesgada, y su
ECM es [4]
( )
1 n3 4
2
ECM(Sn1 )= 4
n n1
( )
1 2n
= 2 + 4 ,
n n1
n1 2
Sa2 = Sn1
a
1 ( )2
n
= Xi X
a i=1
a continuacin, el MSE es
(( )2 )
n1 2
MSE(Sa2 ) =E Sn1 2
a
n1 2(n 1) 4
= [(n 1)2 + n2 + n] 4 + 4
na2 a
Esto se minimiza cuando
(n 1)2 + n2 + n n1
a= =n+1+ 2 .
n n
Para una distribucin gaussiana, donde 2 = 0 . Esto signica que el MSE se minimiza cuando dividiendo la suma por
a = n + 1 . El exceso de curtosis es mnimo 2 = 2 , [a] que se consigue mediante una distribucin de Bernoulli
con p = 1/2 (un tirn de la moneda), y el MSE se reduce al mnimo para a = n 1 + 2/n . As que no importa lo
que la curtosis, obtenemos una estimacin mejor (en el sentido de tener un MSE inferior) reduciendo el tamao de
la perito imparcial un poco; este es un ejemplo sencillo de un estimador de la contraccin : uno encoge el estimador
hacia cero (escalas por el estimador no sesgado).
Adems, mientras que la varianza muestral corregida es el mejor estimador insesgado (error cuadrtico medio mnimo
entre los estimadores no sesgados) de la varianza para distribuciones gaussianas, si la distribucin no es gaussiana
2
entonces incluso entre estimadores no sesgados, el mejor estimador insesgado de la varianza puede no ser Sn1 .
6.5 Referencias
[1] Lehmann, E. L.; Casella, George (1998). Theory of Point Estimation (2nd edicin). New York: Springer. ISBN 0-387-
98502-6. MR 1639875.
18 CAPTULO 6. ERROR CUADRTICO MEDIO
[2] Wackerly, Dennis; Scheaer, William (2008). Mathematical Statistics with Applications (7 edicin). Belmont, CA, USA:
Thomson Higher Education. ISBN 0-495-38508-5.
[3] Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences.,
McGraw Hill, 1960, page 288.
[4] Mood, A.; Graybill, F.; Boes, D. (1974). Introduction to the Theory of Statistics (3rd edicin). McGraw-Hill. p. 229.
Captulo 7
Tamao de la muestra
En estadstica el tamao de la muestra es el nmero de sujetos que componen la muestra extrada de una poblacin,
necesarios para que los datos obtenidos sean representativos de la poblacin.
2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mnimo de garanta.
1. Si el nmero de sujetos es insuciente habra que modicar los criterios de seleccin, solicitar la colaboracin
de otros centros o ampliar el perodo de reclutamiento. Los estudios con tamaos muestrales insucientes, no
son capaces de detectar diferencias entre grupos, llegando a la conclusin errnea de que no existe tal diferencia.
2. Si el nmero de sujetos es excesivo, el estudio se encarece desde el punto de vista econmico y humano. Adems
es poco tico al someter a ms individuos a una intervencin que puede ser menos ecaz o incluso perjudicial.
k 2 N pq
e2 (N 1) + k 2 pq
19
20 CAPTULO 7. TAMAO DE LA MUESTRA
(Por tanto si pretendemos obtener un nivel de conanza del 95% necesitamos poner en la frmula k=1,96)
e: es el error muestral deseado, en tanto por uno. El error muestral es la diferencia que puede haber entre el resultado
que obtenemos preguntando a una muestra de la poblacin y el que obtendramos si preguntramos al total de ella.
Ejemplos:
Ejemplo 1: si los resultados de una encuesta dicen que 100 personas compraran un producto y tenemos
un error muestral del 5% comprarn entre 95 y 105 personas.
Ejemplo 2: si hacemos una encuesta de satisfaccin a los empleados con un error muestral del 3% y el
60% de los encuestados se muestran satisfechos signica que entre el 57% y el 63% (60% +/- 3%) del
total de los empleados de la empresa lo estarn.
Ejemplo 3: si los resultados de una encuesta electoral indicaran que un partido iba a obtener el 55% de
los votos y el error estimado fuera del 3%, se estima que el porcentaje real de votos estar en el intervalo
52-58% (55% +/- 3%).
p: proporcin de individuos que poseen en la poblacin la caracterstica de estudio. Este dato es generalmente des-
conocido y se suele suponer que p=q=0.5 que es la opcin ms segura.
q: proporcin de individuos que no poseen esa caracterstica, es decir, es 1-p.
n: tamao de la muestra (nmero de encuestas que vamos a hacer).
Altos niveles de conanza y bajo margen de error no signican que la encuesta sea de mayor conanza o est ms
libre de error necesariamente; antes es preciso minimizar la principal fuente de error que tiene lugar en la recogida
de datos.
Otra frmula para calcular el tamao de la muestra es:
n=(N^2 Z^2)/((N-1) e^2+^2 Z^2 )
Donde: n = el tamao de la muestra.
N = tamao de la poblacin.
= Desviacin estndar de la poblacin, que generalmente cuando no se tiene su valor, suele utilizarse un valor
constante de 0,5.
Z = Valor obtenido mediante niveles de conanza. Es un valor constante que, si no se tiene su valor, se lo toma en
relacin al 95% de conanza equivale a 1,96 (como ms usual) o en relacin al 99% de conanza equivale 2,58, valor
que queda a criterio del encuestador.
e = Lmite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que
vara entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.
La frmula anterior se obtiene de la frmula para calcular la estimacin del intervalo de conanza para la media:
X -Z /n ((N-n)/(N-1))X +Z /n ((N-n)/(N-1))
En donde el error es:
e=Z /n ((N-n)/(N-1))
Elevando al cuadrado el error se tiene: (e) ^2=(Z /n ((N-n)/(N-1)))^2 e^2=Z^2 ^2/n (N-n)/(N-1)
Multiplicando fracciones: e^2=( Z^2 ^2 (N-n))/n(N-1)
Eliminando denominadores: e^2 n(N-1)= Z^2 ^2 (N-n)
Eliminando parntesis: e^2 nN-e^2 n= Z^2 ^2 N- Z^2 ^2 n
Transponiendo n a la izquierda: e^2 nN-e^2 n+ Z^2 ^2 n= Z^2 ^2 N
Factor comn de n:
n(e^2 N-e^2+Z^2 ^2 )= Z^2 ^2 N
Despejando n:
n=( Z^2 ^2 N)/(e^2 N-e^2+Z^2 ^2 )
Ordenando se obtiene la frmula para calcular el tamao de la muestra:
7.1. OBJETIVOS DE LA DETERMINACIN DEL TAMAO ADECUADO DE UNA MUESTRA 21
La estimacin de parmetros consiste en el clculo aproximado del valor de un parmetro en la poblacin, utilizando
la inferencia estadstica, a partir de los valores observados en la muestra estudiada. Para el clculo del tamao de
la muestra en una estimacin de parmetros son necesarios los conceptos de Intervalo de conanza, variabilidad del
parmetro, error, nivel de conanza, valor crtico y valor (vase estimacin por intervalos).
Los datos que tenemos que incluir en la frmula para calcular el nmero de sujetos necesarios de la muestra (N) son:
1. Z/: valor de Z correspondiente al riesgo jado. El riesgo jado suele ser 0,05 y Z/ de 1,96.
3. i: Precisin con que se desea estimar el parmetro ( 2i es la amplitud del intervalo de conanza).
Los datos que tenemos que incluir en la frmula para calcular el nmero de sujetos necesarios en la muestra (N) son:
1. Z/: valor de Z correspondiente al riesgo jado. El riesgo jado suele ser 0,05 y Z/ de 1,96.
3. i : Precisin con que se desea estimar el parmetro ( 2i es la amplitud del intervalo de conanza).
Para conocer el tamao de la muestra en un estudio de investigacin en el que queremos conocer las diferencias
existentes entre dos hiptesis, debemos conocer previamente:
error tipo I y tipo II: Hay que establecer el riesgo de cometer un error de tipo I que se est dispuesto a aceptar.
Normalmente de forma arbitraria se acepta un riesgo del 5%. Adems hay que establecer el riesgo que se acepta
de cometer un error tipo II, que suele ser entre el 5 y el 20%.
Si la hiptesis es unilateral o bilateral: El planteamiento de una hiptesis bilateral o de dos colas requiere
mayor tamao muestral.
Denir la Magnitud de la diferencia efecto o asociacin que se desea detectar: A mayores diferencias prees-
tablecidas en el planteamiento de la hiptesis, menor tamao muestral, y a menor diferencia, mayor espacio
muestral.
Para calcular el nmero de sujetos necesarios en cada una de las muestras (n), debemos prejar:
Coeciente de correlacin
La asociacin entre dos variables cuantitativas necesita normalmente la utilizacin del coeciente de correlacin r de
Pearson.
7.2 Notas
[1] Tamao de una muestra para una investigacin de mercado Trabajo de dos profesoras de la Universidad Rafael Landvar.
7.3. TEXT AND IMAGE SOURCES, CONTRIBUTORS, AND LICENSES 23
7.3.2 Images
Archivo:Commons-emblem-issue.svg Fuente: http://upload.wikimedia.org/wikipedia/commons/b/bc/Commons-emblem-issue.svg Li-
cencia: GPL Colaboradores: File:Gnome-emblem-important.svg Artista original: GNOME icon artists and User:ViperSnake151
Archivo:Commons-emblem-question_book_orange.svg Fuente: http://upload.wikimedia.org/wikipedia/commons/1/1f/Commons-emblem-question_
book_orange.svg Licencia: CC BY-SA 3.0 Colaboradores: <a href='//commons.wikimedia.org/wiki/File:Commons-emblem-issue.svg'
class='image'><img alt='Commons-emblem-issue.svg' src='//upload.wikimedia.org/wikipedia/commons/thumb/b/bc/Commons-emblem-issue.
svg/25px-Commons-emblem-issue.svg.png' width='25' height='25' srcset='//upload.wikimedia.org/wikipedia/commons/thumb/b/bc/Commons-emblem-issue.
svg/38px-Commons-emblem-issue.svg.png 1.5x, //upload.wikimedia.org/wikipedia/commons/thumb/b/bc/Commons-emblem-issue.svg/
50px-Commons-emblem-issue.svg.png 2x' data-le-width='48' data-le-height='48' /></a> + <a href='//commons.wikimedia.org/wiki/
File:Question_book.svg' class='image'><img alt='Question book.svg' src='//upload.wikimedia.org/wikipedia/commons/thumb/9/97/Question_
book.svg/25px-Question_book.svg.png' width='25' height='20' srcset='//upload.wikimedia.org/wikipedia/commons/thumb/9/97/Question_
book.svg/38px-Question_book.svg.png 1.5x, //upload.wikimedia.org/wikipedia/commons/thumb/9/97/Question_book.svg/50px-Question_
book.svg.png 2x' data-le-width='252' data-le-height='199' /></a> Artista original: GNOME icon artists, Jorge 2701
Archivo:Commons-emblem-question_book_yellow.svg Fuente: http://upload.wikimedia.org/wikipedia/commons/d/dd/Commons-emblem-question_
book_yellow.svg Licencia: CC BY-SA 3.0 Colaboradores: <a href='//commons.wikimedia.org/wiki/File:Commons-emblem-query.svg'
class='image'><img alt='Commons-emblem-query.svg' src='//upload.wikimedia.org/wikipedia/commons/thumb/c/c5/Commons-emblem-query.
24 CAPTULO 7. TAMAO DE LA MUESTRA