Está en la página 1de 35

Mdulo 1

Unidad 1
Lectura 1

Inferencia Estadstica

Materia: Herramientas Matemticas V Estadstica II


Profesora: Mgter. Vernica Herrero

Unidad 1: Estimadores

1.1. Estimacin
La mayora de las aplicaciones actuales de la Estadstica se relacionan con
la obtencin de conclusiones referidas a la poblacin a partir de la evidencia
Bibliografa Bsica recogida en una muestra correspondiente a una pequea porcin de casos,
en situaciones prcticas como las siguientes:
Para cumplir con los
objetivos de la Unidad 1
del programa, es necesario
profundizar en los temas Analizar la evolucin del total de desempleados en las grandes
desarrollados en el ciudades de un pas
Captulo 9 y 10 del texto Medir el gasto promedio de las familias en cierto rubro de inters
de Bibliografa Bsica. Cuantificar la variabilidad de un producto surgido de cierto proceso
(Berenson & Levine, industrial estandarizado.
1996), relacionndolos Conocer el porcentaje de votantes que prefieren a cierto candidato
con los comentarios, con anterioridad a una eleccin
ejemplos y
recomendaciones de las
lecturas del mdulo. Las tcnicas correspondientes a la Inferencia estadstica permiten dar
respuesta a estos interrogantes, utilizando slo una pequea porcin de
casos de la poblacin de inters. Para los objetivos de informacin
Captulos: 9 y 10 propuestos como ejemplos previamente, podran tomarse muestras de las
(Apartados 10.1, 10.2, 10.3, poblaciones:
10.4, 10.5, 10.6, 10.7,
10.8,10.9)
Seleccionando individuos residentes en las ciudades de inters, y
registrando su estado ocupacional.
Obteniendo por muestreo un conjunto de familias, y consultndolas
sobre el gasto en ese rubro.
Estudiando por muestreo la caracterstica de anlisis de un grupo de
productos elaborados en tal sistema.
Indagando a un conjunto representativo de votantes del lugar en
cuestin.

Como primer paso en este estudio de la Estadstica inferencial, nos


detendremos en este mdulo en las diferentes tcnicas que permiten dar
considerado plausible acerca de un valor de un parmetro poblacional de
inters (tales como la media poblacional, la varianza poblacional, la
proporcin poblacional, o las diferentes entre medias o entre proporciones).



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|2

1.1.1 Parmetros y estadgrafos


En primer lugar, recordemos la diferencia entre Parmetro y Estadgrafo.

Los parmetros son las medidas de resumen poblacionales que permiten


describir el conjunto de datos analizados. Ejemplos de parmetros son la
media poblacional, la varianza poblacional, etc.

Los estadgrafos son las medidas anlogas obtenidas a partir de datos


muestrales. Este tipo de medida incluye a la media muestral, la varianza
muestral, la proporcin muestral, entre otras. Estos valores, tambin
conocidos como estimadores, se utilizan para proporcionar una idea del
valor de la medida poblacional correspondiente, pero considerando slo
datos muestrales.

1.1.1.1 Estimadores: caractersticas de un


buen estimador

Comenzaremos estudiando la media muestral, el estimador natural de la


media poblacional, que es la medida de tendencia central ms utilizada. La
medida a su vez, es la medida ms adecuada para describir un conjunto de
datos que se distribuye siguiendo el modelo normal.

Las tres propiedades que nos interesa destacar de la media muestral como
estimador de la media poblacional son:

1. Imparcialidad (insesgada)
2. Eficiencia
3. Consistencia

Imparcialidad

Decimos que un estimador es imparcial o insesgado cuando su valor


esperado coincide con el parmetro poblacional que estima.

En el caso de la media muestral, esta propiedad se demuestra muy


fcilmente con unos pocos pasos algebraicos:



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|3

Partiendo de la frmula de clculo de la media muestral, estudiada en el


curso anterior de estadstica:

x i
x= i =1

La esperanza o valor esperado de la media muestral es:

n
xi
E ( x ) = E i =1
n

Como la esperanza de una constante es la constante, resulta:

n
E xi
E ( x ) = i =1
n

Como la esperanza de una suma es igual a la suma de las esperanzas:

n
E ( xi )
E ( x ) = i =1
n

Y como sabemos que la esperanza de la variable estudiada es :

n.
E(x) =
n

Simplificando resulta:

E (x ) =



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|4

Eficiencia

Un estimador es eficiente si en promedio se acerca ms al parmetro


estimado que cualquier otro estimador.

La media muestral cumple este requisito para la media poblacional, ya que


tiene la mnima varianza entre los estimadores de la media poblacional.

Consistencia

Decimos que un estimador es consistente si a medida que se aumenta el


tamao de la muestra, el estimador se aproxima sistemticamente al valor
del parmetro poblacional.

Al aumentar el tamao de la muestra, cada vez, las diferencias entre la


media muestral y la media poblacional se van haciendo ms reducidas.

El cumplimiento de estas propiedades hace de la media muestral el mejor


estimador de la media poblacional.

Error estndar de la media

Es intuitivamente fcil de visualizar que a medida que mayor es la muestra


Error estndar de la (es decir, ms elementos de la poblacin se incluyen para estimar la media
media muestral), menor ser la dispersin de los valores respecto de la media
muestra, ya que el efecto de un valor extremo tiende a diluirse a medida que
Es el nombre que recibe la
desviacin estndar de ms elementos se toman en consideracin para el clculo.
la media muestral. Es
decir, es la desviacin Por esto, la desviacin estndar de la media muestral, conocido como error
estndar de la distribucin estndar de la media, se relaciona de la siguiente manera con la desviacin
de muestreo de la media. estndar poblacional:

x
x =
n


Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|5

Como puede observarse, la frmula anterior refleja la relacin indicada


entre la dispersin de la muestra y el tamao muestral.

Distribucin en el muestreo de la proporcin

Para las variables categricas, en las cuales es registra la posesin o no de


Distribucin de una caracterstica, el parmetro poblacional de inters es la proporcin, que
muestreo de un indica justamente qu parte de la poblacin posee una caracterstica.
estimador
Por ejemplo, si en una poblacin de 10.000 individuos, 2400 tiene ojos
La distribucin de
probabilidades de los claros, decimos que
valores posibles que
puede asumir un
estadstico muestral,
calculados a partir de X
muestras del mismo
P=
N
tamao y extrado en forma
aleatoria de la misma
2400
poblacin, se llama P=
distribucin muestral de 10000
ese estadstico.
es la proporcin de individuos con ojos claros en la poblacin.

Por ejemplo, puede ser la


distribucin de muestreo
Donde X es la cantidad de casos de la poblacin que tienen la caracterstica,
de la media como vimos
en el punto anterior, o de conocidos habitualmente como xitos. N es el tamao de la poblacin.
la proporcin, entre
otros.
El estimador de P ser p, la proporcin muestral. Para obtener p:

x
p=
n

Donde x es la cantidad de xitos en la muestra, y n es el tamao de la


muestra.

Como puede observarse la proporcin se ubica en el intervalo [0,1], siendo


los extremos del intervalo las situaciones extremas en las que ningn
individuo posee la caracterstica o bien, cuando la poseen todos. Estos dos
casos extremos son los que implican la menor dispersin entre los
individuos (ya que por tener o por no tener la caracterstica, los individuos


Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|6

se parecen), y en cambio, la mayor dispersin ocurre en los valores


intermedios (cuando p=0,5), ya que es mxima la cantidad de individuos
que difieren de p.

P(1 P)
p =
n

La distribucin muestral de la proporcin sigue una distribucin


binomial, que puede aproximarse a la normal cuando se cumplen las
siguientes condiciones:

np > 5

n(1 p ) > 5

Estas condiciones implican requerimientos de muestras de tamao


considerables para las estimaciones de proporciones.

Muestreo de poblaciones finitas

Cuando se selecciona una muestra, debe establecerse con precisin cul fue
el mecanismo con el que se procedi a escoger a los elementos que
componen la muestra.

El diseo bsico que est implcito en muchos de los desarrollos estadsticos


supone que los elementos fueron seleccionados con reemplazo. Esto
implica que una vez que se seleccion un individuo o elemento, ste vuelve
a formar parte de los casos seleccionables, por lo que la probabilidad de
seleccin de los distintos casos no cambia a medida que se va construyendo
la muestra.

En diversas situaciones de aplicacin de muestreo esto no ocurre de esta


manera por diferentes razones. Por ejemplo, cuando realizamos una
encuesta para un estudio de mercado, no tiene demasiado sentido encuestar
dos veces al mismo individuo en un estudio; incluso en ocasiones, como las


Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|7

aplicaciones para control de calidad, pueden implicar la destruccin del


caso seleccionado en la muestra, tal como cuando se analiza la duracin de
una pieza, por lo que difcilmente en tales casos usemos un muestreo con
reposicin.

En todas estas situaciones debemos introducir una correccin a las


frmulas que ajuste la diferente probabilidad de seleccin que tienen los
Factor de Correccin
para poblaciones sucesivos casos que integran la muestra.
finitas

Dado que este factor ser


siempre menor que 1, su Esta correccin se conoce como factor de correccin para poblaciones
aplicacin reducir el finitas (fcpf) y se obtiene a travs del siguiente cociente:
error estndar, haciendo
las estimaciones ms
exactas.
N n
fcpf =
N 1

Con esta frmula se ajusta tanto el error estndar de la media muestral:

x N n
x =
n N 1

como el error estndar de la proporcin muestral:

P(1 P) N n
p =
n N 1

El fcpf siempre ser menor que 1, lo cual implica que en este tipo de
muestreo, las estimaciones surgidas de este tipo de muestreo resultan ms
exactas, o lo que es lo mismo tienen menos dispersin en el muestreo.

Preguntas de reflexin:

Por qu usamos los estimadores habituales para estimar la media


poblacional o la proporcin poblacional?
Cmo se comporta el error estndar si tomamos muestras ms
grandes?
Qu debe verificarse para que la proporcin muestral se distribuya
normal? Qu implicancias tiene para la muestra?
Por qu se usa el fcpf? Cmo afecta al error estndar?



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|8

1.1.1.2 Estimacin puntual y por intervalos

Hasta ahora hemos visualizado el proceso de estimacin simplemente como


proporcionar un valor nico que sirva como referencia indicativa del valor
que suponemos que alcanza el parmetro poblacional de inters. En
definitiva, como se indica en Berenson y Levine (p. 344):

La estimacin puntual consiste en una sola estadstica de


muestra que se utiliza para estimar el valor verdadero del
parmetro de la poblacin.

Tabla: Estimadores puntuales

Parmetros Estimadores puntuales ms


usuales

Media poblacional Media muestral

Proporcin poblacional Proporcin muestral

Varianza poblacional Varianza muestral

Sin embargo, debido con este procedimiento no estamos aprovechando


realmente la potencialidad de conocer con qu probabilidad de acertar
hacemos nuestra afirmacin. Debemos considerar la variabilidad posible
que es propia de un estimador, ya que el valor de ste depender de la
muestra que haya sido seleccionada.

Para tener en cuenta esta caracterstica, la estimacin por intervalos


considera justamente las distribuciones en el muestreo de los respectivos
estimadores.

Cuando obtengamos un intervalo, estaremos considerando una


determinada confianza de estimar acertadamente el parmetro.



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|9

En definitiva vamos a poder decir, a travs del intervalo, con una confianza
establecida por el investigador (por ejemplo para la estimacin de la media
poblacional) que un intervalo a partir de la estimacin puntual ms /
menos un cierto margen de error o error de muestreo, atrapa al
verdadero valor del parmetro. Los intervalos en este caso tendrn la
siguiente estructura:

Bibliografa Bsica
x margen de error
Captulo 9: Repaso de
conceptos como
distribucin de muestreo
y Teorema Central del Estimacin por intervalo de la media
Lmite.
Caso: Desviacin estndar conocida
Captulo 10: Desarrollo
de los procedimientos
para estimacin de la
media y la proporcin. Por el Teorema del lmite central (que Ud. conoce la materia previa,
pero recordaremos ms adelante en el mdulo), sabemos que es posible
determinar qu porcentaje de las medias muestrales se ubican a
determinada distancia de la media de la poblacin, teniendo en cuenta la
distribucin de la medias muestrales.

Si bien tenemos en cuenta ese razonamiento, permanentemente en las


diferentes investigaciones que llevemos a cabo, tomaremos una nica
muestra, a partir de la cual haremos la estimacin, considerando lo que
probabilsticamente podemos deducir de la distribucin de muestreo de la
media.

La idea de este tipo de estimacin es considerar que la muestra que fue


Error de muestreo de seleccionada nos proporciona una de las medias muestrales posibles, que
la media con una probabilidad 1-a, se encuentra a una distancia de

Es la diferencia entre la
media de la muestra y la
media de la poblacin. Su x
frmula es: Z
1
2 n
x
Z
1
2 n
con respecto del valor de la media poblacional.
Observe que debe
diferenciarse del error Donde, Z es el valor de la tabla estandarizada normal, que tiene

estndar de la media, 1
2
dado que debe
multiplicarse por Z.
acumulado hasta ese valor 1 de probabilidad. Este valor se denomina
2


Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|10

valor crtico de la distribucin. Algunos de los valores crticos ms usados,


correspondientes a los niveles de confianza (1-) usuales, son:

(1-) Z
1
Tabla de la 2

distribucin normal

Es importante que Ud.


pueda manejar con 95% 1,96
suficiente solvencia la
tabla de la distribucin
normal. En el anexo del
mdulo tiene disponible 99% 2,575
una tabla y en los anexos
del texto de bibliografa
bsica otra con un
formato diferente. 90% 1,645
Verifique cul le resulta
ms prctica para
trabajar. A modo de
ejercitacin, intente
encontrar los valores
crticos ms usados que se
presentan en la tabla a la
derecha. Por lo tanto a travs de la construccin de un intervalo de confianza, con un
nivel de confianza de 1-, podemos decir que la media poblacional es
atrapada por el intervalo:

x x
[LI , LS ] = x Z1 ;x + Z
1

2 n 2 n

Donde LI = lmite inferior y LS= lmite superior.

Si se tomaran todas las muestras posibles de tamao n de la poblacin bajo


estudio, en el (1-)% de los intervalos surgidos de tales estimaciones de la
media poblacional, la media poblacional (que es fija aunque desconocida
para nosotros) quedara incluida en tales intervalos. Como destacamos
antes, ya que en cualquier estimacin trabajaremos con una muestra al
azar, podemos decir que la probabilidad de que se cumpla la condicin
detallada es (1-).



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|11

Veamos un ejemplo:

Deseamos estimar la altura promedio de una poblacin de


estudiantes varones de esta Universidad.

Utilizaremos para ello una muestra aleatoria de 10 estudiantes. Los


valores obtenidos de la medicin de la altura son:

Caso Altura (en cm.)

1 162

2 176

3 169

4 165

5 171

6 172

7 169

8 168

9 175

10 167

De un estudio previo se conoce que la varianza de esta poblacin es


16 cm2.

Cmo podemos estimar la altura promedio?

En primer lugar veamos una estimacin puntual de la media, que va


a estar dada por la media muestral.

x i
x= i =1

x = 169,4 cm



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|12

Para obtener el intervalo de confianza suponemos que la variable


aleatoria se distribuye normal, y calculamos cada uno de los valores
que indicamos. Trabajaremos con un 1-=0,95.

Z = 1,96
1
2

x = 4

n = 10

Por lo tanto el intervalo que surge ser:

[LI , LS ] = [166,920; 171,879]

Y podemos expresar la conclusin: Con un nivel de confianza del


95%, la altura promedio de los varones de la poblacin de
estudiantes de la Universidad es atrapada por el intervalo [166,92
cm; 171,88 cm].

Como puede analizarse a partir del ejemplo, el intervalo que surge depende
de la muestra que ha sido seleccionada, en el caso de haber elegido a otros
estudiantes y no a esos, el resultado de la media muestra podra haber sido
distinto, y en consecuencias tambin el intervalo obtenido.

Estimacin por intervalo de la media

Caso: Desviacin estndar desconocida




Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|13

En general, cuando no se dispone de informacin referida a la media


poblacional, tampoco resulta conocido el valor de la varianza poblacional.
Si tal es la situacin, no podemos aplicar la distribucin normal para la
estimacin por intervalos de la media poblacional.

Para solucionar esta situacin, se aplica la distribucin t, que


presentaremos, para calcular el intervalo de confianza.

Distribucin t de Student1
Tabla de la
distribucin t

Es importante que Ud. La distribucin t de Student fue estudiada por William Gosset (1876-1937)
pueda manejar con quien se ocupaba de tareas de control de calidad en la fbrica de cervezas
suficiente solvencia la
Guiness, en Irlanda.
tabla de la distribucin t
de Student. En el anexo
del mdulo tiene
disponible una tabla. Ms
Figura: Comparacin de la distribucin t y la normal estndar para
adelante en el mdulo se
explica cmo trabajar con diferentes grados de libertad
la tabla.
Distribucintcon2gradosde
libertad

Grficodeladistribucin
normal:lnearoja

Grficodeladistribucint:azul


1
La nota que se indica est basada en:
http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstudent.html. En
este sitio se pueden realizar visualizaciones de las diferentes distribuciones que
estudiaremos en este mdulo, simplemente ajustando los parmetros de las
mismas. En la pgina
http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstudentprob.html
pueden calcularse y compararse las respectivas probabilidades de la tabla normal
y la tabla t de Student.


Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|14

Distribucintcon5gradosde
libertad

Distribucintcon15gradosde
libertad

Distribucintcon30gradosde
libertad

Observarcmoprcticamente
nohaydiferenciaentreambas
distribuciones.

Fuente: Elaboracin propia en base a herramienta de simulacin provista


por:
http://www.geogebra.org/en/upload/files/Juan%20de%20Jesus%20Sand
oval/la_distribucion_normal_t_student.html

Desarroll trabajos acerca de esta distribucin que le permitiera analizar


muestras pequeas. Debido a ciertas restricciones que le impona la fbrica,
no pudo publicar sus trabajos con su nombre y us el seudnimo de
Student, dado que consider que su aporte podra servir a otros.

La distribucin t, en realidad est conformada por una familia de variables


aleatorias continuas. Esta familia se diferencia entre s de acuerdo con un
parmetro que se denomina "grados de libertad".


Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|15

La distribucin t es similar a la distribucin normal estndar: tiene forma


de campana, su media es 0 y es simtrica. Su varianza es mayor que 1.
Cuanto ms grados de libertad posee, ms cercana a 1 es la varianza y ms
se aproxima la distribucin t de Student a la normal estndar. Si trabajamos
con ms de 30 grados de libertad, se considera despreciable la diferencia
entre la t de Student y la normal estndar.

Para buscar valores de t en la tabla se procede de manera similar a la


correspondiente a la bsqueda en la tabla normal estndar. En este caso
debern considerarse los grados de libertad (indicados en las filas de las
tablas).

Por ejemplo, si queremos buscar el t (con 25 grados de libertad) que


acumula 0,90 de probabilidad hasta ese valor, en primer lugar ubicamos la
fila que corresponde a esos grados de libertad. Como la tabla que
presentamos en este caso seala las probabilidades a la derecha del valor
respectivo, se debe seleccionar el valor de t asociado con una probabilidad a
la derecha de 0,10. A continuacin recuadramos el valor de t buscado.



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|16

En otras ocasiones, como ya han aprendido para la distribucin normal,


queremos conocer cul es la probabilidad acumulada hasta determinado
valor de la variable aleatoria. Podemos querer saber qu probabilidad hay
de que una variable t, con 17 grados de libertad sea menor o igual a 2,1098.
Nuevamente, buscamos en la tabla la fila correspondiente a los grados de
libertad que nos interesan. Luego, entre los valores de la fila, identificamos
el valor que nos interesa. En este caso, la columna donde se ubica el 2,1098
nos seala que la probabilidad de obtener un nmero mayor a ese valor de t
es 0,025. Por lo tanto, la probabilidad acumulada hasta ese nmero ser su
complemento: 1 0,025 = 0,975.

Estadstica I

En el curso anterior se ha
estudiado la
distribucin normal,
sus parmetros y la Para los diversos problemas en los cuales es requieren valores de t o
manera de obtener probabilidades asociadas con valores de la variable t se pueden utilizar las
probabilidades en la tablas que indicamos a continuacin. Existen diversas tablas publicadas. La
tabla correspondiente. Su nica recomendacin importante para el uso es considerar cuidadosamente
Ud. no recuerda esos
qu probabilidad estn informando, y hacer uso de la propiedad de simetra
conceptos y
procedimientos deber de la distribucin t (que se debe aplicar de manera anloga a la de la
repasarlos a partir del distribucin normal, ya conocida del curso anterior).
material de ese curso.


Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|17

Figura: Valores de la Tabla t (segn la probabilidad de la cola superior)

Fuente: Anderson , David y Sweeney, (2008) Dennis J. Estadstica para


administracin y economa. 10 edicin. Cengage Learning. Mxico.



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|18

Figura: Valores de la Tabla t (segn la probabilidad de la cola superior)


Continuacin



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|19

Las distribuciones t de Student son parecidas a la normal. Se pueden


utilizar para hacer estimaciones de la media cuando se desconoce la
varianza (situacin que de ms est decirlo es la habitual) y se usan
muestras pequeas.

Tabla de la
Los intervalos as obtenidos son, no podra ser de otra manera, ms grandes
distribucin t
y menos precisos que los que se obtendran si conocemos la varianza en una
En el punto 10.3 del texto distribucin normal.
de Berenson & Levine
(1996) se desarrolla el
tema de estimacin de un
intervalo de confianza de Si la variable aleatoria X es normal, el estadstico:
la media cuando la
desviacin estndar es
desconocida. Le
recomendamos que siga x
con detalle los ejemplos s
propuestos en el texto,
verificando si llega a los
n
mismos resultados.

Se distribuye t con n-1 grados de libertad.

Para buscar valores de probabilidad o de la variable aleatoria en la tabla t,


se deben considerar los grados de libertad de la variable que se est
analizando.

Grados de libertad

La idea de grados de libertad remite a la cantidad de valores de una muestra


que podran asumir cualquier valor. Si nosotros conocemos o calculamos en
funcin de tales datos un estadstico, podemos perder grados de libertad o
valores que pueden variar, del total de datos disponibles de la muestra. El
Diccionario de metodologa estadstica (Gonzalo Gonzalvo Maynar, 1978,
Morata Ed., Madrid) indica que cuando un estadstico se usa en la
estimacin de un parmetro poblacional, los grados de libertad dependen
de las restricciones impuestas sobre las observaciones: cada restriccin
hace perder un grado de libertad.



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|20

Estimacin del intervalo de confianza

El intervalo de confianza para la media se construir segn el siguiente


esquema:

Nivel de confianza: (1-)%

Lmites del intervalo:

Inferior:

s
x t
1 ; n 1 n
2

Superior:

s
x +t
1 ; n 1 n
2

Veamos un ejemplo:

Repitamos el ejercicio vinculado con la altura promedio de una


poblacin de estudiantes varones de esta Universidad, pero ahora
suponiendo que no conocemos la varianza poblacional.

Supongamos que estimamos con los datos de la muestra la varianza


muestral, s2 = 16,16 cm2.

Trabajaremos con un 1-=0,95.

x = 169,4 cm



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|21

t = 2,2622
9;1
2

s = 4,02

n = 10

Por lo tanto el intervalo que surge ser:

[LI , LS ] = [166,52; 172,26]

La conclusin en este caso ser: Con un nivel de confianza del 95%,


la altura promedio de los varones de la poblacin de estudiantes de
la Universidad es atrapada por el intervalo [166,52 cm; 172,26 cm].

Si comparamos el resultado con el caso de varianza conocida (a


pesar de la pequea diferencia de varianzas implicadas), el intervalo
que surge de considerar que no conocemos la varianza implica un
intervalo ms amplio (menos preciso), lo cual est asociado con un
mayor margen de seguridad debido a que no conocemos el
verdadero valor de la varianza.



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|22

Estimacin por intervalo de la proporcin


Bibliografa Bsica

En el punto 10.6 del texto En el caso de datos categricos tambin podemos aplicar estimacin por
de Berenson & Levine intervalos de la proporcin poblacional de casos que poseen cierta
(1996) se desarrolla el caracterstica.
tema de estimacin de un
intervalo de confianza
para la proporcin. Le
recomendamos que siga Tal como sealamos en el caso de la estimacin puntual, la base de la
con detalle los ejemplos estimacin va a estar dada por la proporcin muestral.
propuestos en el texto,
verificando si llega a los
mismos resultados.
La propiedad que permite hacer uso de la distribucin normal en este caso
es la aproximacin de la distribucin binomial a la normal cuando se
verifican las condiciones:

P.n5

(1-P).n5

Con esta premisa, los lmites del intervalo van a estar dados por:

p (1 p ) p (1 p )
[LI , LS ] = p Z1 ;p+Z
1

2
n 2
n

Donde:



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|23

p = proporcin muestral
P = proporcin poblacional
n = tamao de la muestra
Z = valor crtico de la distribucin normal

Veamos un ejemplo de estimacin de una proporcin poblacional.

En un estudio de opinin pblica, en el cual se quiere estimar la proporcin


de votantes que elegirn a un candidato, se realiza una encuesta a una
muestra representativa de votantes. El tamao de la muestra es 400 casos.

Tras procesar las encuestas se obtiene que 178 individuos estn seguros que
elegirn al candidato en cuestin en la eleccin.

Cmo se estima la proporcin de electores que tendr el candidato en la


eleccin, con un nivel de confianza del 99%?

La estimacin puntual que surge de la proporcin muestral es:

178
p=
400
p = 0,445

Veamos si se cumplen las condiciones para aproximar la distribucin


binomial a la distribucin normal.

n . p = 400 . 0,445

= 178

n (1-p) = 400 . 0,555

= 222

En ambos casos se cumple la condicin.



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|24

Ahora procedamos a estimar el intervalo de confianza:

p (1 p ) p (1 p )
[LI , LS ] = p Z1 ;p+Z
1

2
n 2
n

El estadstico Z que tiene acumulada una probabilidad de 0,995,

Z = 2,576
1
2

0,445(1 0,445) 0,445(1 0,445)


[LI , LS ] = 0,445 2,576 ;0,445 + 2,576
400 400

[LI , LS ] = [0,38;0,51]

Como conclusin, podemos decir que con un nivel de confianza del 99%, el
intervalo [0,38; 0,51] atrapa el verdadero valor poblacional de la proporcin
de votantes que tienen decidido votar al candidato. Observe que,
dependiendo de los porcentajes de otros candidatos, esto podra significar
que pierda la eleccin (si obtiene un porcentaje inferior al 50% de los votos,
algn otro candidato puede alcanzar un porcentaje mayoritario) o bien que
gane (si obtiene un valor mayor al 50% de los votos), en ambos casos, con el
nivel de confianza definido, que siendo tan elevado, le permite estar casi
seguro de que el resultado se encuentra en el intervalo estimado.



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|25

Resumen de casos de estimacin

La siguiente figura resume los casos presentados de estimacin por


intervalos.

Figura:

Fuente: Elaboracin propia

Cundo aplicar cada estadstico?

Como mencionamos, para estimar el intervalo para la media


poblacional, se aplica distribucin normal, en caso de distribucin
normal de la variable de estudio, o en su defecto, si la muestra es
Anexo de Ejercitacin
superior a 30 casos.
Adems de los ejemplos
presentados en la lectura y El uso de la distribucin t en la estimacin por intervalos de la
el texto bsico, Ud. media poblacional es un requisito cuando desconocemos la varianza
encontrar en el anexo del poblacional, con distribucin de la variable de estudio normal si la
mdulo una gua de muestra es menor a 30 casos, y es recomendable, en idnticas
ejercicios y sus condiciones, an cuando la muestra es mayor. De hecho, los
respectivas soluciones. paquetes estadsticos, usan las pruebas t, en los casos en los que se
Le recomendamos que necesita estimar la varianza.
realice toda la ejercitacin
posible para identificar con
claridad las situaciones en Materia:HerramientasMatemticasV(EstadsticaII)
las que se aplica cada Profesora:Mgter.VernicaHerrero|26
prueba estudiada.

Para la estimacin de la proporcin poblacional, debe verificarse que


tanto p.n5 y (1-p).n5.

Determinacin del tamao de la muestra


Hasta ahora, se ha estudiado el modo de realizar la estimacin de
parmetros poblacionales a partir de una muestra de tamao n. Sin
Bibliografa Bsica
embargo, una cuestin fundamental en la estadstica inferencial es
Le recomendamos que determinar cul es el tamao de muestra ptimo para lograr resultados
revise en detalle este tema dentro de un error mximo tolerable, minimizando los recursos empleados.
en el texto de Berenson
y Levine (1996). Los 1. Determinacin del tamao de la muestra para la media
puntos 10.7, 10.8 y 10.9
desarrollan estos La frmula que permite obtener el tamao adecuado de la muestra para la
conceptos. Preste estimacin de la media es la siguiente:
atencin a los ejemplos
all propuestos.

Esta frmula se obtiene despejando la frmula del error de muestreo e.


Esto puede verse con detenimiento en el punto 10.7 del texto de Berenson &
Levine (1996). Como se observa, son datos necesarios para el clculo:
conocer el nivel de confianza deseado (a partir del cual se obtiene Z), tener
en cuenta el error mximo permitido o aceptable en cada caso (e) y la
desviacin estndar de la poblacin (posiblemente a partir de datos
histricos o conocidos por la experiencia del investigador)

2. Determinacin del tamao de la muestra para la


proporcin
Si se cuenta con una
estimacin de p

En este caso, la regla La frmula que permite obtener el tamao adecuado de la muestra para la
prctica indica que se estimacin de la proporcin es la siguiente:
utilizar un valor de
p=0,5 dado que es un
criterio conservador
(que dar un mayor valor
de la varianza y del
tamao de la muestra.
Al igual que en el caso anterior, esta frmula se desprende de la expresin
Ver Berenson & Levine del error de muestreo (en este caso para la proporcin). Adems de los
(1996) punto 10.8 datos sobre el nivel de confianza deseado y el error mximo tolerable, debe
conocerse alguna estimacin o dato histrico sobre para p. De lo contrario,
una regla prctica consiste en darle a p el valor 0,5. De esta manera, la
expresin p (1-p) ser la mayor posible, al igual que el tamao de muestra
determinado.

3. Determinacin del tamao de la muestra para la


poblaciones finitas.



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|27

Tal como se estudi en los casos anteriores la frmula para obtener el


tamao de la muestra se obtiene despejando n de la frmula del error (en el
que se utilizar el factor de correccin por poblacin finita. (Ver punto 10.9
del texto).

1.1.2 Concepto de Distribucin de muestreo


Dada una poblacin, si se consideran todas las muestras posibles de un
mismo tamao, n, para las que se calcula un estadstico determinado (por
ejemplo, la media o la proporcin), la distribucin de los resultados
obtenidos de esas muestras recibe el nombre de distribucin de
muestreo.

Un resultado fundamental para la Inferencia estadstica:

Bibliografa Bsica Si bien este tema fue desarrollado en Estadstica I, es muy importante
recordarlo, ya que es un concepto fundamental para la Inferencia
Le recomendamos que estadstica, del cual se nutren los contenidos de este y los siguientes
revise en detalle este mdulos.
tema en el texto de
Berenson y Levine
(1996). El Captulo 9,
tambin estudiado en
Estadstica I, trata el 1.1.2.1 Teorema Central del lmite
tema de la distribucin
de muestreo y el
Teorema Central del
Lmite. Este resultado nos indica que:

Cuando el tamao es suficientemente grande, la distribucin de la variable


aleatoria media muestral puede aproximarse a la distribucin normal. Y
esta relacin es vlida, cualquiera sea la distribucin de los datos de la
variable original.

Por ejemplo, si estamos interesados en analizar la media de ingresos en


cierta poblacin, an cuando la distribucin de ingresos en esa poblacin
no sea normal, si tomamos muestras suficientemente grandes, la
distribucin en el muestreo de las medias muestrales de ingresos, tendrn
una forma aproximadamente normal.

Analicemos un ejemplo:


Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|28

Analizamos la supervivencia adulta en una pequea poblacin rural. Uno de


los datos que analizamos es el nmero de hermanos tenidos en promedio.
Consideremos la siguiente tabla que indica el nmero de hermanos tenidos
por todos los residentes.
Tabla: Datos de anlisis
Caso Nmero de Caso Nmero de
hermanos hermanos
1 8 26 4
2 4 27 2
3 1 28 6
4 5 29 4
5 2 30 3
6 6 31 1
7 4 32 7
8 6 33 3
9 4 34 5
10 2 35 2
11 5 36 4
12 3 37 5
13 2 38 9
14 6 39 4
15 2 40 3
16 1 41 5
17 4 42 4
18 5 43 3
19 4 44 1
20 3 45 4
21 7 46 5
22 4 47 6
23 5 48 3
24 2 49 8
25 4 50 3

La informacin que proveemos en la tabla anterior corresponde a los 50


residentes mayores de 40 aos del paraje.


Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|29

Vamos a analizar qu hubiramos estimado si las muestras hubieran sido


de tamaos: 3, 5 y 7 casos. Para ejemplificar, tomamos 10 muestras de cada
tamao, de entre todas las posibles de ese tamao.

Tamao 3
Muestra Casos
seleccionados
1 24 14 7
2 37 4 49
3 11 41 48
4 21 7 8
5 6 50 30
6 10 40 48
7 4 26 34
8 3 11 17
9 47 40 9
10 31 47 11

Tamao 5
Muestra Casos seleccionados
1 9 45 21 14 15
2 33 41 33 16 38
3 34 49 22 35 17
4 49 30 17 15 8
5 39 21 35 2 28
6 11 26 40 24 45
7 42 5 31 23 19
8 19 38 46 50 6
9 37 33 31 8 48
10 34 46 33 46 37

Tamao 7



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|30

Muestra Casos seleccionados


1 40 41 20 14 7 17 8
2 32 30 50 23 45 21 4
3 13 37 30 4 2 13 22
4 1 17 35 10 25 19 28
5 17 14 2 42 6 28 31
6 41 9 27 36 10 14 20
7 38 1 36 2 18 38 48
8 18 7 48 35 6 46 17
9 2 23 39 14 33 19 48
10 8 13 49 20 27 48 34

Ahora, para muestra, calculemos la media muestral:

Tamao 3
Muestra Valores de los Media muestral
casos de la
muestra
seleccionada
1 2 6 4 4
2 5 5 8 6
3 5 5 3 4,33
4 7 4 6 5,67
5 6 3 3 4
6 2 3 3 2,67
7 5 4 5 4,67
8 1 5 4 3,33
9 6 3 4 4,33
10 2 6 5 4,33



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|31

Tamao 5
Muestra Valores de los casos de la Media muestral
muestra seleccionada
1 4 4 7 6 2 4,6
2 3 5 6 1 9 4,8
3 5 8 4 2 4 4,6
4 8 3 4 2 6 4,6
5 4 7 2 4 6 4,6
6 5 4 3 2 4 3,6
7 4 2 1 5 4 3,2
8 4 9 5 3 6 5,6
9 5 3 1 6 3 3,6
10 5 5 3 5 5 4,6

Tamao 7
Muestra Valores de los casos de la muestra Media
seleccionada muestral
1 3 5 3 6 4 4 6 4,43
2 7 3 3 5 4 7 5 4,86
3 2 5 3 5 4 2 4 3,57
4 8 4 2 2 4 4 6 4,28
5 4 6 4 4 6 6 1 4,43
6 5 4 2 4 2 6 3 3,71
7 9 8 4 4 5 9 8 6,71
8 5 4 3 2 6 5 4 4,14
9 2 5 4 6 3 4 3 3,86
10 6 2 8 3 2 3 5 4,14

Veamos a continuacin cmo se distribuyen las medias muestrales


obtenidas en cada tamao de muestra, a travs de histogramas de
frecuencia:

Figura: distribucin de medias muestrales de muestras de tamao 3



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|32

Figura: distribucin de medias muestrales de muestras de tamao 5

Figura: distribucin de medias muestrales de muestras de tamao 7



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|33

A partir de este ejemplo, qu reflexin puede hacer, teniendo en cuenta el


Teorema del Lmite central, vinculada con la media muestral que se analiza
de una muestra en particular (y el tamao de una muestra que se
considere), y la probabilidad de aproximarse lo ms posible al verdadero
valor del parmetro poblacional de inters?

Bibliografa Lectura 1
Berenson & Levine (1996). Estadstica para administracin y
economa. Sexta Edicin. Ed. Prentice Hall Hispanoamericana. Mxico.

www.uesiglo21.edu.ar



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|34



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|35

También podría gustarte