Está en la página 1de 18

República Bolivariana de Venezuela

Ministerio del Poder Popular para la Educación Universitaria, Ciencia y Tecnología


Universidad Nacional Experimental de Lara
Martín Luther King
Barquisimeto, Estado Lara

FUNDAMENTOS DE INFERENCIA

SECCIÓN 4202 FISIOTERAPIA


ELIZABETH PINEDA
16.279.833
1. INFERENCIA ESTADÍSTICA

Inferir es, en general, establecer un nuevo conocimiento partiendo de uno ya "dado". La inferencia
estadística va a ser una forma especial de realizar este proceso. Consiste, básicamente, en determinar
algunas características desconocidas de una población partiendo de datos muestrales conocidos. Estas
características poblacionales serán "inferidas" utilizando los recursos de la TEORÍA MATEMATICA DE
LA PROBABILIDAD.

Fundamentalmente la Inferencia Estadística consiste en la resolución de dos grandes categorías de


problemas:

* LA ESTIMACIÓN: Determinar el valor de una característica poblacional desconocida. Podrá ser:

Por punto: Determinación de un valor poblacional concreto

Por intervalo: Determinación de un intervalo en el que quede incluido el valor de la


característica con cierto grado de probabilidad.

* EL CONTRASTE DE HIPOTESIS: Determinar si es aceptable, partiendo de los datos muestrales,


que la característica poblacional estudiada tome un valor determinado o bien que pertenezca a un
intervalo de valores determinado. (Es obvio que estos dos problemas de conocimiento pueden, muy
bien , considerarse como dos tipos particulares de problemas de decisión estadística y así, de hecho
,lo considera una de las escuelas metodológicas de la Estadística)

Conceptos básicos.

POBLACION: Colectivo sujeto del estudio .Cabe distinguir entre Población (colectivo en el que
estamos considerando la magnitud sujeta a estudio) y Universo (colectivo de todos los elementos
sujetos del estudio ,en el que no consideramos la magnitud). El universo es , por tanto, el conjunto de
individuos que poseen la característica o características sujetas a estudio , y éstas en su conjunto
forman la población

MUESTRA: Un subconjunto cualquiera de la población. Para que la muestra nos sirva para extraer
conclusiones sobre la población deber ser representativa, lo que se consigue seleccionando sus
elementos al azar, lo que da lugar a una muestra aleatoria

MUESTREO: Procedimiento para la obtención de una muestra

MUESTREO OPINATICO: es aquel procedimiento de selección de los elementos muestrales que se


realiza según el criterio del investigador. Es , por tanto ,subjetivo y la muestra obtenida puede no ser
representativa de la población.

MUESTREO ALEATORIO: es aquel procedimiento de selección de la muestra en el que todos y cada


uno de los elementos de la población tiene una cierta probabilidad de resultar elegidos. De esta
forma, si tenemos una población de N elementos y estamos interesados en obtener una muestra de n
elementos (muestra de tamaño n), cada subconjunto de n elementos de la población tendrá también
una cierta probabilidad de resultar la muestra elegida.
Si designamos por Mi a cada uno de estos subconjuntos, con
i= 1,2, 3,...N; cada Mi tendrá una cierta probabilidad P(Mi) de
resultar elegido.
MUESTREO ALEATORIO SIMPLE: (M.A S.): es aquel muestreo aleatorio en el que la probabilidad de
que un elemento resulte seleccionado se mantiene constante a lo largo de todo el proceso de
obtención de la misma. La técnica del muestreo puede asimilarse a un modelo de extracción de bolas
de una urna con devolución ( reemplazamiento) de la bola extraída. Un mismo dato puede, en
consecuencia, resultar muestreado más de una vez .Cada elección no depender de las anteriores y ,
por tanto, los datos muestrales serán estocásticamente independientes.

MUESTREO IRRESTRICTO (SIN REEMPLAZAMIENTO): en este tipo de muestreo la probabilidad de


obtener un dato en cada selección viene influida por los resultados anteriores , en la medida en que
en este muestreo no permitimos que un mismo dato sea seleccionado más de una vez (lo que hace
variar las probabilidades en cada extracción muestral) . Se corresponde con un modelo de extracción
sin reemplazamiento .Teniendo en cuenta la convergencia de la distribución hipergeométrica a la
binomial es fácil intuir que cuando la población sea muy grande (N® ¥) el muestreo irrestricto puede
considerarse como muestreo aleatorio simple.

El estudio de muestras para poblaciones grandes consideraremos sólo el muestreo simple .En el
estudio de muestras de poblaciones finitas es, sin embargo , fundamental analizar las distribuciones
muestrales que generará su adecuado muestreo irrestricto)

MUESTRA GENERICA DE TAMAÑO n: Es una variable


aleatoria n-dimensional; X=[x1 ,x2 ,x 3,...,xn ] donde cada xj
(con j=1,2,...n)

(Cada dato muestral genérico) recorre todos los posibles valores que puede tomar el j-simo elemento
de una muestra de n elementos.

Por tanto, una muestra concreta (ya obtenida) será un valor particular (una realización concreta) de la
muestra genérica.

En la medida en que en el muestreo aleatorio cada elemento de la población tiene una probabilidad
de ser elegido, cada dato muestral genérico será una variable aleatoria que tendrá asociada una
función de probabilidad f(x) (de cuantía o de densidad) según una determinada distribución que
llamaremos distribución básica, madre, o, simplemente, distribución de la población y recorrerá
todos los posibles valores de la población.

Si trabajamos con un muestreo aleatorio simple (M.A.S.), cada dato muestral genérico será
estocásticamente independiente de los demás y por tanto la función de probabilidad (cuantía o
densidad) conjunta de la muestra genérica será:

f(x) = f ( x1 ,x2 ,x3 ,x4 ……. ,x n ) =f(x1 )· f(x2 )· f(x3 )…..f(x n )


Por ser las xj variables aleatorias independientes.
ESTADÍSTICO: Es cualquier función de los valores muestrales que dependa exclusivamente de estos. En
la medida en que los valores muestrales son variables aleatorias también lo serán las funciones de éstos:
los estadísticos.

A modo de ejemplo podemos decir que son estadísticos la media muestral ,la varianza muestral , la
cuasivarianza muestral , dado que son funciones de valores muéstrales exclusivamente y no sería
estadístico la función

Que si bien contiene la varianza muestral, también depende de la poblacional y por tanto no es
función exclusiva de la muestra.

Como hemos visto, los estadísticos son variables aleatorias por lo que tendrán determinas
distribuciones de probabilidad y determinados parámetros ( media , varianza , etc) .Para el desarrollo
de la inferencia es imprescindible conocer dichas distribuciones y parámetros , consiguiendo
establecer entonces las relaciones entre éstas y las de la población , pudiendo entonces inferir las
características desconocidas de ésta.

Tras un breve recorrido por las técnicas de muestreo pasaremos a desarrollar las distribuciones de
probabilidad de los principales estadísticos.

TÉCNICAS DE MUESTREO

Es evidente que un conocimiento previo por parte del investigador de las características de la realidad
de la población mejora o debe mejorar los resultados inferenciales que se pueden obtener de la
obtención de una muestra; parace claro que si bien el método de selección aleatoria conlleva los
mejores resultados, quizá el adecuar la manera de extraer la muestra a las posibles distintas
naturalezas de las poblaciones puede mejorar el rendimiento, aunque sólo fuere a nivel de coste. No
es por tanto lo mismo intentar conocer la altura media de los habitantes de un país, que el número de
errores en una gran contabilidad, dado que la naturaleza de su universo y por tanto el
comportamiento poblacional son distintos. Es por ello, que para distintas "naturalezas" del problema
han de plantearse distintas soluciones , si bien todas ,o casi todas, pasan por la aleatoriedad ; de ahí
que se establezcan diversas "técnicas" o "métodos" de muestreo , de los que brevemente
enumeramos algunos .

Muestreo aleatorio sistemático. Esta técnica consiste en extraer elementos de la población mediante
una regla sistematizadora que previamente hemos creado (sencillamente cada K elementos). Así;
numerada la población, se elige (aleatoriamente) un primer elemento base , partiendo de éste se
aplica la regla para conseguir los demás hasta conseguir el tamaño muestral adecuado . Este
procedimiento conlleva el riesgo de dar resultados sesgados si en la población se dan periodicidades
o rachas.

Muestreo aleatorio estratificado. Consiste en considerar categorías típicas diferentes entre sí


(estratos) que poseen una gran homogeneidad interna (poca varianza interna) y no obstante son
heterogéneos entre sí (mucha varianza entre estratos). La muestra se distribuye (se extrae de) entre los
estratos predeterminados según la naturaleza de la población (ejemplo: sexo, lugar geográfico, etc.).
Dicha distribución-reparto de la muestra se denomina afijación; que puede ser de varias formas:

*afijación simple: a cada estrato le corresponde igual número de elementos (extracciones) muestrales.

*afijación proporcional: la distribución se hace de acuerdo con el peso (tamaño) relativo de cada
estrato.

*afijación óptima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se
considera la proporción y la desviación típica.

Muestreo por conglomerados. La unidad muestral es un grupo de elementos de la población que


forman previsiblemente una unidad de comportamiento representativo. Dicha unidad es el
conglomerado cuyo comportamiento interno puede ser muy disperso (varianza grande) pero que
presumiblemente poseerá un comportamiento próximo a otros conglomerados (varianza entre
conglomerados, pequeña). Los conglomerados se estudian en profundidad hasta conseguir el tamaño
muestral adecuado.

Muestreo por unidades monetarias .Este tipo de muestreo es especifico en auditoría , viene a
solucionar el problema que plantea la selección aleatoria de partidas contables que no tienen
(evidentemente) el mismo monto económico y por ello en un muestreo estrictamente aleatorio se
"primaría" la inspección de las numerosas partidas pequeñas irrelevante s dejando sin inspección las
importantes y cuantiosas. Para solucionarlo el M.U.M plantea la selección aleatoria no de asientos o partidas
sino de unidades monetarias (ordenadas y numeradas) de tal manera que el defecto anterior se subsana al
tener una partida cuantiosa más probabilidades de ser elegida pues contiene más unidades monetarias.

Otros tipos de muestreo. Es evidente que los planteados no son las únicas técnicas de muestreo. Existen otras
como las no aleatorias: Cuotas, Intencional, Incidental, bola de nieve, etc. Y otras aleatorias y complicadas como
el muestreo por superpoblaciones, y que en este curso no podemos desarrollar.

2. DISTRIBUCIONES EN EL MUESTREO DE LOS PRINCIPALES ESTADÍSTICOS.

Esquemáticamente pueden plantearse algunos de los posibles escenarios que darán origen a las diversas
distribuciones muéstrales que después desarrollaremos.
Una vez esquematizadas las distribuciones de algunos de los principales estadísticos muestrales
pasamos a desarrollar algunas de ellas.

DISTRIBUCIONES MUESTRALES PARA UNA POBLACIÓN CUALQUIERA

Si desconocemos la distribución de la población no podemos, evidentemente, conocer la distribución


de la muestra genérica de tamaño n y, en consecuencia, no podremos llegar a conocer la distribución
de los estadísticos. Pero sí se podrá, en cualquier caso, determinar los principales parámetros
(esperanza y varianza) de las principales distribuciones muestrales(de estadísticos) en función de los
parámetros de la distribución de la población ( media poblacional, varianza poblacional .)

DISTRIBUCIÓN DE LA MEDIA MUESTRAL

La esperanza de la media muestral coincide con la media de la población, en definitiva ; la media de


la media muestral es la media de la población :

en efecto :

así :

dado que para cualquier valor de i ya que pertenece a la población

Tendríamos que

En cuanto a la varianza de la media muestral , tendremos que si el muestreo utilizado es aleatorio

simple se cumple que en efecto :

dado que en el muestreo aleatorio simple las observaciones o elementos son independientes
tendremos covarianzas iguales a cero y dado que :

para todo i

Tendremos
evidentemente la desviación típica será

en el caso de que el muestreo que hayamos realizado no sea aleatorio simple y que sea irrestricto y
por tanto se plantee que no hay reemplazamiento siendo la población finita la media de la media
muestral no sufrirá variaciones , pero no así la varianza de la media muestral que se verá afectada por
el "coeficiente corrector de poblaciones finitas" (C .C .P.F. ), o "coeficiente de exhaustividad" , ya
conocido del estudio de la distribución hipergeométrica. Así la varianza de la media muestral quedaría
:

siendo N el tamaño de la población (finita) y el resto lo habitual

Dado que ya conocemos la media y la varianza de la media muestral , y dado que podríamos tomar la
muestra genérica como una sucesión de variables aleatorias independientes de media y varianza
conocida , aunque con distribución desconocida , y en aplicación del T.C.L. , tendremos que la ley de la
media muestral sea cual sea la distribución poblacional viene dada por :

DISTRIBUCIÓN DE LA VARIANZA MUESTRAL

Al igual que la media muestral la varianza muestral tendrá media y varianza dado que se trata
también de una variable aleatoria.

La media de la varianza muestral con M.A.S. es:

la varianza muestral tiene expresión

Si cambiamos de origen a la media de la población la varianza muestral no varía así:

aplicando el operador esperanza tendremos:

= =
dado que

y también

En cuanto a la varianza de la varianza muestral diremos que su expresión es la siguiente, que


admitimos sin demostrar que:

DISTRIBUCIONES MUESTRALES PARA UNA POBLACIÓN NORMAL

De todas las posibles distribuciones básicas es, sin duda, la distribución normal la más importante por
el gran número de poblaciones que se distribuyen así, real o asintóticamente, (en virtud de los
Teoremas Límite).

en los su apartados siguientes ,consideraremos que conocemos la distribución de la población y que


‚ ésta , es normal . Consideraremos igualmente muestreo aleatorio simple (m.a.s.)

DISTRIBUCIÓN DE LA MEDIA MUESTRAL

Si la población se distribuye N [ ; ] entonces

en efecto si y dado que siendo independientes pues realizamos


m.a.s. y en
aplicación del teorema fundamental de las distribuciones normales obtendremos

DISTRIBUCIÓN DE LA VARIANZA MUESTRAL

En lugar de obtener la distribución muestral del estadístico varianza muestral

L [S2] que nos llevaría a conclusiones próximas a las anteriormente descritas en el apartado en el que la
población no era normal, es más conveniente la utilización de la variable aleatoria

que recordemos , no es un estadístico , y que contiene en su expresión a la varianza muestral y a la


poblacional , de ahí su utilidad dado que ambas quedan relacionadas con una distribución conocida ; la
jhi-dos.
No demostramos la relación pero la recordamos dada su importancia posterior.
DISTRIBUCIÓN DE LA MEDIA MUESTRAL CON VARIANZA DESCONOCIDA.

En apartados anteriores estudiamos el comportamiento de la media muestral y vimos que ésta


dependía tanto del valor de la media poblacional, como de la varianza poblacional, parece lógico
pensar que si nuestro interés radica en inferir comportamientos de la población partiendo de la
muestra parece ilógico pensar que conozcamos la varianza . De ahí la importancia de establecer una
distribución para la media muestral que la relacione únicamente con la poblacional, lo que hará que
conocida la muestral concreta podamos aventurar el comportamiento de la poblacional.

Así tendríamos:

lo que da lugar a :

Hemos visto sin demostrar que

Conocemos que luego simplificando tendríamos

expresión que relaciona ambas medias y la varianza muestral con una distribución conocida

DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL DE UNA CARACTERÍSTICA.

Por su importancia incluimos esta distribución si bien podría considerarse un caso particular de la
media muestral con distribución poblacional desconocida.

Así dada una población que por sus características consideramos binomial pues nuestra intención es
inferir la proporción de éxitos p y por tanto la población sería B (N,p) podemos considerar cada
realización muestral xi una D(p) cuya media sería p y su varianza pq

la variable dado que las xi son independientes y en aplicación del TCL tendríamos

que
DISTRIBUCIÓN DE LA DIFERENCIA DE DOS MEDIAS MUESTRALES DE DOS POBLACIONES
NORMALES.

Por último y dado el gran número de intervalos y contrastes que emanan de la utilización de esta
distribución creemos necesario incluirla . Así:

Dadas dos variable X e Y que se distribuyen normalmente y por


tanto:

e
realizado un MA.S de tamaños nx y ny respectivamente tendremos por conocido que y también

por lo que la variable n aplicación del teorema fundamental de las

Distribuciones normales será:

3. EL TEOREMA CENTRAL DEL LÍMITE

En el resultado anterior, veíamos que la suma de variables aleatorias normales es otra variable
aleatoria normal. Sin embargo, la normalidad de una suma de variables no se limita solo a las
variables normales. El teorema central del límite es un resultado matemático que garantiza que, si
sumamos variables cualesquiera (no necesariamente normales), la variable suma también seguirá una
distribución normal (esto siempre que se cumplan algunas condiciones básicas).

Así, cuando un dato o resultado es la suma de contribuciones independientes, de igual magnitud y


“con un tamaño típico”, este resultado corresponderá a una distribución Gaussiana siempre que el
número de contribuciones (el número de sumandos) sea un número considerable (no pequeño).

Con un tamaño típico se quiere garantizar que las contribuciones tienen que “estar controladas”,
esto es, las contribuciones extremas tienen que estar controladas por una probabilidad muy
pequeña (En jerga matemática las contribuciones tiene que tener varianza finita).
A continuación se presenta el enunciado del TCL en la versión de Lindeberg y Lévy.

Teorema:
Sea X1, X2, ..., Xn, un conjunto de variables aleatorias independientes idénticamente
distribuidas, cada una de ellas con función de distribución F, y supongamos que E(Xk)
= μ y var(Xk) = σ2 para cualquier elemento del conjunto. Si designamos a la suma
normalizada de n términos con el símbolo:

entonces la sucesión de sumas normalizadas converge en ley a la variable aleatoria


Normal tipificada Z ~ N(0, 1), es decir:

El teorema anterior tiene dos importantes corolarios:


 Si consideramos la suma ordinaria de las n variables aleatorias, es decir, Sn = X1 + X2 + ... + Xn,
entonces la sucesión de sumas ordinarias converge en ley a una Normal de media nμ y varianza nσ2.
 Si consideramos el promedio de las n variables aleatorias, es decir, n-1Sn, entonces la sucesión de
promedios converge en ley a una Normal de media μ y varianza n-1σ 2.
 Comentarios al teorema:

 La convergencia a la Normal tipificada se produce con cualquier tipo de variable que cumpla las
condiciones del teorema, sea discreta o absolutamente continua.

 Un sinónimo para indicar que una sucesión converge en ley a una Normal es señalar que es
asintóticamente Normal.

 El TCL presenta el comportamiento de sumas infinitas de variables aleatorias.

Existen otras versiones del TCL dónde se relajan las condiciones de la versión de Lindeberg y Lévy, que,
como se ha visto, obliga a las variables aleatorias a tener idénticas medias varianzas. Dichas versiones
del TCL necesitan el conocimiento de conceptos matemáticos que exceden el nivel al que se orienta
Statmedia, y por esta razón se omite su enunciado.

El Teorema Central del Límite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribución (cualquiera que éste sea), la suma de ellas se
distribuye según una distribución normal.

Ejemplo: la variable "tirar una moneda al aire" sigue la distribución de Bernouilli. Si lanzamos la
moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre si) se distribuye
según una distribución normal.

Este teorema se aplica tanto a suma de variables discretas como de variables continuas.
Los parámetros de la distribución normal son:

Media: n * m (media de la variable individual multiplicada por el número de variables independientes)

Varianza: n * s2 (varianza de la variable individual multiplicada por el número de variables individuales)

Veamos un ejemplo:

Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el valor 0. Cada
lanzamiento es una variable independiente que se distribuye según el modelo de Bernouilli, con media
0,5 y varianza 0,25.

Calcular la probabilidad de que en estos 100 lanzamientos salgan más de 60 caras.

La variable suma de estas 100 variables independientes se distribuye, por tanto, según una distribución
norma

Media = 100 * 0,5 = 50

Varianza = 100 * 0,25 = 25

Para ver la probabilidad de que salgan más de 60 caras calculamos la variable normal tipificada
equivalente:

* 5 es la raíz cuadrada de 25, o sea la desviación

* típica de esta distribución Por lo tanto:

P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228

Es decir, la probabilidad de que al tirar 100 veces la moneda salga más de 60 caras es tan sólo del 2,28%

4. ERROR ESTÁNDAR DE ESTIMACIÓN


El error estándar de estimación mide la desviación en una muestra valor poblacional.
Es decir, el error estándar de estimación mide las posibles variaciones de la media
muestral con respecto al verdadero valor de la media poblacional.

Por ejemplo, si se desea conocer la edad promedio de la población de un país (media


poblacional) se toma un pequeño grupo de habitantes, a los que llamaremos «muestra».
De ella se extrae la edad promedio (media muestral) y se asume que la población tiene esa
edad promedio con un error estándar de estimación que varía más o menos.
Habría que reseñar que es importante no confundir la desviación estándar con el
error estándar y con el error estándar de estimación:
1- La desviación estándar es una medida de la dispersión de los datos; es decir, es una
medida de la variabilidad de la población.

2- El error estándar es una medida de la variabilidad de la muestra, calculada en base a


la desviación estándar de la población.

3- El error estándar de estimación es una medida del error que se comete al tomar la
media muestral como estimación de la media poblacional.

DISTRIBUCIÓN MUESTRAL

Si suponemos que la estatura promedio de las argentinas entre 19 y 49 años es de 161 centímetros
con una desviación estándar de 6,99, estos serían los parámetros de la población. Si sacamos cinco
muestras aleatorias de veinte observaciones de esta población van a arrojar resultados distintos a
estos valores. Algunas muestras van a tener una media por arriba de la media real y otras van a tener
una media por debajo.

Ejemplo 5.1 (Distribución de muestras)


Figura 5.1: Cinco Muestras de 20 observaciones

Como lo podemos observar en la figura 5.1 la distribución de las muestras es simétrica y normal. La
media de nuestras muestras es 161,42; ligeramente por arriba de la media real, y la desviación
estándar es de 6,17; más de medio centímetro por debajo de la desviación estándar de la población.
La distribución muestral tiene algunas propiedades que son útiles para nuestro trabajo estadístico:

* Se aproxima a una distribución normal. Esto se conoce como el teorema del límite central.
* La media de la distribución es igual (o casi igual) a la media de la población.
* La dispersión es menor a la de la población general.

El número (3) de la lista tiene su lógica ya que en una muestra aleatoria un valor frecuente tiene más
probabilidad de ser seleccionada que un valor extremo. La diferencia entre curva normal de la
población y la curva de la distribución muestral está ilustrada en la figura 5.2
El error estándar de estimación se puede calcular para todas las medidas que se obtienen
en las muestras (por ejemplo, error estándar de estimación de la media o error estándar
de estimación de la desviación estándar) y mide el error que se comete al estimar la
verdadera medida poblacional a partir de su valor muestral

A partir del error estándar de estimación se construye el intervalo de confianza de la


medida correspondiente.

La estructura general de una fórmula para el error estándar de estimación es la siguiente:

Error estándar de estimación = ± Coeficiente de confianza * Error estándar

Coeficiente de confianza = valor límite de un estadístico muestral o distribución de


muestreo (normal o campana de Gauss, t de Student, entre otras) para un determinado
intervalo de probabilidades.

Error estándar = desviación estándar de la población dividida por la raíz cuadrada del
tamaño de la muestra.

El coeficiente de confianza indica la cantidad de errores estándar que está dispuesto a


sumar y restar a la medida para tener un cierto nivel de confianza en los resultados.

Ejemplos de cálculo
Suponga que está tratando de estimar la proporción de personas en la población que
tienen una conducta A, y se desea tener un 95% de confianza en sus resultados.

Se toma una muestra de n personas y se determina la proporción muestral p y su


complemento q.

Error estándar de estimación (EEE) = ± Coeficiente de confianza * Error estándar

Coeficiente de confianza = z = 1.96.

Error estándar = la raíz cuadrada de la razón entre el producto de la proporción muestral


por su complemento y el tamaño de la muestra n.
A partir del error estándar de estimación se establece el intervalo en el que se espera se
encuentre la proporción poblacional o la proporción muestral de otras muestras que se
puedan formar de esa población, con un 95% de nivel de confianza:

p – EEE ≤ Proporción poblacional ≤ p + EEE

Ejercicios resueltos

Ejercicio 1

1- Suponga que está tratando de estimar la proporción de personas en la población que


tienen preferencia por una fórmula láctea enriquecida, y se desea tener un 95% de
confianza en sus resultados.

Se toma una muestra de 800 personas y se determina que 560 personas en la muestra
tiene preferencia por la fórmula láctea enriquecida. Determine un intervalo en el cual se
pueda esperar se encuentre la proporción poblacional y la proporción de otras muestras que
se puedan tomar de la población, con un 95% de confianza

* Calculemos la proporción muestral p y su complemento:

p = 560/800 = 0.70

q = 1 – p = 1 – 0.70 = 0.30

* Se conoce que la proporción se aproxima a una distribución normal a muestras de tamaño

grande (mayores a 30). Entonces, se aplica la llamada regla 68 – 95 – 99.7 y se tiene que:

Coeficiente de confianza = z = 1.96

Error estándar = √(p*q/n)

Error estándar de estimación (EEE) = ± (1.96)*√(0.70)*(0.30)/800) = ± 0.0318

c) A partir del error estándar de estimación se establece el intervalo en el que se espera


se encuentre la proporción poblacional con un 95% de nivel de confianza:

0.70 – 0.0318 ≤ Proporción poblacional ≤ 0.70 + 0.0318


0.6682 ≤ Proporción poblacional ≤ 0.7318

Se puede esperar que la proporción de muestra del 70% cambie hasta en 3.18 puntos
porcentuales si toma una muestra diferente de 800 individuos o que la proporción real de
la población está entre 70 – 3.18 = 66.82% y 70 + 3.18 = 73.18%.

Ejercicio 2

2- Tomaremos de Spiegel y Stephens, 2008, el siguiente caso estudio:

Del total de calificaciones de matemáticas de los alumnos de primer año de una universidad
se tomó una muestra aleatoria de 50 calificaciones en la que la media encontrada fue 75
puntos y la desviación estándar, 10 puntos. ¿Cuáles son los límites de confianza de 95%
para la estimación de la media de las calificaciones de matemática de la universidad?

a) Calculemos el error estándar de estimación: Coeficiente de confianza del 95%

= z = 1.96 Error estándar = s/√n

Error estándar de estimación (EEE) = ± (1.96)*(10√50) = ± 2.7718

b) A partir del error estándar de estimación se establece el intervalo en el que se espera se


encuentre la media poblacional o la media de otra muestra de tamaño 50, con un 95% de
nivel de confianza:

50 – 2.7718 ≤ Promedio poblacional ≤ 50 + 2.7718

47.2282 ≤ Promedio poblacional ≤ 52.7718

c) Se puede esperar que la media de la muestra cambie hasta en 2.7718 puntos si se toma una
muestra diferente de 50 calificaciones o que la media real de las calificaciones de matemática de la
población de la universidad está entre 47.2282 puntos y 52.7718 puntos.

También podría gustarte