Está en la página 1de 31

TECNOLÓGICO DE ESTUDIOS

SUPERIORES DE JOCOTITLÁN
Ingeniería Industrial
ESTADÍSTICA INFERENCIAL

INVESTIGACIÓN
UNIDAD 2
Estimaciones
Presentan:
• De Jesús Basilio Grettel Arlin _ 202150480246
• García Fuentes Leonardo Fabian _ 2021150480368
• González Salazar Luis Fernando _ 2021150480469
• Hernández García Rubí _ 2021150480509
• Huitrón Pascual Arlett _ 2021150480537
• Jacinto Jacinto Luis David _ 2021150480544
• Munguía Dávila María Magdalena _ 2021150480792
• Pérez Castañeda José Omar _ 2021150480866

DOCENTE: ING. JAIME GUTIÉRREZ


BALDERAS
GRUPO: ID-0301
1
JOCOTITLÁN, ESTADO DE MÉXICO A 06 DE NOVIEMBRE DE 2022
ÍNDICE

2.1 Introducción .............................................................................................................................. 4


2.2 Características de un estimado ........................................................................................... 5
2.2.1 Sesgo ................................................................................................................................... 5
Ejemplo ..................................................................................................................................... 5
2.2.2 Consistencia ...................................................................................................................... 6
Ejemplo ..................................................................................................................................... 6
2.2.3 Eficiencia ............................................................................................................................ 7
Ejemplo ..................................................................................................................................... 7
2.3 Estimador puntual ................................................................................................................... 8
2.3.1 Objetivo de la estimación puntual ............................................................................... 8
2.3.2 Propiedades ....................................................................................................................... 9
Ejemplos: .................................................................................................................................. 9
2.4 Estimación por intervalos ..................................................................................................... 9
Definición ..................................................................................................................................... 9
Estimación por intervalos con muestras pequeñas ....................................................... 11
Ejemplo ................................................................................................................................... 11
2.4.1 Intervalo de confianza para la media ............................................................................ 13
2.4.2 Intervalo de confianza para la diferencia de medias ................................................ 13
Intervalo de confianza para varianzas conocidas ........................................................... 14
Intervalo de confianza para varianzas desconocidas .................................................... 14
Intervalo de confianza para la diferencia de medias con varianzas diferentes y
desconocidas ............................................................................................................................ 14
Ejemplo ....................................................................................................................................... 15
2.4.3 Intervalos de confianza para la proporción................................................................. 15
Ejemplo ....................................................................................................................................... 16
2.4.4 Intervalos de confianza para la diferencia de proporciones .................................. 17
Ejemplo ....................................................................................................................................... 17
2.4.5 Intervalo de confianza para la varianza ........................................................................ 18
Ejemplo ....................................................................................................................................... 20
2.4.6 Intervalos de confianza para la relación de varianzas ............................................. 21
Ejemplo: ...................................................................................................................................... 23

2
2.5 Determinación del tamaño de muestra. ........................................................................... 24
2.5.1 Basado en la media de la Población. ........................................................................ 24
Ejemplo ................................................................................................................................... 25
Ejemplo: .................................................................................................................................. 26
2.5.2 Basado en la proporción de la Población................................................................ 26
a) Fórmula 1 ............................................................................................................................... 26
Ejemplo: .................................................................................................................................. 27
b) Fórmula 2 ............................................................................................................................... 28
Ejemplo: .................................................................................................................................. 28
Conclusiones................................................................................................................................. 29
Fuentes de consulta .................................................................................................................... 31

3
2.1 Introducción

Cuando se realiza una investigación, es usual que se estudie una muestra o


subconjunto de la población y no a la población completa debido a muchas razones
de factibilidad. El estudio de una muestra es suficiente para aproximarse al
verdadero parámetro de la población sin tener que estudiar a todos los individuos
que la con forman. Al estudiar una muestra se obtiene un estimador que no
necesariamente es igual al verdadero parámetro de la población, pero, según las
teorías del muestro, debe ser bastante próximo, mientras la muestra sea grande y
se haya seleccionado aleatoriamente si se efectúan diversas muestras de la misma
población, se encontrarán diferencias en los estimadores. En la realidad, no es
posible estudiar muestras variadas para asegurar que el verdadero parámetro
poblacional esté determinado en al menos una de ellas, ni estudiar a toda la
población de tal manera que no exista necesidad de hacer inferencia estadística.
Sólo se dispone de una muestra, y con base en ésta se realiza el análisis e
inferencia estadística de los resultados. Lo que interesa saber es si los resultados
observados en la muestra son aplicables a la población de la que procede, es decir,
que puedan ser generalizables a la población blanco. Una forma de generalizar lo
observado en una muestra a la población blanco es a través de la construcción de
intervalos de confianza de los estimadores (IC).
Los IC son un rango de valores calculado a partir de un conjunto determinado de
datos de muestra de un estimador puntual. Determinan la variabilidad esperada o
posible del estimador obtenido en una muestra, tomando en cuenta el tamaño de
esta. Para construir un IC a partir de un estimador se requiere: 1) Determinar el nivel
de confianza que se desea alcanzar, usualmente del 95 o 99% y 2) Una estimación
del error estándar, que representa la variabilidad muestral. En muestras grandes se
obtiene escasa variabilidad muestral, lo que condiciona un error estándar pequeño
e IC estrechos; en muestras pequeñas la variabilidad muestral es mayor, con error
estándar grande e IC muy amplios.
La Estadística Inferencial Clásica se establece estimando los intervalos de
confianza de los resultados puntuales y se basan en el conocimiento de la
variabilidad muestral. En el presente trabajo se ofrece una construcción e
interpretación de intervalos de confianza para medias, proporciones y varianzas
poblacionales. Se destacan las aplicaciones y el frecuente uso de los intervalos de
confianza como requisito en la presentación de resultados en investigaciones.

4
2.2 Características de un estimado

2.2.1 Sesgo

Se dice que un estimador es insesgado si la Media de la distribución del estimador


es igual al parámetro.

Estimadores insesgados son la Media muestral (estimador de la Media de la


población) y la Varianza (estimador de la Varianza de la población):

Un sesgo en estadística describe la tendencia de un profesional a subestimar o


sobrestimar el valor del parámetro. Esto ocurre cuando un profesional recoge una
cantidad inadecuada de datos o malinterpreta las implicaciones del resultado del
estudio. Por ejemplo, imaginemos que un profesional realiza un estudio para decidir
el nuevo horario de funcionamiento de su empresa y sólo utiliza las opiniones de
tres empleados. Al haber elegido un parámetro pequeño, su estudio falsearía el
deseo real de otros empleados de la empresa, lo que desbarataría la validez del
estudio.

Ejemplo

En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho
un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras= 100)
y hallan que la Media de las Medias muestrales es igual a 5.09, (la media
poblacional y la media de las medias muestrales coinciden). En cambio, la Mediana
de la población es igual a 5 y la Media de las Medianas es igual a 5.1 esto es, hay
diferencia ya que la Mediana es un estimador sesgado.

Ejemplo: La Media de las Varianzas obtenidas con la Varianza

5
En un muestreo de 1000 muestras (n=25) en que la Varianza de la población es
igual a 9.56 ha resultado igual a 9.12, esto es, no coinciden. En cambio, al utilizar la
Cuasi varianza.

La Media de las Varianzas muestrales es igual a 9.5, esto es, coincide con la
Varianza de la población ya que la Cuasi varianza es un estimador insesgado.

2.2.2 Consistencia

Un estimador es consistente si aproxima el valor del parámetro cuanto mayor


es n (tamaño de la muestra).

En estadística es la consistencia es una propiedad de ciertos estimadores,


Se dice que un estimador es consistente cuando éste converge a su valor
verdadero cuando el número de datos de la muestra tiende a infinito.
El concepto está relacionado con el del sesgo de los estimadores: un estimador
puede presentar cierto sesgo, pero si es consistente, dicho sesgo decrece conforme
crece el tamaño muestral.
Algunos estimadores consistentes son:

Ejemplo

En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho
tres muestreos aleatorios (número de muestras= 100) con los siguientes resultados:

6
Vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el
mismo valor que la Media de la población.

2.2.3 Eficiencia

Diremos que un estimador es más eficiente que otro si la Varianza de la distribución


muestral del estimador es menor a la del otro estimador. Cuanto menor es la
eficiencia, menor es la confianza de que el estadístico obtenido en la muestra
aproxime al parámetro poblacional.

En la comparación de varios procedimientos estadísticos la eficiencia es una


medida de la calidad de un estimador, de un diseño de prueba de hipótesis piones
que uno menos eficiente para lograr un desempeño dado. Este artículo trata
principalmente de la eficiencia de los estimadores.

Ejemplo

La Varianza de la distribución muestral de la Media en un muestreo aleatorio


(número de muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la
distribución de Medianas ha resultado, en el mismo muestreo, igual a 1.12, (este
resultado muestra que la Media es un estimador más eficiente que la Mediana)

7
2.3 Estimador puntual

En muchos casos no será posible determinar el valor de un parámetro poblacional


desconocido, analizando todos los valores poblacionales, pues el proceso a seguir
puede ser destructivo, o bien puede costar mucho tiempo, o mucho dinero, el
analizar cada unidad poblacional. En estos casos, la única salida es hacer uso de
la inferencia estadística, basándonos en la información contenida en un muestreo
aleatorio simple. Así, si suponemos una población definida por una variable aleatoria
X, con función de densidad f(x,2), siendo 2 un parámetro poblacional desconocido,
el objeto de la teoría de la estimación consiste en tratar de determinar el parámetro
poblacional desconocido 2, a partir de una muestra aleatoria simple de tamaño n.

En una estimación puntual se utiliza un solo número o valor para determinar una
estimación del parámetro poblacional desconocido. En la estimación puntual se
asume que el estadístico es un buen estimador del parámetro desconocido.
Obviamente cualquier estadístico no sirve, es necesario que satisfaga ciertas
propiedades.

2.3.1 Objetivo de la estimación puntual


En una estimación puntual se utiliza un solo número o valor para determinar una
estimación del parámetro poblacional desconocido. En la estimación puntual se
asume que el estadístico es un buen estimador del parámetro. Obviamente
cualquier estadístico no sirve, es necesario que satisfaga ciertas propiedades, que
se analizarán en el próximo apartado.

Estadísticos muestrales-
Parámetros poblacionales
Estimaciónpuntual
N n
Media å xi å xi
m = i=1 x = i=1
N n 2
N 2 ån(x - x)
å (x - m
i
) i
Varianza
d 2 = i=1 S 2 = i=1
N n -1

número de éxitos en N pruebas número de éxitos en n pruebas


Proporción p= p̂ =
x
N n
8
2.3.2 Propiedades

➢ Insesgadez: Un estimador es insesgado cuando la esperanza matemática del


este es igual al parámetro que se desea estimar. Por tanto, la diferencia entre el
parámetro a estimar y la esperanza de nuestro estimador tendría que ser 0.
➢ Eficiente: Un estimador es más eficiente o tiene la capacidad de estimar de
forma precisa cuando su varianza es reducida. Por lo tanto, ante 2 estimadores,
siempre elegiremos el que tenga una varianza menor.
➢ Consistencia: Un estimador consistente es aquel que a medida que la medida
que la muestra crece se aproxima cada vez más al valor real del parámetro. Por
lo tanto, cuantos más y valores entran en la muestra, el parámetro estimado será
más preciso.

Ejemplos:

La media muestral que sirve como estimación puntual de la media poblacional X̄ = μ

La desviación típica muestral que sirve de estimación para la desviación típica de


la población S=σ

2.4 Estimación por intervalos

Definición
En estadística, la estimación de intervalo es el uso de datos de muestra para estimar
un intervalo de valores plausibles de un parámetro de interés. Esto contrasta con la
estimación puntual, que da un valor único.

El intervalo dentro del cual se espera que se encuentre un parámetro poblacional


usualmente es conocido como intervalo de confianza. Se trata por lo tanto de una
variable aleatoria bidimensional, donde, por ejemplo, el intervalo de confianza para
la media poblacional es el intervalo de valores que tiene una alta probabilidad de
contener a la media de la población. Por lo tanto, en una estimación por intervalo se

9
establece el rango de valores dentro del cual se espera que se encuentre un
parámetro poblacional.

Al ser el estimador por intervalo una variable aleatoria, resulta adecuado hablar en
términos de probabilidad de que el estimador cubra el verdadero valor del
parámetro.

Si se seleccionan 100 muestras de una población y se calcula la media de las


muestras para intervalos de confianza del 95% para cada muestra; se observa que
aproximadamente 95 de los 100 intervalos de confianza contienen la media
poblacional. El nivel de confianza es la probabilidad de que el parámetro poblacional
se encuentre dentro del intervalo; los niveles de confianza más ampliamente usados
son 0.95 y 0.99, sin embargo, puede usarse cualquier probabilidad cercana a 1.

Los casos que existen en el planteamiento de los estimadores por intervalos de


confianza para una distribución normal son los siguientes, en función del
conocimiento previo que se tenga de la población:

- Intervalo de confianza para la media de una distribución normal de varianza


conocida ⇒ test Z

- Intervalo de confianza para la media de una distribución normal de varianza


desconocida

i. Muestras superiores a 30 ⇒ test Z

ii. Muestras pequeñas n< 30 ⇒ test t

- Intervalo de confianza para varianza de una distribución normal ⇒ test F

10
Estimación por intervalos con muestras pequeñas

Para poder utilizar la distribución normal es necesario que las muestras sean
grandes (n > 30) y conocer la desviación estándar. Sino se conoce σ se utiliza s,
pero si además la muestra es pequeña, los resultados no serán satisfactorios. En
estos casos se utiliza la distribución t de Student, cuyas características son que es
una distribución continua, tiene forma de campana y es simétrica, es una familia de
curvas todas con la misma media de cero, pero sus desviaciones estándar difieren
de acuerdo con el tamaño de la muestra, y que es más baja y dispersa que la
distribución normal. Cuando el tamaño de la muestra se incrementa, la distribución
t se aproxima a la normal.

Ejemplo

Se generan 100000 muestras aleatorias (n=25) de una población que sigue la


distribución normal, y resulta

La distribución de las Medias muestrales aproxima al modelo normal:

11
En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias
muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución


muestral son los valores cuya función de distribución es igual a 0.975 y 0.025
respectivamente y se pueden obtener en las tablas de la distribución Normal
estandarizada o de funciones en aplicaciones informáticas como Excel).
Seguidamente generamos una muestra de la población y obtenemos su Media, que
es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el
parámetro poblacional (5.1) está incluido dentro de sus límites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por


esa razón, la distancia desde m a la Media muestral es la misma que va de la Media
muestral a m. En consecuencia, si hacemos un muestreo con un número grande de
muestras observamos que el 95% de las veces (aproximadamente) el valor de la
Media de la población (m) se encuentra dentro del intervalo definido alrededor
de cada uno de los valores de la Media muestral. El porcentaje de veces que el valor
de m se halla dentro de alguno de los intervalos de confianza es del 95%, y es
denominado nivel de confianza.

Si queremos establecer un intervalo de confianza en que él % de veces que m se


halle dentro del intervalo sea igual al 99%, la expresión anterior es:

(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución


muestral en las tablas de la distribución Normal estandarizada o de funciones en
aplicaciones informáticas como Excel), y son los valores cuya función de
probabilidad es igual a 0.995 y 0.005 respectivamente).

12
2.4.1 Intervalo de confianza para la media
2.4.2 Intervalo de confianza para la diferencia de medias
En el campo del análisis estadístico, uno de los aspectos fundamentales que se
desea reportar de los datos estudiados, o que se encuentra en los resultados que
ofrecen los autores de una investigación, es generalizar los hallazgos observados
en una muestra a la población de la cual fue seleccionada, proceso al que
llamaremos inferencia o estimación.

La definición de la confianza se entiende usualmente desde un punto de vista


frecuentista más que probabilista en el sentido que los límites del intervalo se
calculan de tal manera que, si construimos muchos intervalos, cada vez con
distintos valores muestrales el 100(1 − α) % de ellos contendrían el verdadero valor
del parámetro.

Los intervalos de confianza de análisis no paramétricos, como por ejemplo de


medianas y otros cuartiles, también pueden ser calculados, aunque sólo con un nivel
aproximado de confianza. Un intervalo de confianza es más impreciso mientras más
ancho resulte. Esto depende esencialmente de tres factores:

• El tamaño de la muestra: muestras más


grandes darán resultados más precisos y
por ende intervalos de confianza más
angostos. El corolario es que hay que
desconfiar de las estimaciones
provenientes de muestras pequeñas,
afirmación que vale la pena repetir una y
otra vez.
• La variabilidad de la característica que se
estudia: entre y dentro de la muestra, de
errores de medición u otras fuentes.

El grado de confianza requerido: mientras más Ilustración 1 Intervalo de confianza


confianza se necesita, más ancho es el intervalo.

13
Observamos que los extremos del intervalo variarán de forma aleatoria de una
muestra a otra, pues dependen de las observaciones de la muestra, luego tanto los
extremos del intervalo como la longitud del intervalo serán cantidades aleatorias y,
por tanto, no podremos saber con seguridad si el valor del parámetro θ se encuentra
dentro del intervalo obtenido cuando se selecciona una sola muestra.

Intervalo de confianza para varianzas conocidas


Un intervalo de confianza para la diferencia de medias poblacionales de dos
distribuciones normales con desviaciones típicas σ1 y σ2 conocidas, con un nivel
de confianza 1-α construido a partir de dos muestras de tamaño n1 y n2 es:

𝜎12 𝜎22 𝜎12 𝜎22


((𝑥 𝑥2 − 𝑧𝛼2 √
̅̅̅1 − ̅̅̅) + , (𝑥
̅̅̅1 − ̅̅̅)
𝑥2 − 𝑧𝛼2 √ + )
𝑛1 𝑛2 𝑛1 𝑛2

Intervalo de confianza para varianzas desconocidas


Si ̅̅̅
𝑥1 𝑦 ̅̅̅
𝑥2 son las medias de muestras aleatorias independientes con tamaños 𝑛1 y
𝑛2 respectivamente, de poblaciones aproximadamente normales con varianzas
iguales pero desconocidas, un intervalo de confianza de (1 − 𝛼) 100% para 𝜇1 −
𝜇2 está dada por:

1 1 1 1
((𝑥 𝑥2 − 𝑡𝛼 √
̅̅̅1 − ̅̅̅) + < 𝜇1 − 𝜇2 < (𝑥 𝑥2 − 𝑡𝛼/2 √ + )
̅̅̅1 − ̅̅̅)
2 𝑛1 𝑛2 𝑛1 𝑛2

Intervalo de confianza para la diferencia de medias con varianzas


diferentes y desconocidas

𝑆12 𝑆22 2
𝑆12 𝑆22 (+ )
𝑛1 𝑛2
(𝑥 𝑥2 ± 𝑡𝛼 √
̅̅̅1 − ̅̅̅) + 𝓋= 2
2 𝑛1 𝑛2 𝑆1 𝑆22
𝑛 𝑛
( 1 − 1)2 + ( 2 − 1)2
𝑛1 𝑛2

14
Ejemplo

En un hospital se realiza un estudio sobre la influencia del estrés en el peso de los


bebés al nacer. Se consideran dos grupos de mujeres embarazadas: aquellas que
viven en el campo y aquellas que viven en la ciudad, y se obtienen los siguientes
datos sobre el peso de sus hijos.

Decide cómo influye que la madre viva


en el campo o en la ciudad en el peso de
su hijo al nacer, utilizando un intervalo de
confianza para la diferencia de medias
con un nivel de confianza del 95%.

Intervalo de confianza del 95%

1 − 𝛼 = 0.95 ⟹ 𝛼 = 1 − 0.95 = 0.05 ⟹ 𝑧𝛼 = 𝑧0.025 = 1.96


2

𝜎12 𝜎2 𝜎12 𝜎2
((𝑥
̅̅̅1 − ̅̅̅)
𝑥2 − 𝑧𝛼2 𝑛1
+ 𝑛2 , (𝑥
̅̅̅1 − ̅̅̅)
𝑥2 − 𝑧𝛼2 𝑛1
+ 𝑛2 )
2 2

0.62 0.82 0.62 0.82


((3.8 − 3.4) − 1.96√ + , ((3.8 − 3.4) + 1.96√ + ) = (0.279, 0.520)
320 240 320 240

2.4.3 Intervalos de confianza para la proporción

Un estimador puntual de la proporción P en un experimento binomial está dado por


la estadística P=X/N, donde x representa el número de éxitos en n pruebas. Por
tanto, la proporción de la muestra p =x/n se utilizará como estimador puntual del
parámetro P.

Si no se espera que la proporción P desconocida esté demasiado cerca de 0 o de


1, se puede establecer un intervalo de confianza para P al considerar la distribución
muestral de proporciones.

15
Al despejar P de esta ecuación nos queda:

En este despeje podemos observar que se necesita el valor del parámetro P y es


precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporción
de la muestra P siempre y cuando el tamaño de muestra no sea pequeño.

Cuando n es pequeña y la proporción desconocida P se considera cercana a O ó a


1, el procedimiento del intervalo de confianza que se establece aquí no es confiable,
por tanto, no se debe utilizar. Para estar seguro, se debe requerir que np o nq no
sea mayor o igual a 5, El error de estimación será la diferencia absoluta entre p y P,
y podemos tener el nivel de confianza de que esta diferencia no excederá.

Ejemplo
Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas
amplias para evaluar la función eléctrica de su producto. Todos los reproductores
de discos compactos deben pasar todas las pruebas antes de venderse. Una
muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una
o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de
los reproductores de discos compactos de la población que no pasan todas las
pruebas,

Solución:
n=500
p=15/500 = 0.03
z (0.90) = 1.645

16
Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos
que no pasan la prueba en esa población está entre 0.0237 y 0.0376

2.4.4 Intervalos de confianza para la diferencia de proporciones


Para este caso en particular se utilizará la distribución muestral de diferencia de
proporciones para la estimación de esta, Recordando la fórmula:

Aquí se tiene el mismo caso que en la estimación de una proporción, ya que al hacer
el despeje nos queda las dos proporciones poblacionales y es precisamente lo que
queremos estimar, por lo que se utilizarán las proporciones de la muestra como
estimadores puntuales:

Ejemplo

Se considera cierto cambio en un proceso de fabricación de partes componentes.


Se toman muestras del procedimiento existente y del nuevo para determinar si éste
tiene como resultado una mejoría. Si se encuentra que 75 de 1500 artículos del
procedimiento actual son defectuosos y 80 de 2000 artículos del procedimiento
nuevo también lo son, encuentre un intervalo de confianza de 90% para la diferencia
real en la fracción de defectuosos entre el proceso actual y el nuevo.

17
Solución:

Sean P1 y P2 las proporciones reales de defectuosos para los procesos actual y


nuevo, respectivamente. De aquí, P1=75/1500 = 0.05 y P2 = 80/2000 = 0.04. con el
uso de la tabla encontramos que z para un nivel de confianza del 90% es de 1.645.

Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo
procedimiento producirá una disminución significativa en la proporción de artículos
defectuosos comparado con el método existente.

2.4.5 Intervalo de confianza para la varianza

En estadística, se llama intervalo de confianza a un par o varios pares de números


entre los cuales se estima que estará cierto valor desconocido con una determinada
probabilidad de acierto. Formalmente, estos números determinan un intervalo, que
se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro
poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se
denomina nivel de confianza. En estas circunstancias, α es el llamado error
aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar
en la estimación mediante tal intervalo.

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que


un intervalo más amplio tendrá más probabilidad de acierto (mayor nivel de
confianza), mientras que, para un intervalo más pequeño, que ofrece una estimación
más precisa, aumenta su probabilidad de error.

Para la construcción de un determinado intervalo de confianza es necesario conocer


la distribución teórica que sigue el parámetro a estimar, θ.2 Es habitual que el

18
parámetro presente una distribución normal. También pueden construirse intervalos
de confianza con la desigualdad de Chebyshev.

En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un


parámetro poblacional θ que sigue una determinada distribución de probabilidad, es
una expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de
distribución de probabilidad de θ. [1]

Para estimar un intervalo de confianza para la varianza, nos ayudaremos de la


siguiente propiedad de la distribución

Consideremos dos cuantiles de esta distribución que nos dejen una probabilidad
1 - α en la ``zona central'' de la distribución:

Entonces un intervalo de confianza al nivel 1 - α para la varianza de una distribución


gaussiana (cuyos parámetros desconocemos) lo obtenemos teniendo en cuenta
que existe una probabilidad 1 - α de que:

19
Por tanto, el intervalo que buscamos es:

Ejemplo
Se estudió la altura de los individuos de una ciudad, obteniéndose en una muestra
de tamaño 25 los siguientes valores:

Calcular un intervalo de confianza con para la varianza de la altura de


los individuos de la ciudad.

Solución: Para estimar un intervalo de confianza para (varianza poblacional) el


estadístico que nos resulta útil es:

Entonces el intervalo de confianza que buscamos lo obtenemos mediante:

Percentiles del 2,5% y del 97,5% para la

distribución .

20
Por tanto, para el valor poblacional de la desviación tópica tenemos que:
con una confianza del 95%, que por supuesto contiene a las

estimaciones puntuales y calculados sobre la muestra.

2.4.6 Intervalos de confianza para la relación de varianzas

Supongamos que se tienen dos poblaciones normales e independientes con


varianzas desconocidas 𝜎12 y 𝜎22 respectivamente. Se desea encontrar un intervalo
𝜎12
de nivel 1 − 𝛼 para el cociente de las dos varianzas .
𝜎22

Se toma una muestra aleatoria de tamaño n1 de una de las poblaciones y una


muestra de tamaño n2 de la otra población. Sean 𝑆12 y 𝑆22 las dos varianzas
muestrales. Consideramos el estadístico

𝜎12
Notar que F contiene al parámetro de interés , pues
𝜎22

Se puede probar que F tiene una distribución llamada Fisher con n2 – 1 y n1 – 1


grados de libertad.

Observación: Sea X una variable aleatoria continua, se dice que tiene distribución
Fisher con u grados de libertad en el numerador y v grados de libertad en el
denominador si su fdp es de la forma:

21
En particular si W e Y son variables aleatorias independientes ji-cuadrado con u y v
grados de libertad respectivamente, entonces el cociente

Tiene una distribución Fisher con u grados de libertad en el numerador y v grados


de libertad en el denominador.

Notación: F ~ F U, V.

La gráfica de una distribución Fisher es similar a la de una ji-cuadrado, es asimétrica.


Anotamos f α, u, v al cuantil que deja a su derecha un área α de bajo la curva de
densidad.

Existe la siguiente relación entre los cuantiles de una F U, V y de una F V, U.

Planteamos la siguiente ecuación y se puede probar que la mejor


elección de a y b es:

22
Entonces

𝜎12
Despejando el cociente , queda:
𝜎22

Por lo tanto: Si se tienen dos poblaciones normales e independientes con varianzas


desconocidas 𝜎12 y 𝜎22 respectivamente, entonces un intervalo de nivel 1 − 𝛼 para el
𝜎12
cociente de las dos varianzas es:
𝜎22

Ejemplo:

Una compañía fabrica propulsores para uso en motores de turbina. Una de las
operaciones consiste en esmerilar el terminado de una superficie particular con una
aleación de titanio. Pueden emplearse dos procesos de esmerilado, y ambos
pueden producir partes que tienen la misma rugosidad superficial promedio.
Interesaría seleccionar el proceso que tenga la menor variabilidad en la rugosidad
de la superficie. Para esto se toma una muestra de 12 partes del primer proceso, la
cual tiene una desviación estándar muestral S1 = 5.1 micropulgadas, y una muestra
aleatoria de 15 partes del segundo proceso, la cual tiene una desviación estándar
muestral S2 = 4.7 micropulgadas. Se desea encontrar un intervalo de confianza de
nivel 90% para el cociente de las dos varianzas. Suponer que los dos procesos son
independientes y que la rugosidad de la superficie está distribuida de manera
normal.

Estamos en las condiciones para aplicar el cociente de varianzas

23
Buscamos en la tabla de la Fisher

Entonces el intervalo es

Como este intervalo incluye al 1, no podemos afirmar que las desviaciones estándar
de los dos procesos sean diferentes con una confianza de 90%.

2.5 Determinación del tamaño de muestra.


Cuando el objetivo es estimar un parámetro poblacional (p.ej, una media), la
(im)precisión puede definirse como la amplitud (A) de
dicho intervalo, la semi-amplitud (e = A/2) del intervalo
o el error estándar del estimador (EE). En este apartado
se mostrará cómo obtener el tamaño muestral para la
estimación de una media o de una probabilidad a partir
de e por coherencia con la medida de (im)precisión usada por R.

2.5.1 Basado en la media de la Población.

Para el cálculo del tamaño muestral es necesario fijar de antemano unos parámetros
que dependen del tipo de estudio. En el caso de la estimación de una media, estos
parámetros son la desviación típica de la respuesta (σ), la confianza (1-α) y la semi-
amplitud (e) del intervalo.

24
En esta fórmula, la confianza 1-α y la semi-amplitud e del intervalo son dos
parámetros que escoge el investigador, si bien es tradicional fijar 1-α=0.95=95%.
Por contra, la desviación típica 𝜎 de la variable de interés viene dada por el
fenómeno en estudio y su valor debe provenir de la literatura existente o de la
experiencia profesional de cada uno. La ambición del investigador determina el nivel
de confianza y la precisión, pero la desviación típica es una premisa que depende
del conocimiento previo.

Nota técnica: Se vio que la amplitud del intervalo de confianza depende del error
típico del estimador y del nivel de confianza. La forma de limitar el grado de
incertidumbre o amplitud de este intervalo sin disminuir el nivel de confianza 1-α es
disminuir el error típico de la estimación del parámetro a través de modificar el
tamaño muestral. En el caso de la estimación de la media poblacional o esperanza
matemática, el intervalo de confianza, asumiendo σ conocida, es:

Por tanto, para una semi-amplitud del intervalo de confianza que valga e, se tiene:

Aislando la n en esta expresión se obtiene la fórmula anterior.

Ejemplo

Para estudiar la imagen de los diferentes políticos, se pide a los encuestados que
los evalúen en una escala (continua) de 0 a 10 puntos. Si se acepta que la
desviación típica de esta variable es de 1.5 puntos, ¿cuántos casos se necesitan
para que la semi-amplitud del intervalo de confianza (e) al 95% de la media
poblacional sea de 0.05 puntos?

25
Nota técnica: En los cálculos de tamaño muestral el número obtenido siempre se
redondea al alza para alcanzar el objetivo especificado.
Ejemplo:

¿Cuántas mujeres será necesario estudiar para estimar la media de glucemia de las
embarazadas que han acudido al servicio de paritorio de un determinado hospital?

Estableciendo un nivel de confianza del 95% y una precisión de 5 (la diferencia entre
la media de glucemia de la población y la de la muestra, será ≤ 5 mg); faltaría por
conocer la DE. Se supone que se ha obtenido a partir de la prueba piloto y que es
de 20. Por lo que el número mínimo de mujeres que ha de estudiarse será de 62.

Nota técnica: Además, cuando se pretenda determinar el tamaño que debe tener
una muestra, hay que tener en consideración el tipo de muestreo. Casi todas las
fórmulas que se utilizan asumen que el muestreo es aleatorio, es decir, que todos
los sujetos tienen la misma probabilidad de entrar a formar parte del estudio. Si el
muestreo no es aleatorio, se tiene en cuenta el llamado «efecto de diseño», por el
que se ha de multiplicar el valor calculado. En el muestreo aleatorio este valor es 1.
Generalmente, este valor está entre 1,5 y 3. Así, un valor igual a 2, por ejemplo, con
un muestreo estratificado, significa que para obtener la misma precisión habrá que
estudiar al doble de individuos que con muestreo aleatorio. Si se necesitaban 200,
se deberán estudiar 400 (200 × 2).

2.5.2 Basado en la proporción de la Población.


a) Fórmula 1

Como ya se ha visto, el intervalo de confianza para estimar una proporción está


determinado por la estimación puntual (p0) y por la amplitud o anchura de dicho
intervalo, denominada «precisión» (d).

26
Despejando n, se obtiene la fórmula para calcular el número de observaciones o
individuos necesarios para estimar una proporción:

Por tanto, es evidente que las dos cosas más importantes que determinan el
intervalo de confianza son las que se han de tener en cuenta para calcular el tamaño
de la muestra: la anchura del intervalo o precisión (d= 1/2 de la amplitud del IC) y la
confianza o seguridad establecida (1-α). Ambas han de ser determinadas a priori
por el investigador, al igual que el valor de p que se pretende estimar, a partir de la
bibliografía o con los resultados de la prueba piloto.
Ejemplo:

¿Cuántas mujeres será necesario estudiar para estimar la prevalencia de dolor


lumbar en una población de embarazadas?

Con un nivel de confianza del 95% (α= 0,05; Zα = 1,96), un error máximo admitido
del 8% (la amplitud del IC será 16) y un valor de prevalencia conocido por la
bibliografía del 20%, el tamaño de la muestra necesario será de 96 mujeres:

Nota técnica: El tamaño de la muestra dependerá de los valores que se


introduzcan en la fórmula, de modo que, para una mayor precisión (IC más
estrecho), se necesitará un mayor tamaño de la muestra, al igual que si se dese
trabajar con un nivel de confianza mayor.

27
Existen distintas fórmulas para calcular el tamaño de la muestra, según la población
sea finita o infinita, es decir, si conocemos el número de individuos que la componen
o si lo desconocemos.

b) Fórmula 2

En el caso de una respuesta dicotómica, únicamente se deben especificar 2


parámetros: la confianza y la semi-amplitud del intervalo.

Nota técnica: El intervalo de confianza, en la situación de máxima incertidumbre,


es:

Por tanto, la amplitud del intervalo A vale:

Aislando la n se llega a la fórmula descrita.

Ejemplo:

Para conocer el porcentaje de votos de un partido político, con una semi-amplitud


total del intervalo de confianza al 95% igual a 0.5% (Amplitud del 1%) ¿Cuántos
casos se necesitan?

28
Conclusiones

 Un estimador debe tener 3 características importantes en las cuales debe tener


en sesgo, en estadística describe la tendencia de un profesional a subestimar o
sobrestimar el valor del parámetro. Es muy importante tener una eficiencia esta
es una propiedad de ciertos estimadores, en estadística esto es de gran
relevancia para la estimación de las varianzas muestrales.

 Un intervalo de confianza (estimación por intervalos) es un recorrido de valores,


basados en una muestra tomada de una población, en el que cabe esperar que
se encuentre el verdadero valor de un parámetro poblacional con cierto grado
de confianza.

 Las estadísticas de muestra representan aproximaciones a los valores reales de


la población. Pueden ser precisos, medios o imprecisos por intervalo; las
estimaciones de intervalo promedio caen entre ciertos valores mínimos o
máximos llamados confianza. Los intervalos de confianza proporcionan una
estimación de la media de la población que se encuentra dentro de un rango
determinado.

 Un tamaño de muestra pequeño, como un tamaño de muestra pequeño de uno,


da como resultado un intervalo de confianza estrecho. A medida que aumenta el
ancho del intervalo de confianza, aumenta el grado de incertidumbre en la
estimación.

 Cuando utilizamos el intervalo de confianza para una proporción, lo que estamos


haciendo es una aproximación entre la distribución binomial y la distribución
normal, por otro lado, los intervalos de confianza para la diferencia de
proporciones nos ayudan a tener los intervalos de confianza entre dos casos
particulares y así tomar una decisión de cuál es el más conveniente

 Por medio de los intervalos de confianza ya sean por diferencias de medias o


proporciones, o en su parte de manera normal, nos muestran o ayudan a
identificar la determinación de cierto un intervalo, que es calculado a partir de
datos de una muestra, por su parte la probabilidad de éxito en la estimación se

29
representa con 1 - α y se denomina nivel de confianza, entonces α es el
llamado error aleatorio o nivel de significación, esto es, una medida de las
posibilidades de fallar en la estimación mediante tal intervalo, así que
conociendo más de esto, y más a fondo entenderemos de donde salen ciertos
valores y por qué salen y se necesitan.

 Ahora bien, Los IC son una herramienta de la estadística inferencial que se


emplea con mucha frecuencia en estudios clínicos e investigaciones sobre la
funcionalidad de productos. Aplican para cualquier medida de resumen que se
obtenga de una muestra y permiten disponer de un estimador que considera la
variabilidad muestral, al generalizar el resultado observado de la muestra a la
población blanco.

En resumen, los aspectos más importantes que deben ser considerados por parte
del equipo investigador, cuando se plantea qué sujetos se estudiaran, son:
características de la población; criterios de inclusión y criterios de exclusión. Una
vez definidos, se ha de decidir si se estudia a toda la población o, si ésta es
demasiado grande, si se estudia una muestra. Es imprescindible, entonces, calcular
el tamaño necesario de la muestra según: los objetivos del estudio, el diseño
planteado y el tipo de variables; y decidir qué técnica de muestreo se utilizará para
seleccionar a los sujetos. Todo ello debe quedar reflejado con detalle en el protocolo
de investigación, en el que han de indicarse, además, los valores que se han
empleado para calcular el tamaño de la muestra.

30
Fuentes de consulta

A. . Sánchez, F. . Fernández, C. . Valero, M. . Muñoz, A. F. Rodríguez, M. . López y I. . Espejo,


«Estadística Descriptiva y Probabilidad: (Teoría y problemas),» , 2009. [En línea]:
https://libros.metabiblioteca.org/handle/001/140.

Candia B, R. & Caiozzi A., G. (2005). Intervalos de Confianza. Revista médica de Chile, 133(9).
https://doi.org/10.4067/s0034-98872005000900017

Carmen Fuentelsaz Gallego. (2003). Cálculo del tamaño de la muestra. Matronas profesión, 5(18),
5-13. https://dialnet.unirioja.es/servlet/articulo?codigo=6125940

García C, Almenara J. Determinación del tamaño de muestra en variables cualitativas en las que
se desconoce el valor del parámetro. Med Clin (Barc). 1999; 112: 797-798.

Gomez, Ricardo, «estadistica inferencial,» sesgomx, 04 09 2019. [En línea]. Available:


https://historiadelaempresa.com/sesgo-en-la-estadistica.

González, J. A., Rufino, H., Riba, L. & Cobo, E. (2014). BIOESTADÍSTICA PARA NO
ESTADÍSTICOS. Tamaño muestral. https://dialnet.unirioja.es/servlet/libro?codigo=140843

Maricruz. "intervalos de confianza para la varianza". Estadística inferencial


https://maricruzvelazquezmendez.blogspot.com/2018/11/intervalos-de-confianza-para-la-
varianza.html (accedido el 5 de noviembre de 2022).

Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A. S. (3ra. Edición 2006).
Estadística Descriptiva y Probabilidad. Cádiz: Servicio de Publicaciones de la Universidad de Cádiz.
Montgomery, D., & R., R. (2da. Edición)

Ronald E. Walpole, Raymound H. Myers, Probabilidad y estadística para ingeniería y ciencias.


Novena edición. PEARSON EDUCACION; México, 2012.

Rio, A. Q. del. (2019, 4 septiembre). 7.4 Intervalos de confianza | Estadística Básica Edulcorada.
https://bookdown.org/aquintela/EBE/intervalos-de-confianza.html

31

También podría gustarte