Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SUPERIORES DE JOCOTITLÁN
Ingeniería Industrial
ESTADÍSTICA INFERENCIAL
INVESTIGACIÓN
UNIDAD 2
Estimaciones
Presentan:
• De Jesús Basilio Grettel Arlin _ 202150480246
• García Fuentes Leonardo Fabian _ 2021150480368
• González Salazar Luis Fernando _ 2021150480469
• Hernández García Rubí _ 2021150480509
• Huitrón Pascual Arlett _ 2021150480537
• Jacinto Jacinto Luis David _ 2021150480544
• Munguía Dávila María Magdalena _ 2021150480792
• Pérez Castañeda José Omar _ 2021150480866
2
2.5 Determinación del tamaño de muestra. ........................................................................... 24
2.5.1 Basado en la media de la Población. ........................................................................ 24
Ejemplo ................................................................................................................................... 25
Ejemplo: .................................................................................................................................. 26
2.5.2 Basado en la proporción de la Población................................................................ 26
a) Fórmula 1 ............................................................................................................................... 26
Ejemplo: .................................................................................................................................. 27
b) Fórmula 2 ............................................................................................................................... 28
Ejemplo: .................................................................................................................................. 28
Conclusiones................................................................................................................................. 29
Fuentes de consulta .................................................................................................................... 31
3
2.1 Introducción
4
2.2 Características de un estimado
2.2.1 Sesgo
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho
un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras= 100)
y hallan que la Media de las Medias muestrales es igual a 5.09, (la media
poblacional y la media de las medias muestrales coinciden). En cambio, la Mediana
de la población es igual a 5 y la Media de las Medianas es igual a 5.1 esto es, hay
diferencia ya que la Mediana es un estimador sesgado.
5
En un muestreo de 1000 muestras (n=25) en que la Varianza de la población es
igual a 9.56 ha resultado igual a 9.12, esto es, no coinciden. En cambio, al utilizar la
Cuasi varianza.
La Media de las Varianzas muestrales es igual a 9.5, esto es, coincide con la
Varianza de la población ya que la Cuasi varianza es un estimador insesgado.
2.2.2 Consistencia
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho
tres muestreos aleatorios (número de muestras= 100) con los siguientes resultados:
6
Vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el
mismo valor que la Media de la población.
2.2.3 Eficiencia
Ejemplo
7
2.3 Estimador puntual
En una estimación puntual se utiliza un solo número o valor para determinar una
estimación del parámetro poblacional desconocido. En la estimación puntual se
asume que el estadístico es un buen estimador del parámetro desconocido.
Obviamente cualquier estadístico no sirve, es necesario que satisfaga ciertas
propiedades.
Estadísticos muestrales-
Parámetros poblacionales
Estimaciónpuntual
N n
Media å xi å xi
m = i=1 x = i=1
N n 2
N 2 ån(x - x)
å (x - m
i
) i
Varianza
d 2 = i=1 S 2 = i=1
N n -1
Ejemplos:
Definición
En estadística, la estimación de intervalo es el uso de datos de muestra para estimar
un intervalo de valores plausibles de un parámetro de interés. Esto contrasta con la
estimación puntual, que da un valor único.
9
establece el rango de valores dentro del cual se espera que se encuentre un
parámetro poblacional.
Al ser el estimador por intervalo una variable aleatoria, resulta adecuado hablar en
términos de probabilidad de que el estimador cubra el verdadero valor del
parámetro.
10
Estimación por intervalos con muestras pequeñas
Para poder utilizar la distribución normal es necesario que las muestras sean
grandes (n > 30) y conocer la desviación estándar. Sino se conoce σ se utiliza s,
pero si además la muestra es pequeña, los resultados no serán satisfactorios. En
estos casos se utiliza la distribución t de Student, cuyas características son que es
una distribución continua, tiene forma de campana y es simétrica, es una familia de
curvas todas con la misma media de cero, pero sus desviaciones estándar difieren
de acuerdo con el tamaño de la muestra, y que es más baja y dispersa que la
distribución normal. Cuando el tamaño de la muestra se incrementa, la distribución
t se aproxima a la normal.
Ejemplo
11
En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias
muestrales es
12
2.4.1 Intervalo de confianza para la media
2.4.2 Intervalo de confianza para la diferencia de medias
En el campo del análisis estadístico, uno de los aspectos fundamentales que se
desea reportar de los datos estudiados, o que se encuentra en los resultados que
ofrecen los autores de una investigación, es generalizar los hallazgos observados
en una muestra a la población de la cual fue seleccionada, proceso al que
llamaremos inferencia o estimación.
13
Observamos que los extremos del intervalo variarán de forma aleatoria de una
muestra a otra, pues dependen de las observaciones de la muestra, luego tanto los
extremos del intervalo como la longitud del intervalo serán cantidades aleatorias y,
por tanto, no podremos saber con seguridad si el valor del parámetro θ se encuentra
dentro del intervalo obtenido cuando se selecciona una sola muestra.
1 1 1 1
((𝑥 𝑥2 − 𝑡𝛼 √
̅̅̅1 − ̅̅̅) + < 𝜇1 − 𝜇2 < (𝑥 𝑥2 − 𝑡𝛼/2 √ + )
̅̅̅1 − ̅̅̅)
2 𝑛1 𝑛2 𝑛1 𝑛2
𝑆12 𝑆22 2
𝑆12 𝑆22 (+ )
𝑛1 𝑛2
(𝑥 𝑥2 ± 𝑡𝛼 √
̅̅̅1 − ̅̅̅) + 𝓋= 2
2 𝑛1 𝑛2 𝑆1 𝑆22
𝑛 𝑛
( 1 − 1)2 + ( 2 − 1)2
𝑛1 𝑛2
14
Ejemplo
𝜎12 𝜎2 𝜎12 𝜎2
((𝑥
̅̅̅1 − ̅̅̅)
𝑥2 − 𝑧𝛼2 𝑛1
+ 𝑛2 , (𝑥
̅̅̅1 − ̅̅̅)
𝑥2 − 𝑧𝛼2 𝑛1
+ 𝑛2 )
2 2
15
Al despejar P de esta ecuación nos queda:
Ejemplo
Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas
amplias para evaluar la función eléctrica de su producto. Todos los reproductores
de discos compactos deben pasar todas las pruebas antes de venderse. Una
muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una
o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de
los reproductores de discos compactos de la población que no pasan todas las
pruebas,
Solución:
n=500
p=15/500 = 0.03
z (0.90) = 1.645
16
Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos
que no pasan la prueba en esa población está entre 0.0237 y 0.0376
Aquí se tiene el mismo caso que en la estimación de una proporción, ya que al hacer
el despeje nos queda las dos proporciones poblacionales y es precisamente lo que
queremos estimar, por lo que se utilizarán las proporciones de la muestra como
estimadores puntuales:
Ejemplo
17
Solución:
Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo
procedimiento producirá una disminución significativa en la proporción de artículos
defectuosos comparado con el método existente.
18
parámetro presente una distribución normal. También pueden construirse intervalos
de confianza con la desigualdad de Chebyshev.
Consideremos dos cuantiles de esta distribución que nos dejen una probabilidad
1 - α en la ``zona central'' de la distribución:
19
Por tanto, el intervalo que buscamos es:
Ejemplo
Se estudió la altura de los individuos de una ciudad, obteniéndose en una muestra
de tamaño 25 los siguientes valores:
distribución .
20
Por tanto, para el valor poblacional de la desviación tópica tenemos que:
con una confianza del 95%, que por supuesto contiene a las
𝜎12
Notar que F contiene al parámetro de interés , pues
𝜎22
Observación: Sea X una variable aleatoria continua, se dice que tiene distribución
Fisher con u grados de libertad en el numerador y v grados de libertad en el
denominador si su fdp es de la forma:
21
En particular si W e Y son variables aleatorias independientes ji-cuadrado con u y v
grados de libertad respectivamente, entonces el cociente
Notación: F ~ F U, V.
22
Entonces
𝜎12
Despejando el cociente , queda:
𝜎22
Ejemplo:
Una compañía fabrica propulsores para uso en motores de turbina. Una de las
operaciones consiste en esmerilar el terminado de una superficie particular con una
aleación de titanio. Pueden emplearse dos procesos de esmerilado, y ambos
pueden producir partes que tienen la misma rugosidad superficial promedio.
Interesaría seleccionar el proceso que tenga la menor variabilidad en la rugosidad
de la superficie. Para esto se toma una muestra de 12 partes del primer proceso, la
cual tiene una desviación estándar muestral S1 = 5.1 micropulgadas, y una muestra
aleatoria de 15 partes del segundo proceso, la cual tiene una desviación estándar
muestral S2 = 4.7 micropulgadas. Se desea encontrar un intervalo de confianza de
nivel 90% para el cociente de las dos varianzas. Suponer que los dos procesos son
independientes y que la rugosidad de la superficie está distribuida de manera
normal.
23
Buscamos en la tabla de la Fisher
Entonces el intervalo es
Como este intervalo incluye al 1, no podemos afirmar que las desviaciones estándar
de los dos procesos sean diferentes con una confianza de 90%.
Para el cálculo del tamaño muestral es necesario fijar de antemano unos parámetros
que dependen del tipo de estudio. En el caso de la estimación de una media, estos
parámetros son la desviación típica de la respuesta (σ), la confianza (1-α) y la semi-
amplitud (e) del intervalo.
24
En esta fórmula, la confianza 1-α y la semi-amplitud e del intervalo son dos
parámetros que escoge el investigador, si bien es tradicional fijar 1-α=0.95=95%.
Por contra, la desviación típica 𝜎 de la variable de interés viene dada por el
fenómeno en estudio y su valor debe provenir de la literatura existente o de la
experiencia profesional de cada uno. La ambición del investigador determina el nivel
de confianza y la precisión, pero la desviación típica es una premisa que depende
del conocimiento previo.
Nota técnica: Se vio que la amplitud del intervalo de confianza depende del error
típico del estimador y del nivel de confianza. La forma de limitar el grado de
incertidumbre o amplitud de este intervalo sin disminuir el nivel de confianza 1-α es
disminuir el error típico de la estimación del parámetro a través de modificar el
tamaño muestral. En el caso de la estimación de la media poblacional o esperanza
matemática, el intervalo de confianza, asumiendo σ conocida, es:
Por tanto, para una semi-amplitud del intervalo de confianza que valga e, se tiene:
Ejemplo
Para estudiar la imagen de los diferentes políticos, se pide a los encuestados que
los evalúen en una escala (continua) de 0 a 10 puntos. Si se acepta que la
desviación típica de esta variable es de 1.5 puntos, ¿cuántos casos se necesitan
para que la semi-amplitud del intervalo de confianza (e) al 95% de la media
poblacional sea de 0.05 puntos?
25
Nota técnica: En los cálculos de tamaño muestral el número obtenido siempre se
redondea al alza para alcanzar el objetivo especificado.
Ejemplo:
¿Cuántas mujeres será necesario estudiar para estimar la media de glucemia de las
embarazadas que han acudido al servicio de paritorio de un determinado hospital?
Estableciendo un nivel de confianza del 95% y una precisión de 5 (la diferencia entre
la media de glucemia de la población y la de la muestra, será ≤ 5 mg); faltaría por
conocer la DE. Se supone que se ha obtenido a partir de la prueba piloto y que es
de 20. Por lo que el número mínimo de mujeres que ha de estudiarse será de 62.
Nota técnica: Además, cuando se pretenda determinar el tamaño que debe tener
una muestra, hay que tener en consideración el tipo de muestreo. Casi todas las
fórmulas que se utilizan asumen que el muestreo es aleatorio, es decir, que todos
los sujetos tienen la misma probabilidad de entrar a formar parte del estudio. Si el
muestreo no es aleatorio, se tiene en cuenta el llamado «efecto de diseño», por el
que se ha de multiplicar el valor calculado. En el muestreo aleatorio este valor es 1.
Generalmente, este valor está entre 1,5 y 3. Así, un valor igual a 2, por ejemplo, con
un muestreo estratificado, significa que para obtener la misma precisión habrá que
estudiar al doble de individuos que con muestreo aleatorio. Si se necesitaban 200,
se deberán estudiar 400 (200 × 2).
26
Despejando n, se obtiene la fórmula para calcular el número de observaciones o
individuos necesarios para estimar una proporción:
Por tanto, es evidente que las dos cosas más importantes que determinan el
intervalo de confianza son las que se han de tener en cuenta para calcular el tamaño
de la muestra: la anchura del intervalo o precisión (d= 1/2 de la amplitud del IC) y la
confianza o seguridad establecida (1-α). Ambas han de ser determinadas a priori
por el investigador, al igual que el valor de p que se pretende estimar, a partir de la
bibliografía o con los resultados de la prueba piloto.
Ejemplo:
Con un nivel de confianza del 95% (α= 0,05; Zα = 1,96), un error máximo admitido
del 8% (la amplitud del IC será 16) y un valor de prevalencia conocido por la
bibliografía del 20%, el tamaño de la muestra necesario será de 96 mujeres:
27
Existen distintas fórmulas para calcular el tamaño de la muestra, según la población
sea finita o infinita, es decir, si conocemos el número de individuos que la componen
o si lo desconocemos.
b) Fórmula 2
Ejemplo:
28
Conclusiones
29
representa con 1 - α y se denomina nivel de confianza, entonces α es el
llamado error aleatorio o nivel de significación, esto es, una medida de las
posibilidades de fallar en la estimación mediante tal intervalo, así que
conociendo más de esto, y más a fondo entenderemos de donde salen ciertos
valores y por qué salen y se necesitan.
En resumen, los aspectos más importantes que deben ser considerados por parte
del equipo investigador, cuando se plantea qué sujetos se estudiaran, son:
características de la población; criterios de inclusión y criterios de exclusión. Una
vez definidos, se ha de decidir si se estudia a toda la población o, si ésta es
demasiado grande, si se estudia una muestra. Es imprescindible, entonces, calcular
el tamaño necesario de la muestra según: los objetivos del estudio, el diseño
planteado y el tipo de variables; y decidir qué técnica de muestreo se utilizará para
seleccionar a los sujetos. Todo ello debe quedar reflejado con detalle en el protocolo
de investigación, en el que han de indicarse, además, los valores que se han
empleado para calcular el tamaño de la muestra.
30
Fuentes de consulta
Candia B, R. & Caiozzi A., G. (2005). Intervalos de Confianza. Revista médica de Chile, 133(9).
https://doi.org/10.4067/s0034-98872005000900017
Carmen Fuentelsaz Gallego. (2003). Cálculo del tamaño de la muestra. Matronas profesión, 5(18),
5-13. https://dialnet.unirioja.es/servlet/articulo?codigo=6125940
García C, Almenara J. Determinación del tamaño de muestra en variables cualitativas en las que
se desconoce el valor del parámetro. Med Clin (Barc). 1999; 112: 797-798.
González, J. A., Rufino, H., Riba, L. & Cobo, E. (2014). BIOESTADÍSTICA PARA NO
ESTADÍSTICOS. Tamaño muestral. https://dialnet.unirioja.es/servlet/libro?codigo=140843
Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A. S. (3ra. Edición 2006).
Estadística Descriptiva y Probabilidad. Cádiz: Servicio de Publicaciones de la Universidad de Cádiz.
Montgomery, D., & R., R. (2da. Edición)
Rio, A. Q. del. (2019, 4 septiembre). 7.4 Intervalos de confianza | Estadística Básica Edulcorada.
https://bookdown.org/aquintela/EBE/intervalos-de-confianza.html
31