Tarea - 1 - Unidad5 - Principios de Muestreo - Rosales - Hugo

INSTITUTO TECNOLOGICO DE MERIDA
LICENCIATURA EN ADMINISTRACION
Campus poniente
ESTADISTICAS PARA LA ADMINISTRACION I
GRUPO:2L3
UNIDAD V: Muestreo y estimación aplicado al control estadístico
de procesos.
Competencia Específica: Conocer, Comprender y aplicar el muestreo,
para estimar las características de los elementos de una población.
TAREA #1 Principios de muestreo.
EQUIPO #2
Hugo Javier Rosales Manrique
Luciano Emmanuel Alcocer Aban
Jesús Dorilian Martín Chulim
Addy Gabriela Fernández May
PERIODO ESCOLAR: FEBRERO - JUNIO 2022
PROFESOR: CARLOS MIGUEL SALAZAR DURAN
MÉRIDA, YUC. A 22 DE MAYO DE 2022

Contenido
Introducción. ........................................................................................................................................... 3
Fundamentos Teóricos del Muestreo y Estimación. ........................................................................... 4
Muestreo......................................................................................................................................... 4
El diseño y la elección de la muestra de estudio ............................................................................ 4
Tamaño de la muestra ........................................................................................................................ 8
Teoría de la estimación. .................................................................................................................. 8
Propiedades de un Buen Estimador................................................................................................ 9
Teorema del Límite Central. ............................................................................................................. 10
Intervalos de Confianza para la media poblacional. ......................................................................... 14
Cómo calcular el intervalo de confianza para la media poblacional ............................................ 15
Ejercicio resuelto sobre el Intervalo de confianza para la medida poblacional ............................... 18
Distribución muestral de la media con varianza conocida ............................................................... 21
Distribución muestral de la diferencia de medidas con varianza conocida...................................... 25
Gráfica de control ............................................................................................................................. 27
Fuentes de Variación en un Proceso ............................................................................................. 27
Conclusión ......................................................................................................................................... 55
Como pudimos observar en este trabajo cada uno de los temas mostrados en el mismo
can casi de la mano con diferentes constantes o bien apoyándose una de la otra con
cortos conocimiento de todas, gracias a esta investigación nos dimos la tarea de aprender
y adquirir un mejor conocimiento del tema de la estadística enfocada a los principios de
muestreo. ......................................................................................................................................... 55
Referencias ..................................................................................................................................... 56
Introducción.
Uno de los aspectos más importante de la Estadística es la obtención de
conclusiones basadas en los datos experimentales. Este proceso, como ya hemos
mencionado anteriormente, se conoce como Inferencia Estadística. Para
comprender la esencia de la inferencia estadística es necesario entender las
nociones de Población y Muestra.
En este capítulo se establecerán algunos conceptos teóricos básicos con respecto
al muestreo y a la inferencia estadística. La aplicación de estos conceptos se
mostrará en capítulos posteriores.
Consideramos una población formada por N objetos en los que se selecciona una
muestra de tamaño n, el proceso de muestreo debe asegurar que cada elemento de
la población tiene la misma probabilidad de ser seleccionado para formar parte de la
muestra y cada muestra del mismo tamaño tiene la misma probabilidad de ser
seleccionada. Este procedimiento nos conduce al concepto de Muestra Aleatoria
Simple.
Una muestra extraída de una población se dice que es una Muestra Aleatoria
Simple), cuando todo elemento de dicha población tiene la misma probabilidad de
ser seleccionado para formar parte de la muestra.
Sea una población donde observamos la variable aleatoria X. Una muestra aleatoria
simple de tamaño n, es un conjunto de n variables aleatorias X1,X2,⋯,Xn, tales que:
a) Las variables aleatorias X1,X2,⋯,Xn son independientes entre sí
b) Cada v.a. Xi, para i=1,2,⋯,n, tiene idénticas características que la v.a. X.
De acuerdo con lo anterior, cada una de las observaciones X1,X2,⋯,Xn es una
variable aleatoria cuya distribución de probabilidad es idéntica a la de la población
de la que ha sido obtenida
Comentario 8.1: Si se va a tomar una m.a. sus valores serán vv. aa., ya que aún no
se ha tomado la muestra, y por tanto la notación que se debe de utilizar es
X1,X2,⋯,Xn y su media se debe notar por X¯¯¯¯ ya que también es una v.a.. Pero
cuando se obtienen los valores de la muestra éstos dejan de ser vv.aa. para pasar a
ser constantes, y la notación sería x1,x2,⋯,xn, y su media, x¯¯¯, también es un
valor.
En poblaciones finitas el muestreo aleatorio simple se realiza con reemplazamiento,
es decir: Se selecciona un elemento de la población al azar, se observa el valor de
la v.a. X, se devuelve a la población y se vuelve a seleccionar otro elemento. Así
hasta obtener los n elementos. Este procedimiento garantiza la independencia de
las observaciones.
Fundamentos Teóricos del Muestreo y Estimación.

Muestreo
Es el procedimiento mediante el cual seleccionamos una muestra representativa de
la población objeto de estudio.
El diseño y la elección de la muestra de estudio
El paso siguiente que debe resolver el investigador es el del diseño y la elección de
la muestra. Ambas acciones están íntimamente unidas puesto que dependiendo del
diseño que utilice el investigador así será la elección de los sujetos de estudio. Los
elementos, personas, fenómenos, constituyen la muestra de la investigación. Estos
elementos forman parte de un grupo de conceptos básicos que conviene clarificar y
que deben ser definidos en cada investigación.
Conceptos Básicos
Universo: Es la serie real o hipotética de elementos que comparten unas
características definidas relacionadas con el problema de investigación.
Es un conjunto definido, limitado y accesible del universo que forma el referente
para la elección de la muestra. Es el grupo al que se intenta generalizar los
resultados.
Muestra: Conjunto de individuos extraído de la población a partir de algún
procedimiento específico. Los valores que obtenemos del análisis estadístico de la
muestra se denominan estadígrafos o estadísticos.
Población – Elemento o individuo (Muestral)
Es la unidad mas pequeña en la que podemos descomponer la muestra, la
población o el universo. Esta unidad puede ser una persona, un grupo, un centro,
etc. La identificación de este elemento está en función del problema de
investigación.
Etapas del muestreo

Preparación. En esta se define el universo y la población a partir de la cual se va a
extraer la muestra.
Muestreo. En esta fase se determina la técnica más apropiada en función del
problema, las hipótesis y el diseño. Aquí cabe diferenciar varios tipos de muestras
resultado de las distintas depuraciones que se van haciendo a lo largo del proceso
de la recogida de los datos. Nos referimos a:
• Muestra invitada. Son los sujetos de la población a quienes se les invita a

participar.
• Muestra participante. Son los sujetos que aceptan formar parte del estudio.
• Muestra real. Es la muestra productora de los datos que servirán para el

análisis final. La diferencia entre la muestra invitada y la muestra real rara vez
aparece especificado en los informes de investigación.
Técnicas de muestreo La elección de la muestra puede hacerse desde dos

perspectivas: probabilísticas o al azar y no probabilísticas.
Las técnicas probabilísticas tienen su base en el principio de equiprobabilidad, en el
sentido de que todos los elementos de la población tienen la misma oportunidad de
ser elegidos para formar parte de la muestra de estudio. Las técnicas más
Probabilísticas:
• Azar simple. Cada miembro de la población tiene la misma probabilidad de

ser elegido para formar parte de la muestra. Este tipo de muestreo se suele
hacer a través del uso de tablas de números aleatorios. Este tipo de tablas es
fácil encontrarla en muchos libros de estadística. Las dos variantes de este
muestreo se les conoce como exhaustivo o sin reposición puesto que una vez
seleccionado un sujeto no vuelve a formar parte de la población por
consiguiente no puede ser seleccionado de nuevo. No exhaustivo o con
reposición consiste en que un sujeto que ha sido seleccionado vuelve a ser
colocado en la población y por tanto volver a ser elegido.
• Aleatorio sistemático. Una vez ordenados los sujetos de la población, a partir

de unos criterios previamente establecidos se procede a la elección de los
sujetos. Por ejemplo, elegir un sujeto cada K elementos, siendo K una
constante que resulta de dividir el número de sujetos de la población por el
número de sujetos que formarán parte de la muestra (K= N/n).
• Aleatorio estratificado. Es un proceso en el que ciertos subgrupos o estratos

se seleccionan para forma parte de la muestra. Las variantes de esta técnica
son: simple, consistente en extraer la muestra década uno de los estratos en
igual número. proporcional, consiste en elegir los sujetos manteniendo la
proporcionalidad de las elecciones según sea el tamaño de los estratos.
• Aleatorio por conglomerados. En este muestreo la unidad muestral es el

grupo (por ejemplo, un grupo de clase ya formado en un centro educativo). La
selección se aplica a los grupos.
• Multietapa. La elección se hace en sucesivas etapas que van desde los

niveles más generales a los más específicos. Por ejemplo, supongamos que
en España se quiere realizar un estudio sobre qué opinan los alumnos de
psicopedagogía acerca de la formación que reciben en esta titulación. En
primer lugar, se seleccionaríamos 6 universidades de todas las que están
impartiendo la titulación; a continuación, seleccionaríamos los cursos;
seguidamente a los alumnos. Estos individuos seleccionados de las diversas
universidades y cursos formarían la muestra de estudio. El proceso de
selección por etapas sigue unos criterios establecidos por el investigador que
acaba como podemos apreciar seleccionando los sujetos al azar.
No Probabilísticas:
• Deliberado. Consiste en seleccionar la muestra de forma deliberada porque
los sujetos poseen las características necesarias para la investigación. Los
resultados son difíciles de generalizar
• Accidental o causal. Esta muestra se forma con sujetos que casualmente se

encuentran en el lugar y en el momento decidido por el investigador.
• Muestra de voluntarios. En algunas investigaciones el autor se ve obligado a

pedir voluntarios que quieran participar en su estudio dado que por razones
éticas o morales no puede utilizar ninguno de los procedimientos explicado
más arriba. Esta muestra presenta ciertos sesgos y suelen presentar
determinadas características como, por ejemplo: son sujetos más educados,
tienen mejor estatus social, suelen ser más inteligentes, son más sociables,
son menos convencionales, son menos conformistas, etc.
• Muestreos mixtos. Dadas las dificultades existentes a la hora de seleccionar

una muestra, el investigador puede optar por hacer una combinación de
procedimientos y adaptarlos a las necesidades de la investigación. Esta
posibilidad es legítima siempre que se justifique por el investigador.
Ejemplo
¿Cómo votarán estos jóvenes en el
Cuestión - Ejemplo
referéndum?
Una profesora de Historia, ante la proximidad de un Referéndum en la Unión

Europea, decide realizar una encuesta entre 200 de sus alumnos. Obtiene los
siguientes resultados:
Sentido de la votación
SI 95
NO 70
No sabe/No contesta 35
Según estos resultados, ¿se puede inferir que en el Referéndum el SI obtendrá el
50% de los votos, o más?
Esta situación es un ejemplo claro de la necesidad de efectuar una operación
estadística llamada Estimación.
La encuesta que realiza la profesora abarca una muestra de alumnos y lo que le
interesa a ella es qué puede ocurrir en la población. Cada vez que tenemos que
comparar un colectivo (llamado población) con una de sus partes (llamada muestra),
debemos realizar una operación llamada estimación.
Concretamos
Población
Es el conjunto de referencia que pretendemos estudiar, formado por elementos que
comparten una misma propiedad: españoles adultos, alumnos de la Enseñanza
Privada de Méjico, fresnos existentes en la Sierra de Guadarrama.
Censo
Si es posible estudiar toda la población, por ejemplo, los alumnos de un colegio, a
este estudio le llamaremos censo. Un censo no siempre es posible, especialmente
por motivos económicos.
Muestra
Una muestra es un subconjunto de la población, y es el que verdaderamente se
estudia en la inmensa mayoría de los experimentos y estudios. Se debe acudir a
muestras cuando la población es demasiado numerosa (población infinita), o bien
resulta muy caro un estudio exhaustivo. Otro motivo suele ser que el experimento
requiera pruebas destructivas, y no es caso de destruir la población.
Una muestra es representativa cuando tiene una estructura y unos parámetros muy
parecidos a la población. Desgraciadamente, esta definición no es útil, pues
generalmente no se conoce con seguridad la población, o existe la sospecha de que
sus características hayan cambiado. Llamaremos muestreo al conjunto de técnicas
que nos ayudan a elegir una muestra representativa.
Muestreo
La operación de elegir una muestra puede ser tan compleja que llena libros enteros.
Aquí sólo repasaremos las cuestiones de muestreo más frecuentes.
La parte de la Estadística que estudia las estimaciones (relaciones entre
poblaciones y muestras) se llama Estadística Inferencial, y es la que comenzamos a
estudiar en esta sesión.
Tamaño de la muestra
El tamaño que debe tener la muestra que se selecciona depende básicamente del
tipo de estudio que se vaya a realizar. Si el trabajo es experimental, la muestra
puede ser bastante más pequeña que si realizamos trabajos descriptivos, en los que
la única forma de controlar los muchos factores que pueden aparecerá lo largo del
proceso, es aumentar el número de elementos en la muestra.
Sin recurrir a procedimientos matemáticos, una muestra se considera pequeña
siempre que es menor de 30, aunque este dato debe aumentarse
considerablemente en el caso de investigaciones de campo. En estos estudios, y
siempre que el número de elementos que forman la población sea suficientemente
grande como para considerarlo estadísticamente infinito, es recomendable que la
muestra sea al menos el 10% de la población total. En una población de 1000
individuos, una muestra puede considerarse suficiente a partir de 100 sujetos,
siempre que el tipo de estudio así lo requiera. Ahora bien, existe un procedimiento
matemático para determinar con precisión el tamaño de la muestra, asumiendo el
investigador un pequeño error en función del nivel de confianza.
Teoría de la estimación.
Objetivos: La inferencia estadísticas ocupa, entre otras cuestiones, de los
procedimientos de estimación de parámetros desconocidos de la distribución de una
variable aleatoria de la población, a partir de la información suministrada por una
muestra de tamaño reducido, extraída al azar. La estimación de parámetros por
intervalos, permite construir un intervalo que contendrá el parámetro a estimar con
una confianza fijada a priori por el experimentador.
Parámetro: Constante que puede ser calculada con ayuda del modelo de
probabilidad de una variable aleatoria o población.
Estimación: Podrecimiento que permite determinar valores posibles de un
parámetro desconocido, a partir de los datos suministrados por nuestras extraídas al
azar.
El objetivo principal de la estadística inferencial es la estimación, esto es que
mediante el estudio de una muestra de una población se quiere generalizar las
conclusiones al total de la misma. Como vimos en la sección anterior, los
estadísticos varían mucho dentro de sus distribuciones muestrales, y mientras
menor sea el error estándar de un estadístico, más cercanos serán unos de otros
sus valores.
Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo. Una
estimación puntual un único valor estadístico y se usa para estimar un parámetro. El
estadístico usado se denomina estimador
Una estimación por intervalo es un rango, generalmente de ancho finito, que se
espera que contenga el parámetro.
Propiedades de un Buen Estimador
Insesgado. -Se dice que un estimador puntual es un estimador insesgado des, para
todo valor posible de. En otras palabras, un estimador insesgado es aquel para el
cual la media de la distribución muestral es el parámetro estimado. Si se usa la
media muestral para estimar la media poblacional, se sabe que la, por lo tanto, la
media es un estimador insesgado.
Eficiente o con varianza mínima. -Suponga que1y2son dos estimadores insesgados
de. Entonces, aun cuando la distribución de cada estimador esté centrada en el
valor verdadero de, las dispersiones de las distribuciones alrededor del valor
verdadero pueden ser diferentes.
Teorema del Límite Central.
El teorema central del límite es un resultado matemático que garantiza que, si
sumamos variables cualesquiera (no necesariamente normales), la variable suma
también seguirá una distribución normal (esto siempre que se cumplan algunas
condiciones básicas).
Así, cuando un dato o resultado es la suma de contribuciones independientes, de

igual magnitud y “con un tamaño típico”, este resultado corresponderá a una
distribución Gaussiana siempre que el número de contribuciones (el número de
sumandos) sea un número considerable (no pequeño).
Con un tamaño típico se quiere garantizar que las contribuciones tienen que “estar
controladas”, esto es, las contribuciones extremas tienen que estar controladas por
una probabilidad muy pequeña (En jerga matemática las contribuciones tienen que
tener varianza finita).
Este teorema asegura, de manera esquemática, que, cuando sumamos un número

grande de variables, la variable resultante sigue una distribución normal.
De manera general, si X1, X2...,Xn son variables de media o esperanza μi=E(Xi) y

varianza σ2i=Var (Xi), i=1...,, se verifica que la variable suma Y=X1+X2+...+Xn
(si n es un número tendiendo a infinito) se puede aproximar por una variable
normal, de media la suma de las medias y varianza la suma de varianzas
(desviación típica = raíz de la suma de varianzas
En el caso de sumar variables aleatorias normales, la aproximación anterior no es tal,

sino que es una distribución exacta, como hemos visto anteriormente.
Si, en vez de sumar variables, realizamos la media aritmética de las mismas, también
podemos utilizar el teorema central del límite (puesto que la media aritmética es sumar
y luego dividir por una constante).
Este teorema (del que damos únicamente una idea general, sin establecer las
hipótesis matemáticas reales) establece la importancia de la distribución normal. Su
resultado es que, cuando se suma un número grande de variables aleatorias, la
variable resultante es una variable con distribución aproximadamente igual a la
distribución normal. Incluso, el término número grande (porque matemáticamente el
teorema se establece cuando n tiende a infinito) no lo es tanto, porque, en la práctica,
con tener que n sea un número mayor o igual a 30, la aproximación ya proporciona
buenos resultados.
Además, el teorema es cierto independientemente de la distribución que sigan las
variables que se sumen (no importa si son exponenciales, binomiales, etc.). Lo único
que se necesita es saber su media y su varianza.
La proporción muestral de una característica A es el número de veces que dicha

característica A aparece en una muestra. Por ejemplo, si A representa tener una
enfermedad cualquiera, p=P(A) es la probabilidad de que una persona tenga la
enfermedad.
Si se seleccionan, de manera independiente, n personas, tenemos una muestra
de n individuos de esa población, y la proporción muestral es:
En vez de tener una enfermedad, AA puede representar estar de acuerdo o no con

algo, tener trabajo o no, etc (cualquier cosa que admita solo 2 posibilidades
complementarias).
Cada vez que consideramos una persona, podemos considerar la variable de
Bernoulli X=tiene la enfermedad (o característica) A. Esta variable toma los
valores 1con probabilidad P y 0 con probabilidad 1−p.
De esta manera, la proporción muestral que acabamos de definir se puede
considerar como.
donde X1 es la variable X en el individuo 1…, Xn es la variable X en el individuo n,

es decir vale 11 o 00 en cada individuo, según tenga la característica AA o no la
tenga.
De manera que, si n es grande, por el teorema central del límite, la variable
suma X1+X2+…+Xn se aproximará mediante una distribución normal, de media la
suma de las medias (cada variable de Bernoulli tiene de media p) y de desviación
típica la raíz cuadrada de la suma de varianzas (y cada variable de Bernoulli tiene
de varianza p⋅(1−p). En consecuencia, la variable suma Y verificará:
Supongamos ahora que lanzamos una moneda. La variable X que vale 1 si sale
cara y 0 si sale cruz es una variable de Bernoulli. Si lanzamos una moneda, por
ejemplo, 200 veces, la variable que mide el número de caras que salen es una suma
de 200 variables (Xi cuenta 1 o 0 si sale cara en el lanzamiento i).
Supongamos que repetimos esta operación 10 veces (cada operación es lanzar la
moneda 200 veces). La primera vez pueden salir 115 caras, la segunda 94, etc. Se
supone que el número de caras andará cerca de 100 (es la media, 200⋅0.5).
Podemos simular el experimento con R:
y=rbinom(10,200,0.5)
y
## [1] 102 94 98 103 114 109 94 90 109 109

Si en vez de repetirlo 10 veces, lo hacemos 1000, tenemos mil valores de la
variable. Dibujamos su histograma:
y=rbinom(1000,200,0.5)
hist(y, col="lightblue")
abline(v=100, col="red")
Como vemos, se parece mucho a la campana de Gauss, con media 100 y
desviación típica √ 200⋅0.5⋅0.5 =7.071
Consideremos de nuevo una proporción. Según acabamos de ver, la proporción
muestral es
y, como la suma de arriba es aproximadamente una distribución normal, de

parámetros media np y varianza np(1−p), la proporción muestral también sigue
aproximadamente una distribución normal.
Ejemplo
La renta media de los habitantes de un país se distribuye uniformemente entre 4,0
millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al seleccionar al
azar a 100 personas la suma de sus rentas supere los 725 millones ptas.
Cada renta personal es una variable independiente que se distribuye según una
función uniforme. Por ello, a la suma de las rentas de 100 personas se le puede
aplicar el Teorema Central del Límite.
La media y varianza de cada variable individual es:
m = (4 + 10) / 2 = 7
s 2 = (10 - 4) ^2 / 12 = 3
Por tanto, la suma de las 100 variables se distribuye según una normal
cuya media y varianza son:
Media: n * m = 100 * 7 = 700
Varianza: n * s2 = 100 * 3 = 300
Para calcular la probabilidad de que la suma de las rentas sea superior a 725
millones ptas, comenzamos por calcular el valor equivalente de la variable normal
tipificada:
Luego:
P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749
Es decir, la probabilidad de que la suma de las rentas de 100 personas

seleccionadas al azar supere los 725 millones de pesetas es tan sólo del 7,49%
Intervalos de Confianza para la media poblacional.

Supongamos que queremos obtener la estatura media de los habitantes de un
determinado país. No podemos medir la estatura de todos los habitantes, por lo que
se toma una muestra y se calcula la media de esa muestra, es decir, la media
muestral.
¿La media muestral será igual a la media poblacional μ?
La respuesta es no. No por haber cogido por ejemplo una muestra de 100 personas,
su media muestral no tiene por qué ser igual a la media poblacional.
Si tengo la media muestral, puedo encontrar dos valores entre los cuales se
encontrará la media poblacional con una cierta seguridad.
Como sabemos que las medias de las muestras tienen una distribución normal, se
puede llegar a conocer el porcentaje de confianza de ese intervalo y ese porcentaje
es lo que llamamos el intervalo de confianza para la media poblacional:
Por tanto, a partir de la media muestral, puedo generar un intervalo de confianza

dentro del cual tenemos cierta seguridad de que estará la media poblacional μ, es
decir, no se puede determinar con total seguridad el valor de la media poblacional,
pero se puede dar un porcentaje de seguridad de que la media poblacional se
encuentra entre dos valores.
Cómo calcular el intervalo de confianza para la media poblacional

En la lección anterior, ya te expliqué a calcular intervalos de confianza en una
distribución normal N(0,1) donde obteníamos los valores de -z de α/2 y z de α/2
Ahora lo que queremos es encontrar dos valores X1 y X2, que generen ese mismo
intervalo, entre los cuáles se encuentre la media poblacional. Como yo tengo la
media de las muestras, la distribución normal tendrá la misma media que la
población, pero la desviación típica estará dividida entre raíz de N:
Y si lo representamos en una curva de distribución normal y lo comparamos con la

curva de distribución normal N(0,1) tenemos:
Por lo tanto, para poder calcular el intervalo de confianza para la media poblacional
vamos a tipificar los valores de x1 y x2 para transformarlos en -z de α/2 y z de α/2 y
poder así utilizar la tabla de distribución normal N(0,1):
Tipificamos el valor de x1, teniendo en cuenta que la media es la media muestral y
la desviación típica se divide entre raíz de N:
De esta expresión despejo x1:
Ahora tipifico x2:

Y despejo x2:
Si te das cuenta, las expresiones donde he despejado x1 y x2 son iguales a la

media muestral y se le suma o se le resta z de α/2 multiplicado por la desviación
típica se dividida entre raíz de N (en color azul):
A esa expresión de color azul es lo que se llama el error:
Y, por tanto, x1 será igual a la media muestral menos el error y x2 será igual a la
media muestral más el error:
Por tanto, el intervalo de confianza que quiero calcular se encuentra entre x1 y x2:
O lo que es lo mismo entre la media muestral menos el error y entre la media
muestral más el error:
Que sustituyendo el error por su expresión el intervalo de confianza para la media

poblacional nos queda:
Vamos a analizar un poco más con detalle la fórmula del error:
Al estar el número de individuos N dividiendo en el denominador, cuando mayor sea

N, más pequeño será el error, lo que quiere decir que cuanto mayor sea la muestra,
el intervalo de confianza será más fiable ya que tendremos menos error y por tanto,
el intervalo de confianza será más específico.
Ejercicio resuelto sobre el Intervalo de confianza para la

medida poblacional
Tenemos el siguiente ejercicio:
El tiempo diario que los adultos de una determinada ciudad dedican a actividades
deportivas, expresado en minutos, se puede aproximar por una variable aleatoria
con distribución normal de desviación típica σ=20 minutos.
a) Para una muestra aleatoria simple de 25o habitantes se ha obtenido un tiempo
medio de dedicación a actividades deportivas de 90 minutos diarios. Calcular un
intervalo de confianza al 90% para la media poblacional μ.
b) ¿Qué tamaño mínimo debe tener una muestra aleatoria simple para que el error
máximo cometido en la estimación de la media poblacional μ por la media muestral
sea menor que 1 minuto con el mismo nivel de confianza del 90%
Apartado a:
Tengo la población que sigue una distribución normal de la que no conozco la
media, pero sí la desviación típica que es igual a 20:
Se toma una muestra de 250 personas, cuya media muestral es igual a 90:
Nos preguntan el intervalo de confianza al 90% para la media poblacional μ:
Por tanto, quiero dos valores que entre los cuales, me encierren un porcentaje del
90%, por lo que a cada lado, me quedará un 5%:
Por tanto, en la tabla tengo que buscar el valor de z que me deje a la izquierda el
95%, que será el valor de z α/2:
Busco en la tabla de distribución normal N(0,1) el valor que deje a la izquierda 0,95
y obtengo que está entre z=1,64 y z=1,65, por lo que me quedo con 1,645. Este es z
de α/2:
Con este valor de z de α/2 calculo el error cuya fórmula es:
Sustituyo z de α/2, σ y N por sus valores y calculo:
El intervalo de confianza se encuentra entre la media muestral menos el error y

entre la media muestral más el error:
Para calcular nuestro intervalo de confianza al 90%, a nuestra media muestral que
es 90, le restamos y le sumamos el error:
Operamos y nos queda:
Por lo que al 90% de seguridad, podemos decir que la media de la población se

encuentra entre 87,92 minutos y 92,08 minutos.
Apartado b:
Nos piden el tamaño de la muestra N, para que el error sea menor que 1, para un
intervalo de confianza al 90%, es decir:
Si sustituimos el error por su fórmula nos queda:
z de α/2 y σ siguen teniendo los mismos valores, que los sustituimos en la expresión
anterior y N es lo que tenemos que calcular:
Vamos a despejar N.
Primero pasamos raíz de N multiplicando al segundo miembro:
Operamos en el primer miembro:
La raíz del segundo miembro pasa a elevar al cuadrado al primer miembro
Operamos y nos queda que N debe ser mayor o igual a 1082,41, que redondeando
nos queda que el tamaño de la muestra N debe ser igual a 1083 personas para que
el error sea menor que 1:
Distribución muestral de la media con varianza conocida

El objetivo es construir un intervalo de confianza para la media μ de una población
normal (altura media, peso medio, tiempo medio haciendo gimnasia…)
Por una vez, y sin que sirva de precedente, vamos a ver cómo es la construcción
matemática del intervalo de confianza. Consideremos la variable X∈N(μ,σ)X∈N(μ,σ),
que representa a la característica que estamos midiendo (altura, peso…).
Supongamos que σσ es conocida.
Consideramos una muestra aleatoria simple X1,…,Xn de la variable X. Dado el nivel
de confianza 1−α1−α, elegimos el llamado estadístico pivote
Un estadístico es una función de variables aleatorias y es también otra variable

aleatoria. En este caso, vamos a ver que distribución sigue esta variable T que
acabamos de definir (el término pivote es una nomenclatura utilizada en los test de
hipótesis).
Como vimos anteriormente, la media muestral verifica
Por lo tanto, si tipificamos la variable (restamos la media y dividimos por la
desviación típica), obtenemos la variable T, lo que quiere decir que esta variable
sigue una distribución normal estándar (N(0,1)).
Teniendo en cuenta que, sabemos que
Niveles de significación en una normal estandarizada
Despejando el parámetro μ obtenemos
Por tanto, el I.C. para μ al nivel de confianza
El procedimiento teórico para llegar a esta fórmula es simple, aunque difícil de

seguir para cualquiera con pocos conocimientos matemáticos. En todo caso, lo
importante es que la fórmula del intervalo no tiene excesiva dificultad. El intervalo
está centrado en la estimadora media muestral, y los extremos consisten en restar y
sumar la misma cantidad: un valor que depende del nivel de confianza utilizado,
multiplicado por el error muestral de la media.
*Retomamos el Ejercicio anterior. **
En una clínica de fisioterapia se quiere saber el número de grados que acaba
doblando una rodilla después de dos semanas de tratamiento. Las medidas de 10
pacientes
fueron41.60,41.48,42.34,41.95,41.86,42.41,41.72,42.26,41.81,42.04.41.60,41.48,42.
34,41.95,41.86,42.41,41.72,42.26,41.81,42.04.
Aceptando que la variable aleatoria X=“grados que dobla la rodilla” sigue una
distribución normal, y suponiendo que σ=0.3 grados,
a. Obtener un intervalo de confianza para la temperatura media al nivel del 90%.
b. Deduce el tamaño muestral necesario para conseguir un intervalo de
confianza al 99%, con un error menor o igual que 0.05.
Solución
a. Sabemos que σ=0.3 y n=10
La media muestral es
El I.C. para μμ al nivel de confianza 1−α es:
donde el valor Zα/2=1.645 se puede obtener como

qnorm(0.1/2)
## [1] -1.645
es decir, calculamos el cuantil de una normal (por defecto, los
parámetros 00 y 11 no hace falta escribirlos) mediante qnorm.
El I.C. para μ al 95% es, entonces:
b. Escribimos de nuevo la formula del intervalo de confianza:

para ver que, con una probabilidad 1−α1−α el parámetro verdadero (μ) está dentro
de ese intervalo; es decir, que la distancia entre μ y es, como mucho,
Esto es, el error de estimación está acotado:
Si queremos calcular el tamaño muestral necesario para que el error sea menor o
igual a una cantidad e (0.05 en este caso), hacemos
Hay que tomar entonces n=139 mediciones.

Fijémonos en que, si quisiésemos -con la misma confianza- obtener un error la
mitad de pequeño (e/2), la fórmula que obtenemos es
es decir, habría que tomar una muestra 4 veces más grande.
Regla de la raíz de n: “si quieres multiplicar la exactitud de una investigación, no

basta con duplicar el esfuerzo, debes multiplicarlo por 4”.
Distribución muestral de la diferencia de medidas con
varianza conocida
La forma de una distribución muestral de depende de nuestros tamaños de

las muestras y de la forma de cada distribución de población de la cual
muestreamos.
• Si ambas poblaciones son normales, entonces la distribución muestral
de es exactamente normal sin importar los tamaños de las
muestras.
• Si una o ambas poblaciones son no normales (o sus formas son
desconocidas), entonces la distribución muestral
de es aproximadamente normal siempre y cuando el tamaño de
nuestra muestra sea de al menos 303030 de la(s) población(es) no
normal(es).
Centro
La diferencia media es la diferencia entre las medias de la población:
Variabilidad
La desviación estándar de la diferencia es:
(donde n1 y n2 son los tamaños de cada muestra).

Esta fórmula para la desviación estándar es exactamente correcta siempre y cuando
tengamos:
• Observaciones independientes entre las dos muestras.
• Observaciones independientes dentro cada muestra*.
*Si estamos muestreando sin reemplazo, esta fórmula en realidad va a sobreestimar
la desviación estándar, pero es extremadamente cercana al valor correcto siempre y
cuando cada muestra sea menos del 10% de su población.
Vamos a intentar aplicar estas ideas a algunos ejemplos y a ver si podemos
utilizarlas para calcular algunas probabilidades.
Ejemplo 1
Cada día, miles de personas en un aeropuerto pasan por un control de seguridad en
uno de dos niveles: el nivel A o el nivel B. Supón que, en promedio, a las personas
les toma 26 minutos pasar por el control de seguridad en el nivel A con una
desviación estándar de 7.5 minutos. En el nivel B, la media y la desviación estándar
son de 24 y 4 minutos, respectivamente.
Cada día, en el aeropuerto ven muestras aleatorias separadas de 100 personas de
cada nivel. Calculan el tiempo medio para cada muestra, luego ven la diferencia
entre las medias muestrales

Gráfica de control
Una gráfica de control es un diagrama que sirve para examinar si un proceso se
encuentra en una condición estable, o para asegurar que se mantenga en esa
condición.
En estadística, se dice que un proceso es estable (o está en control) cuando las

únicas causas de variación presentes son las de tipo aleatorio. En esta condición se
pueden hacer inferencias con respecto a la salida del proceso, esto es, la
característica de calidad que se esté midiendo. En cambio, la presencia de causas
especiales o asignables hace que el proceso se desestabilice, impidiendo la
predicción de su comportamiento futuro.
Con base en la información obtenida en intervalos determinados de tiempo, las

gráficas de control definen un intervalo de confianza: Si un proceso es
estadísticamente estable, el 99.73% de las veces el resultado se mantendrá dentro
de ese intervalo.
La estructura de las gráficas contiene una “línea central” (LC), una línea superior que
marca el “límite superior de control” (LSC), y una línea inferior que marca el “límite
inferior de control” (LIC). Los puntos contienen información sobre las lecturas
hechas; pueden ser promedios de grupos de lecturas, o sus rangos, o bien las lecturas
individuales mismas. Los límites de control marcan el intervalo de confianza en el cual
se espera que caigan los puntos.
Las gráficas de control sirven para:

• Determinar el estado de control de un proceso.
• Diagnostica el comportamiento de un proceso en el tiempo.
• Indica si un proceso ha mejorado o ha empeorado.
• Permite identificar las dos fuentes de variación de un proceso.
• Sirve como una herramienta de detección de problemas.
Fuentes de Variación en un Proceso:
1. Causas Asignables o Especiales:

• Son los factores esporádicos que desestabilizan el sistema.
• Su identificación es inmediata y fácil.
2. Causas Comunes o Naturales:
• Son los factores que afectan en poco la variabilidad del sistema.
• Su presencia es aleatoria y no son de fácil detección.
• Generalmente están relacionadas con aspectos administrativos.
Consideraciones previas:
Antes de establecer una gráfica de control, es necesario definir con claridad los
siguientes puntos: el propósito de la gráfica, el aspecto que se va a considerar, y la
unidad de donde se va a tomar la muestra.
Tipos de gráficas de control:
1. Gráficas de Control de Variables

• Gráfica x – R Promedios y rangos
• Gráfica x – s Promedios y Desviación Estándar
• Gráfica x – R Medianas y Rangos
• Gráfica x – R Lecturas Individuales y Rangos
2. Gráficas de Control por Atributos
• Gráfica p Porcentaje de unidades o procesos defectuosos
• Gráfica np Número de unidades o procesos defectuosos
• Gráfica c Número de defectos por área de oportunidad
• Gráfica u Porcentaje de defectos por área de oportunidad
4. Distribución Muestral de la Medias con Varianza conocida
1.- Los ingresos mensuales que perciben los médicos de EsSalud, de una cierta área, se distribuyen normalmente
con un ingreso medio de 3500 soles y desviación estándar de 700 soles.
A) ) Si el 18% de ellospagan impuestos, ¿cuál es el ingreso mensual mínimo de un médico de esta área que paga
impuestos?
B) ) Si se escoge al azar una muestra de 150 médicos de dicha área y se registran sus ingresos, ¿cuál es la
probabilidad de que el promedio de la muestra se diferencie de su valor real en no más de 100 soles?
Sea X la variable definida como “El ingreso mensual de un médico”
Según el problema: X → N(3500, 7002)
Esto es μ = 3500 y σ = 700
A) ) Sea K la cantidad mínima a partir de la cual se paga impuestos. Esto significa que un médico
pagará impuestos si X ≥ K.
La probabilidad de que esto ocurra es P(X ≥ K ) = 1 – P(X < K) = 0.18.
Despejando P(X < K ) = 0.82
En Excel:
Luego P(X < K ) = Distr.Norm.Inv(0.82,3500,700) = 4140.76
B) En este caso n = 150.
La frase “El promedio de la muestra se diferencia de su valor real” se puede expresar simbólicamente
como | - μ | ≤ 100.
Usamos valor absoluto puesto que la diferencia puede ser positiva o negativa.
Luego
P(| - μ |≤100 )= P(μ -100 ≤ ≤ μ + 100)=P(3400 ≤ μ ≤ 3600)= F(3600) – F(3400)
= Distr.Norm(3600,3500,700,1)-Distr.Norm(3400,3500,700,1)
= 0.5567985 – 0.4432015 = 0.113597
Recuerde que, cuando se usa la función Distr.Norm, el último argumento debe ser 1 para que devuelva la
probabilidad acumulada.
2.- MoviClaro afirma que el tiempo que emplean los clientes en pagar sus facturas es una variable normal de
valor medio 30 días y desviación estándar 8 días.
A)Si se escogen al azar las cuentas de 40 clientes, ¿cuál es la probabilidad de observar un promedio muestral
inferior a 32 días?
B) Si la muestra es de 25 cuentas, ¿qué tan probable es de tener un promedio entre 28.5 y 32.5 días?
C) En una muestra al azar de 16 cuentas, ¿qué valor máximo tomará el promedio con probabilidad 0.90?.
Sea X: Tiempo que un cliente se tarda en pagar sus facturas.
Según los datos: X → N(30, 64)
Donde es μ = 30 y σ = 8
3.- De un lote de focos ahorradores enviados por un proveedor, se han tomado al azar, 12 focos. El propósito
es observar la duración del producto para determinar su conveniencia en compras futuras. Se les dejaron
encendido hasta que se quemen. Los datos (en horas) obtenidos con el experimento fueron:
120, 128, 132, 130 124, 127, 130, 135, 122, 129, 131, 130.
Si el proveedor indica que su producto tiene una duración media de 127.5 horas.
A)Calcule la media de la muestra y luego determine la probabilidad de que una muestra del mismo tamaño
arroje un promedio superior al que usted calculó.
B) ¿Cuál es la probabilidad de que la media muestral se aparte del valor real en a lo más 2 horas?
Ingrese los datos a una hoja en un nuevo libro o abra el archivo Prob01. Calculemos primero la media de la
muestra; es decir, .
Por lo que sabemos, = (∑Xi / n = Promedio(B2:B13) = 128.167
Por si fuera necesario, calculamos también la varianza y la desviación estándar
s² = Var(B2:B13) = 18.515 y s = DesvEst(B2:B13) = 4.303
a) Debemos calcular P( > 128.167).
Como la varianza poblacional no es conocida, usaremos la distribución t.
Para ello, debemos construir la variable T= ( - μ)/(s/√n) talque T → t(n-1)
Luego
4.- Un exportador de espárragos envasa sus productos en frascos cuyo contenido medio es de 300 gramos.
Para controlar el proceso automático de llenado, se selecciona cada hora una muestra de 36 frascos. Si el peso
neto medio de la muestra está entre 301 y 302 gramos, el proceso continúa; en caso contrario, se detiene y se
reajusta la máquina.
A) ¿Cuál es la probabilidad de detener el proceso que está operando con una desviación estándar de 7.5
gramos?
B) Si Ud. fuera el responsable del proceso, ¿deberá reajustar la máquina?
Sea X: El contenido de un frasco de espárragos (gramos).
Nótese que en cada hora se está tomando la muestra de tamaño n = 36.
Como el frasco contiene 300 gramos, supondremos que este indicador constituye el contenido medio. No se
conoce la varianza.
a) El proceso continúa si 301 ≤ ≤ 302.
Sea A: El evento definido como el proceso debe ser detenido.

Si la probabilidad de que el proceso continúe es P(301 ≤ ≤ 302)
Entonces P(A) = 1 – P(301 ≤ ¯X ≤ 302).
Si 0 =301.5 y s = 7.5, usando la distribución t de Student tendremos:
Creo que el proceso debe ser detenido para reajustar la máquina pues el porcentaje de veces que el contenido
no está en el rango especificado es suficientemente considerable.
Dada una población formada por elementos que poseen o no cierta característica, diremos que el indicador o
parámetro π constituye la proporción de elementos que poseen dicha característica.
Si un experimento aleatorio tiene dos únicos resultados: éxito o fracaso y se ejecuta una sola vez, diremos que
la población es de Bernoulli donde π representa la proporción de éxitos y 1 – π representa la proporción de
fracasos. Si el experimento se repite n veces, podemos afirmar que la población es Binomial. Y cuando se realiza
un muestreo con reposición, se dice que la población desde donde se extrae la muestra es una población
Binomial.
Sea X1, X2,…, Xn una muestra aleatoria independiente extraída de una población de Bernoulli en donde si Xi = 1
ocurre éxito, si Xi = 0 ocurre fracaso.
Si ahora definimos a X= ∑(i=1)nXi, como el número de éxitos obtenidos en esta muestra, entonces X
constituye una variable Binomial tal que su valor esperado es E(X) = μ = nπ y su varianza V(X) = σ² =
n π(1- π).
Si definimos a p = X/n como la proporción de éxitos o la proporción, diremos que p es una variable muestral cuya
distribución de probabilidad viene dada por μp y σ2p .
5.- El gerente de McAllum Inc. cree que el 30% de los pedidos a su empresa provienen de clientes nuevos. Para
comprobar esta afirmación se toma una muestra aleatoria de 100 clientes que hicieron sus pedidos en la
empresa.
a) Suponga que el presidente está en lo correcto y que π = 0.30. ¿Cuál es la distribución muestral de p para
este estudio?
b) ¿Cuál es la probabilidad de que la proporción muestral esté a ± 0.05 o menos de la proporción poblacional?
Sea π la proporción de pedidos provenientes de clientes nuevos. Según el problema, π = 0.30. Igualmente n =
100.
a) Si definimos a p como la proporción muestral de pedidos provenientes de clientes nuevos,

entonces la distribución muestral de p será p → N(π,π(1-π)/n); es decir, p → N(0.30,0.0021). En este
caso σp = 0.04582576
b) Se pide encontrar P( | p – π | ≤ 0.05)
P( | p – π | ≤ 0.05) = P(0.25 ≤ p ≤ 0.35 )
= Dstr.Norm(0.35,0.3,0.04583) - Distr.Norm(0.25,0.3,0.04583)
= 0.724722
5.- Distribución Muestral de Diferencia de Medias con varianza conocida

1.- En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela primaria se
usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños como para niñas los
pesos siguen una distribución normal. El promedio de los pesos de todos los niños de sexto grado de esa escuela
es de 100 libras y su desviación estándar es de 14.142, mientras que el promedio de los pesos de todas las niñas
del sexto grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras. Si representa el
promedio de los pesos de 20 niños y es el promedio de los pesos de una muestra de 25 niñas, encuentre la
probabilidad de que el promedio de los pesos de los 20 niños sea al menos 20 libras más grande que el de las 25
niñas.
Datos:
1 = 100 libras
2 = 85 libras
1 = 14.142 libras
2 = 12.247 libras
n1 = 20 niños
n2 = 25 niñas
=?
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos 20 libras más
grande que el de la muestra de las niñas es 0.1056.
2.- Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos compañías. Los
tubos de la compañía A tienen una vida media de 7.2 años con una desviación estándar de 0.8 años, mientras
que los de la B tienen una vida media de 6.7 años con una desviación estándar de 0.7. Determine la probabilidad
de que una muestra aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos un año más
que la de una muestra aleatoria de 40 tubos de la compañía B.
Solución:
Datos:
A = 7.2 años
B = 6.7 años
A = 0.8 años
B = 0.7 años
nA = 34 tubos
nB = 40 tubos
=?
3.- Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación estándar de
1.23km/L para la primera gasolina y una desviación estándar de 1.37km/L para la segunda gasolina; se prueba
la primera gasolina en 35 autos y la segunda en 42 autos.
A)Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la
segunda gasolina?
B)Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a
favor de la gasolina 1?.
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos poblaciones, por lo que
se supondrán que son iguales.
Datos:
1 = 1.23 Km/Lto
2 = 1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos
=?
A.
B. ?
La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre 0.65 y 0.83
Km/Lto a favor de la gasolina 1 es de 0.0117.
4.- Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la
promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres
adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta
a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte,
determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
Datos:
PH = 0.12
PM = 0.10
nH = 100
nM = 100
p(pH-pM 0.03) = ?
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución binomial y se está
utilizando la distribución normal.
Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3%
mayor que el de mujeres es de 0.4562.
5. Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos
fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:
A. ¿Cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la máquina 1

en por lo menos 0.10?
B.¿Cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a la máquina 2

en por lo menos 0.15?
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
A. p(p2-p10.10) = ?
Otra manera de hacer este ejercicio es poner P1-P2:

La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 10% a
favor de la máquina 2 es de 0.0011.
B. p(p1-p2
0.15)=?
La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 15% a
favor de la máquina 1 es de 0.2357.
6. Gráficas de control y tipos de variación en los procesos
1. En una fábrica se ensamblan artículos electrónicos y al final del proceso se hace

una inspección por muestreo para detectar defectos relativamente menores.
En la tabla se muestra el número defectos observados en muestreos realizados
a 24 lotes consecutivos de piezas electrónicos.
Datos:
Artículos con
defecto:
Muestra:
variable tipo u
Tamaño
Lote Defectos
muestra
1 2 17
0
2 2 24
0
3 2 16
0
4 2 26
0
5 1 15
5
6 1 15
5
7 1 20
5
8 2 18
5
9 2 26
5
10 2 10
5
11 2 25
5
12 3 21
0
13 3 40
0
14 3 24
0
15 3 46
0
16 3 32
0
17 3 30
0
18 3 34
0
19 1 11
5
20 1 14
5
21 1 30
5
22 1 17
5
23 1 18
5
24 1 20
5
a. Qué tipo de grafica de control utilizaría
En la grafica utilizaremos una grafica de control por numero de defectos tipo U.
b. Cuáles son los límites de control
LCS=1.69
LC=1.04
LCI=0.39
a. Grafique e interprete
b. Interpretación:
En la gráfica podemos observar la cantidad de artículos electronicos con
defectos, donde la muestras en los lotes 13 y 15 están por encima del límite
superior.
Podemos concluir que en dicho proceso no está bajo control estadístico.
Recomendado determinar la causas del problema para mejorar la calidad del
proceso.
2. En una fábrica de muebles se inspecciona a detalle el acabado de las mesas cuando salen
del departamento de laca. La cantidad de defectos que son encontrados en cada mesa son
registrados con el fin de conocer y mejorar el proceso. En la tabla se muestran los defectos
encontrados en las últimas 25 mesas.
Datos:
Productos con defectos

Muestra : constante(una inspección por cada mesa).
MESA DEFECT
OS
1 7
2 5
3 10
4 2
5 6
6 5
7 4
8 9
9 7
10 5
11 6
12 7
13 8
14 4
15 5
16 12
17 8
18 10
19 4
20 7
21 3
22 10
23 6
24 6
25 7
26 4
27 5
28 6
29 8
30 5
465 191
a. Qué tipo de gráfica de control utilizaría

Se utilizaría una grafica de control tipo C ya que la muestra de los datos es
constante(una mesa de la 25 que se inspeccionan)
b. Cuáles son los límites de

control: LS= 13.9363
LC=6.366
7
LI=0.0000
c. Grafique e interprete
3. Dunkin Donuts es la empresa líder en fabricación de donuts y venta de café presente en más de 1000 locales
en todo el mundo. En su filial Chiclayo, se han tomado datos de un mes en la producción de donuts con la
cantidad de producción defectuosa (mal relleno, cocción indebida, merma fin de día etc) que son calificadas
así debido a que ya no se pueden colocar en venta al público.
Datos:
Son productos defectuosos
Datos en un mes , de los cuales esas mustras son variables ya que cada dia se saca un
numeor determinado de donust.
D Producci Donuts defectuosas -

í ón Mermas
a
1 320 26
2 350 18
3 280 24
4 250 14
5 350 32
6 700 52
7 650 40
8 290 28
9 360 16
1 260 28
0
1 240 20
1
1 360 29
2
1 640 62
3
1 600 32
4
1 280 14
5
1 320 22
6
1 260 22
7
1 230 11
8
1 350 34
9
2 700 39
0
2 650 22
1
2 250 17
2
2 340 25
3
2 260 16
4
25 240 23
26 350 32
27 750 20
28 700 46
29 350 17
30 320 16

El tipo de grafica de control que usaría seria la de unidades defectuosas tipo P, ya que
la muestra es variable.
b. Cuáles son los límites de

control LCS=0.1038
LC=0.066
4 LCI=
0.0291
c. Grafique e interprete
4. En una empresa de rubro alimenticio, se empaquetan salchichas en paquetes mediante ciertas máquinas.
Un problema que se ha tenido es que dentro del paquete sobra aire (falta de vacío). El problema se detecta
mediante inspección semi - automatizada, en donde las salchichas con aire de sobra son segregadas y después
se vuelven a abrir para recuperar las salchichas y volverlas a empaquetar.
El atributo de vacío es importante ya que si un paquete llega con aire al mercado, la vida de
anaquel se acorta, por lo que días después la salchicha cambia de color, pierde frescura y
esta situación repercute en los clientes insatisfechos y genera una mala imagen de la
compañía. Se Toma una muestra tamaño 500. Los datos obtenidos durante tres días en una
máquina se muestran en la siguiente tabla dividida por subgrupos:
Datos relevantes:
- Defectuosas
- Grafica =NP (muestra contante).
PAQUETES
SUBGRU
CON
PO
AIRE
1 15
2 5
3 8
4 10
5 6
6 5
7 5
8 7
9 2
10 4
11 9
12 17
13 4
14 5
15 3
16 10
17 7
18 5
19 4
20 9
21 7
22 5
23 7
24 4
25 2
26 3
27 5
28 3
29 6
30 5
31 7
32 9
33 5
34 3
35 8
36 15
37 4
38 6
39 8
40 5
Debe utilizar una gráfica de control tipo NP(Muestra constante):

b. Cuáles son los límites de control:
Los limites de control son los siguientes:
LCS=13.9
8 LC=6.43
LCI=0.00
c. Grafique e interprete:
En la grafica podemos observar el numero de paquetes de salchichas defectuosos con aire. Al

observar dicha grafica en los subgrupos 1,12, y 36 están por encima de límite superior.
Por lo observado podemos concluir que el proceso no esta bajo control estadístico.
Por lo que se recomuineda identificar las causas de problemas para posibles
soluciones en la calidad que esta requiera.
54
Conclusión
Como pudimos observar en este trabajo cada uno de los temas mostrados en el
mismo can casi de la mano con diferentes constantes o bien apoyándose una de
la otra con cortos conocimiento de todas, gracias a esta investigación nos dimos la
tarea de aprender y adquirir un mejor conocimiento del tema de la estadística
enfocada a los principios de muestreo.
55
Referencias
Ramiro González Horta. (Junio 2011). Muestreo y estimación aplicado al control

estadístico de procesos. 2022, de 1Library Sitio web:
https://1library.co/document/y90p8mjy-6-1-2.html
Alejandro Quintela del Rio. (2019). Estadística Básica Edulcorada. 2022, de
Boockdown Sitio web: https://bookdown.org/aquintela/EBE/
SoyStaff. (Febrero 23, 2016). Graficas de control y tipos de variación en los
procesos. Mayo 20,2022, de SoyStaff Sitio web: http://soy-
staff.blogspot.com/2016/02/GraficasdeControl.html
Jorge Alonzo Martínez . (2019). Intervalo de confianza para la media

poblacional.. 2022, de Ekuatio Sitio web: https://ekuatio.com/intervalo-de-
confianza-para-la-media-poblacional-ejercicios-resueltos-paso-a-paso/
56

Tarea - 1 - Unidad5 - Principios de Muestreo - Rosales - Hugo

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tarea - 1 - Unidad5 - Principios de Muestreo - Rosales - Hugo

Cargado por

Copyright:

Formatos disponibles

INSTITUTO TECNOLOGICO DE MERIDA

TAREA #1 Principios de muestreo.

PERIODO ESCOLAR: FEBRERO - JUNIO 2022

PROFESOR: CARLOS MIGUEL SALAZAR DURAN

MÉRIDA, YUC. A 22 DE MAYO DE 2022

Fundamentos Teóricos del Muestreo y Estimación.

Etapas del muestreo

• Muestra invitada. Son los sujetos de la población a quienes se les invita a

• Muestra real. Es la muestra productora de los datos que servirán para el

Técnicas de muestreo La elección de la muestra puede hacerse desde dos

• Azar simple. Cada miembro de la población tiene la misma probabilidad de

• Aleatorio sistemático. Una vez ordenados los sujetos de la población, a partir

• Aleatorio estratificado. Es un proceso en el que ciertos subgrupos o estratos

• Aleatorio por conglomerados. En este muestreo la unidad muestral es el

• Multietapa. La elección se hace en sucesivas etapas que van desde los

• Accidental o causal. Esta muestra se forma con sujetos que casualmente se

• Muestra de voluntarios. En algunas investigaciones el autor se ve obligado a

• Muestreos mixtos. Dadas las dificultades existentes a la hora de seleccionar

Una profesora de Historia, ante la proximidad de un Referéndum en la Unión

Así, cuando un dato o resultado es la suma de contribuciones independientes, de

Este teorema asegura, de manera esquemática, que, cuando sumamos un número

De manera general, si X1, X2...,Xn son variables de media o esperanza μi=E(Xi) y

En el caso de sumar variables aleatorias normales, la aproximación anterior no es tal,

La proporción muestral de una característica A es el número de veces que dicha

En vez de tener una enfermedad, AA puede representar estar de acuerdo o no con

donde X1 es la variable X en el individuo 1…, Xn es la variable X en el individuo n,

## [1] 102 94 98 103 114 109 94 90 109 109

y, como la suma de arriba es aproximadamente una distribución normal, de

La media y varianza de cada variable individual es:

Es decir, la probabilidad de que la suma de las rentas de 100 personas

Intervalos de Confianza para la media poblacional.

Por tanto, a partir de la media muestral, puedo generar un intervalo de confianza

Cómo calcular el intervalo de confianza para la media poblacional

Y si lo representamos en una curva de distribución normal y lo comparamos con la

De esta expresión despejo x1:

Ahora tipifico x2:

Si te das cuenta, las expresiones donde he despejado x1 y x2 son iguales a la

A esa expresión de color azul es lo que se llama el error:

Que sustituyendo el error por su expresión el intervalo de confianza para la media

Vamos a analizar un poco más con detalle la fórmula del error:

Al estar el número de individuos N dividiendo en el denominador, cuando mayor sea

Ejercicio resuelto sobre el Intervalo de confianza para la

Nos preguntan el intervalo de confianza al 90% para la media poblacional μ:

Sustituyo z de α/2, σ y N por sus valores y calculo:

El intervalo de confianza se encuentra entre la media muestral menos el error y

Operamos y nos queda:

Por lo que al 90% de seguridad, podemos decir que la media de la población se

Si sustituimos el error por su fórmula nos queda:

La raíz del segundo miembro pasa a elevar al cuadrado al primer miembro

Distribución muestral de la media con varianza conocida

Un estadístico es una función de variables aleatorias y es también otra variable

Niveles de significación en una normal estandarizada

Despejando el parámetro μ obtenemos

Por tanto, el I.C. para μ al nivel de confianza

El procedimiento teórico para llegar a esta fórmula es simple, aunque difícil de

El I.C. para μμ al nivel de confianza 1−α es:

donde el valor Zα/2=1.645 se puede obtener como

b. Escribimos de nuevo la formula del intervalo de confianza:

Esto es, el error de estimación está acotado:

Hay que tomar entonces n=139 mediciones.

es decir, habría que tomar una muestra 4 veces más grande.

Regla de la raíz de n: “si quieres multiplicar la exactitud de una investigación, no

La forma de una distribución muestral de depende de nuestros tamaños de