Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DESCRIPTIVA
E
INFERENCIAL
2
Unidad IV: Muestreo y cálculo Muestral
Tenemos variables cualitativas como, por ejemplo, la variedad del frijol, el color de
las frutas, el sabor de una comida, etc.
También tenemos variables cuantitativas tales como la estatura de una persona,
los costos de los boletos en las aerolíneas, el peso de las maletas de los viajeros en
un aeropuerto, etc.
∑𝑵
𝟏𝑿
La media aritmética 𝝁 = Desviación estándar 𝝈 = √𝝈𝟐
𝑵
𝟐 ∑𝑵
𝟏 (𝑿−𝝁)
𝟐
La varianza 𝝈 = El total 𝜏 = ∑𝑋
𝑵
3
Ejemplo: El nivel promedio de colesterol sérico de adultos > 65 años de la X región,
Ejemplo: El peso promedio de los pollos de 2 meses de edad en una granja avícola,
etc
Estadístico: Es una medida que proviene de los datos de una muestra. Los
estadísticos son constantes que representan por lo general características numéricas
de una muestra.
Ejemplo
̅̅̅ ∑𝑵 𝑿
La media aritmética 𝑿= 𝟏
𝒏
𝟐 ̅̅̅ 𝟐
∑𝑵(𝑿−𝑿 )
La varianza 𝑺 = 𝟏
𝒏−𝟏
4.2 Muestreo: Conjunto de técnicas que nos ayudan a elegir, extraer una muestra
representativa, de una población.
Existen poblaciones finitas tan grandes que resulta imposible observar sus
4
elementos en un período de tiempo razonable, por ejemplo, todas las familias de una
ciudad. Otras son tan inmensas que muchos de sus elementos son inaccesibles y
su tamaño puede ser desconocido, por ejemplo, todos los pequeños agricultores de
un país.
También existen poblaciones infinitamente grandes, esto es, con un número ilimitado
de elementos, razón por la cual le llamaremos poblaciones infinitas. Podríamos
considerar que los procesos continuos de producción de algún bien generan
poblaciones infinitas porque, teóricamente, podría suponerse que estos procesos
operan indefinidamente, por ejemplo, el proceso de producción de chips de
computadores.
A) Muestreo no probabilístico
:
B) Muestreo probabilístico (azar)
A) Muestreo no probabilístico: Se caracteriza porque no todos los elementos de la
población tienen oportunidad de ser seleccionados para integrar la muestra. Este tipo
de muestreo se basa en:
• Conocimiento de expertos.
• Juicios.
• La conveniencia.
• La experiencia.
• Es intencional.
5
“cada elemento de la población tiene igual probabilidad de ser incluidos en la
muestra”
El procedimiento habitual consiste en numerar todos los elementos de la población y
se seleccionan muestras del tamaño deseado utilizando una tabla de números
aleatorios o un programa de ordenador que proporcione números aleatorios
b) 13 35 57 79
15 37 59
17 39
19
99.73%.
95.44%
68.26%
6
2) Muestreo Aleatorio Sistemático
Se ordenan los individuos de la población y se numeran. - Se divide la población en
tantos grupos como individuos se quieren tener en la muestra. Se selecciona uno al
azar en el primer grupo y se elige el que ocupa el mismo lugar en todos los grupos.
La ventaja principal es que es más sencillo y más barato que el muestreo aleatorio
simple, además, se comporta igual si no hay patrones o periodicidades en los datos.
La aparición de patrones desconocidos puede llevar a importantes errores en la
estimación de los parámetros.
N
K=
n
Ejemplo 2. Tome una muestra aleatoria de 6 árboles de aguacate de los 78 que están
plantados en una finca, mediante el muestreo sistemático. Use la tabla de números
aleatorios entrando por la fila 2 columna 4 con dirección descendente.
Primero; Se enumeran los 78 árboles 1, 2, 3, 4 . . . . . . . 78
7
N 78
Después de busca el intervalo k = = = 13
n 6
En seguida, se determinan el punto de arranque r que estará comprendido entre 1 y
13, es decir, 1 < r < 13 usando la tabla, se encontró el número 07.
Por último, se encuentran los otros números que formarán la muestra a partir del punto
de arranque; 7, 7+13, 7+2(13), 7+3(13), 7+4(13), 7 + 5(13), lo que resulta: 7, 20, 33, 46,
59, y 72. Estos elementos formarán la muestra.
Ejemplo 1:
Z = 1.96, valor en la tabla de distribución Normal para el 95 % de confianza;
N = es la población total = 54,337 habitantes del municipio El Rama;
p y q = probabilidades complementarias de 0.5,
e = error de estimación = 0.05
n = tamaño de la muestra = ?
8
Z2 * p*q* N (1.96) 2 * (0.5) * (0.5) * 54,337
n= n=
N * e2 + Z 2 * p * q 54,337 * (0.05) 2 + (1.96) 2 * (0.5) * (0.5)
n = 381.46 o n = 382
Ejemplo 2:
Se desea determinar los estilos de liderazgo predominantes en las 382 empresas más
grandes de origen agropecuario del país, con un 95 % de confianza, por tanto, el error
de estimación “e” = 5 %, a través de la aplicación de una encuesta a ingenieros
agropecuarios.
Pasos a seguir
Primero: Calcular el tamaño de muestra:
donde:
Z = 1.96, para el nivel de confianza del 95%;
N = es la población objeto de estudio = 382;
p y q = probabilidades complementarias = 0.5,
e = error de estimación = 5 %.
n = tamaño de la muestra =?
Se debe utilizar la tabla de los números aleatorios para seleccionar las 192 empresas
del marco muestral
Ejemplo 3.
9
Observe que: Si se requiere minimizar el error se debe aumentar el tamaño de la
muestra. Al aumentar el tamaño de la muestra, se incrementan los costos.
3) El muestreo estratificado
Se divide la población en grupos homogéneos (estratos) de acuerdo con las
características a estudiar. Por ejemplo, en un estudio de las características
socioeconómicas de una ciudad los estratos pueden ser los barrios de la misma, ya
que los barrios suelen presentar características diferenciales, parcelas cultivadas en
una comunidad etc.
Se selecciona una muestra aleatoria de cada estrato tratando de que todos los
estratos de la población queden representados.
10
2) La varianza del estimador de la media poblacional se reduce, debido a que la
variabilidad dentro de los grupos o estratos es generalmente menor que la variabilidad
de la población.
Ejemplo 1:
11
Las sub muestras serían:
n1 = 268, que son los directores.
n2 = 87, que son los subdirectores.
n3 = 173 Gerentes.
n4 = 8 sub gerentes (o vice gerentes)
n5 =72 Jefes de departamento.
La muestra sería
n = n1 + n 2 + n 3 + n 4 + n 5
n = 268 + 87 + 173 + 8 + 72
n = 608
El costo por observación en cada pueblo se estima en C$9 mientras que en el área
rural el costo es de C$16. En una encuesta previa se estimó que las varianzas de las
submuestras de los estratos 1, 2 y 3 son S12 = 25, S22 = 225 y S32 = 100.
12
El tamaño de cada estrato se presenta en la tabla que se da a continuación. Calcular
para un error aproximado de 2 horas:
a) El tamaño de la muestra requerida.
b) El tamaño de las muestras.
a)
n=
N S i. i / Ci N .S .
i i Ci n=
800.83338,835
E 2
22
N 2 + N i .S i 2 3102 + 27,125
4 4
7,075,362.206
n= = 57.418 n = 58 hogares. Tamaño de la muestra.
123,225
Ni.Si / Ci
b) ni = n Fórmula para calcular el tamaño de la submuestra.
N i S i / / Ci
258.3333
n1 = 58 = 18.71 = 19 hogares Submuestra del primer estrato
800.8333
(Pueblo A)
310
n2 = 58 = 22.45 = 22 hogares Submuestra del segundo estrato
800.8333
(Pueblo B)
232.5
n3 = 58 = 16.83 = 17 hogares Sub muestra del tercer estrato
800.8333
(Área rural).
Total 58
13
258.3333
a) n1 = n n1 = 0.32258 n
800.8333
310
n2 = n n2 = 0.38709 n
800.8333
232.5
n3 = n n3 = 0.2903 n
800.8333
b)
n1 = 0.32258 n n1 = 0.32258 (46) = 14.8 n1 = 15 hogares
submuestra estrato 1.
14
2
NS c
2E
n= 2
N M + Sc
2
4
Entonces:
2
NS c 100(108.42)
n= n= = 17.6387
2E 2 (0.3)
2 2
N M + Sc 100(15) + 108.42
2
4 4
En conclusión: Se deben muestrear n = 18 bloques rectangulares.
Ejercicio (Guía # 1)
IV Explique:
a) Importancia de aplicar muestreo en proyectos de Investigación.
b) ¿Funciones de la muestra y cuáles son sus etapas?
c) ¿Qué es población?
d) ¿Qué es muestra?
e) ¿Cuál es la importancia de la Estadística en su carrera?
f) ¿Qué es un estadístico?
g) ¿Cuál es la importancia de trabajar con muestra y no con la población en estudio?
h) ¿Cuáles son los tipos de muestreo probabilísticos?
i)¿Cuál es la diferencia entre muestra y muestreo?
II Lea y Analice:
1) En la región norte del país hay una población aproximada de 10 600 agricultores, se
quiere aplicar una semilla mejorada de maíz resistente a la sequía, plagas. Los
16
ingenieros quieren saber el tamaño de la muestra para saber la factibilidad del proyecto.
El nivel de confianza será el 90%. Use muestreo completamente aleatorio.
e = 0.10 Z = 0.645 p = 0.5 q = 0.5
Calcule el tamaño de la muestra.
2) En una finca hay 14 000 árboles frutales, el ingeniero debe realizar un estudio con
una muestra representativa de árboles para medir la calidad, cantidad de frutas, el nivel
de confianza será el 95%. La cantidad de arboledas está distribuida de la siguiente
manera:
Árboles de aguacate: 1 420 Árboles de cacao: 3 000
Árboles de jocote: 430 Árboles de naranjas: 3 850
Árboles de mango:1 200 Árboles de guayaba: ¿?
Árboles de limones ácidos: 1 400
Las varianzas son respectivamente: 16, 25, 9, 36, 49, 81 64
a) Calcular el tamaño de la muestra n.
b) Encuentre la submuestra utilizando el muestreo aleatorio estratificado.
3) En una finca hay 850 árboles frutales, se quiere obtener una muestra representativa,
estratificada con el objeto de estudiar la calidad y cantidad de frutos de cada uno de
ellos, la cantidad de árboles está distribuido de la siguiente manera:
a) arboles de zapote 380
b) arboles de mandarina 200
c) árboles de papaya 140
d) arboles de nancite 80
e) árboles de jícaro 50
Las varianzas son respectivamente 25, 9, 36, 49, 64
4.5 Estimación
Se refiere a un cálculo aproximado del parámetro poblacional a partir de datos
muestrales.
17
4.5.2 Errores de muestreo: Estos errores ocurren debido a que sólo se hace una
observación parcial de la población. El error de muestreo es la diferencia absoluta entre
resultado de la muestra y el parámetro. Estos errores no son medibles porque los
parámetros son desconocidos y aunque son aleatorios pueden ser controlados, de
manera que, a menor error de muestreo, mayor precisión tendrá la estimación.
Estos errores no son medibles, pero pueden ser controlados evitando las causas que
los producen.
La exactitud de una estimación tiene que ver con lo que llamaremos el error total, esto
es la suma del error de muestreo más el error ajeno al muestreo.
18
Estadística y probabilidades
𝝈 𝝈
̅ − 𝒁∝
𝑿 < 𝝁 ̅ + 𝒁∝
< 𝑿 Intervalo para la media
𝟐 √𝒏 𝟐 √𝒏
Población infinita y n > 30.
Población infinita.
𝝈 𝑵−𝒏
E= + 𝒁∝ √ Población finita.
𝟐 √𝒏 𝑵−𝟏
𝝈 𝑵−𝒏
𝐄 = + 𝒁∝ 𝑵√𝑵−𝟏 Para el total
𝟐 √𝒏
𝑵−𝒏 𝒏
Nota: El factor de corrección √ p u e d e omitirse si < 0.05
𝑵−𝟏 𝑵
Ejemplo 1:
Se va a vender ju nuevo cereal para desayuno como prueba de mercados durante un
mes en las tiendas de una cadena de autoservicio. Los resultados de una muestra de
36 tiendas indicaron ventas promedio de C$1,200 con una desviación estándar de
C$180.
a) Construya un intervalo de confianza del 99% para las ventas promedio reales de ese
nuevo cereal.
b) Si la cadena tiene 200 tiendas, establezca un intervalo de confianza del 99% de las
ventas promedio reales de ese producto.
Solución
a)
𝝈 𝝈
̅ − 𝒁∝
𝑿 < 𝝁 ̅ + 𝒁∝
< 𝑿
𝟐 √𝒏 𝟐 √𝒏
𝟏𝟖𝟎 𝟏𝟖𝟎
𝟏, 𝟐𝟎𝟎 − 𝟐. 𝟓𝟖 < 𝝁 < 𝟏. 𝟐𝟎𝟎 + 𝟐. 𝟓𝟖
√𝟑𝟔 √𝟑𝟔
1,200 – 77.4 < 𝝁 < 1,200 + 77.4
C$ 1,122.60 < 𝝁 < C$ 1,277.4 Intervalo de confianza
Interpretación “Se tiene un 99% de confianza de que las ventas promedio estarán
comprendida entre 1,122.60 y 1,277.40 córdobas”
b)
𝝈 𝑵−𝒏 𝝈 𝑵−𝒏
̅ − 𝒁∝
𝑿 √ < 𝝁 ̅ + 𝒁∝
< 𝑿 √
𝟐 √𝒏 𝑵−𝟏 𝟐 √𝒏 𝑵−𝟏
Interpretación “Se tiene un 99% de confianza de que las ventas promedio de las
200 tiendas, estarán comprendida entre 1,122.60 y 1,277.40 córdobas”
Nótese que este intervalo tiene una longitud menor que el anterior, esto significa
que proporciona mejor precisión con el mismo nivel de confianza.
En este inciso b) la población es finita con N = 200. Usamos el factor de corrección
𝒏
ya que la fracción es igual a 0.18 que es mayor que 0.05
𝑵
Ejemplo 2:
Consideremos el conjunto de todas las pequeñas industrias de un determinado
artículo. Se quiere determinar la producción anual total de todas las industrias y se
sabe en base a estudios anteriores que la desviación estándar poblacional de las
producciones anuales es igual a 2 en miles de unidades.
Con tal propósito se selecciona de un listado actualizado de826 industrias una muestra
aleatoria de 50 industrias obteniendo una ´producción anual promedio de 5.52 en miles
de unidades.
a) Encuentre un intervalo de confianza del 90% para la producción anual total de las
industrias.
b) Con una confianza del 95% calcule el valor del error máximo permitido en la
estimación de la producción anual total del inciso (a).
c) Si quiero estimar la producción anual promedio de las industrias con una
confiabilidad del 80% de que el error máximo permitido sea de 300 unidades ¿cuál
debe ser el tamaño de la muestra?
Solución:
a) 𝝈 𝑵−𝒏 𝝈 𝑵−𝒏
̅ − 𝒁∝
N𝑿 ̅ + 𝒁∝ N
𝑵√𝑵−𝟏 < 𝑻 < N 𝑿 √
𝟐 √𝒏 𝟐 √𝒏 𝑵−𝟏
𝟐 𝟖𝟐𝟔−𝟓𝟎
826(5.52) ± (1.645) (826) √
√𝟓𝟎 𝟖𝟐𝟔−𝟏
𝝈 𝑵−𝒏
b) E = 𝒁∝ 𝑵√𝑵−𝟏
𝟐 √𝒏
𝟐 𝟖𝟐𝟔−𝟓𝟎
E = 1.96 (𝟖𝟐𝟔)√
√𝟓𝟎 𝟖𝟐𝟔−𝟏
E = 444.1051
c)
El error máximo dado es de 300 unidades. Estas se convierten a miles porque las
otras variables están en miles. Entonces E = 300 / 1,000 = 0.3
∝
El valor de Z para el 70% de confianza es de 1.28
𝟐
𝒁∝. 𝟐
𝝈 𝟏.𝟐𝟖.(𝟐) 𝟐
n0 = [
𝟐
] n0 = [ ] n0 = 72.8178
𝑬 𝟎.𝟑
n = 67 pequeñas industrias.
Distribución t de student.
σX̅ =
𝑺 𝑵−𝒏
√ Para poblaciones finitas
√𝒏 𝑵−𝟏
22
Msc. Isaac de Jesús Alvir Videa
Estadística y probabilidades
𝑺 𝑺
̅ − 𝒕∝
𝑿 ̅ + 𝒕∝
< 𝝁 < 𝑿
𝟐 √𝒏 𝟐 √𝒏
Ejemplo 3:
Una máquina empaca azúcar en bolsas plásticas. Se quiere estimar el peso promedio de
las bolsas de azúcar sabiendo por estudios anteriores que la desviación estándar
poblacional es de 0.10 libras. Del flujo de producción se toma una muestra aleatoria
sistemática de 10 bolsas obteniendo los pesos en libras.
5.10, 4.90, 4.80, 5.15, 5.05, 4.95, 4.97, 4.85, 5.03, 5.00
a) Obtenga un intervalo de confianza del 80% para el peso promedio de las bolsas de
azúcar.
b) Identifique el error muestral promedio en la estimación del intervalo del inciso (a).
c) Con la misma muestra anterior, obtenga un intervalo de confianza para el peso
promedio de las bolsas de azúcar para un nivel de confianza del 97%. Compare la
longitud de este intervalo con el obtenido en el inciso (a)
d) Identifique el error máximo permitido con una confianza del 80% en la estimación del
inciso (a)
e) Se quiere estimar el peso promedio de las bolsas de azúcar con una confiabilidad de
90% de que el error máximo permitido sea de 0.0313 libras ¿Cuál debe ser el
tamaño de la muestra?
Solución
a)
Datos n = 10, ̅ = 4.98 libras Desviación Estándar S = 0.10 libras.
media muestral 𝑿
NC = 80%
∝ 𝟎.𝟐𝟎
∝ = 1 – 0.80 = 0.20 = = 0.10
𝟐 𝟐
Grados de libertad GL = n – 1 = 10 – 1 = 9
𝑺 𝑺
̅ − 𝒕∝
𝑿 < 𝝁 ̅ + 𝒕∝
< 𝑿
𝟐 √𝒏 𝟐 √𝒏
𝟎.𝟏𝟎
𝟒. 𝟗𝟖 + 𝟏. 𝟑𝟖𝟑 < 𝝁
√𝟏𝟎
4.9363 5.0237
b)
𝑺 𝟎.𝟏𝟎
σX̅ = σX̅ = σX̅ = 0.0316 libras.
√𝒏 √𝟏𝟎
c)
∝ 𝟎.𝟎𝟑
∝ = 1 – 0.97 = 0.03 = = 0.015
𝟐 𝟐
Grados de libertad GL = n – 1 = 10 – 1 = 9
𝟎.𝟏𝟎 𝟎.𝟏𝟎
𝟒. 𝟗𝟖 − 𝟐. 𝟓𝟕𝟒 < 𝝁 < 𝟒. 𝟗𝟖 + 𝟐. 𝟓𝟕𝟒
√𝟏𝟎 √𝟏𝟎
d)
E = 0.0487 libras
e)
∝ 𝟎.𝟏𝟎
∝ = 1 – 0.90 = 0.10 = = 0.05
𝟐 𝟐
Grados de libertad GL = n – 1 = 10 – 1 = 9
24
Msc. Isaac de Jesús Alvir Videa
Estadística y probabilidades
(𝟏.𝟖𝟑𝟑)(𝟎.𝟏𝟎)
𝟐
n = [ ] n = 34.29 n = 34 bolsas de azúcar.
𝟎.𝟎𝟑𝟏𝟑
𝑃𝑠(1−𝑃𝑠) 𝑃𝑠(1−𝑃𝑠)
Ps - 𝒁∝ √
𝑛
< P < Ps + 𝐙∝ √
𝑛
Para una población infinita
𝟐 𝟐
𝑁−𝑛 𝒏
Nota: El factor de corrección √ puede omitirse si < 0.05
𝑁−1 𝑵
Tamaño de la muestra
∝ 𝟐
𝒁
𝟐
n = Ps (1 – Ps) [ ] Para una población infinita.
𝑬
∝ 𝟐
𝒁 𝒏𝟎 𝑵
𝟐
n0 = Ps (1 – Ps) [ ] y n = Para una población finita.
𝑬 𝒏𝟎 +(𝑵−𝟏)
25
Msc. Isaac de Jesús Alvir Videa
Estadística y probabilidades
𝒏𝟎 𝑵
La expresión n = se llama factor de corrección y puede omitirse
𝒏𝟎 +(𝑵−𝟏)
𝒏𝟎
si la fracción < 0.05
𝑵
Ejemplo 1:
Solución:
𝑿 𝟔𝟎
Ps = Ps = Ps = 0.60
𝒏 𝟏𝟎𝟎
∝ 𝟎.𝟎𝟏
∝ = 1 – 0.99 = 0.01 = = 0.005
𝟐 𝟐
Buscando este valor en la tabla de la distribución normal (de adentro hacia
afuera) así determinamos la fila y la columna. En tal caso el valor de 𝒁∝ = 2.58
𝟐
𝑃𝑠(1−𝑃𝑠) 𝑃𝑠(1−𝑃𝑠)
Ps - 𝒁∝ √
𝑛
< P < Ps + 𝐙∝ √
𝑛
𝟐 𝟐
0.60(1−0.60) 0.60(1−0.60)
0.60 - 𝟐. 𝟓𝟖√
100
< P < 0.60 + 𝟐. 𝟓𝟖√
100
26
Msc. Isaac de Jesús Alvir Videa
Estadística y probabilidades
E = 0.1264
∝ 𝟐
𝒁
𝟐 𝟐.𝟓𝟖 𝟐
n = Ps (1 – Ps) [ ] n = 0.60 (1 – 0.60) [ ]
𝑬 𝟎.𝟎𝟐𝟓
n = 2,556.0576 n = 2,557 clientes tarjetahabientes.
Nota: Observe que la muestra de tamaño 100 del inciso a) tiene el mismo nivel de
confianza (99%) pero tiene alrededor de cinco veces más error muestral que el
permitido aquí.
Ejemplo 2:
Suponga para el ejemplo anterior que la cadena de hoteles cuenta con 10,000
poseedores de tarjetas de crédito.
a) Encuentre un intervalo de confianza del 95% para el total de tarjetahabientes que
visitarían los hoteles los domingos.
𝒏 𝟏𝟎𝟎 𝑁−𝑛
Probamos = 0.01 < 0.05 Se omite el factor de corrección. √
𝑵 𝟏𝟎,𝟎𝟎𝟎 𝑁−1
𝑃𝑠(1−𝑃𝑠) 𝑃𝑠(1−𝑃𝑠)
Ps - 𝒁∝ 𝑵√
𝑛
< T < NPs + 𝐙∝ 𝑵√ 𝑛
𝟐 𝟐
27
Msc. Isaac de Jesús Alvir Videa
Estadística y probabilidades
∝ 𝟐
𝒁
𝟐 𝟏.𝟗𝟔 𝟐
n = Ps (1 – Ps) [ ] n = 0.60 (1 – 0.60) [ ]
𝑬 𝟎.𝟎𝟐𝟓
n = 1,475.1744
𝒏 𝟏,𝟒𝟕𝟓.𝟏𝟕𝟒𝟒
Probamos = 0.1475 > 0.05 Se tiene que usar el factor de
𝑵 𝟏𝟎,𝟎𝟎𝟎
corrección.
𝒏𝟎 𝑵 𝟏,𝟒𝟕𝟓.𝟏𝟕𝟒𝟒(𝟏𝟎,𝟎𝟎𝟎)
n = n = = 1,285.64
𝒏𝟎 +(𝑵−𝟏) 𝟏,𝟒𝟕𝟓.𝟏𝟕𝟒𝟒+(𝟏𝟎,𝟎𝟎𝟎−𝟏)
n = 1,286 tarjetahabientes.
3) Los ingresos del impuesto sobre ventas en una comunidad particular se recogen
cada trimestre. Los siguientes datos representan los ingresos (en miles de
córdobas), cobrados durante el primer trimestre en una muestra de 9
establecimientos de menudeo en la comunidad.
5.1 Hipótesis: Es un supuesto que se hace acerca del valor de un parámetro de una
población o acerca de parámetros de varias poblaciones.
Hipótesis nula: La hipótesis nula será generalmente la que afirma en los problemas
ausencia de efecto alguno para determinada acción o tratamiento Se representa por
H0.
30
Estadística y probabilidades
31
Estadística y probabilidades
Z - z
Cuando H1 : 0
− Z Z
2 2
Solución
Paso 2. = 0.05
Paso 3.
x−
Z=
N −n
n N −1 Muestra grande (n > 30) Población finita.
0 1.645
A R
Reglas de decisión
Si Z < 1.645se acepta H0
Si Z > 1.645se Rechaza H0
47.30 − 44
Z=
6.6 200 − 36 3 .3
Z=
36 200 − 1 0.9986 = 3.30
Paso 5. Puesto que Z = 3.30 > 1.645 cae en la región de rechazo. Se rechaza la
hipótesis nula H0 (que dice que el rendimiento es 44 quintales por manzana) y se acepta
la hipótesis alternativa (H1 > 44.quintales por manzana).Se concluye que el rendimiento
es mayor de 44 quintales por manzana, por tanto se recomienda el uso del nuevo
fertilizante.
33
Estadística y probabilidades
Ejemplo 2: Prueba de dos colas muestras grandes n > 30
Suponga que una empresa tiene una cantidad muy grande de cuentas por cobrar y
que los saldos de esas cuentas tienen aproximadamente una distribución normal. En
los libros de la empresa aparece registrado un saldo promedio de C$ 25, 850.
Un auditor, utiliza muestreo estadístico para seleccionar una muestra de 100 cuentas,
donde se obtuvo un saldo promedio de C$ 27,550 y una desviación estándar de
C$ 1,200 ¿Debe el auditor concluir que el saldo es distinto a C$ 25, 850 y que por lo
tanto debe hacer un asiento de ajuste al valor en libros a un nivel de significancia del
2%?
Solución
Paso 1. H0: = 25,850 Hipótesis nula
H1: ≠ 25,850 Hipótesis alternativa
Es una prueba de dos colas pues la hipótesis alternativa dice “distinto que”. O
sea que puede ser mayor o puede ser menor.
Paso 2. = 0.02
Paso 3.
x−
Z =
n Muestra grande (n > 30) Población infinita.
Paso 4. Z = 2.33 (Valor crítico)
2
Reglas de decisión
-2.33 2.33
R A R
34
Estadística y probabilidades
27,550 − 25,850
Z=
1,200
100 1,700
Z= Z = 14.1667
120
Paso 5. Puesto que Z = 14.1667 > 2.33 cae en la región de rechazo. Se rechaza la
hipótesis nula H0 (que dice que el saldo promedio es de C$ 25,850) y se acepta la
hipótesis alternativa (H1 el saldo promedio es distinto que C$ 25,850) Se concluye
que el auditor debe hacer un asiento de ajuste al valor en libros.
Solución.
Paso 1. H0: = 2 libras El proceso está funcionando correctamente.
H1: < 2 libras El proceso no está funcionando correctamente.
Paso 2. = 0.01
Paso 3
x−
t=
s
n Muestra pequeña (n < 30) población infinita.
Paso 4
(Valor crítico)
G. L. = n – 1 = 6 – 1 = 5
35
Estadística y probabilidades
t = - 3.365
Reglas de decisión
1.98 − 2
t=
0.1377
6
t = - 0.355
Paso 5.
Como el valor de t = - 0.355 > - 3.365 cae en la región de aceptación. Se
dice que no hay suficiente evidencia para rechazar la hipótesis nula
H0: = 2. Se concluye que el proceso de producción está funcionando
correctamente.
Ps − Po
Z= Si la población es finita y n > 30
Po (1 − Po ) N − n
n N −1
x
Ps es la proporción de casos de la muestra. Ps =
n
36
Estadística y probabilidades
Solución
Paso 1. H0: P0 = 0.02 Declarar que el 2% de las cuentas no satisfacen los requisitos.
H1: P0> 0.02 Más del 2% de las cuentas no satisfacen los requisitos
Paso 2. = 0.01
Ps − Po
Paso 3. Z = Población finita y muestra grande.
Po (1 − Po ) N − n
n N −1
x 12
Ps = Ps = = 0.04
n 300
0.04 − 0.02
Z= Z = 2.765
0.02(1 − 0.02) 1500 − 300
300 1500 − 1
Paso 5. Puesto que Z = 2.765 > 2.33 cae en la región de rechazo. Se rechaza la
hipótesis nula H0 (que dice que el 2% de las cuentas no satisfacen los requisitos) y se
acepta la hipótesis alternativa (H1que más del 2% de las cuentas no satisfacen los
requisitos) Se concluye que el auditor debe declara que más del 2% de las cuentas
no satisfacen los requisitos institucionales.
37
Estadística y probabilidades
Ejercicio (Guía # 3)
38
Estadística y probabilidades
39
Estadística y probabilidades
40
Estadística y probabilidades
(∑ 𝑿)(∑ 𝒀)
∑ 𝑿𝒀−
𝒏
r=
(∑ 𝑿)𝟐 (∑ 𝒀)𝟐
√[∑ 𝑿𝟐 − ][∑ 𝒀𝟐 − 𝒏 ]
𝒏
Ejemplo:
La gerente de una compañía desea estimar la relación que hay entre los costos
usados en el proceso de producción (Y) y las horas de operación (X). Con esta
información espera ser capaz de preparar un presupuesto más preciso y tener
un mejor control sobre los costos.
Datos sobre los costos en centenas de dólares para varias horas de operación
del proceso se presentan abajo.
N X Y
1 50 6.5
2 20 4
3 30 4.5
4 50 6
5 40 5.5
6 30 5
7 30 5.5
8 10 3.5
9 40 6
10 20 4.5
41
Estadística y probabilidades
N X Y Xy x cuad Y cuad.
1 50 6.5 325 2500 42.25
2 20 4 80 400 16
3 30 4.5 135 900 20.25
4 50 6 300 2500 36
5 40 5.5 220 1600 30.25
6 30 5 150 900 25
7 30 5.5 165 900 30.25
8 10 3.5 35 100 12.25
9 40 6 240 1600 36
10 20 4.5 90 400 20.25
320 51 1,740 11,800 268.5
(∑ 𝑿)(∑ 𝒀)
∑ 𝑿𝒀−
𝒏
r=
(∑ 𝑿)𝟐 (∑ 𝒀)𝟐
√[∑ 𝑿𝟐 − ][∑ 𝒀𝟐 − 𝒏 ]
𝒏
42
Estadística y probabilidades
(𝟑𝟐𝟎)(𝟓𝟏)
𝟏,𝟕𝟒𝟎− 𝟏𝟎𝟖
r=
𝟏𝟎
r= r = 0.9434
(𝟑𝟐𝟎)𝟐 (𝟓𝟏)𝟐
√[𝟏,𝟓𝟔𝟎][𝟖.𝟒]
√[𝟏𝟏,𝟖𝟎𝟎− ][𝟐𝟔𝟖.𝟓− 𝟏𝟎 ]
𝟏𝟎
(∑ 𝑿)(∑ 𝒀) (𝟑𝟐𝟎)(𝟓𝟏)
∑ 𝑿𝒀− 𝟏,𝟕𝟒𝟎− 𝟏𝟎𝟖
b=
𝒏 𝟏𝟎
b= b= b = 0.0692
(∑ 𝑿)𝟐 (𝟑𝟐𝟎)𝟐 𝟏,𝟓𝟔𝟎
∑ 𝑿𝟐 − 𝟏𝟏,𝟖𝟎𝟎− 𝟏𝟎
𝒏
∑ 𝒀−𝒃 ∑ 𝑿 𝟓𝟏−(𝟎.𝟎𝟔𝟗𝟐)(𝟑𝟐𝟎)
a= a= a = 2.8856
𝒏 𝟏𝟎
43
Estadística y probabilidades
6.8 Pronostico
Se trata de predecir el valor de la variable Y a partir que se conoce el valor de la
variable X.
Suponga que se desea saber cuál es el costo cuando se trabajan 60 horas.
Tomamos la ecuación de regresión y sustituimos el valor de x = 60
⏞
𝒀 = 2.8856 + 0.0692X
⏞ = 2.8856 + 0.0692(60)
𝒀 ⏞ = 7.0376
𝒀
Se espera que los costos sean aproximadamente 7.0376 cientos de dólares
cuando se trabajen 60 horas.
Ejercicio (Guía # 4)
44
Estadística y probabilidades
N X Y
1 5 5.2
2 10 4.8
3 15 4.6
4 20 4.5
5 25 4.3
6 30 4.0
7 35 3.8
45