Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modulo de Estadis 2018
Modulo de Estadis 2018
EXTENSION VILLANUEVA
ASIGNATURA ESTADISTICA II
GUIA DE ESTUDIO
amsantiago@uniguajira.edu.co
monterocivil@gmail.com
1. PRESENTACIÓN
En nuestra última década del siglo XXI, hemos observado, que nuestro país y demás países
del mundo, la vida diaria de todo ser humano está rodeada de diversos grados de
incertidumbre, que inciden en los problemas económicos, social, político, cultural, dejando
como consecuencias, estados de violencia, desempleo, miseria, desarrollo no adecuado de
las empresas, resultados no satisfactorio de la información, mal manejo de la información
en algunos casos para la toma de decisiones. Es preciso decir que para la solución de los
problemas anteriores contamos con una herramienta importante, que es la estadística II,
Inferencial las cual utiliza las técnicas en casi todos los aspectos de la vida y mediante ella
podemos utilizar métodos y modelos, estimaciones, hipótesis para predecir el resultado de
futuras repeticiones en las empresas. Se diseñan encuestas para obtener información previa
por ejemplo el día de las elecciones y predecir el resultado de las mismas. Se seleccionan al
azar consumidores para obtener información, con el fin de predecir, la frecuencia con
respecto a cierto producto, el medico investiga para obtener el efecto de ciertos
medicamentos a través de expertos y condiciones ambientales controladas en los humanos y
así determinan el método apropiado para curar la enfermedad. El ingeniero muestra las
características de calidad de un producto junto con otras variables controlables del proceso,
para facilitar la identificación de variables que están más relacionadas con nuestra calidad.
En algunos casos se toman muestras de productos recientemente fabricados, antes de su
envío al mercado, para decidir si se retira o se entrega ciertos lotes, dichos productos. El
economista y el contador público consideran varios índices de la situación económica
durante cierto periodo y utiliza la información para predecir la situación contable,
económica y futura. Las técnicas estadísticas desempeñan una función importante en el
logro de los objetivos de cada uno de los problemas de nuestra región o país. El requisito
para la explicación de la teoría es la estadística y la formulación de sus objetivos. Por eso
podemos decir que la estadística es la rama del método científico que trata de los datos
recopilados al contar o medir, propiedades de alguna población y a partir de los métodos y
conclusiones de expertos y procesos. Entramos en la toma de decisiones.
CONTENDIO PROGRAMATICO
I. UNIDAD
1-TEORÍA DE LA COMBINATORIA
1.1 Permutaciones y combinaciones
1.2 Formulas y ejemplos prácticos
1.3 Teoría de la probabilidad
II.UNIDAD
2 DISTRIBUCIONES MUESTRALES
2.1 Muestras aleatorias con y sin reemplazo
2.2 Media muestral
2.3 Varianza muestral
2.4 Propiedades de Media muestral y Varianza muestral
III. UNIDAD
3. ESTIMACIÓN DE PARÁMETROS
3.1 Estimación Puntual
3.1.1 Generalidades
3.1.2 Definición de estimación puntual
3.1.3 Propiedades de los estimadores: insesgado, eficiente, consistente y suficiente.
3.1.4 Método de máxima verosimilitud.
3.2 Estimación por Intervalos
3.2.1 Definición de estimación por intervalos.
3.2.2 Intervalo de confianza para estimar la media poblacional.
3.2.3 Intervalo de confianza para estimar la diferencia de medias Poblacionales.
3.2.4 Intervalo de confianza para estimar la proporción Poblacional
3.2.5 Intervalo de confianza para estimar la diferencia de proporciones poblacionales.
Intervalo de confianza para estimar la varianza poblacional
IV. UNIDAD
4. PRUEBAS DE HIPÓTESIS
4.1 Definición de pruebas de hipótesis.
4.2 Prueba de hipótesis para la media poblacional.
4.3 Prueba de hipótesis para la diferencia de medias poblacionales.
4.4 Prueba de hipótesis para la proporción poblacional
4.5 Prueba de hipótesis para la diferencia de proporciones poblacionales.
4.6 Prueba de hipótesis para la varianza poblacional.
V. UNIDAD
5REGRESIÓN Y CORRELACIÓN
5.1 Generalidades
5.2 El método de mínimos cuadrados
5.3 Inferencias basadas en estimadores de mínimos cuadrados
5.4 Regresión simple y regresión múltiple
5.5 Correlación
1-TEORIA DE COMBINATORIA.
Evento: es un conjunto formado por los elementos del espacio muestral con alguna
característica similar.
Como los eventos son conjuntos de le puede aplicar las operaciones y propiedades de la
teoría de conjunto.
Evento simple:
Evento compuesto:
Evento imposible:
Evento seguro:
Unión de Eventos:
Intersección de Eventos:
Eventos mutuamente excluyentes:
Importa el orden en que se escriben los elementos y/o estos se pueden repetir.
Existen varias fases para realizar algún experimento y en cada fase hay diferentes
maneras de hacerlo.
EJEMPLO 2: una persona quiere hacer una rifa de tres cifras ¿cuantas boletas debe
imprimir?: N=10 n=3 #S=103= 1000 boletas
#S= 10x10x10=1000 donde N1= son las opciones que tiene el primer número de la boleta.
Al igual ocurre con N2 y N3.
Ejercicios:
1-En Colombia las placas de los automóviles, tienen tres letras (de un alfabeto de 26)
seguida de tres dígitos. La cantidad de placas sin letras ni números repetidos que comienzan
por vocal y son impares es:
2-Un examen consta de 4 preguntas, hay que dar respuesta a solo 3 de las 4 preguntas,
¿cuantos exámenes de diferente contenido habrá que corregir como máximo?
1.2.2 PERMUTACION
𝑁!
NPn= Cuando N=n entonces NPn =N!
(𝑁−𝑛)!
𝑛!
NPn=
𝑛1!𝑥𝑛2𝑥𝑛3𝑥…
EJEMPLO 3:
Hallar la cantidad de maneras en que pueden obtener las medallas de oro, plata y bronce 10
ciclista que participan en un campeonato.
𝑁! 𝑁! 10!
NPn=
(𝑁−𝑛)!
: N=10 n=3 NPn=
(𝑁−𝑛)!
= (10−3 )!
= 10!
7!
= 720
EJEMPLO 4:
𝑛! 10!
Tenemos que s=3 t=3 i=2 a=1 y c=1 NPn= = = 50.400
𝑛1!𝑥𝑛2𝑥𝑛3𝑥… 3!∗3!∗2!∗1!∗1!
Ejercicios:
𝑁!
NCn=
(𝑁−𝑛)!∗𝑛!
EJEMPLO 5:
EJEMPLO 6:
𝑁! 5! 𝑁! 7!
a) NCn=
(𝑁−𝑛)!∗𝑛!
= (5−2)!∗2! = 10 NCn=
(𝑁−𝑛)!∗𝑛!
= (7−3)!∗3! = 35
# De comisión =10*35=350
𝑁! 5! 𝑁! 6!
b) NCn=
(𝑁−𝑛)!∗𝑛!
= (5−2)!∗2! = 10 NCn=
(𝑁−𝑛)!∗𝑛!
= (6−2)!∗2! = 15
# De comisión =10*15=150
𝑁! 3! 𝑁! 7!
c) NCn=
(𝑁−𝑛)!∗𝑛!
= (3−2)!∗2! = 3 NCn=
(𝑁−𝑛)!∗𝑛!
= (7−3)!∗3! = 35
# De comisión =3*35=105
Ejercicios:
1-Con 7 consonantes y 5 vocales, ¿cuantas palabras se pueden formar que tengan 4
consonantes distintas y 3 vocales distintas? Se admiten palabras sin significado.
EJEMPLO 7:
En una bolsa hay 5 balotas numeradas del 5 al 9. Se extraen dos balotas, una detrás de otra
sin devolverlas a la bolsa. Se anotan los resultados formando números de dos cifras. ¿Cuál
es la probabilidad de formar un número múltiplo de 4 o formar un número mayor que 87?.
El espacio muestral está dado por #S=5*4=20 (utilizando el principio de multiplicación)
#S=56,57,58,59,65,67,68,69,75,76,78,79,85,86,87,89,95,96,97,98
Eventos: E=[x/x es múltiplo de 4] = [56, 68 ,76 96]
F= [x/x mayor que 87] = [89,95, 96, 97, 98]
EJEMPLO 8:
Una bolsa contiene 4 bolas blancas y 2 bolas negras; otra contiene 3 bolas blancas y 5
bolas negras. Si se saca una bola de cada bolsa hallar la probabilidad de que:
a) Ambas sean blancas b) ambas sean negras y c) una sea blanca y la otra negra.
a) (4/6)*(3/8)=1/4 =25%
b) (2/6)*(5/8)=5/24 =21%
c) (4/6)*(3/8)+(2/6)*(5/8)=13/24=54%
Este último valor también se puede determinar aplicando “La probabilidad de que no
suceda A es: P’(A)=1-P(A). = 1-1/4-5/24=13/14
Ejercicios:
1-se escogen al azar dos números de teléfono y se tiene en cuenta la última cifra de cada
uno, determinar las siguientes probabilidades:
a-que las dos cifras sean iguales
b-que su suma sea 11
c-que su suma sea mayor que 4 menor que 8
2-En una universidad, el 30% de los alumnos hablan inglés, el 10%, francés y el 8% los dos
idiomas. ¿Cuál es la probabilidad de encontrar alumnos que hablen alguna lengua
extranjera?
3-hallar la probabilidad de obtener un total de 7 puntos al lanzar dos dados:
a-un solo lanzamiento
b-en dos lanzamientos.
1.3.1Probabilidad condicional
La probabilidad de un evento A, cuando se sabe que ha ocurrido un evento B, se denomina
Probabilidad condicional. Se simboliza P(A/B) y se lee la probabilidad de A dado B.
Para calcular la probabilidad de un evento dado que ha ocurrido otro, se tiene una
restricción en el espacio muestral. El nuevo espacio muestral será formado por el número
de elementos del evento que sucedió primero:
𝑃(𝐴∩𝐵)
P(A/B)=
𝑃(𝐵)
II. DISTRIBUCIONES MUESTRALES
Distribuciones Muéstrales
DISTRIBUCIONES MUESTRALES
Medidas Población Muestra
M aritmética µ 𝑥̅
Varianza 𝜎2 𝑠2
Desviación típica 𝜎 s
Tamaño N n
𝑁! 𝑁!
NCn= sin reposición NPn= NPn =N! con reposición.
(𝑁−𝑛)!∗𝑛! (𝑁−𝑛)!
𝜎 𝑁−𝑛
𝜎𝑥 = ∗√ Sin reemplazo
√𝑛 𝑁−1
EJEMPLO 9:
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 7,3 y
5. Encuentre:
a) µ, la media poblacional.
b) 𝜎, la desviación estándar poblacional.
c) µx, la media de la distribución muestral de medias
d) 𝜎𝑥 =, la desviación estándar de la distribución muestral de medias.
𝜎 1.63
𝜎𝑥 = = = 1.15
√𝑛 √2
EJEMPLO 10:
Se eligen muestras ordenadas de tamaño 2, sin reemplazo, de la población de valores 7,3 y
5. Encuentre:
a) µ, la media poblacional.
b) 𝜎, la desviación estándar poblacional.
c) µx, la media de la distribución muestral de medias
d) 𝜎𝑥 =, la desviación estándar de la distribución muestral de medias.
Tartus Industries cuenta con siete empleados de producción (a quienes se les considera la
población). En la tabla 8-2 se incluyen los ingresos por hora de cada uno de ellos.
1- µ=($7+7+8+8+7+8+9)/7 =$7.71
𝑁!
2- NCn=
(𝑁−𝑛)!∗𝑛!
=21.
Las 21 medias muestrales que se pueden tomar de la población:
a-La media de las medias de las muestras es exactamente igual a la media de la población.
EJEMPLO 11:
µ= µx =1.72mts 𝜎 = 0.076𝑚𝑡𝑠
𝑥̅ − 𝜇
𝑧=
𝜎 𝑁−𝑛
( ) ∗ √𝑁 − 1
√𝑛
EJEMPLO 11:
EJEMPLO 13.
EJEMPLO 14.
Si la resistencia promedio está por encima de 6.5 toneladas o por debajo de 5.5, se suspende
el proceso. Si esta entre entre 5.5 y 6.5 se deja tal y como está.
Solución:
Z 2 A 0,4772 ; Z 2 A 0,4772
EJERCICIOS:
3-Se sabe que en cierta ciudad, los clientes de los restaurantes gastan en promedio $32.900
en comida, con una desviación estándar de $1.500. Si se pide cada uno de los 50
restaurantes que seleccionen al azar las cuentas de 100 personas y que informen sobre el
consumo medio de esas 100 personas. ¿De cuántos restaurantes debe esperarse que
informen sobre cuentas promedios, superiores $33.259,30?
𝑝−𝑃 𝑃𝑄 𝑃𝑄 𝑁−𝑛
Simbología: 𝑧= 𝜎𝑝 = √
𝑛
𝜎𝑝 = √
𝑛
∗√
𝑁−1
𝑃𝑄
√
𝑛
Sin reemplazo
P=P-0.5/n factor de corrección
Q=P-1
EJEMPLO 15:
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos.
Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la
proporción de la muestra de la gente que fuma cigarrillos sea menor que 55%.
Datos:
0.55−0.60
n=800 P=0.60 p=0.55 𝑧 = =2.89 Z=0.4981 P=0.5-0.4981=0.0019=0.19%
0.60∗0.40
√
800
EJEMPLO 16:
Se tiene que el 4% de las piezas producidas por ciertas maquinas es defectuosa, ¿cuál es la
probabilidad de que en un grupo de 200 piezas, el 3% más sea defectuosa.
0.03−0.04
𝑧= =-0.71
√0.40∗0,60
200
Z ( 0,2611) p=0,2611+0,5=0,7611 =76,11%
EJEMPLO 17.
Por cada 50 sindicatos del país 23 no están de acuerdo con el comercio con la china
continental; ¿cuál es la probabilidad de que en una encuesta a 100 sindicatos muestre que
más del 52% tenga la misma posición?
0,52−0,46
𝑧= =1.20
0.46∗0,54
√
100
Z (0.3849) p=0,50-0,3849=0,1151 =11,51%
EJERCICIOS:
3) Un nuevo tratamiento con rayo láser asegura su eficacia en el 90% de los casos. Si se
selecciona una muestra de 40 enfermos, ¿qué probabilidad hay que se presente una
diferencia mayor del 8% en cuanto a su eficacia?
2.4 Distribución de diferencia entre dos medias Muestrales.
Suponga que se tienen dos poblaciones distintas, la primera con media µ1 y desviación
estándar σ1, y la segunda con media µ2 y desviación estándar σ2. Más aún, se elige una
muestra aleatoria de tamaño n1 de la primera población y una muestra independiente
aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada
muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se llama
distribución muestral de las diferencias entre medias o la distribución muestral del
estadístico 𝑥̅ 1 − 𝑥̅ 2.
Se puede demostrar que la media de las diferencias de todos los pares de medias muestrales
posibles, es igual a la diferencia entre las medias poblacionales. 𝜇𝑥̅ −𝑦̅ = 𝜇𝑥̅ − 𝜇𝑦̅ .
La desviación típica de las diferencias entre los pares de medias muestrales se simboliza
2
∑[(𝑥𝑖
̅ −𝑦𝑖
̅̅̅)+(𝜇
̅ 𝑥 −𝜇
̅ 𝑦 )] 𝜎 2 𝜎𝑦 2
por: 𝜎𝑥̅ −𝑦̅ =√ 𝜎𝑥̅ −𝑦̅ =√ 𝑥 +
𝑀 𝑛1 𝑛2
EJEMPLO 18
(−1000) − (742)
𝑧= = −11.62 → 0.50
9502 820 2
√
80 + 60
A=0.4572+0.500=0.9572
P=1-0.9272=0.0428=4.28%
EJEMPLO 18
Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación
estándar de 1.23km/L para la primera gasolina y una desviación estándar de 1.37km/L para
la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos.
a) ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor
de 0.45km/L que la segunda gasolina?
b) ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre
entre 0.65 y 0.83km/L a favor de la gasolina 1?.
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos
poblaciones, por lo que se supondrán que son iguales
(0.45)−(0)
a) 𝑧= 2 2
=1.52→0.4357
√1.23 +1.37
35 42
P=0.5-0.4357=0.0643=6.43%
b) 0.65 x1x20.83
(0.65) − (0)
𝑧= = 2.19 → 0.4857
2 2
√1.23 + 1.37
35 42
(0.83) − (0)
𝑧= = 2.80 → 0.4974
2 2
√1.23 + 1.37
35 42
P=0.4974-0.4857=0.0117=1.17%
EJERCICIOS:
La variante estadística, estará dad en la misma forma que fue presentada para diferencias entre
medias muestrales:
(𝑝1 − 𝑝2 ) − (𝑃1 − 𝑃2 )
𝑧=
𝑃1∗ 𝑄1 𝑃2 ∗ 𝑄2
√ +
𝑛1 𝑛2
EJEMPLO 19:
Los hombres y mujeres adultos radicados en la ciudad de Bogotá difieren en sus opiniones
sobre la promulgación de la pena de muerte para personas culpables de asesinato de niños.
Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que
sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100
hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte para
asesinos de niños, determine la probabilidad de que el porcentaje de hombres a favor sea al
menos 3% mayor que el de las mujeres.
Datos: P1 = 0.12 P2 = 0.10 n1 = 100 n2 = 100 p1-p2=0.03
P=0.5-0.0910=0.409=40.9%
EJEMPLO 20:
Consideremos dos máquinas que producen un determinado artículo; la primera produce por
término medio un 14% de artículos defectuosos, en tanto que otra, produce el 20% de
artículos defectuoso; si se obtienen muestras de 200 unidades en la primera y 100 unidades
en la segunda, ¿cuál es la probabilidad de que difiera A de B en 8% o más?
P=0.5-0.4986=0.0014=0.14%
EJEMPLO 21:
Ciertas encuestas a televidentes, revelan que el 25% de los hombres y 33% de las mujeres
de clase media ven la telenovela de las 11 y ½ de la mañana. ¿Cuál es la probabilidad de
que en dos muestras aleatorias de 150 hombres y 100 mujeres respectivamente,
pertenecientes a dicho estrato social, se encuentre que la proporción de hombres que han
visto el programa sea igual o mayor que la proporción de mujeres?
P=0.50-0.4131=0.0869=8.69%
EJERCICIOS:
2) Es sabido que los porcentajes de familias con ingreso superior a $570.000 en las
ciudades A y B es de 25% y 20%, respectivamente. Se seleccionan al azar dos muestras de
100 familias en cada una de las dos ciudades y se comparan las proporciones muestrales de
las familias con ingreso superior a $570.000. ¿Cuál es la probabilidad de que la proporción
muestral correspondiente a la ciudad B sea:
3) En una agencia de empleo se sabe que por cada 100 personas que lo solicitan, 50,
además de ser bachilleres, tienen alguna experiencia sobre el trabajo a desarrollar. Se
extraen 2 muestras de la misma población, en forma independiente de tamaño 36 cada una.
¿Cuál es la probabilidad de que las dos muestras difieran en 8 o más personas que tengan
alguna experiencia sobre el trabajo?
III ESTIMACION DE PARAMETROS.
Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo. Una
estimación puntual es un único valor estadístico y se usa para estimar un parámetro. El
estadístico usado se denomina estimador. Una estimación por intervalo es un rango,
generalmente de ancho finito, que se espera que contenga el parámetro.
Existen varias tablas en las cuales podemos encontrar el valor de z, según sea el área
proporcionada por la misma
Ejemplo 1:
Encuentre el valor de z para un nivel de confianza del 95%.→0.95→0.475→1.96 (valor
encontrado en la tabla)
Para los valores de 96%, 97%... se utilizara el proceso de interpolación la cual consiste en
fijar tres puntos en la tabla con los valores correspondientes. Así.
x1 x x2
0.4798 0.48 0.4803
fx1 fx fx2
2.05 ¿? 2.06
𝑓𝑥2 − 𝑓𝑥1 2.06 − 2.05
𝑓(𝑥) = 𝑓𝑥1 + ∗ (𝑥 − 𝑥1 ) = 2.05 + ∗ (0.48 − 0.4798)
(𝑥2 − 𝑥1 ) 0.48.03 − 0.4798
N.S 90% 91% 92% 93% 94% 95% 96% 97% 98% 99%
Z 1.645 1.96 2.054
𝑥̅ −𝑢
Sabemos que la distribución muestral de media 𝑧=𝜎 , ahora desconocemos el
⁄ 𝑛
√
parámetro y se quiere estimar por medio de la media muestral, por lo tanto al despejar a
𝒛𝝈
̅±
"𝑢" del modelo anterior nos queda: 𝒖 = 𝒙
√𝒏
𝟐.𝟓𝟕𝟓∗𝟑.𝟓
𝑢 = 25.6 ± = 25.6 ± 1.50 → 𝟐𝟒. 𝟏 ≤ 𝒖 ≤ 𝟐𝟕. 𝟏
√𝟑𝟔
Respuesta: la cooperativa no debe comprar esa flota ya que el valor de la media no oscila
entre el margen que la cooperativa espera: 𝑢 = 27.5𝑀𝑖𝑙𝑙𝑎𝑠
Ejemplo 3: Se encuentra que la concentración promedio de zinc que se saca del gua a
partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentración media
de zinc en el río. Suponga que la desviación estándar de la población es 0.3.
𝑥̅ = 2.6 𝑔
3.3 Estimación de Proporciones:
𝑝−𝑃 𝑷𝑄
Sabemos que 𝑧 = al despejar p nos queda 𝑷 = 𝑝 ± 𝑧√ 𝑛
𝑃𝑄
√
𝑛
En este despeje podemos observar que se necesita el valor del parámetro P y es
precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporción de la
muestra p siempre y cuando el tamaño de muestra no sea pequeño.
𝑝𝑄
𝑷 = 𝑝 ± 𝑧√
𝑛
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el
procedimiento del intervalo de confianza que se establece aquí no es confiable, por tanto,
no se debe utilizar. Para estar seguro, se debe requerir que np ó nq sea mayor o igual a 5.
Ejemplo 4: En un estudio de 300 accidentes de automóvil en una ciudad específica, 60
tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 90%
de confianza para aproximar la proporción de todos los accidentes automovilísticos que en
esa ciudad tienen consecuencias fatales
𝑝 = 60⁄300 = 0,2 𝑄 = 0,8 𝑧 = 1.645 𝑛 = 300.
0.2 ∗ 0.8
𝑷 = 0.20 ± 1.645√ = 0.20 ± 0,038 → 𝟎. 𝟏𝟔𝟐 ≤ 𝑷 ≤ 𝟎. 𝟐𝟑𝟖
300
Como se puede observar en este problema solo se solicitó un intervalo, pero es posible que
la pregunta sea más que eso, donde ustedes deban tomar una decisión miremos el siguiente
ejemplo.
0.22 ∗ 0.78
𝑃 = 0.22 ± 2.575√ = 0.22 ± 0,057 → 𝟎. 𝟏𝟔𝟑 ≤ 𝑃 ≤ 𝟎, 𝟐𝟖
350
Respuesta: se apoya la afirmación ya que la revista dinero está hablando que un 25% de los
directores son personas de afuera. (Uno de cada cuatro-….1/4=0,25=25%) y este valor está
dentro del rango calculado.
3.4 Estimación de diferencia de medias:
Recordemos que:
𝜎𝑥 2 𝜎𝑦 2
𝜇̅1 − 𝜇̅2 = (𝑥̅1 − 𝑥̅2 ) ± 𝑧√ +
𝑛1 𝑛2
En el caso en que se desconozcan las varianzas de la población y los tamaños de muestra
sean mayores a 30 se podrá utilizar la varianza de la muestra como una estimación puntual.
Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la
media mayor menos la media menor
362 642
𝜇̅𝐵 − 𝜇̅𝐴 = (42 − 36) ± 2.05√ 50 + 3,43 < (𝜇̅𝐵 − 𝜇̅𝐴 ) < 8,57
75
La interpretación de este ejemplo sería que con un nivel de confianza del 96% la diferencia
del rendimiento promedio esta entre 3.43 y 8.57 millas por galón a favor del motor B. Esto
quiere decir que el motor B da más rendimiento promedio que el motor A, ya que los dos
valores del intervalo son positivos.
(𝑝1 − 𝑝2 ) − (𝑃1 − 𝑃2 )
𝑧= , 𝑎𝑙 𝑑𝑒𝑠𝑝𝑒𝑗𝑎𝑟𝑃1 − 𝑃2 𝑠𝑒 𝑡𝑖𝑒𝑛𝑒:
𝑃 𝑄 𝑃 ∗ 𝑄2
√ 1∗ 1 + 2
𝑛1 𝑛2
𝑝1∗ 𝑄1 𝑝2∗ 𝑄2
𝑃1 − 𝑃2 = (𝑝1 − 𝑝2 ) ± 𝑧√ +
𝑛1 𝑛2
Ejemplo 8: La empresa MOSTER S.A utiliza dos máquinas diferentes para cortar los
disfraces para la temporada que se avecina “31 de octubre”. Se han presentado problemas
en cuanto al ajuste apropiado, debido al funcionamiento de las maquinas. Como director de
control de calidad su trabajo es estimar la diferencia en la proporción de defectos
producidos por cada máquina. Se tomaron muestras de tamaño n1= 170 y n2=150: la
primera máquina produjo 38% de defectos y la segunda, 53% de defectos. Fijar un nivel de
significancia de 96%. Si la evidencia sugiere que la diferencia en la proporción de defectos
excede del 5%, todos los disfraces se producirán en la máquina que parezca tener una tasa
de defectos menor. ¿Qué decisión tomará usted?
0,037 ≤ 𝑃2 − 𝑃1 ≤ 0,263
Se puede estar 96% seguro que la proporción de defectos producidos por las máquinas
esta entre 3.7% y 26.3% a favor de la maquina 2 además el valor de 5% está dentro del
rango determinado, el coordinador de calidad debe inclinarse por la maquina 2.
Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo
procedimiento producirá una disminución significativa en la proporción de artículos
defectuosos comparado con el método existente.
EJERCICIOS:
3- Suponga que se quiere estimar la producción media por hora, en un proceso que produce
antibiótico. Se observa el proceso durante 100 períodos de una hora, seleccionados al azar y
se obtiene una media de 34 onzas por hora con una desviación estándar de 3 onzas por hora.
Estime la producción media por hora para el proceso, utilizando un nivel de confianza del
95%.
4-Se seleccionaron dos muestras de 400 tubos electrónicos, de cada una de dos líneas de
producción, A y B. De la línea A se obtuvieron 40 tubos defectuosos y de la B 80. Estime
la diferencia real en las fracciones de defectuosos para las dos líneas, con un coeficiente de
confianza de 0.90 e interprete los resultados.
IV ESTIMACION DE TAMAÑO DE LA MUESTRA.
Al iniciar cualquier investigación, la primera pregunta que surge es: ¿de qué tamaño debe
ser la o las muestras?. La respuesta a esta pregunta la veremos en esta sección, con
conceptos que ya se han visto a través de este material.
Los recursos financieros y tiempo, no entran dentro de la determinación técnica del tamaño
de la muestra.
Sin reemplazo
Sin reemplazo
→n1=kn2
→n1=kn2
Ejemplos1: Una empresa eléctrica fabrica focos que tienen una duración aproximadamente
normal con una desviación estándar de 40 horas. ¿De qué tamaño se necesita una muestra si
se desea tener 96% de confianza que la media real esté dentro de 10 horas de la media real?
𝑧∗𝜎 2 2,053 ∗ 40 2
𝑛=( ) =( ) = 67.43 = 68
𝜀 10
Ejemplo 2: En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de
Hamilton, Canadá, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se
requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de P
esté dentro de 0.02?
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más
poblaciones.
Ho; m = 50 cm/s
H1; m ¹ 50 cm/s
Puesto que la hipótesis alternativa especifica valores de m que pueden ser mayores o
menores que 50 cm/s, también se conoce como hipótesis alternativa bilateral. En algunas
situaciones, lo que se desea es formular una hipótesis alternativa unilateral, como en
Ho; m = 50 cm/s Ho; m = 50 cm/s ó H1; m < 50 cm/s H1; m > 50 cm/s
Es importante recordar que las hipótesis siempre son proposiciones sobre la población o
distribución bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parámetro de la población especificado en la hipótesis nula se determina en una de tres
maneras diferentes:
1- Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el
objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del
parámetro.
2-Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso bajo
estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo.
3-Cuando el valor del parámetro proviene de consideraciones externas, tales como las
especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta situación,
el objetivo usual de la prueba de hipótesis es probar el cumplimiento de las
especificaciones.
La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de
poblaciones que al inicio se supone cierta (es decir, la “creencia a priori”).
La hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta
es la hipótesis del investigador.
Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar
Ho o no rechazar Ho.
1. Interpretar correctamente hacia qué distribución muestral se ajustan los datos del
enunciado.
2. Interpretar correctamente los datos del enunciado diferenciando los parámetros de los
estadísticos. Así mismo se debe determinar en este punto información implícita como el
tipo de muestreo y si la población es finita o infinita.
4. Establecer la regla de decisión. Esta se puede establecer en función del valor crítico, el
cual se obtiene dependiendo del valor de a (Error tipo I o nivel de significancia) o en
función del estadístico límite de la distribución muestral. Cada una de las hipótesis deberá
ser argumentada correctamente para tomar la decisión, la cual estará en función de la
hipótesis nula o Ho.
Unilateral Derecho
Unilateral Izquierdo
Bilateral
Ensayo de hipótesis:
Ho; Parámetro ≤x
Ensayo de hipótesis:
Ho; Parámetro ≥x
Ensayo de hipótesis:
Ho; Parámetro = x
H1; Parámetro ≠x
PROBLEMAS:
1-Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado
muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de
8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice
un nivel de significancia de 0.05.
2-. Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma
aproximadamente normal con una media de 800 horas y una desviación estándar de 40
horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas,
¿muestran los datos suficiente evidencia para decir que la duración media ha cambiado?
Utilice un nivel de significancia del 0.04.
3-Una muestra aleatoria de 64 bolsas de palomitas de maíz pesan, en promedio 5.23 onzas
con una desviación estándar de 0.24 onzas. Pruebe la hipótesis de que µ= 5.5 onzas contra a
la hipótesis alternativa, µ < 5.5 onzas en el nivel de significancia de 0.05.
4-Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que se
construyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta afirmación
si una investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas
bombas de calor? Utilice un nivel de significancia de 0.10.
6-Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura
tapaporos. Se prueban dos fórmulas de pintura; la fórmula 1 tiene el contenido químico
estándar, y la fórmula 2 tiene un nuevo ingrediente secante que debe reducir el tiempo de
secado. De la experiencia se sabe que la desviación estándar del tiempo de secado es ocho
minutos, y esta variabilidad inherente no debe verse afectada por la adición del nuevo
ingrediente. Se pintan diez especímenes con la fórmula 1, y otros diez con la fórmula 2. Los
dos tiempos promedio de secado muéstrales son 121 min y 112 min respectivamente. ¿A
qué conclusiones puede llegar el diseñador del producto sobre la eficacia del nuevo
ingrediente, utilizando α = 0?05?
7- Existen dos tipos de plástico apropiados para su uso por un fabricante de componentes
electrónicos. La tensión de ruptura de ese plástico es un parámetro importante. Se sabe que
𝜎1 = 𝜎1 = 1𝑝𝑠𝑖. De una muestra aleatoria de tamaño 10 y 12 para cada plástico
respectivamente, se tiene una media de 162.5 para el plástico 1 y de 155 para el plástico 2.
La compañía no adoptará el plástico 1 a menos que la tensión de ruptura de éste exceda a la
del plástico 2 al menos por 10 psi. Con base a la información contenida en la muestra, ¿la
compañía deberá utilizar el plástico 1? Utilice α = 0.05 para llegar a una decisión.
8-Se evalúan dos tipos diferentes de soluciones para pulir, para su posible uso en una
operación de pulido en la fabricación de lentes intraoculares utilizados en el ojo humano
después de una cirugía de cataratas. Se pulen 300 lentes con la primera solución y, de éstos,
253 no presentaron defectos inducidos por el pulido. Después se pulen otros 300 lentes con
la segunda solución, de los cuales 196 resultan satisfactorios. ¿Existe alguna razón para
creer que las dos soluciones para pulir son diferentes? Utilice α= 0.01
9-. Se tomará el voto entre los residentes de una ciudad y el condado circundante para
determinar si se debe construir una planta química propuesta. El lugar de construcción está
dentro de los límites de la ciudad y por esta razón muchos votantes del condado consideran
que la propuesta pasará debido a la gran proporción de votantes que favorecen la
construcción. Para determinar si hay una diferencia significativa en la proporción de
votantes de la ciudad y votantes del condado que favorecen la propuesta, se realiza una
encuesta. Si 120 de 200 votantes de la ciudad favorecen la propuesta y 240 de 500
residentes del condado también lo hacen, ¿estaría de acuerdo en que la proporción de
votantes de la ciudad que favorecen la propuesta es más alto que la proporción de votantes
del condado? Utilice un nivel de significancia de 0.025.
VI Regresión y correlación
Una ecuación de este tipo se conoce como una relación de estimación, el procedimiento de
estimación es también una técnica de predicción, lo cual es función fundamental de la
ciencia natural o social. En la ciencia naturales, la predicción se hace posible porque existe
la relación causa efecto entre dos o más variables.
Como es de esperarse, para dar validez a las conclusiones acerca de la citada recta, hay que
fijar cierto supuestos, entre los de mayor relevancia están los siguientes.
Calculo de la ecuación : 𝑦 = 𝒃𝑥 + 𝒄
Ventas Costos
𝑥 𝑦 𝑥𝑦 𝑥2 𝑦2
8 5 40 64 25
12 7 84 144 49
18 10 180 324 100
32 16 512 1.024 256
40 22 880 1.600 484
110 60 1.696 3.156 914
𝑛 ∑ 𝑥𝑖 𝑦𝑖 − (∑ 𝑥𝑖 ) (∑ 𝑦𝑖 ) ∑ 𝑥𝑖 𝑦𝑖 − 𝑛𝑥̅ 𝑦̅
𝑏= = 0.51 𝑏=
2
𝑛 ∑ 𝑥𝑖 − (∑ 𝑥𝑖 )2 ∑ 𝑥𝑖2 − 𝑛𝑥̅ 2
𝒚 = 𝟎. 𝟓𝟏𝒙 + 𝟎. 𝟕𝟖
¿Si las ventas son de 20 millones cual será el costo para ese año?
Los estimados que se hacen, por lo general, difieren del valor real, por lo tanto, hay
necesidad de calcular el margen de error que se pueda cometer. En principio calculados la
varianza residual o varianza no explicada, correspondiente a los puntos del diagrama de
dispersión que no quedan sobre la recta de estimación, en otras palabras, aquellos que
quedaron por fuera de ella. Los modelos para calcularla son variados y aproximadamente
2
los resultados son iguales. 𝑠𝑦𝑥 = 𝑉𝑅 = 𝑆𝑒2
2
∑ 𝑦𝑖2 − 𝑐 ∑ 𝑦𝑖 − 𝑏 ∑ 𝑦𝑖 𝑥𝑖
𝑠𝑦𝑥 = = 0.448
𝑛
2
𝑠𝑦𝑥 = 𝑠𝑦2 (1 − 𝑟 2 )
2
𝑐𝑜𝑣 2
𝑠𝑦𝑥 = 𝑠𝑦2 − = 0.38
𝑠𝑥2
2 →𝑠
𝑠𝑦𝑥 = √𝑠𝑦𝑥 𝑦𝑥 = √0.38 = 0.62
0.62
10.98 ± 𝟑. 𝟏𝟖𝟐𝟓 10.98 ± 0.40
5
10.58 < 𝑦 < 11.38
Coeficiente de correlación ( R )
2
𝐶𝑜𝑣 2 𝑆𝑦𝑥 𝐶𝑜𝑣
𝑅2 = 𝑅2 = 1 − 𝑟=𝑅=
𝑆𝑋2 𝑆𝑌2 𝑆𝑦2 𝑆𝑥 𝑆𝑦
Entre más cercano esté R a 1, hay una mayor correlación cuando r≤30 se dice que no hay
correlación, por lo tanto, la relación utilizada no nos va a dar una buena estimación