Está en la página 1de 18

Campus Interlomas

Medio Termino

Nombre: Sergio Mendizabal Rodriguez Maestro: Juan Manuel Romano

NE: 00276173

Clase: Estadistica Infer y Pronostico

Hora: 14:30-16:00

Fecha: 03/02/2018

Intervalos de confianza

En la vida diaria y en la empresa se encuentran referentes de la estadística, por


ejemplo cuando se lleva a los niños al colegio, se dice que en promedio los
educandos tienen una calificación de 8.5, en la casa en promedio se ve la
televisión dos horas al día, en el trabajo se manejan los promedios de los salarios,
los tiempos extra que realizan los empleados, de manera continua encontramos
durante el día conceptos de estadística. La mayoría de las actividades donde se
encuentran variables aleatorias se quedan sin importancia alguna, pero en el ramo
de la empresa siempre se está evaluando toda información que tenga a bien
reportar una ganancia utilidad, o mejora de productiva. En este ramo se encuentra
la estadística, pero se requiere saber el comportamiento que tiene o pueden llegar
a tener las variables, para ello se cuenta con la estadística.

Para mucha gente estadística significa descripciones numéricas. Esto puede


verificarse fácilmente al escuchar el domingo cualquiera, a un comentarista de
televisión narrar un juego de fútbol. Sin embargo en términos más precisos, le
estadística es el estudio de fenómenos aleatorios. Es este sentido la ciencia de la
estadística tienen, virtualmente un alcance ilimitado de aplicaciones en un
espectro tan amplio de disciplinas que van desde las ciencias y la ingeniería hasta
la leyes y la medicina.

La estadística tiene una herramienta para calcular los intervalos de confianza en


los que se desea se encuentren determinadas probabilidades de algunas
variables aleatorias.

Los intervalos de confianza tienen su propias metodología, aquí se desarrollaran


con ejemplos la teoría de dichas metodologías.

Para ejemplificar y mostrar el dominio de dichas herramientas desarrollaremos los


puntos siguientes.

Para intervalo de confianza muestra la media con sigma conocida:

Autozone es una empresa de mercadeo en el ramo automotriz, su entrada al


mercado de valores fue en 2012, teniendo una aceptación en el mercado
mexicano las tiendas autozone han aumentado entre los años 2014-2017, su
acción más representativa en la Bolsa Mexicana de Valores es la AZO, que tiene
el precio de hoy (29/09/2018) tiene un precio por acción de $ 526,920, se tomó
una muestra de los últimos tres meses con una base de 63 cotizaciones, los
meses de Julio, Agosto y Septiembre, que revela una media de $ 533,264. La
desviación estándar es de $ 25,819 (la coma es el punto decimal).

Para los accionistas de AZO, les gustaría conocer los siguientes aspectos.

¿Cuál es la media de la cotización de AZO?

¿Cuál es un conjunto de valores de la cotización razonable para no abandonar la


participación?

¿Qué se debe de entender de estos resultados?

En general el comportamiento de las acciones tiene un sesgo positivo, pues unas


acciones ganan más que otras, lo cual sesga la distribución en una dirección
positiva. Además el teorema de límite central estipula que, si se selecciona una
muestra grande, la distribución de las medias muestras tenderá a seguir una
distribución normal. En el caso de 63 muestras supera el mínimo que sugiere de
30, es lo bastante grande para suponer una distribución Normal.

Resolvamos el problema de una media con sigma conocida=$ 25,819

¿Cuál es la media de la cotización de AZO?

En este caso tenemos más de más de 2400 datos que determinarían la media
poblacional, el tiempo de análisis es muy largo, y necesitamos la respuesta hoy,
por lo que realizamos una inferencia de manera directa en la que suponemos que
una muestra representativa de la población supone el comportamiento de la
población, por lo que podemos decir que la media del valor de la acción AZO en
de $ 533,264.

¿Cuál es un conjunto de valores de la cotización razonable para no abandonar la


participación?

Nos piden un conjunto de valores que sean razonables para seguir en la


cotización de la acción, dichos valores deben garantizar una acción saludable, por
lo que se requiere de un intervalo en el cuál fluctué la acción sin grandes cambios
que puedan sugerir una caída en particular. Por lo que los accionistas deciden que
sea con un nivel de confianza del 95% para garantizar la estabilidad de la acción.

Orden de Datos

n=63

ẍ=533,264

σ=25,819

Para aplicar este nivel de confianza se aplica la siguiente fórmula

σ 25,819
ẍ±Z =533,264 ± 1.96
√n √ 63
Por lo que el valor que se obtiene es para el límite inferior 526,888, y para el límite
superior es 539,639. Esto es ($526,888 y $539,639). Este intervalo tiene en un
95% de confianza de evidencia estadística para que los accionistas tengan entre
estos precio la calma de que su acción es sana, sin problemas de altibajos.

Ahora tomamos el supuesto donde la sigma es desconocida, para ellos tomamos


los valores que refleja la muestra. Por ello se toma el valor de sigma de los datos
no agrupado, donde se suman todos los datos de la muestra y se realiza la
desviación.

Media con sigma desconocida

Tenemos el mismo problema de un intervalo de confianza

Se tiene la base de datos de una Universidad en que se encuentran 2000


empleados con diferentes cargos. Y profesores de Administración, diseño,
ingeniería, etc. en este caso lo que se desea es conocer un intervalo de confianza
de 90 % de los salarios de nuestra universidad. Se tomó una muestra de 63
empleados por un administrador.

Sabemos por el administrador de la universidad que el salario promedio es de


$2,705,069 pesos colombianos. La muestra arroja una desviación estándar de
$1,220,116. Esta desviación es de la muestra, pero no es de la poblacional, por lo
que se requiere de otro proceso para el cálculo de un intervalo de referencia
buscamos la desviación estándar, es decir desviación estándar de la población


2
con ( x−ẍ ) estimación de la desviación estándar de la
σ =s= =1,230,077
n−1
población.

Ahora el cálculo del error estándar de la media poblacional. Se elabora mediante


la siguiente fórmula:
ðẍ =
σ
=
√N −n
√ n N−1
=¿ $ 152,552.85 estimación del error estándar de la media de

una población finita (derivada de una estimación de la desviación estándar de la


población.

En seguida consideramos el nivel de confianza del 90% que incluiría el 45% del
área bajo la curva de la normal en ambos lados de la media en la campana de
Gauss. En la tabla nos arroja un valor de 1.64 como lo podemos verificar.

Procedemos al cálculo de nuestros estadísticos para el intervalo.

ẍ±1.64*(error de la desviación)

ẍ±1.64*(152,552.85), la media de los salarios es 2,705,069

Por lo tanto el cálculo del intervalo es:

2,705,069±1.64*152,552.85= ($2,454,881.95 , $2,998,225.30).

Este es el intervalo en el que se encuentra el 90% de los salarios de la universidad


de Colombia.

Para un grupo de 75 empleados de la universidad se les pregunto si querían


seguir con su programa de retiro y un 40 por ciento dijo que si lo datos son

N=75

p=0.40

q=0.60
A continuación se solicita que utilice esta muestra para encontrar un intervalo al el
que puedan tener el 99% de confianza du que contiene una proporción verdadera
de la población, Error estándar estimado de la población estimado de la porción

σ p=
√ √
pq
n
=
0.4∗0.6
75
=0.057 para el 99% el valor de Z=2.58 así

P+2.58* σ p =0.40+2.58(0.057)=0.40+0.147=0.547

p-2.58 σ p =0.40-2.58(0.057)=0.4-0.147=0.253

así el intervalo es (0.253 a 0.547)

Entonces los empleados que desean seguir con el sistema de pensión va de 19 a


41 empleados.

Un proceso produce cierta clase de cojinetes de bola cuyo diámetro interior es de


3cm, se seleccionan, en forma aleatoria 12 de estos cojinetes y se miden sus
diámetros internos, que resultan ser 3.01, 3.05, 2.99, 2.99, 3.02, 2.98, 2.99,
2.97,2.97, 3.02 y 3.01, suponiendo que le diámetro es una variable aleatoria
normalmente distribuida, determinar un intervalo de confianza del 99% para la
varianza, para la desviación estándar es (0.014986661 a 0.048040608)

Dado que el nivel de α=0.010 en la tabla de la Chi cuadrada tenemos 2.60 y 26.71,
respectivamente. Para terminar, el valor calculado de la varianza es
2
s =0.0005455 por lo tanto un intervalo de confianza DEL 99% par sigma
cuadrada es

(12−2)(0.0005455) (12−1 )∗(0.05455)


, =0.0002246, 0.0023079
26.7 2.6

Prueba de hipótesis para la media con sigma conocida


Se presenta un problema de la Empresa Alerce Austral que se dedica a la
fabricación y venta de artículos para campamento en diferentes plantas y tiendas a
lo largo de México. La producción semanal del artículo M-380, que corresponde a
una mesa plegable, tiene una distribución normal, con una media de 300 unidades
y una desviación estándar igual a 20.

Por la expansión del mercado, se modernizan los métodos de producción y se


aumentó la mano de obra. El gerente de producción quiere investigar si se
produjeron cambios en la producción semanal del artículo m-380 es diferente a
300 mesas plegables producidas semanalmente. Considere un nivel de
significancia igual a 0.01 y que el año anterior la producción semanal tuvo una
media de 303 mesas plegables (del año laboral de 50 semanas, y fueron dos
semanas de vacaciones).

En los datos podemos observar que hay un valor de media y desviación estándar,
lo que nos permite hacer uso de

ẍ−μ
Z=
σ
√n

Datos

n=50

�=300

ẍ=303

σ=20

La hipótesis nula se encuentra dentro de los conocimientos históricos de nuestra


empresa, históricamente tenemos el de 300 mesas. Como regla probada de forma
histórica ya probada.

H0: µ=300 suponemos que sigue siendo la misma media


H0: µ≠300 suponemos que no es la misma media, que es diferente.

El paso siguiente es establecer un nivel de significancia que es el de la propuesta


del gerente del 0.010 del nivel de confianza. Este nivel es para tener un alto nivel
de confianza en la prueba.

El tipo de prueba es la el tipo de áreas que se desean evaluar en cierto problema


o investigación. Para nuestra propuesta de hipótesis es lo que se conoce como
prueba de dos colas, pues la hipótesis alternativa refuta la media histórica de 300
mesas.

Para la fuerza de la prueba nos proponen un valor de significancia del 0.01, pero
al ser de dos colas repartimos el porcentaje en ambos lados de la campana, por
ser los valores que se encuentren alrededor de la media, no que sea mayor o
menor que un valor que este antes o después de la media, por lo que tenemos
una Z /2 que es igual a 0.10/2=0.005, por lo que se requiere de una cobertura
dentro de

Lo que conocemos como regla de decisión: la hipótesis alternativa que indica que
la media de la población no está en 300, si el Z calculado no se encuentra dentro
de -2.58 hasta 2.58 en la campana de gauss. La hipótesis nula no se rechaza si z
esta entre ( -2.58 y 2.58.)

Ahor sustituimos los valores en nuestra formula

ẍ−μ
Z=
σ
√n

030−300−μ
Z= =1.06
20
√ 50

Por lo que se puede ver la región del valor de la estandarización está dentro de la
región de aceptación. -2.58, … , 0, … , 1.06, … , 2.58. es decir no está en la zona
de rechazo que sería de -∞, -2.58 y 2.58, ∞, se encuentra dentro de la región de
aceptación.

Por lo que se resuelve rechazar la hipótesis alternativa y se acepta la hipótesis


nula, dicha decisión también expone que la media muestral de 303 mesas
producidas puede ser por casualidad, por un error en la toma de la muestra o que
la producción de 303 mesas en esta periodo pudo haber estado ligado a un
extraño comportamiento de la producción en esos días.

Prueba de hipótesis para la media para sigma desconocida

El departamento de quejas de Latino Seguros indica que el costo promedio de


procesar una queja es de $ 60. Una comparación en la industria ha demostrado
que esta cantidad es que otras compañías de seguros, ha tomado medidas para
reducirlos gastos. Para evaluar el efecto de las medidas de educción de costos, el
supervisor de El departamento de quejas seleccionó una muestra aleatoria de 26
quejas recibidas el mes pasado.
La información en el ejemplo aparece a continuación.

¿Es razonable concluir que el costo promedio de tramitar una queja es ahora
menor a $ 60 con un nivel de significancia de 0.01?

Se establecen hipótesis nulas y alternativas. La hipótesis nula consiste en


que la población promedio es de al menos $ 60. La hipótesis alternativa consiste
en el cual la población promedio es inferior a $ 60. Se expresan hipótesis nulas y
nulas. alternativa de la siguiente manera:
Se selecciona un nivel de confianza d 0.010.
El estadístico de prueba es la T, porque se supone una distribución normal y
porque no se conoce la desviación estándar de la población, por lo que esta
sustituye la desviación estándar de la población
ẍ−μ
t= =¿
s
√n
La regla de decisión es con los valores de n-1 grados de libertad sea 26-1= grados
para una prueba de una cola y con un grado de significancia de 0.01 el valor es de
2.485, pero por la estructura de la prueba es de rechazar Ho si t es menor que
-2.485
56.42−60
t= =−1.818
Realizamos 10.04
√ 26
Como el valor -1.818 se localiza en la región ubicada a la derecha del valor critico
de -2.485, la hipótesis nula no se rechaza.

Proporción Se tiene una elección para gobernador se requiere que por lo menos
80% de los votos de la zona norte para que un candidato gane. Se tomo anu
encuesta de 2000 votantes en la región.
Aplique la prueba de hipótesis para porciones
nπ y n(1-π) exceden 5 , n=2000 π=0.80 es la proporción de votos requerida
nπ=0.80*2000=1600 y n(1-π)=0.20*200=400
la hipótesis nula consiste en π>= 0.80
Ho: π ≥ 0.80
H1 π <0.80

Se selección el nivel se significancia 0.050 esta es la posibilidad de rechazar una


hipótesis verdadera.

Se selecciona el estadístico de prueba z

p−π
z= =¿

√ π (1−π )
n
Regla de decisión se trata de una prueba de una cola, signo de la desigualdad
apunta hacia la izquierda. El alfa es de 0.05 el área entre cero y el valor critico es
0.4500 en tablas es 1.65 se rechaza la hipótesis nula si el valor es -1.65 en tablas
de otra forma se acepta Ho

El sondeo revelo que 1550 pensaban votar por un candidato en particular ahora
tenemos 0.755 (de los 1550) =p

n=2000

π=0.80

z es el estadístico de prueba

0.755−0.80
Z= =−2.80
Aplicamos y tenemos
√ 0.80∗0.20
2000
se rechaza la Ho, porque se

encuentra el valor -2.8 se encuentra muy lejano del p-valor.

Prueba de hipótesis para varianzas

Alerce Austral debe enviar un pedido de diversos artículos producidos en la planta


del Distrito Federal a su tienda ubicada en Guadalajara. El gerente de la planta en
el D.F. decide hacer el envío por avión, por lo que el director de transporte le
sugiere dos posibles vías para trasladar la carga desde la planta hasta el
Aeropuerto Internacional de la Ciudad de México (AICM): el Viaducto Miguel
Alemán y Río Churubusco. El director de Transporte, a su vez, quiere analizar el
tiempo que tardarían en transportar la carga desde la planta hasta el AICM por
cada una de las vías sugeridas y, luego, comparar los resultados. La recopilación
de los datos muestrales que se reportaron en minutos se registran en la tabla 2.

a) ¿Existe alguna diferencia en los tiempos empleados en transportar la carga


desde la planta en el D.F.hasta el AICM a través las dos vías recomendadas?
Los tiempos de traslado son muy parecidos. El tiempo medio es de 58.5 para la
ruta de Rio Churubusco y 59 de Viaducto Miguel Alemán. La diferencia es mínima.

b) ¿Son iguales o diferentes las desviaciones estándar de cada una de las vías
escogidas? En caso de ser diferentes, explica qué implica dicha diferencia en
términos estadísticos

∑( ẍ −x)2
s=√
n−1

∑ 488
S 1=√ =8.34950811
8−1

∑ 134
S 2=√ = 4.375255095
8−1

La variación de la ruta Rio Churubusco es mayor que la del Viaducto M A, se


puede entender por los resultados que existen más obstáculos en la ruta de Rio
Churubusco, es importante que el servicio que ofrece sea lo más puntual posible
como seguro por lo que se decide realizar una prueba de hipótesis sobre la
variabilidad de las dos rutas, para saber si es casualidad o es la verdad que
tengan una gran diferencia.

Para la estadística se entiende que la variación de los tiempos para cada muestra
es que tan alejados están los datos generales o que se tiene de la media, cuando
existe más varianza quiere decir que los datos se encuentran muy dispersos de la
media, es decir, se tiene más posibilidad de que los vehículos no lleguen en un
tiempo promedio. Fuera de la tolerancia de traslado.

c) ¿Qué tipo de análisis estadístico empleará para responder la interrogante?


Fundamenta tu respuesta.

Podemos hacer uso de la F, ya que sabemos que con la F se puede comparar las
varianzas de dos muestras para relacionar que tan grande o pequeña es la
relación.
d) ¿Qué estadístico de prueba debe utilizar? ¿Por qué?

Utilizaremos la ANOVA, porque es la comparación de varianzas, la cual


necesitamos, ya que los promedios son muy parecidos y las varianzas si son
diferentes.

Resuelve el problema con base en la metodología (pasos) para las pruebas de


hipótesis.

Paso 1: Formular la hipótesis nula y alternativa. Como es una diferencia por que
buscamos analizar si existe diferencia entre las variaciones de las dos muestras.
No queremos demostrar lo contrario.
2 2
Ho: σ 1=σ 2
2 2
Ho : σ 1 ≠ σ 2

Paso 2: Seleccionamos el nivel de significancia propuesto del 0.10

Paso 3: El estadístico de prueba es la F como ya se había mencionado.

Paso 4: Obtener el valor crítico de la Fc, tenemos la alfa de 0.10, por lo que
tenemos que el alfa requerido será de 0.10/2, por ser de dos colas, entonces
buscamos los valores de n=8, v =8-1, con 0.05 de significancia.

Se busca el valor de los grados de libertad de 7 en columna horizontal y después


el 7 en la columna vertical.

El valor de F tablas es de 3.79.

Paso 5: debemos evaluar las varianzas para obtener F-calculado y compararlo con
F-tablas que tenemos en el renglón de arriba que sacamos de la tabla para f con n
grados de libertad.

8.352 69.7225
F= 2 = =3.6013063
4.40 19.36
Por ultimo tomamos la decisión de las hipótesis, no se rechaza la hipótesis nula ya
que el valor de F-tablas es mayor de F-calculado.

No existe suficiente evidencia estadística para afirmar que existe diferencia entre
las varianzas.
Cálculos en Excel
Conclusión

Podemos entender que la estadística tiene un gran beneficio en la toma de


decisiones y en el levantamiento de datos, en el análisis de los mismos y en
misma administración de los mismos,

Gracias por la atención y tiempo.

Bibliografíía
Levin, R. I., & Rubin, D. S. (2004). Estadística para administración y economía. México: Pearson
Educación.

Lind, D. (2012). Estadistica para administración y economía. México: McGraw-Hill.