Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Inferenciaestimacinest 1
Inferenciaestimacinest 1
Inferencia Estadística
•Estimación y
Prueba de Hipótesis de la Media
OBJETIVO GENERAL
Evaluar las estimaciones de intervalos de confianza para
tomar decisiones empresariales eficientes.
Evaluar las suposiciones de los valores estadísticos de
la población sobre la representación de la población.
OBJETIVO TERMINAL
Al finalizar el tema estarás en capacidad de:
OBJETIVOS ESPECÍFICOS
3
Inferencia Estadistica
PRE-TEST
4
Inferencia Estadistica
PRE-TEST
a) Parámetro:____________________________________________________
_____________________________________________________________
____________________________________________________________
b) Estadístico:____________________________________________________
_____________________________________________________________
_____________________________________________________________
c) Inferencia:_______________________________________________
_____________________________________________________________
_____________________________________________________________
d) Estimación:____________________________________________________
_____________________________________________________________
_____________________________________________________________
e) Hipótesis:____________________________________________
5
_____________________________________________________________
Inferencia Estadistica
Actividad:
a. Define con tus propias palabras INFERENCIA ESTADISTICA.
________________________________________________________________
________________________________________________________________
________________________________________________________________
6
Inferencia Estadistica
2.Clasificación de la inferencia
a. Estimación:_________________________________________________________
__________________________________________________________________
__________________________________________________________________
b. Pruebas de Hipótesis :_________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
_
7
Inferencia Estadistica
2.Estimación. Definición
La estimación es un proceso de utilizar datos muéstrales para estimar los valores de parámetros
desconocidos de una población. Esencialmente, cualquier características de la población se pueden estimar a
partir de una muestra al azar.
Debemos hacer la distinción entre estimador y estimaciones.
Cualquier estadística de muestra que se utiliza para estimar un parámetro de la población se conoce como
estimador, es decir, un estimador es una estadística de muestra utilizada para estimar un parámetro de la
población. La media de la muestra x puede ser un estimador de la media de la población.
Una estimación es un valor especifico observado de una estadística. Hacemos una estimación si tomamos
una muestra y calculamos el valor que toma el estimador en esa muestra.
Por ejemplo, se toma la lectura media en kilometraje a partir de una muestra de taxis en servicio, el valor
obtenido es de 160.000 kilómetros.
Estimador: lectura media del recorrido en kilometraje
Estimación: 160.000 kilómetros recorridos en promedio por taxis
3.Estimación.
Criterios para Seleccionar un Buen Estimador
Podemos evaluar la calidad de una estadística como un buen estimador mediante el uso de cuatro criterios:
a. Imparcialidad.
El termino Imparcialidad se refiere al hecho de que una media de muestra es un estimador no sesgado de la
media de la población porque la media de la distribución de muestreo de las medias de muestra tomadas de
una población es igual a la media de la población misma.
b. Eficiencia.
Se refiere al tamaño del error estándar de la estadística. Si comparamos dos estadísticas de una muestra del
mismo tamaño y tratamos de decidir cual de ellas es un mejor estimador más eficiente, escogeríamos la que
tuviera el menor error estándar o la menor desviación estándar de la distribución de muestreo.
c. Coherencia.
Una estadística es un estimador coherente de un parámetro de la población si al aumentar el tamaño de la
muestra, se tiene la certeza de que el valor de la estadística se aproxima bastante al valor del parámetro de
la población.
d. Suficiente.
Un estimador es suficiente si utiliza una cantidad de la información contenida en la muestra que ningún otro
estimador podría extraer información adicional de la muestra sobre el parámetro de la población que se está
estimando.
9
Inferencia Estadistica
3. Tipos de Estimación
Actividad: Dada la bibliografía recomendada indica las características con sus propias palabras:
Estimación puntual:_____________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
__
Estimación de intervalo:__________________________________________________________
________________________________________________________________________________
_
10
Inferencia Estadistica
3. Tipos de Estimación
a. Estimación Puntual
La estimación puntual es un solo número que se utiliza para estimar un parámetro de la
población desconocido.
Los valores estadísticos muéstrales se utilizan como estimadores de los parámetros de la
población. Así, la media de la muestra se utiliza como estimación del valor de la media de la
población; la desviaron Estándar de la muestra se emplea como una estimación de la
desviación estándar de la población. , la cual se expresa:
X
S
11
Inferencia Estadistica
3. Tipos de Estimación
b. Estimación de intervalos
Una estimación de intervalo es un conjunto de valores entre dos extremos dados que se
utiliza para estimar un parámetro. Esta estimación indica el error de dos maneras por la
extensión del intervalo y por la probabilidad de obtener el verdadero valor de la población
que se encuentra dentro del intervalo. Es decir, estas estimaciones proporcionan un
intervalo de los valores posibles para el parámetro de la población.
La estimación por intervalo de un parámetro poblacional( ) es un intervalo de la forma
inferior superior, donde inferior y superior depende del valor del estadístico
para una muestra particular y también de la distribución muestral
12
Inferencia Estadistica
3. Tipos de Estimación
P ( inferior ≤ ≤ superior ) = 1 -
Donde
• 1 - se denomina intervalo de confianza o grado de confianza, el cual proporciona unos
intervalos de valores, centrado en el valor estadístico de la muestra, en el cual
supuestamente se ubica el parámetro de la población, con un riesgo de error.
13
Inferencia Estadistica
3. Tipos de Estimación
Cada intervalo de confianza incluye o no al verdadero valor del parámetro que se estima, el
nivel de confianza (1-), nos indica que en el limite, el (1-) de los intervalos así construidos
incluyen el valor poblacional. Por ejemplo, la interpretación del intervalo de confianza, sería:
Una estimación de intervalo de confianza de 95%, nos indica como si se tomaran todas las
muestras posibles del mismo tamaño, n, 95% de ellas incluirían el valor de la media real en
alguna parte del intervalo alrededor de sus medias de muestras, y solamente el 5% de ellas
no están incluidas.(Berenson y Levine,1996:346)
14
Inferencia Estadistica
_________________________________________________________________________
_______________________________________________________________________________
15
Inferencia Estadistica
20
10
Frecuencia
17
Media = 4,11
0 N = 109,00
2,50 3,00 3,50 4,00 4,50 5,00 5,50 6,00
2,75 3,25 3,75 4,25 4,75 5,25 5,75
Log(10) de POBLAC
Inferencia Estadistica
Figura Nº 1
El intervalo de confianza esta centrado respecto al valor medio de la muestra
intervalo
de confianza
X–Zx X X + Z x
18
Inferencia Estadistica
P X Z1 / 2 * / n X Z1 / 2 * / n 1
Limite inferior Limite superior
Donde
X : es la media muestral
Z 1- : Es el valor de Z a la derecha de la cual se tiene el área de , representa la
confianza deseada, se conoce como el valor critico de la distribución.
:
Es el error de una estimación de intervalo que se refiere a la desviación o diferencia
x / n
entre el valor medio de la media muestral y la media real de la población.
19
Inferencia Estadistica
Variable: ________________
Datos:
20
Inferencia Estadistica
El valor de _____ se ubica en la tabla de los valores de Z del anexo No. 1, buscando de adentro
hacia fuera, dando como resultado . (figura Nº 2)
Figura Nº2
Área bajo la curva normal
Z
.00 .01 .02 .03. .06 ...... .09
0.0
1.9 0.975
3.0
3.1
3.2
21
Inferencia Estadistica
*Tercer paso: se sustituye el valor de Z en la formula y se procese a calcular los puntos
extremos.
Por lo tanto se estima, con una confianza del %, que la media esta entre
_____________________________________, el valor que indica que el proceso de la
producción esta operando en forma adecuada, no hay motivos para pensar que haya
problemas en la fabrica.
22
Inferencia Estadistica
23
Inferencia Estadistica
4. Calcular los intervalos de confianza
Conclusión :
__________________________________________________________________________________
__________________________________________________________________________________
__________________________________________________________________________________
___
24
Inferencia Estadistica
Por lo general se desconoce la desviación estándar real de la población, por lo tanto los
cálculos de los intervalos de confianza se deben basar en la Distribución T de Student, su
origen se remonta a principios del siglo XX, fue William S. Gosset el que planteo esta
distribución, empleado de una cervecería en Irlanda, puesto que no se les permitía publicar
investigaciones con los nombres propios adopta un seudónimo de Student.
Si la variable X esta distribuida en forma normal, entonces el estadístico es
s
n
25
Inferencia Estadistica
Propiedades de la distribución t de
Figura N° 3 Student
Distribución t’student
Tiene forma de campana y es simétrica, al igual que la
distribución normal. Sin embargo, la distribución t tiene mas
área en las colas y menos en el centro. Debido a que se usa
S en vez de . (Ver la Figura Nº 3)
La distribución t es bastante sensible con respecto al
tamaño de la muestra, sin embargo esta sensibilidad
disminuye en el caso de tamaños muéstrales grandes.
Los grados de libertad están relacionados con la forma del cálculo de la desviación
estándar muestral
n
2
2
Xi X X 2
*n
s i 1
S
n 1 n 1
Los grados de libertad son n-1, que se pueden definir como el número de valores que pueden
escoger libremente. El hecho de que n=5 y que X = 20 , nos indica que Xi = 100. Por lo
tanto una vez que se conocen cuatro de los valores, el quinto no tendrá libertad para variar,
puesto que la suma tiene que dar 100.
La Formula para La estimación por intervalo de confianza con nivel de (1- para la media,
desconociendo x, se expresa en la siguiente forma:
P X t n 1; / 2 * S / n X t n 1; / 2 * S / n 1
Limite inferior Limite superior
Donde:
n-1: grados de libertad
t : distribución t
S: desviación estándar de la muestra 27
Inferencia Estadistica
El director de una gran cadena de departamentos le gustaría tomar una muestra de mujeres
con tarjetas de créditos para obtener información relacionada con el comportamiento de
actitudes y de compras. De hecho quiere estimar la cantidad que gastan al mes las mujeres
en compras de ropa para uso personal. Se selecciono una muestra de 25 mujeres con
tarjetas de créditos. Los resultaron mostraron un promedio muestral de $ 86, 40 y una
desviación estándar de $ 37.50.
Estimar con un nivel de confianza del 95% de que el intervalo contenga la cantidad promedio
real de la población de los gastos en ropa. Se tendría que:
Primer paso: identificar la variable y extraer los datos del problema
Variable: __________________
Datos :
28
Inferencia Estadistica
Tercer paso: para obtener el valor de t se utiliza la tabla del anexo 2.La cual tiene las siguientes características:
La parte superior de cada columna señala la cola derecha de la distribución t, cada renglón representa un valor
particular para grado de libertad.(Ver Figura N°4)
En la fila se encuentran los grados de libertad desde 1 hasta infinito. Si como en este caso se ubica con un
95% y 24 grados de libertad. Se observa en la columna /2=0.025, el renglón correspondiente a 24 grados
de libertad se tiene como resultado el valor de la cola superior de _____________.
Figua N°4
gl Valores distribución t’student
.001 .01 .025. .05 ...... .10
1
2
.24 2.064
.
29
29
Inferencia Estadistica
Cuarto paso: una vez ubicado el valor de t, se sustituye en la formula y se calcula el intervalo.
Se llega a la conclusión, a un nivel de confianza del 95%, que la cantidad promedio gastada al mes en
ropa por las mujeres con tarjetas de créditos esta entre $____________. Esta confianza de 95% en
realidad significa que si se selecciona todas las muestras posibles de tamaño 25, el 95% de los
intervalos elaborados incluiría la media real de la población en algún lugar dentro del intervalo.
30
Inferencia Estadistica
2. Se debe calcular la media muestral y desviación estándar muestral con las siguientes
formulas
S
( Xi X ) 2
n 1
31
Inferencia Estadistica
Interpretación:
________________________________________________________________________
________________________________________________________________________
______________________________________________________________________
32
Inferencia Estadistica
Interpretación
:___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
__
33
Inferencia Estadistica
-Procedimiento:
1. Identificar la variable y extraer los datos.
variable
datos:
34
Inferencia Estadistica
Interpretación
:___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
__
35
Inferencia Estadistica
9. Autoevaluación.
µ:____________________
Β:____________________
S:____________________
:____________________
:____________________
t:_____________________
:____________________
:____________________
Sp:___________________
1-:__________________
X:___________________
36
Inferencia Estadistica
9. Autoevaluación.
b.Para un determinado producto de consumo popular, el promedio de ventas por tienda fue,
el año anterior, en una muestra de n1 = 10 tiendas,un promedio de 3425000 y una
desviación estándar 200000. Para un segundo producto, el promedio de ventas por tienda
de una muestra de n2 = 12 tiendas, un promedio de 3250000 y una desviación estándar
175000. Se supone que los montos de las ventas por tienda tienen una distribución normal,
para ambos productos.
Estime la diferencia entre el nivel promedio de ventas por tienda del año anterior
utilizando un intervalo de confianza del 98%.
Resolver según el procedimiento:
37
Inferencia Estadistica
9. Autoevaluación.
38
Inferencia Estadistica
9. Autoevaluación.
39
Inferencia Estadistica
40
Inferencia Estadistica
• Valor estadístico de prueba, mide que tan cerca de la hipótesis nula se encuentra el
valor de la muestra. Su formulas dependerá de la distribución de probabilidad que se desee
aplicar y de la situación si se conoce o no la desviación estándar de la población.
41
Inferencia Estadistica
Pueden ocurrir dos tipos de problemas al aplicar el enfoque de la prueba de hipótesis a la toma de decisiones
relacionados con los parámetros de la población. (ver Figura Nº6)
¨ Error Tipo I se da cuando se rechaza la hipótesis nula cuando en realidad es cierta, se conoce como α.
También denominado nivel de significación.
¨ El error tipo II ocurre cuando no se rechaza la Ho nula siendo falsa y se debería rechazar, se le conoce
con la llamada β .
El complemento de la probabilidad de un error tipo II se conoce como potencia de una prueba estadística. Es
la probabilidad de rechazar la hipótesis nula cuando es falsa.
Decisión Ho Ho
Estadística Verdadera Falsa
Aceptar Ho 1-α Conclusión Error tipo II
Correcta probabilidad β
1. El primer paso constituye en formular la hipótesis nula, en el ámbito general las hipótesis son
explicaciones potenciales que intenta información acerca de hechos observados en situaciones que
existen algunos factores desconocidos.
Esta se puede establecer como:
Ho: = o
Ho: o
Ho: o
2. Establecer la Hipótesis Alternativa, se utiliza para indicar que aspecto de variación no aleatoria resulta
de interés.
Existen tres tipos posibles:
43
Inferencia Estadistica
3. El tercer paso, es seleccionar un nivel de significación que sea aceptable que es la probabilidad de
rechazar una hipótesis nula que sea verdadera, tambien es conocido como error tipo I. Esto, a su vez,
indicara el valor critico correspondiente que servirá como un estándar de comparación respecto al cual
juzgar un valor critico de prueba.
4. El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo, el
trazado dependerá de cómo este formulada la hipótesis alternativa, si es mayo, menor o diferente., quedando
dividida en dos regiones. Si por ejemplo la Hipótesis alternativa tiene el signo de menor, el valor critico se
trazará en el extremo inferior de la distribución( Ver figura Nº 6)
Figura N 6
Regiones de rechazo y no rechazo en
una prueba de hipótesis Rho : Región de rechazo o región critica,
se considera compuesta por los valores de la
prueba estadística que es poco probable que
RHo ocurran si la hipótesis nula es cierta.
No RHo No Rho:Región de no rechazo, si la prueba
cae en esta región no se puede rechazar la
hipótesis nula
Valor
critico hipotético de
44
Inferencia Estadistica
X 0 X 0
V.E.P
z V.E.P
t
cuando
se conoce
cuando
se no conoce
S
n n
Si se supone que se conoce la desviación estándar, entonces la distribución muestral de la
media seguirá la distribución normal,en esta formula el numerador mide que tan lejos esta la
media hipotética x de la media observada X. El denominador es el error estándar, por lo
que Z representa los valores estándar de x.
45
Inferencia Estadistica
46
Inferencia Estadistica
47
Inferencia Estadistica
5. El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo. Su trazado
dependerá de cómo este planteada la hipótesis alternativa: Si es menor, el valor critico estará en la zona
negativa; Si es mayor, se marcara en la zona positiva y si es diferente existirán dos valores cítricos uno en la
zona negativa y otro en la zona positiva.
Conclusión :
De este modo se concluye que el promedio de vida útil de las llantas es _____________________,
a un nivel de significación del 5%.
49
Inferencia Estadistica
__________________________________
__________________________________
__________________________________
50
Inferencia Estadistica
X
=
1-=
S=
n=
2. Establecer la Hipótesis nula
Ho :
5. El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo.
(Ver figura Nº7)
x 0
t
s
n
0 1.711
Dónde cae
el V.E.P? 52
Inferencia Estadistica
53
Inferencia Estadistica
a. Para una muestra de 60 mujeres, tomadas de una población de más de 5000 inscritas en un programa
de reducción de peso en una cadena nacional de balnearios de aguas termales, la presión sanguínea
diastólica media de la muestra es de 101 y la desviación estándar es de 42. A un nivel de significación de
0.02 ¿Puede concluir que, en promedio, las mujeres inscritas en el programa tienen una presión diastólica
que excede el valor de 75 recomendado por diversas sociedades médicas?.
Procedimiento
1. Determinar la variable y los datos
• Variable : _____________________
• Datos
=
1-=
S=
n=
2. Establecer la Hipótesis nula
Ho :
3. Establecer la Hipótesis alternativa
:
Hi :
54
Inferencia Estadistica
t(n-1; )=
5. El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo.
6. Se selecciona y calcula el Valor estadística de prueba cuando se no conoce la desviación estándar poblacional
comparándolo con los valores críticos de la distribución de muestreo para determinar si cae o no en la
región de rechazo
Dónde cae
el V.E.P?
0
55
Inferencia Estadistica
Si t t (n-1, ) RHo
56
Inferencia Estadistica
Grande(n30) x 0
Sin z
x 0
* t
x 0
* z
*
S
Distribución n n o n
Normal
Pequeña(n<30) Se usaria pruebas no paramétricas
BIBLIOGRAFÍA
58
Inferencia Estadistica
- ANEXOS
59