Está en la página 1de 18

INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA

VENTA, TAB.

INTRODUCCION
A la inferencia estadística le interesa sacar conclusiones de un gran número de
acontecimientos (población), fundándose en las observaciones de una parte de los
mismos (muestra). La estadística nos proporciona herramientas que formalizan y
uniforman los procedimientos para sacar conclusiones siempre que las muestras
seleccionadas sean representativas de la población que han sido extraídas. Esta
representatividad permite extender los valores que describen a las muestras
(estadísticos), tales como la media, la desviación típica, un coeficiente de
correlación, a la población correspondiente, es decir, la media o la desviación
típica (estadísticos) pueden tomarse como estimadores de los parámetros μ y σ,
valores que caracterizan a la población. Los estadísticos, valores obtenidos en la
muestra, son, pues, estimadores de los parámetros correspondientes (valores de
la población).

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

2.1 CONCEPTOS BÁSICOS.


POBLACIÓN: Conjunto de elementos sobre los que se observa un carácter
común. Se representa con la letra N.
MUESTRA: Conjunto de unidades de una población. Cuanto más significativa sea,
mejor será la muestra. Se representa con la letra n.
UNIDAD DE MUESTREO: Está formada por uno o más elementos de la población.
El total de unidades de muestreo constituyen la población. Estas unidades son
disjuntas entre sí y cada elemento de la población pertenece a una unidad de
muestreo.
PARÁMETRO: Es un resumen numérico de alguna variable observada de la
población. Los parámetros normales que se estudian son:
- La media poblacional: ͠ꭓ
- Total poblacional: X
- Proporción: P
ESTIMADOR: Un estimador θ *de un parámetro θ, es un estadístico que se
emplea para conocer el parámetro θ desconocido.
ESTADÍSTICO: Es una función de los valores de la muestra. Es una variable
aleatoria, cuyos valores dependen de la muestra seleccionada. Su distribución de
probabilidad, se conoce como “Distribución muestral del estadístico”.
ESTIMACIÓN: Este término indica que a partir de lo observado en una muestra
(un resumen estadístico con las medidas que conocemos de Descriptiva) se
extrapola o generaliza dicho resultado muestral a la población total, de modo que
lo estimado es el valor generalizado a la población. Consiste en la búsqueda del
valor de los parámetros poblacionales objeto de estudio. Puede ser puntual o por
intervalo de confianza:
•Puntual: cuando buscamos un valor concreto.
• Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se
supone que va a estar el valor del parámetro que se busca con una cierta
probabilidad.

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

•CONTRATE DE HIPÓTESIS: Consiste en determinar si es aceptable, partiendo


de datos muéstrales, que la característica o el parámetro poblacional estudiado
tome un determinado valor o esté dentro de unos determinados valores.
•NIVEL DE CONFIANZA: Indica la proporción de veces que acertaríamos al
afirmar que el parámetro θ está dentro del intervalo al seleccionar muchas
muestras.

2.2 DISTRIBUCIONES DE MUESTREO.


La inferencia estadística es el proceso que permite hacer inferencias
(predicciones, suposiciones, etc.) acerca de los parámetros de la población a partir
de los estimadores obtenidos con una muestra. Utiliza como base el muestreo
aleatorio simple. La distribución muestral de un estimador es la distribución de la
probabilidad de la variable que recoge los distintos valores del estimador
obtenidos al analizar diferentes muestras.
Una población con cualquier distribución de frecuencias, que tiene una µ y σ
concretas, tiene una distribución muestral de la x (las medias de infinitas muestras
obtenidas de dicha población):

• Con una media igual a la media de la población


• Una desviación estándar, denominada error típico o estándar, igual a σ,
desviación estándar de la población, dividida entre la raíz cuadrada del tamaño de
la muestra,

•y sigue una distribución normal (si n es suficientemente grande).


Ejemplo:
Población: µ= 0.5 y σ = 0.25

Distribución muestral ꭓ:

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

2.3 ESTIMACIÓN PUNTUAL.


Con la estimación puntual se estima el valor del parámetro poblacional
desconocido, a partir de una muestra. Para cada muestra se tendrá un valor que
estima el parámetro. Esta estimación no es muy útil si desconocemos el grado de
aproximación de la estimación al parámetro.
Un estimador de un parámetro poblacional es una función de los datos muéstrales.
En pocas palabras, es una fórmula que depende de los valores obtenidos de una
muestra, para realizar estimaciones. Lo que se pretende obtener es el valor exacto
de un parámetro. Por ejemplo, si se pretende estimar la talla media de un
determinado grupo de individuos, puede extraerse una muestra y ofrecer como
estimación puntual la talla media de los individuos de la muestra.
La media de la muestra puede ser un estimador de la media de la población, la
cuasivarianza muestral es un buen estimador de la varianza poblacional y el total
muestral es un buen estimador del total poblacional.
Por tanto, una definición más matemática de un estimador y las propiedades que
debe de cumplir un estimador para ser bueno.
Sea X1......Xn, una m.a.s. de tamaño n, decimos que es un estimador θ* de un
parámetro θ si el estadístico que se emplea para conocer dicho parámetro
desconocido es este.

Propiedades deseables de un estimador


Las propiedades o criterios para seleccionar un buen estimador son los
siguientes:
A) Insesgadez: Diremos que un estimador θ* de un parámetro θ es insesgado
si su esperanza coincide con el verdadero valor del parámetro. E[ө*]= θ

B) Eficiencia: Dados dos estimadores θ1* y θ2* para un mismo parámetro θ,


se dice que θ1* es más eficiente que θ2* si: V[ө*]< v[ө*]

C) Suficiencia: Se dice que un estimador de un parámetro es suficiente


cuando para su cálculo utiliza toda la información de la muestra.

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

D) Consistencia: Decimos que un estimador θ* de un parámetro θ es consistente


si la distribución del estimador tiende a concentrarse en un cierto punto cuando el
tamaño de la muestra tiende a infinito.

Métodos para obtener estimadores


El demostrar que un cierto estimador cumple estas propiedades puede ser
complicado en determinadas ocasiones. Existen varios métodos que nos van a
permitir obtener los estimadores puntuales. Los más importantes son:
MÉTODO DE LOS MOMENTOS: se basa en que los momentos poblacionales y
se estiman mediante los momentos muéstrales. Suelen dar estimadores
consistentes. MÉTODO DE MÍNIMOS CUADRADOS: consiste en obtener un
estimador que hace mínima una determinada función.
MÉTODO DE MÁXIMA VEROSIMILITUD: consiste en tomar como parámetro
poblacional el valor de la muestra que sea más probable, es decir, que tenga
mayor probabilidad. Se suelen obtener estimadores consistentes y eficientes. Es el
más utilizado.
La probabilidad de que la media muestral sea igual a la media poblacional es cero,
ρ[ꭓ= µ]0, es decir, que será bastante complicado obtener un estimador puntual,
por ello se utiliza más el Intervalo de Confianza y el Contraste de Hipótesis.

2.4 ESTIMACIÓN DE INTERVALO.


Es deseable conocer un método que nos permita saber dónde se encuentra el
parámetro con un cierto grado de certeza. Este método va a ser la determinación
de un intervalo donde estará el parámetro con un nivel de confianza.
Estimación de intervalo expresa la amplitud dentro de la cual probablemente se
encuentra un parámetro poblacional.
El intervalo se construye a partir de una muestra, entonces, para cada muestra se
tendrá un intervalo distinto. Llamaremos al error que se permite al dar el intervalo
y

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

el nivel de confianza será 1- . Un intervalo tiene un nivel de confianza 1- cuando el


100·(1- )% de los intervalos que se construyen para el parámetro lo contienen.
Es deseable para un intervalo de confianza que tenga la menor amplitud posible,
esta amplitud dependerá de:
• El tamaño de la muestra, mientras mayor sea el tamaño mejor será la
estimación, aunque se incurre en un aumento de costes
•Nivel de confianza, si se pide mayor nivel de confianza, el intervalo será mayor.

2.5 INTERVALOS DE CONFIANZA PARA MEDIAS.


En los capítulos anteriores se estudió el estadístico,

Como estimador de la media poblacional, y si se considera una muestra grande,


extraída de una población con conocida, entonces del teorema del límite central
y en consecuencia

donde:
Por lo tanto

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

De donde el intervalo de confianza de dos lados para la media con un nivel de


confianza de (1- ∞)100%, cuando la muestra es grande es:

Y los límites son:

El valor se obtiene de tablas de distribución normal estándar de forma que

Al denotar a z como , es una notación común en estadística, pero no


está completamente generalizada.
Cuando la muestra es pequeña (n < 30) y la población tiene una distribución
normal con variancia conocida, entonces puede emplearse.

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

2.6 INTERVALOS DE CONFIANZA PARA DIFERENCIA ENTRE


MEDIAS.
Para construir intervalos de confianza para la diferencia de medias poblacionales
se hace uso de la distribución en el muestreo de la diferencia de medias
muéstrales.
Se sabe que si son variables
aleatorias independientes, entonces:

Y por tanto, si las distribuciones de la variables son normales, cualesquiera que


sean los tamaños muéstrales, se verificara que

También se sabe que para muestras independientes se puede asegurar que la


distribución de la diferencia de medias muéstrales es
si las distribuciones de las variables son X ꜟnormales.

Si se conocen las varianzas poblacionales

Y a partir del intervalo de probabilidad


con ∞ para la diferencia de medias muéstrales se construye el intervalo de
confianza con coeficiente de confianza (1-∞) para la diferencia de medias
poblacionales:

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

Si no se conocen las varianzas poblacionales pero se pueden


suponer iguales

Siempre que y las muestras sean independientes la


distribución de la diferencia de medias muéstrales es:

Si las varianzas poblacionales se pueden suponer iguales se estima la varianza


común por y en este caso la distribución del
estadístico

no es normal sino y por ello, el intervalo de confianza, con coeficiente de


confianza 1- ∞ será en este caso

Si no
se conocen las varianzas poblaciones y no se pueden
suponer iguales
Si las varianzas poblacionales no se pueden suponer iguales, se estiman por las
cuasivarianzas de las muestras correspondientes, y es este caso el estadístico
sigue una distribución t de Student con g grados de libertad, siendo
el

numero natural más próximo a

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

El intervalo de confianza será:

2.7 INTERVALOS DE CONFIANZA PARA PROPORCIONES.


Si se toma una muestra de tamaño n de una población muy grande (o infinita), y X
observaciones pertenecen a la clase de interés, entonces es un
estimador puntual de la proporción de la población que pertenece
a la clase en cuestión, y la distribución de muestreo es:

Donde
Ypy n son los parámetros de la distribución binomial.
Utilizando el estimador y aproximando la cantidad p(1-p) mediante
su
estimador puntual se obtiene el intervalo de confianza de dos lados
con un coeficiente (1- ∞)100% para la proporción p es

Ejemplo
En una muestra al azar de 60 secciones de tubo en una planta química, 8 de ellos
mostraron señales de corrosión seria. Construir un intervalo de confianza del 95 %
para la proporción de los tramos de tubo con corrosión seria.

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

Resolución
Utilizando la formula (3.7), con de tablas, y
recordando que
se tiene:

Finalmente:

2.8 INTERVALOS DE CONFIANZA PARA DIFERENCIAS ENTRE


PROPORCIONES.
Si dos muestras independientes de tamaño se extraen de poblaciones
infinitas con distribuciones binomiales, X representa el número de
observaciones de la primera muestra que corresponden a la clase en cuestión,
entonces la distribución de muestreo para la diferencia de proporciones está dada
por:

Donde
De la definición se obtiene el intervalo de confianza de dos lados
para la diferencia de proporciones, con un nivel de confianza de (1- ∞)100%, el

cual es

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

Ejemplo
Dos grupos de 80 pacientes tomaron parte en un experimento en el cual un grupo
recibió píldoras que contenían un antialérgico, mientras que al otro grupo se le

administro un placebo, es decir, una píldora sin droga alguna. En el grupo que
recibió el medicamento 23 exhibieron síntomas alérgicos, mientras que en el otro
grupo 41 los exhibieron. Obtener un intervalo de confianza del 99% para la
diferencia entre las proporciones.
Resolución
Sustituyendo en la fórmula (3.8) con:

Tópicos especiales:
Intervalo de confianza para la diferencia de medias, casos especiales.
Existen algunos casos especiales para los intervalos de confianza de diferencia de
medias. El primero de ellos es cuando se tienen datos apareados, o en pares, es
decir, las muestras aleatorias no son independientes y tienen el mismo tamaño. El
segundo de ellos, que queda un poco más allá del objetivo del presente curso, se
tiene cuando las muestras son pequeñas, independientes, con distribuciones
aproximadamente normales con varianzas desconocidas y diferentes.

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

Datos en pares
Cuando se observan datos en pares y se espera que exista una fuerte correlación
entre cada pareja de datos, se debe generar una nueva variable aleatoria para
construir el intervalo de confianza
Sea la variable aleatoria , donde i =1, 2, … , n, entonces:

Y el intervalo se puede generar mediante:

Donde son la media y la desviación estándar muestrales, que se


calculan mediante:

Variancias diferentes muestras pequeñas


Cuando el problema consiste en encontrar una estimación por intervalos para
diferencia de medias , las muestras son pequeñas, las poblaciones
son
aproximadamente normales y las varianzas desconocidas no pueden considerarse
iguales, entonces no existe un estadístico exacto para el problema; sin embargo,
algunos autores han encontrado muy buenas aproximaciones utilizando el
estadístico:

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

el cual tiene una distribución aproximadamente t, con v grados de libertad, los


cuales se aproximan mediante:

O bien mediante

Puesto que v difícilmente es entero se aproxima al entero más cercano.


El intervalo de confianza de dos lados queda entonces:

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

2.9 INTERVALOS DE CONFIANZA PARA VARIANZAS.


Si X es una v.a. con distribución normal con media µ y varianza
desconocidas, entonces el estadístico empleado es

Donde

Utilizando el estadístico se obtiene el intervalo de confianza de dos


lados con un coeficiente de confianza de (1-
∞)100%, para el cual es:

Ejemplo:
Considérese los siguientes datos:
8.2 8.28 8.24
8.23 8.21 8.25
8.24 8.23 8.24

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

8.25 8.2 8.26


8.19 8.23 8.26

Obtener:
a) Un intervalo de confianza de dos lados del 95% para .
b) Un intervalo de confianza inferior del 95% para
c) Un intervalo de confianza superior de 95% para

Resolución
De los datos de la tabla se obtiene:

a) Sustituyendo en

b) Para un intervalo superior

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

2.10 INTERVALOS DE CONFIANZA PARA RAZONES DE DOS


VARIANZAS.
Si X y Y son vv.aa. independientes con distribuciones normales con medidas
desconocidas y variancias desconocidas,
respectivamente, entonces el estadístico empleado es:

Donde

Utilizando el estadístico se obtiene el intervalo de confianza de dos lados


con un coeficiente de confianza de (1- ∞)100%, para la relación de las
variancias
el cual es:

Unidad II 06/Diciembre/2016
INSTITUTO TECNOLÓGICO SUPERIOR DE VILLA LA
VENTA, TAB.

NOMBRE DEL FACILITADOR:


ING. ANGEL ARMANDO CARRILLO PEREZ

MATERIA:
ESTADFISTICA INFERENCIAL 1

UNIDAD 2
INTRODUCCION A LA ESTADISTICA

INGENIERIA INDUSTRIAL

ALUMNO:
ADAN CRUZ ALEJANDRO
3° “U”

Unidad II 06/Diciembre/2016

También podría gustarte