Está en la página 1de 22

Elementos de inferencia

estadística: experimentos
con uno y dos tratamientos

Curso: Diseño Experimental


Profesor: Ing. Paulo C. Laura Poblete
plaurap@unjbg.edu.pe
Conceptos clave

• Error tipo I • Intervalo de confianza


• Error tipo II • Muestras pareadas
• Estadístico • Orden completamente al azar
• Estadístico de prueba • Potencia de la prueba
• Estimador puntual • Región de aceptación
• Grados de libertad • Región de rechazo
• Hipótesis estadística • Significancia observada
• Inferencia estadística • Significancia predefinida

2
Población finita

Es aquella en la que se pueden medir todos los individuos para tener un


conocimiento exacto de sus características.

Parámetros

Características que, mediante su valor numérico, describen a un conjunto de


elementos o individuos.

Población infinita

Es aquella en la que la población es grande y es imposible e incosteable medir


a todos los individuos.

Muestra representativa

Es una parte de una población, seleccionada adecuadamente, que conserva


los aspectos clave de la población.

3
INFERENCIA ESTADÍSTICA

Son las El objetivo de la inferencia estadística es hacer afirmaciones válidas


acerca de la población o proceso con base en la información
afirmaciones contenida en una muestra. Estas afirmaciones tienen por objetivo
válidas acerca de coadyuvar en la toma de decisiones.
la población o
proceso basadas
Por lo general se divide en estimación y prueba de hipótesis, y se
en la información apoya en cantidades o datos estadísticos calculados a partir de las
contenida en la observaciones en la muestra.
muestra. .
Un estadístico se define como cualquier función de los datos
muestrales que no contiene parámetros desconocidos. Un ejemplo de
estadístico es la media muestral Ẋ con la cual se tratan de hacer
afirmaciones sobre la media, µ, que es un parámetro poblacional.
Un aspecto clave en la interpretación y utilización de cualquier
estadístico es que se trata de una variable aleatoria, ya que su valor
depende de los elementos que son seleccionados en la muestra y,
por lo tanto, varía de una muestra a otra. La forma de tomar en
cuenta este hecho es conocer la distribución de probabilidad de cada
estadístico..
.

4
INFERENCIA ESTADÍSTICA

Relación entre población y muestra, parámetros y estadísticos.

5
Distribuciones de probabilidad e inferencia

Distribución de probabilidad de X: Relaciona el conjunto de valores de


X con la probabilidad asociada con cada uno de estos valores.

 La distribución de probabilidad o distribución de una variable aleatoria


X relaciona el conjunto de valores posibles de X (rango de X), con la
probabilidad asociada a cada uno de estos valores y los representa a
través de una tabla o por medio de una función planteada como una
fórmula.
 La distribución de probabilidad hace que lo aleatorio no sea un
capricho, y modela (describe, acota) los posibles valores de un
estadístico muestral, con lo que al observar una realización específica
de un estadístico se pueden corroborar o rechazar supuestos (prueba
de hipótesis), o bien, hacer estimaciones poblacionales.
 Las distribuciones de probabilidad que más se usan en intervalos de
confianza y pruebas de hipótesis son las distribuciones: normal, T de
Student, ji-cuadrada y F.
 .
6
Muestra de las distribuciones de probabilidad de mayor uso en
inferencia
Grados de libertad: Son
parámetros que definen las
distribuciones T, ji-cuadrada y
F, y se determinan a partir de
los tamaños muestrales
involucrados.

Las distribuciones normal y T


de Student sirven para hacer
inferencias sobre las medias;
mientras que la distribución ji-
cuadrada será de utilidad para
hacer inferencias sobre
varianzas y la distribución F se
empleará para comparar
varianzas.

La distribución F es la de
mayor relevancia en diseño
de experimentos. dado que el
análisis de la variabilidad que
se observó en un experimento
se hace comparando
7 varianzas.
Estimación puntual y por intervalo
Las distribuciones de probabilidad que tienen una variable que representa cierta
característica de una población se definen completamente cuando se conocen
sus parámetros, pero cuando éstos no se conocen, será necesario estimarlos
con base en los datos muestrales para hacer inferencias sobre la población. Hay
dos tipos de estimación: puntual y por intervalo:

Estimación puntual
 Un estimador puntual de un parámetro desconocido es un estadístico que genera un
valor numérico simple, que se utiliza para hacer una estimación del valor del parámetro
desconocido; por ejemplo, tres parámetros sobre los que con frecuencia se desea hacer
inferencia son:

 Los estimadores puntuales (estadísticos) más recomendados para estimar estos


parámetros son, respectivamente:

8
Estimación puntual y por intervalo
Estimación por intervalo
 La estimación puntual de un parámetro se genera a través de un estadístico, y
como el valor de éste es aleatorio porque depende de los elementos que
fueron seleccionados en la muestra, entonces la estimación que se hace
sobre el parámetro dependerá y variará de una muestra a otra. De esta forma,
cuando se quiere tener mayor certidumbre sobre el verdadero valor del
parámetro poblacional, será necesario obtener la información sobre qué tan
precisa es la estimación puntual.
 Así, la estimación puntual dirá poco sobre el parámetro cuando la variación
entre una estimación y otra es muy grande.
 Una forma de saber qué tan variable es el estimador, consiste en calcular la
desviación estándar o error estándar del estadístico, visto como una variable
aleatoria. Por ejemplo, consideremos la desviación estándar S y la media Ẋ
de una muestra de tamaño n. Puesto que Ẋ es una variable aleatoria, ésta
tiene su propia desviación o error estándar, que se puede estimar mediante

9
Estimación puntual y por intervalo
Estimación por intervalo
Una forma operativa de saber qué tan precisa es la estimación consiste en calcular un
intervalo de confianza que indique un rango “donde puede estar el parámetro” con cierto
nivel de seguridad o confianza. Construir un intervalo al 100(1 – α)% de confianza para
un parámetro desconocido ϴ, consiste en estimar dos números (estadísticos) L y U, de
manera que la probabilidad de que ϴ se encuentre entre ellos sea 1 – α, es decir,

donde L y U forman el intervalo de confianza buscado [L, U]. La correcta interpretación


de un intervalo de confianza es como sigue: si se obtuvieran 100 muestras
independientes de la misma población o proceso, cada una de tamaño n y para cada
muestra se calculará el intervalo de confianza a 95% para el mismo parámetro, entonces
se espera que 95 de los 100 intervalos contengan el verdadero valor de dicho parámetro.
En la práctica se obtiene sólo un intervalo y se dice que el intervalo [L, U] tiene una
confianza de 100(1 – α)%; esto tiene una interpretación constante, en el sentido de que el
parámetro estará en el intervalo 100(1 – α)% de las veces que apliquemos el
procedimiento.

La longitud del intervalo de confianza es una medida de la precisión de la estimación.


De aquí que es deseable que la longitud de los intervalos sea pequeña y con alto nivel de
confianza. El ancho de los intervalos es mayor a medida que sea mayor la varianza de la
población y el nivel de confianza exigido. El ancho del intervalo es menor si se
10
incrementa el tamaño de la muestra.
Intervalo de confianza para una media
 Por definición de intervalo de confianza se trata de encontrar dos números L y U, tales
que el parámetro m se encuentre entre ellos con una probabilidad de 1 – α. Esto es,

 Sea X1, X2, …, Xn una muestra aleatoria de tamaño n de una población, con una
distribución normal con media μ y varianza σ2, ambas desconocidas. El procedimiento
general para deducir el intervalo consiste en partir de un estadístico que involucra al
parámetro de interés y que tiene una distribución conocida. Tal estadístico es

 el cual sigue una distribución T de Student con n – 1 grados de libertad. Por lo tanto, en
la tabla de esta distribución o en su gráfica se pueden ubicar dos valores críticos tα/2 y –
tα/2, tales que:

11
Intervalo de confianza para una media
 De aquí, despejando hasta dejar sólo en medio de las desigualdades al parámetro
de interés, se llega a que:

12
Intervalo de confianza para una media
Ejemplo:

13
Intervalo de confianza para una media

14
Intervalo para la varianza

La

15
Intervalo para la varianza
Ejemplo:

16
Intervalo para la proporción

La

La estimación
La estimación

17
Ejemplo:

18
19
Resumen de fórmulas para intervalos de confianza

En la tabla siguiente se muestran las fórmulas para calcular los intervalos de


confianza más usuales. Además de los intervalos para un parámetro ya
presentados, en la tabla se incluyen las fórmulas correspondientes para
intervalos de confianza que involucran a dos parámetros, como son:
diferencias de medias, diferencias de proporciones y cocientes de varianzas.
Estos intervalos proveen información sobre la igualdad estadística de los
parámetros correspondientes a las dos poblaciones de interés. Note que los
cálculos involucran a los estimadores puntuales obtenidos con cada muestra.
En la tabla, la notación

La
se refiere a puntos críticos de la correspondiente distribución.

20
Resumen de fórmulas para intervalos de confianza

La

21

También podría gustarte