Está en la página 1de 22

Diseño de

experimentos

Estadística inferencial
Estadística • Población, muestra y parámetros estadísticos

inferencial • Inferencia estadística

El objetivo de la inferencia Estimaciones


estadística es hacer afirmaciones
válidas acerca de la población o
proceso con base en la información
contenida en una muestra. Pruebas de hipótesis
2
Estadística
inferencial

3
Estadística
Inferencial
Un estadístico se define como
cualquier función de los datos
muestrales que no contiene
parámetros desconocidos.

Un aspecto clave en la interpretación


y utilización de cualquier estadístico
es que se trata de una variable
aleatoria, ya que su valor depende de
los elementos que son seleccionados
en la muestra y por lo tanto, varía de
una muestra a otra. 4
Estadística
Inferencial • La forma de tomar en cuenta este hecho es conocer la
distribución de probabilidad de cada estadístico.

Dist. De Parámetros
Estimaciones
probabilidad poblacionales

Prueba de
Dist. probabilidad
hipótesis
5
Distribuciones de probabilidad
¿PARÁMETROS?

t student
Grados de libertad
Normal

¿Distribución de mayor
relevancia en diseño de
experimentos? 6

Ji Cuadrada Fisher
Estimación
puntual y por Un estimador puntual de un parámetro desconocido es un
estadístico que genera un valor numérico simple, que se
intervalo utiliza para hacer una estimación del valor de los
parámetros desconocidos.

Parámetros poblacionales Estimadores puntuales


μ
σ 2

Proporciones (p) 7
Estimación
puntual y por Intervalo de confianza. Rango donde se estima
intervalo que está el valor de un parámetro poblacional.

Construir un intervalo al 100(1-α) % de


confianza para un parámetro desconocido θ,
consiste en estimar dos números (estadísticos)
L y U de manera que la probabilidad de que θ
se encuentre entre ellos sea 1- α.

8
P(L≤ θ ≤ U)=1- α
El nivel de confianza se define como 1-alfa y sus valores más comunes son 90%, 95% y 99%.

En estadística es común tener que estimar parámetros, los cuales, nunca vamos a poder afirmar al
100% que son el valor real que buscamos.

Por ejemplo, observando a simple vista la altura de 10 alumnos en una clase podríamos estimar que la
altura está entre 1,70 y 1,75.

Sería difícil saber con un 100% de certeza la altura media si no medimos a cada alumno y hacemos
los cálculos. Por el contrario, sí podríamos acotar un intervalo y situar el valor dentro de este.
9
Nivel de confianza y nivel de
significación
El nivel de confianza está directamente relacionado con el nivel de significación. En
la expresión 1-alfa, el valor de alfa no es más que el nivel de significación.

En otras palabras, el nivel de significación es el máximo error que queremos cometer


en nuestra estimación o contraste.

Pueda sonar algo confuso pero pensemos que si podemos afirmar con un 95% de
probabilidad que nuestro valor estimado estará dentro de nuestro intervalo, el 10
restante 5% será la probabilidad de que el valor estimado, no esté en ese intervalo.
Ejemplo.
• Imaginemos que queremos realizar una
estimación del tiempo medio en el que un
corredor recorre una maratón. Para tal fin, hemos
cronometrado 10 maratones y hemos obtenido
una media de 4 horas con una desviación estándar
de 33 minutos (lo que en realidad serían 0,55
horas). Nos proponen obtener un intervalo con un
nivel de confianza del 95%.

En conclusión, con nivel de confianza del 95% podemos afirmar que el


tiempo medio en el que recorrerá la maratón se encontrará entre 3,7 horas y 11
4,3 horas.
Distribución
normal La distribución normal es una distribución con forma de
campana donde las desviaciones estándar sucesivas con
respecto a la media establecen valores de referencia
para estimar el porcentaje de observaciones de los
datos.

Estos valores de referencia son la


base de muchas pruebas de
hipótesis, como las pruebas Z y t.
12
Teorema central
del límite
Una de las razones por las que la
distribución normal es tan
importante es debido a este
teorema, que en un caso particular
afirma: sea x1, x2 ,..., x n una
muestra aleatoria de cualquier
población, y sea la media
muestral; entonces,
independientemente de cómo sea
la distribución de la población de
donde se extrajo la muestra, la
distribución de se aproxima a la
normal conforme n crece.
13
Cálculo de probabilidades
Si una variable aleatoria X se distribuye normal con media μ y varianza σ2 , y se quiere encontrar la probabilidad de
que esta variable tome valores entre dos números cualesquiera, a y b por ejemplo, entonces lo que se tiene que
hacer es calcular el área bajo la curva entre a y b, y esto se realiza mediante métodos numéricos, ya que la integral
de la función de distribución no tiene solución analítica.

Cuando es una distribución normal con parámetros μ = 0 y σ2 = 1, entonces a la distribución se le conoce como
distribución normal estándar (N(0, 1)).

Por lo que se requiere estandarizar la variable, lo cual sucede en la siguiente ecuación.

14
La ventaja de estandarizar es que cualquier probabilidad de
interés, por ejemplo P(X ≤ x), se puede escribir en términos
de la variable estandarizada Z como:

15
Ejemplo
La dimensión de una pieza se distribuye normal con μ = 82.0 mm, y σ = 0.5. Se desea calcular
el porcentaje de piezas que cumplen con especificaciones 82 ± 1, lo cual se obtiene calculando
la siguiente diferencia de probabilidades

Para calcular cada una de estas probabilidades se estandariza:

16
Para obtener P(Z < 2.0)
• simplemente a 1 se le resta 0.023,
es decir: P(Z < 2.0) = 1 − 0.23 =
0.977.
• Para calcular P(X < 81) se procede
de la misma manera, pero al
restarle la media da un número
negativo y, en ese caso, para
utilizar la tabla A2 se usa una de
las propiedades de simetría de la
distribución normal de la siguiente
manera:

17
para cualquier número a. Al aplicar lo anterior se
obtiene que

Por lo tanto, la
Así, se espera que
probabilidad de que X
95.4% de las piezas
esté dentro de
cumpla con las
especificaciones es
especificaciones.
(0.977 − 0.023) = 0.954.
18
Ejercicio
En una ciudad se estima que la temperatura
máxima en el mes de junio sigue una distribución
normal, con media 28° y desviación típica 5 °.

Calcular el número de días del mes en los que se


espera alcanzar máximas entre 26° y 32°

19
Ejercicio 2

La media de los pesos de 500 estudiantes de un Instituto es 70


kg y la desviación típica 3 kg. Suponiendo que los pesos se
distribuyen normalmente, hallar cuántos estudiantes pensan:
•a) Entre 60 kg y 65 kg.
•b ) Más de 90 kg.
•c) Menos d e 64 kg.
•d ) 64 kg.
•e) 64 kg o menos.

20
Intervalo de confianza para una media

Deducir el intervalo consiste en partir de un estadístico que involucra al parámetro de interés y


que tiene una distribución conocida.

21
Distribución t de student con n-1 grados de libertad-
Intervalo de confianza para una media

Intervalo al 100 (1-α) % para la media desconocida μ

Tabla de distribución T de student


22

También podría gustarte