Está en la página 1de 40

ESTADÍSTICA BÁSICA

Subdirección de innovación y Servicios tecnológicos - SIST

TERCER DÍA
Estadísticos: Katherin Holguin Agudelo/Gustavo Adolfo Gómez Escobar
DESARROLLO DEL CURSO
Primer día Tercer Día
• Conceptos Básicos.
Generalidades • Muestras aleatorias
Definiciones – Muestra aleatorias
• Estadística descriptiva. – Distribución del promedio muestral
Representación de los datos
– Teorema Central del Límite (TLC)
Medidas de tendencia central
Medidas de dispersión – Distribución t de Student y Grados de libertad.
Medidas de posición • Estimación de la media por intervalos de confianza
– Nivel de confianza
Segundo Día – Intervalos de confianza para la media: Distribución
• Nociones de probabilidad normal
Funciones y operaciones con funciones. – Intervalos de confianza para la media: Distribución t-
Conceptos básicos Student
• Variables aleatorias
Funciones de distribución.
Funciones de densidad
• Distribuciones de probabilidad.
Rectangular, Triangular, Normal y t-student.
MUESTRAS ALEATORIAS
INTRODUCCIÓN
Se denomina muestra a cualquier subconjunto de datos seleccionados de una población.

Una muestra aleatoria es un conjunto de datos seleccionados aleatoriamente

La teoría para la estimación de la incertidumbre de medición tiene como requisito de


obligatorio cumplimiento la obtención de muestras aleatorias.
MUESTRA ALEATORIA

En una muestra aleatoria todos los elementos de la población deben tener alguna
probabilidad de salir en la muestra y, además, los elementos de la muestra deben ser
independientes: el que salga un resultado en la muestra no debe afectar a que ningún
otro resultado salga en la muestra.

Cuando todos los elementos de la población


tienen la misma probabilidad de salir en la
muestra esta se llama Muestra Aleatoria Simple
EJEMPLO

Un fabricante de bombillas desea conocer el tiempo de vida útil de todas las


bombillas que produce en su fábrica, La manera de saberlo sería sometiendo a
pruebas todas sus bombillas. No obstante, puesto que este tipo de ensayo es
destructivo, no tendría ningún producto para vender.

Los valores de tiempo de vida útil de todas las bombillas en la fábrica constituiría la
población, entonces el selecciona una muestra aleatoria simple de tamaño 100
para realizar sus mediciones.
EJEMPLO

En la calibración de un instrumento de medición no se tuvo en


Muestra 1 cuenta el tiempo de calentamiento del objeto a calibrar
obteniéndose los siguientes resultados:

2.0, 2.1, 1.9, 2.0, 1.7, 1.5, 1.3, 1.0, ….

En la calibración del mismo instrumento de medición se controló


el tiempo de calentamiento del instrumento a calibrar por lo
Muestra 2 que se obtuvieron los siguientes resultados:

2.0, 2.0, 2.1, 2.0, 1.9, 2.2, 1.9 …


EJEMPLO
Se tiene la siguiente variable aleatoria:
𝑋 = Indicación de un instrumento de medición en el punto de 2 unidades.
Se obtienen las siguientes muestras:

Muestra 1 2.14 2.28 2.06 1.90 2.40


Muestra 2 2.10 2.24 2.40 2.50 2.61
Muestra 3 2.32 2.23 2.27 2.15 2.14

Noten que los datos en cada muestra tienden a ser diferentes. Entonces surgen
inquietudes como:
• ¿Qué promedio representará el valor de la indicación?
• ¿Qué desviación estándar representa la dispersión real de los datos?
DISTRIBUCIÓN DEL PROMEDIO
MUESTRAL
EJEMPLO

Supongamos que estamos observando una variable aleatoria X, y que obtenemos una
muestra aleatoria de tamaño n, 𝑋11 , … 𝑋1𝑛 . Con esos datos podemos calcular el
promedio muestral 𝑿𝟏 y la desviación estándar muestral 𝑺𝟏 .

Si tomamos otra muestra aleatoria de la misma variable 𝑋21 , … 𝑋2𝑛 tendremos 𝑋2 y la


desviación estándar muestral 𝑆2 .

Los valores que salieron en las muestras son fruto de la aleatoriedad, por tanto 𝑿 y 𝑺
son variables aleatorias.
MUESTRA 1 MUESTRA 2 MUESTRA 3 MUESTRA 4 MUESTRA 5 MUESTRA 6 MUESTRA 7
1.99 1.98 2.01 1.99 1.94 2.01 2.00
2.00 1.99 2.02 1.98 2.02 2.01 2.00
A pesar de
obtenerse bajo
2.02 1.96 2.04 1.99 1.97 1.99 2.02
las mismas 2.05 1.99 2.01 1.97 2.01 2.03 2.00
condiciones los
promedios son 2.02 2.01 2.00 2.00 2.02 2.03 2.00
diferentes
1.98 1.98 2.01 2.03 1.99 2.02 1.99
2.00 1.94 1.97 1.98 2.07 1.95 2.01
2.03 2.00 2.00 2.01 1.96 2.00 2.00
2.04 2.00 1.99 2.01 1.98 2.02 1.98
2.03 1.98 1.93 2.03 2.01 1.99 2.00
𝑿 2.016 1.983 1.999 1.998 1.997 2.004 2.001
𝒔 0.024 0.023 0.030 0.020 0.038 0.025 0.012

Por tanto, 𝑥 y 𝑠 son variables aleatorias.


EJERCICIO

Calcule el promedio y la desviación estándar poblacional y muestral de los datos de


Peso de pollo en (kg) de una población de 1000 aves (Datos 6).
DISTRIBUCIÓN DE PROBABILIDAD DEL PROMEDIO
MUESTRAL
Ya sabemos que 𝑋 es una variable aleatoria. ¿Cuál es su distribución de probabilidad?

¿Qué es 𝑋?
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋=
𝑛
Supuestos
𝑋1 , 𝑋2 , … , 𝑋𝑛 corresponden a una muestra aleatoria (misma
media 𝝁 y misma varianza 𝝈 e independencia)
TEOREMA CENTRAL DEL LÍMITE O TLC

Cuando el número de resultados 𝑛 tiende a infinito y 𝑋 proviene de una muestra


aleatoria, entonces 𝑋 tendrá una distribución de probabilidad normal con media 𝝁 y
desviación estándar 𝝈/ 𝒏 .

𝜎
𝑋 ∼ 𝑁 𝜇,
𝑛
TEOREMA CENTRAL DEL LÍMITE O TLC
Histogram of x
Supongamos que obtuvo 10000
muestras de tamaño 𝑛 = 100,

40
Los valores en esas muestras tienden Los

30
promedios
a 𝜇 = 5 y tienen una diferencia tienden a 5

promedio de 𝜎 = 0.1,

Density

20
Si se calculan los promedios se

10
obtendrá un histograma como el
siguiente para este conjunto de
promedios:

0
4.96 4.98 5.00 5.02 5.04

x
ESTANDARIZACIÓN DE LA MEDIA MUESTRAL

Como 𝑋 ∼ 𝑁 𝜇, 𝜎/ 𝑛 , entonces se puede estandarizar esta variable de la siguiente


manera

𝑋−𝜇
𝒁=
𝜎 𝑛
Esta nueva variable tendrá una distribución normal con media 0 y desviación estándar
1.
𝒁 ∼ 𝑵 𝟎, 𝟏
EJEMPLO
Suponga que la variable aleatoria 𝑋 = “Corrección de la temperatura en el punto de
20 °C” se distribuye normalmente con media 𝜇 = −0.2 °𝐶 y desviación estándar 𝜎 =
0.4 °𝐶. Se desea saber la probabilidad de que la media muestral 𝑋 de una muestra de
tamaño 5 se encuentre entre -0.43 °C y 0.03 °C. Distribución Normal

Se determinará la siguiente probabilidad:

2.0
𝑃 −0.43 ≤ 𝑋 ≤ 0.03 = 𝑃 −1.3 ≤ 𝑍 ≤ 1.3

1.5
dnorm(x, -0.2, 0.4/sqrt(5))
= 80.1%

1.0
Es decir, se espera que el 80.1% de los
promedios de una muestra de tamaño 5 se

0.5
encuentren entre -0.43 °C y 0.03 °C.

0.0
-0.5 0.0 0.5

x
DISTRIBUCIÓN T - STUDENT
DISTRIBUCIÓN DE 𝑿 PARA MUESTRAS PEQUEÑAS

Para muestras pequeñas (𝑛 ≤ 30 dependiendo del caso), para que se cumpla el TLC se
debe garantizar que los datos provienen de una muestra aleatoria con una distribución
normal.

Sin embargo, en muestras pequeñas es difícil demostrarlo. Entonces La estandarización


del promedio 𝑋 se denomina 𝑡

𝑋−𝜇
𝑡=
𝑠/ 𝑛

Y sigue una distribución distribución t-Student (𝑡 ∼ 𝑡𝑛−1 ). Suponiendo que 𝑥1 , 𝑥2 , … 𝑥𝑛


es una muestra aleatorio de una distribución normal.
DISTRIBUCIÓN t-STUDENT
El estadístico 𝑡 sigue una distribución t-Student con 𝑣 = 𝑛 − 1 grados de libertad con la
siguiente función de densidad de probabilidad.

𝑣+1 𝑣+1
− 2
Γ 𝑡 2
𝑓 𝑡 = 2 1+ −∞<𝑡 <∞
𝑣 𝑣
𝑣𝜋Γ 2

La curva de densidad de probabilidad de esta función es simétrica y semejante a la de la


distribución normal. Cuando el tamaño de muestra 𝑛 es muy grande la curva tiende a
ser igual a la de la normal.

A continuación se hacen algunas observaciones sobre grados de libertad.


GRADOS DE LIBERTAD
DEFINICIÓN
Se define como la diferencia entre el número de datos en una muestra y el número de parámetros a
estimar. Si se va a estimar la media 𝜇 (un solo parámetro a estimar) en una muestra de tamaño 𝑛
entonces los grados de libertad son: 𝑑𝑓 = 𝑛 − 1.

El número de grados de libertad puede variar de acuerdo a las condiciones del problema que se
esté resolviendo.

EJEMPLO
Se tienen 3 indicaciones de un manómetro de indicación digital y predefinido se tiene que el valor
promedio es 199.50 kPa, los datos obtenidos son 199.55, 199.39, ____. El número de grados de
libertad en este caso es 𝑣 = 3 − 1 = 2.

Para determinar los grados de libertad en la estimación de la incertidumbre de medición se emplea la fórmula de
Welch-Satterwaite. (curso de Estimación de Incertidumbre de medición).
Gráficas de la FDP
EJERCICIO
Determine la incertidumbre tipo A (repetibilidad) para cada una de las
muestras de datos 6, Los resultados preséntelos en la siguiente tabla:

𝒔
𝒔 𝒏 𝒗 𝒖𝒓𝒆𝒑 =
𝒏

Muestra 1
Muestra 2
Muestra 3
Muestra 4
Muestra 5
ESTIMACIÓN DE LA MEDIA POR
INTERVALOS DE CONFIANZA
DETERMINACIÓN DE UN INTERVALO DE CONFIANZA
PARA LA MEDIA POBLACIONAL

Además de la estimación puntual (estadísticos de tendencia central), también


se puede estimar la media a través de intervalos de confianza. Estos intervalos
limitan el valor de la media poblacional a dos valores, entre los que se espera
se encuentre el valor real.
Según el númeral 3.1.1 de la GUM “El objetivo de una medición es
determinar el valor del mensurando (anteriormente determinado
valor verdadero del mensurando)”. Sin embargo, el resultado de una
medición es una estimación o aproximación del valor del mensurando
y solo se considera completo con una estimación de la dispersión de
los resultados.
Los intervalos de confianza cumplen con estas características pero
solo tienen en cuenta la dispersión debida a la repetibilidad de las
mediciones.
NIVEL DE CONFIANZA
NIVEL DE CONFIANZA
0,45
La idea es no aceptar
0,40 esos valores como
representativos de la
0,35 media real 𝝁

0,30
Los valores de 𝑥 que
están…
0,25

0,20

0,15

0,10
En este circulo rojo O en este
0,05

0,00


Se consideran atípicos
NIVEL DE CONFIANZA
Nivel de confianza: probabilidad de que un parámetro poblacional, en este
caso la media 𝜇, se encuentre dentro del intervalo de confianza. Por lo
general, se asume un nivel de confianza de 95.45%, que representa la
probabilidad de éxito en la estimación y se representa por γ = 1 − 𝛼.

Nivel de significancia: probabilidad de cometer un error no controlable


(aleatorio) al estimar el parámetro poblacional. Se representa por la letra
griega 𝛼.
Nivel de confianza
0,45

0,40

0,35 Estimación
0,30 correcta
0,25

0,20
Estimación Estimación
𝟏−𝜶 errónea o
0,15 errónea o
atípica atípica
0,10

0,05
𝛼/2 𝛼/2
0,00
𝑥 − 𝑘𝜎 = 𝑞𝛼 2  𝑥 + 𝑘𝜎 = 𝑞1−𝛼 2
INTERVALO DE CONFIANZA A PARTIR DE LA
DISTRIBUCIÓN NORMAL

Caso 𝝈 conocido
Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una muestra aleatoria de una población con 𝑋 ∼
𝑁(𝜇, 𝜎), con 𝝈 conocido. Entonces la media 𝜇 se encuentra en el
siguiente intervalo con un nivel de confianza de 1 − 𝛼:

𝜎 𝜎
𝑋 − 𝑧1−𝛼 2 , 𝑋 + 𝑧1−𝛼 2
𝑛 𝑛
DESARROLLO

Construcción de intervalos de confianza para la media 𝜇, con varianza


conocida 𝜎0 2 a (1-α)100%
𝑋−𝜇
𝑍= ~𝑁 0,1
𝜎0 / 𝑛
𝑋−𝜇
𝑃 −𝑧1−∝ ≤ ≤ 𝑧1−∝ = 1 −∝
2 𝜎 / 𝑛 2
0
𝜎0 𝜎0
𝑃 −𝑧1−∝ ∙ ≤ 𝑋 − 𝜇 ≤ 𝑧1−∝ ∙ = 1 −∝
2 𝑛 2 𝑛
𝜎0 𝜎0
𝑃 𝑋 − 𝑧1−∝ ∙ ≤ 𝜇 ≤ 𝑋 + 𝑧1−∝ ∙ = 1 −∝
2 𝑛 2 𝑛
𝜎0
Intervalo de confianza para 𝜇 al (1 −∝)100%) es 𝑋 ± 𝑧1−∝ 2 ∙ 𝑛
INTERVALO DE CONFIANZA A PARTIR DE LA
DISTRIBUCIÓN T -STUDENT

Cuando solo se tiene una estimación de 𝝈 a partir de los datos


muestrales, denotada por 𝑠, entonces el intervalo de confianza toma la
siguiente forma

Caso 𝝈 desconocido
Si el tamaño de la muestra es inferior a 100 se asume que 𝑊 ∼ 𝑡𝑛−1

𝑠 𝑠
𝑋 − 𝑡1−𝛼 2,𝑛−1 , 𝑋 + 𝑡1−𝛼 2,𝑛−1
𝑛 𝑛
PROCEDIMIENTO

1 Determinar los valores muestrales 𝑥1 , 𝑥2 , … , 𝑥𝑛 .

2 Determinar los siguientes valores

• 𝑛: tamaño muestral,
• 𝑋: media muestral,
• 𝑆: desviación estándar muestral

3 Especificar el nivel de confianza 1 − 𝛼 para el intervalo de confianza. Por lo


general se acostumbra a usar un nivel de confianza de 95% lo que produce un
𝛼 = 5%
4 Determinar el valor del factor de cobertura 𝑘.

• Si 𝑛 < 30, entonces 𝑘 = 𝑡𝑛−1,1−𝛼 2,


• Si 𝑛 ≥ 30, entonces 𝑘 = 𝑧1−𝛼 2 .

Los valores 𝑧1−𝛼 2 y 𝑡𝑛−1,𝛼 2 se pueden determinar en las tablas para la


distribución normal estándar y la t-Student, respectivamente; o a través de
un software especializado.

5 Aplique la fórmula:
𝑠 𝑠
𝑋−𝑘 ,𝑋 +𝑘
𝑛 𝑛
NOTAS:
1. La construcción del intervalo depende de la muestra
seleccionada.
2. La precisión de la estimación se mide a través de la
amplitud del intervalo.
3. A mayor n, menor amplitud y por tanto mayor
precisión en la estimación.
EJERCICIOS
Determine un intervalo de confianza del 90%, 95%, 99% para la media
poblacional de cada una de las variables (indicaciones) de los conjuntos
muestras de los datos 6. Los resultados preséntelos en la siguiente tabla:

90% 95% 99%


Datos
𝑳inf 𝑳sup 𝑳inf 𝑳sup 𝑳inf 𝑳sup
Muestra 1
Muestra 2
Muestra 3
Muestra 4
Muestra 5
EVALUACIÓN
REFERENCIAS

• Apuntes de Estadística para Ingenieros, Prof. Dr. Antonio José Sáez Castillo, Dpto
de Estadística e Investigación Operativa, Universidad de Jaén, España
• Cómo hacer comprensibles los datos, Naciones Unidas, Comisión Económica
para Europa
• Estadística para Química Analítica, Segunda Edición, JC Miller, JN Miller,
Addison-Wesley IBEROAMERICANA
• Estadística Básica Aplicada, Cuarta Edición., Ciro Martínez Bencardino, ECOE
Ediciones.
GRACIAS

También podría gustarte