Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Básica Dia 3
Estadística Básica Dia 3
TERCER DÍA
Estadísticos: Katherin Holguin Agudelo/Gustavo Adolfo Gómez Escobar
DESARROLLO DEL CURSO
Primer día Tercer Día
• Conceptos Básicos.
Generalidades • Muestras aleatorias
Definiciones – Muestra aleatorias
• Estadística descriptiva. – Distribución del promedio muestral
Representación de los datos
– Teorema Central del Límite (TLC)
Medidas de tendencia central
Medidas de dispersión – Distribución t de Student y Grados de libertad.
Medidas de posición • Estimación de la media por intervalos de confianza
– Nivel de confianza
Segundo Día – Intervalos de confianza para la media: Distribución
• Nociones de probabilidad normal
Funciones y operaciones con funciones. – Intervalos de confianza para la media: Distribución t-
Conceptos básicos Student
• Variables aleatorias
Funciones de distribución.
Funciones de densidad
• Distribuciones de probabilidad.
Rectangular, Triangular, Normal y t-student.
MUESTRAS ALEATORIAS
INTRODUCCIÓN
Se denomina muestra a cualquier subconjunto de datos seleccionados de una población.
En una muestra aleatoria todos los elementos de la población deben tener alguna
probabilidad de salir en la muestra y, además, los elementos de la muestra deben ser
independientes: el que salga un resultado en la muestra no debe afectar a que ningún
otro resultado salga en la muestra.
Los valores de tiempo de vida útil de todas las bombillas en la fábrica constituiría la
población, entonces el selecciona una muestra aleatoria simple de tamaño 100
para realizar sus mediciones.
EJEMPLO
Noten que los datos en cada muestra tienden a ser diferentes. Entonces surgen
inquietudes como:
• ¿Qué promedio representará el valor de la indicación?
• ¿Qué desviación estándar representa la dispersión real de los datos?
DISTRIBUCIÓN DEL PROMEDIO
MUESTRAL
EJEMPLO
Supongamos que estamos observando una variable aleatoria X, y que obtenemos una
muestra aleatoria de tamaño n, 𝑋11 , … 𝑋1𝑛 . Con esos datos podemos calcular el
promedio muestral 𝑿𝟏 y la desviación estándar muestral 𝑺𝟏 .
Los valores que salieron en las muestras son fruto de la aleatoriedad, por tanto 𝑿 y 𝑺
son variables aleatorias.
MUESTRA 1 MUESTRA 2 MUESTRA 3 MUESTRA 4 MUESTRA 5 MUESTRA 6 MUESTRA 7
1.99 1.98 2.01 1.99 1.94 2.01 2.00
2.00 1.99 2.02 1.98 2.02 2.01 2.00
A pesar de
obtenerse bajo
2.02 1.96 2.04 1.99 1.97 1.99 2.02
las mismas 2.05 1.99 2.01 1.97 2.01 2.03 2.00
condiciones los
promedios son 2.02 2.01 2.00 2.00 2.02 2.03 2.00
diferentes
1.98 1.98 2.01 2.03 1.99 2.02 1.99
2.00 1.94 1.97 1.98 2.07 1.95 2.01
2.03 2.00 2.00 2.01 1.96 2.00 2.00
2.04 2.00 1.99 2.01 1.98 2.02 1.98
2.03 1.98 1.93 2.03 2.01 1.99 2.00
𝑿 2.016 1.983 1.999 1.998 1.997 2.004 2.001
𝒔 0.024 0.023 0.030 0.020 0.038 0.025 0.012
¿Qué es 𝑋?
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋=
𝑛
Supuestos
𝑋1 , 𝑋2 , … , 𝑋𝑛 corresponden a una muestra aleatoria (misma
media 𝝁 y misma varianza 𝝈 e independencia)
TEOREMA CENTRAL DEL LÍMITE O TLC
𝜎
𝑋 ∼ 𝑁 𝜇,
𝑛
TEOREMA CENTRAL DEL LÍMITE O TLC
Histogram of x
Supongamos que obtuvo 10000
muestras de tamaño 𝑛 = 100,
40
Los valores en esas muestras tienden Los
30
promedios
a 𝜇 = 5 y tienen una diferencia tienden a 5
promedio de 𝜎 = 0.1,
Density
20
Si se calculan los promedios se
10
obtendrá un histograma como el
siguiente para este conjunto de
promedios:
0
4.96 4.98 5.00 5.02 5.04
x
ESTANDARIZACIÓN DE LA MEDIA MUESTRAL
𝑋−𝜇
𝒁=
𝜎 𝑛
Esta nueva variable tendrá una distribución normal con media 0 y desviación estándar
1.
𝒁 ∼ 𝑵 𝟎, 𝟏
EJEMPLO
Suponga que la variable aleatoria 𝑋 = “Corrección de la temperatura en el punto de
20 °C” se distribuye normalmente con media 𝜇 = −0.2 °𝐶 y desviación estándar 𝜎 =
0.4 °𝐶. Se desea saber la probabilidad de que la media muestral 𝑋 de una muestra de
tamaño 5 se encuentre entre -0.43 °C y 0.03 °C. Distribución Normal
2.0
𝑃 −0.43 ≤ 𝑋 ≤ 0.03 = 𝑃 −1.3 ≤ 𝑍 ≤ 1.3
1.5
dnorm(x, -0.2, 0.4/sqrt(5))
= 80.1%
1.0
Es decir, se espera que el 80.1% de los
promedios de una muestra de tamaño 5 se
0.5
encuentren entre -0.43 °C y 0.03 °C.
0.0
-0.5 0.0 0.5
x
DISTRIBUCIÓN T - STUDENT
DISTRIBUCIÓN DE 𝑿 PARA MUESTRAS PEQUEÑAS
Para muestras pequeñas (𝑛 ≤ 30 dependiendo del caso), para que se cumpla el TLC se
debe garantizar que los datos provienen de una muestra aleatoria con una distribución
normal.
𝑋−𝜇
𝑡=
𝑠/ 𝑛
𝑣+1 𝑣+1
− 2
Γ 𝑡 2
𝑓 𝑡 = 2 1+ −∞<𝑡 <∞
𝑣 𝑣
𝑣𝜋Γ 2
El número de grados de libertad puede variar de acuerdo a las condiciones del problema que se
esté resolviendo.
EJEMPLO
Se tienen 3 indicaciones de un manómetro de indicación digital y predefinido se tiene que el valor
promedio es 199.50 kPa, los datos obtenidos son 199.55, 199.39, ____. El número de grados de
libertad en este caso es 𝑣 = 3 − 1 = 2.
Para determinar los grados de libertad en la estimación de la incertidumbre de medición se emplea la fórmula de
Welch-Satterwaite. (curso de Estimación de Incertidumbre de medición).
Gráficas de la FDP
EJERCICIO
Determine la incertidumbre tipo A (repetibilidad) para cada una de las
muestras de datos 6, Los resultados preséntelos en la siguiente tabla:
𝒔
𝒔 𝒏 𝒗 𝒖𝒓𝒆𝒑 =
𝒏
Muestra 1
Muestra 2
Muestra 3
Muestra 4
Muestra 5
ESTIMACIÓN DE LA MEDIA POR
INTERVALOS DE CONFIANZA
DETERMINACIÓN DE UN INTERVALO DE CONFIANZA
PARA LA MEDIA POBLACIONAL
0,30
Los valores de 𝑥 que
están…
0,25
0,20
0,15
0,10
En este circulo rojo O en este
0,05
0,00
Se consideran atípicos
NIVEL DE CONFIANZA
Nivel de confianza: probabilidad de que un parámetro poblacional, en este
caso la media 𝜇, se encuentre dentro del intervalo de confianza. Por lo
general, se asume un nivel de confianza de 95.45%, que representa la
probabilidad de éxito en la estimación y se representa por γ = 1 − 𝛼.
0,40
0,35 Estimación
0,30 correcta
0,25
0,20
Estimación Estimación
𝟏−𝜶 errónea o
0,15 errónea o
atípica atípica
0,10
0,05
𝛼/2 𝛼/2
0,00
𝑥 − 𝑘𝜎 = 𝑞𝛼 2 𝑥 + 𝑘𝜎 = 𝑞1−𝛼 2
INTERVALO DE CONFIANZA A PARTIR DE LA
DISTRIBUCIÓN NORMAL
Caso 𝝈 conocido
Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una muestra aleatoria de una población con 𝑋 ∼
𝑁(𝜇, 𝜎), con 𝝈 conocido. Entonces la media 𝜇 se encuentra en el
siguiente intervalo con un nivel de confianza de 1 − 𝛼:
𝜎 𝜎
𝑋 − 𝑧1−𝛼 2 , 𝑋 + 𝑧1−𝛼 2
𝑛 𝑛
DESARROLLO
Caso 𝝈 desconocido
Si el tamaño de la muestra es inferior a 100 se asume que 𝑊 ∼ 𝑡𝑛−1
𝑠 𝑠
𝑋 − 𝑡1−𝛼 2,𝑛−1 , 𝑋 + 𝑡1−𝛼 2,𝑛−1
𝑛 𝑛
PROCEDIMIENTO
• 𝑛: tamaño muestral,
• 𝑋: media muestral,
• 𝑆: desviación estándar muestral
5 Aplique la fórmula:
𝑠 𝑠
𝑋−𝑘 ,𝑋 +𝑘
𝑛 𝑛
NOTAS:
1. La construcción del intervalo depende de la muestra
seleccionada.
2. La precisión de la estimación se mide a través de la
amplitud del intervalo.
3. A mayor n, menor amplitud y por tanto mayor
precisión en la estimación.
EJERCICIOS
Determine un intervalo de confianza del 90%, 95%, 99% para la media
poblacional de cada una de las variables (indicaciones) de los conjuntos
muestras de los datos 6. Los resultados preséntelos en la siguiente tabla:
• Apuntes de Estadística para Ingenieros, Prof. Dr. Antonio José Sáez Castillo, Dpto
de Estadística e Investigación Operativa, Universidad de Jaén, España
• Cómo hacer comprensibles los datos, Naciones Unidas, Comisión Económica
para Europa
• Estadística para Química Analítica, Segunda Edición, JC Miller, JN Miller,
Addison-Wesley IBEROAMERICANA
• Estadística Básica Aplicada, Cuarta Edición., Ciro Martínez Bencardino, ECOE
Ediciones.
GRACIAS