Estadística Básica Dia 3

ESTADÍSTICA BÁSICA
Subdirección de innovación y Servicios tecnológicos - SIST
TERCER DÍA
Estadísticos: Katherin Holguin Agudelo/Gustavo Adolfo Gómez Escobar
DESARROLLO DEL CURSO
Primer día Tercer Día
• Conceptos Básicos.
Generalidades • Muestras aleatorias
Definiciones – Muestra aleatorias
• Estadística descriptiva. – Distribución del promedio muestral
Representación de los datos
– Teorema Central del Límite (TLC)
Medidas de tendencia central
Medidas de dispersión – Distribución t de Student y Grados de libertad.
Medidas de posición • Estimación de la media por intervalos de confianza
– Nivel de confianza
Segundo Día – Intervalos de confianza para la media: Distribución
• Nociones de probabilidad normal
Funciones y operaciones con funciones. – Intervalos de confianza para la media: Distribución t-
Conceptos básicos Student
• Variables aleatorias
Funciones de distribución.
Funciones de densidad
• Distribuciones de probabilidad.
Rectangular, Triangular, Normal y t-student.
MUESTRAS ALEATORIAS
INTRODUCCIÓN
Se denomina muestra a cualquier subconjunto de datos seleccionados de una población.
Una muestra aleatoria es un conjunto de datos seleccionados aleatoriamente
La teoría para la estimación de la incertidumbre de medición tiene como requisito de

obligatorio cumplimiento la obtención de muestras aleatorias.
MUESTRA ALEATORIA
En una muestra aleatoria todos los elementos de la población deben tener alguna
probabilidad de salir en la muestra y, además, los elementos de la muestra deben ser
independientes: el que salga un resultado en la muestra no debe afectar a que ningún
otro resultado salga en la muestra.
Cuando todos los elementos de la población

tienen la misma probabilidad de salir en la
muestra esta se llama Muestra Aleatoria Simple
EJEMPLO
Un fabricante de bombillas desea conocer el tiempo de vida útil de todas las

bombillas que produce en su fábrica, La manera de saberlo sería sometiendo a
pruebas todas sus bombillas. No obstante, puesto que este tipo de ensayo es
destructivo, no tendría ningún producto para vender.
Los valores de tiempo de vida útil de todas las bombillas en la fábrica constituiría la
población, entonces el selecciona una muestra aleatoria simple de tamaño 100
para realizar sus mediciones.
EJEMPLO
En la calibración de un instrumento de medición no se tuvo en

Muestra 1 cuenta el tiempo de calentamiento del objeto a calibrar
obteniéndose los siguientes resultados:
2.0, 2.1, 1.9, 2.0, 1.7, 1.5, 1.3, 1.0, ….
En la calibración del mismo instrumento de medición se controló

el tiempo de calentamiento del instrumento a calibrar por lo
Muestra 2 que se obtuvieron los siguientes resultados:
2.0, 2.0, 2.1, 2.0, 1.9, 2.2, 1.9 …

EJEMPLO
Se tiene la siguiente variable aleatoria:
𝑋 = Indicación de un instrumento de medición en el punto de 2 unidades.
Se obtienen las siguientes muestras:
Muestra 1 2.14 2.28 2.06 1.90 2.40

Muestra 2 2.10 2.24 2.40 2.50 2.61
Muestra 3 2.32 2.23 2.27 2.15 2.14
Noten que los datos en cada muestra tienden a ser diferentes. Entonces surgen
inquietudes como:
• ¿Qué promedio representará el valor de la indicación?
• ¿Qué desviación estándar representa la dispersión real de los datos?
DISTRIBUCIÓN DEL PROMEDIO
MUESTRAL
EJEMPLO
Supongamos que estamos observando una variable aleatoria X, y que obtenemos una
muestra aleatoria de tamaño n, 𝑋11 , … 𝑋1𝑛 . Con esos datos podemos calcular el
promedio muestral 𝑿𝟏 y la desviación estándar muestral 𝑺𝟏 .
Si tomamos otra muestra aleatoria de la misma variable 𝑋21 , … 𝑋2𝑛 tendremos 𝑋2 y la

desviación estándar muestral 𝑆2 .
Los valores que salieron en las muestras son fruto de la aleatoriedad, por tanto 𝑿 y 𝑺
son variables aleatorias.
MUESTRA 1 MUESTRA 2 MUESTRA 3 MUESTRA 4 MUESTRA 5 MUESTRA 6 MUESTRA 7
1.99 1.98 2.01 1.99 1.94 2.01 2.00
2.00 1.99 2.02 1.98 2.02 2.01 2.00
A pesar de
obtenerse bajo
2.02 1.96 2.04 1.99 1.97 1.99 2.02
las mismas 2.05 1.99 2.01 1.97 2.01 2.03 2.00
condiciones los
promedios son 2.02 2.01 2.00 2.00 2.02 2.03 2.00
diferentes
1.98 1.98 2.01 2.03 1.99 2.02 1.99
2.00 1.94 1.97 1.98 2.07 1.95 2.01
2.03 2.00 2.00 2.01 1.96 2.00 2.00
2.04 2.00 1.99 2.01 1.98 2.02 1.98
2.03 1.98 1.93 2.03 2.01 1.99 2.00
𝑿 2.016 1.983 1.999 1.998 1.997 2.004 2.001
𝒔 0.024 0.023 0.030 0.020 0.038 0.025 0.012
Por tanto, 𝑥 y 𝑠 son variables aleatorias.

EJERCICIO
Calcule el promedio y la desviación estándar poblacional y muestral de los datos de

Peso de pollo en (kg) de una población de 1000 aves (Datos 6).
DISTRIBUCIÓN DE PROBABILIDAD DEL PROMEDIO
MUESTRAL
Ya sabemos que 𝑋 es una variable aleatoria. ¿Cuál es su distribución de probabilidad?
¿Qué es 𝑋?
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋=
𝑛
Supuestos
𝑋1 , 𝑋2 , … , 𝑋𝑛 corresponden a una muestra aleatoria (misma
media 𝝁 y misma varianza 𝝈 e independencia)
TEOREMA CENTRAL DEL LÍMITE O TLC
Cuando el número de resultados 𝑛 tiende a infinito y 𝑋 proviene de una muestra

aleatoria, entonces 𝑋 tendrá una distribución de probabilidad normal con media 𝝁 y
desviación estándar 𝝈/ 𝒏 .
𝜎
𝑋 ∼ 𝑁 𝜇,
𝑛
TEOREMA CENTRAL DEL LÍMITE O TLC
Histogram of x
Supongamos que obtuvo 10000
muestras de tamaño 𝑛 = 100,
40
Los valores en esas muestras tienden Los
30
promedios
a 𝜇 = 5 y tienen una diferencia tienden a 5
promedio de 𝜎 = 0.1,
Density
20
Si se calculan los promedios se
10
obtendrá un histograma como el
siguiente para este conjunto de
promedios:
0
4.96 4.98 5.00 5.02 5.04
x
ESTANDARIZACIÓN DE LA MEDIA MUESTRAL
Como 𝑋 ∼ 𝑁 𝜇, 𝜎/ 𝑛 , entonces se puede estandarizar esta variable de la siguiente

manera
𝑋−𝜇
𝒁=
𝜎 𝑛
Esta nueva variable tendrá una distribución normal con media 0 y desviación estándar
1.
𝒁 ∼ 𝑵 𝟎, 𝟏
EJEMPLO
Suponga que la variable aleatoria 𝑋 = “Corrección de la temperatura en el punto de
20 °C” se distribuye normalmente con media 𝜇 = −0.2 °𝐶 y desviación estándar 𝜎 =
0.4 °𝐶. Se desea saber la probabilidad de que la media muestral 𝑋 de una muestra de
tamaño 5 se encuentre entre -0.43 °C y 0.03 °C. Distribución Normal
Se determinará la siguiente probabilidad:
2.0
𝑃 −0.43 ≤ 𝑋 ≤ 0.03 = 𝑃 −1.3 ≤ 𝑍 ≤ 1.3
1.5
dnorm(x, -0.2, 0.4/sqrt(5))
= 80.1%
1.0
Es decir, se espera que el 80.1% de los
promedios de una muestra de tamaño 5 se
0.5
encuentren entre -0.43 °C y 0.03 °C.
0.0
-0.5 0.0 0.5
x
DISTRIBUCIÓN T - STUDENT
DISTRIBUCIÓN DE 𝑿 PARA MUESTRAS PEQUEÑAS
Para muestras pequeñas (𝑛 ≤ 30 dependiendo del caso), para que se cumpla el TLC se
debe garantizar que los datos provienen de una muestra aleatoria con una distribución
normal.
Sin embargo, en muestras pequeñas es difícil demostrarlo. Entonces La estandarización

del promedio 𝑋 se denomina 𝑡
𝑋−𝜇
𝑡=
𝑠/ 𝑛
Y sigue una distribución distribución t-Student (𝑡 ∼ 𝑡𝑛−1 ). Suponiendo que 𝑥1 , 𝑥2 , … 𝑥𝑛

es una muestra aleatorio de una distribución normal.
DISTRIBUCIÓN t-STUDENT
El estadístico 𝑡 sigue una distribución t-Student con 𝑣 = 𝑛 − 1 grados de libertad con la
siguiente función de densidad de probabilidad.
𝑣+1 𝑣+1
− 2
Γ 𝑡 2
𝑓 𝑡 = 2 1+ −∞<𝑡 <∞
𝑣 𝑣
𝑣𝜋Γ 2
La curva de densidad de probabilidad de esta función es simétrica y semejante a la de la

distribución normal. Cuando el tamaño de muestra 𝑛 es muy grande la curva tiende a
ser igual a la de la normal.
A continuación se hacen algunas observaciones sobre grados de libertad.

GRADOS DE LIBERTAD
DEFINICIÓN
Se define como la diferencia entre el número de datos en una muestra y el número de parámetros a
estimar. Si se va a estimar la media 𝜇 (un solo parámetro a estimar) en una muestra de tamaño 𝑛
entonces los grados de libertad son: 𝑑𝑓 = 𝑛 − 1.
El número de grados de libertad puede variar de acuerdo a las condiciones del problema que se
esté resolviendo.
EJEMPLO
Se tienen 3 indicaciones de un manómetro de indicación digital y predefinido se tiene que el valor
promedio es 199.50 kPa, los datos obtenidos son 199.55, 199.39, ____. El número de grados de
libertad en este caso es 𝑣 = 3 − 1 = 2.
Para determinar los grados de libertad en la estimación de la incertidumbre de medición se emplea la fórmula de
Welch-Satterwaite. (curso de Estimación de Incertidumbre de medición).
Gráficas de la FDP
EJERCICIO
Determine la incertidumbre tipo A (repetibilidad) para cada una de las
muestras de datos 6, Los resultados preséntelos en la siguiente tabla:
𝒔
𝒔 𝒏 𝒗 𝒖𝒓𝒆𝒑 =
𝒏
Muestra 1
Muestra 2
Muestra 3
Muestra 4
Muestra 5
ESTIMACIÓN DE LA MEDIA POR
INTERVALOS DE CONFIANZA
DETERMINACIÓN DE UN INTERVALO DE CONFIANZA
PARA LA MEDIA POBLACIONAL
Además de la estimación puntual (estadísticos de tendencia central), también

se puede estimar la media a través de intervalos de confianza. Estos intervalos
limitan el valor de la media poblacional a dos valores, entre los que se espera
se encuentre el valor real.
Según el númeral 3.1.1 de la GUM “El objetivo de una medición es
determinar el valor del mensurando (anteriormente determinado
valor verdadero del mensurando)”. Sin embargo, el resultado de una
medición es una estimación o aproximación del valor del mensurando
y solo se considera completo con una estimación de la dispersión de
los resultados.
Los intervalos de confianza cumplen con estas características pero
solo tienen en cuenta la dispersión debida a la repetibilidad de las
mediciones.
NIVEL DE CONFIANZA
NIVEL DE CONFIANZA
0,45
La idea es no aceptar
0,40 esos valores como
representativos de la
0,35 media real 𝝁
0,30
Los valores de 𝑥 que
están…
0,25
0,20
0,15
0,10
En este circulo rojo O en este
0,05
0,00

Se consideran atípicos
NIVEL DE CONFIANZA
Nivel de confianza: probabilidad de que un parámetro poblacional, en este
caso la media 𝜇, se encuentre dentro del intervalo de confianza. Por lo
general, se asume un nivel de confianza de 95.45%, que representa la
probabilidad de éxito en la estimación y se representa por γ = 1 − 𝛼.
Nivel de significancia: probabilidad de cometer un error no controlable

(aleatorio) al estimar el parámetro poblacional. Se representa por la letra
griega 𝛼.
Nivel de confianza
0,45
0,40
0,35 Estimación
0,30 correcta
0,25
0,20
Estimación Estimación
𝟏−𝜶 errónea o
0,15 errónea o
atípica atípica
0,10
0,05
𝛼/2 𝛼/2
0,00
𝑥 − 𝑘𝜎 = 𝑞𝛼 2  𝑥 + 𝑘𝜎 = 𝑞1−𝛼 2
INTERVALO DE CONFIANZA A PARTIR DE LA
DISTRIBUCIÓN NORMAL
Caso 𝝈 conocido
Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una muestra aleatoria de una población con 𝑋 ∼
𝑁(𝜇, 𝜎), con 𝝈 conocido. Entonces la media 𝜇 se encuentra en el
siguiente intervalo con un nivel de confianza de 1 − 𝛼:
𝜎 𝜎
𝑋 − 𝑧1−𝛼 2 , 𝑋 + 𝑧1−𝛼 2
𝑛 𝑛
DESARROLLO
Construcción de intervalos de confianza para la media 𝜇, con varianza

conocida 𝜎0 2 a (1-α)100%
𝑋−𝜇
𝑍= ~𝑁 0,1
𝜎0 / 𝑛
𝑋−𝜇
𝑃 −𝑧1−∝ ≤ ≤ 𝑧1−∝ = 1 −∝
2 𝜎 / 𝑛 2
0
𝜎0 𝜎0
𝑃 −𝑧1−∝ ∙ ≤ 𝑋 − 𝜇 ≤ 𝑧1−∝ ∙ = 1 −∝
2 𝑛 2 𝑛
𝜎0 𝜎0
𝑃 𝑋 − 𝑧1−∝ ∙ ≤ 𝜇 ≤ 𝑋 + 𝑧1−∝ ∙ = 1 −∝
2 𝑛 2 𝑛
𝜎0
Intervalo de confianza para 𝜇 al (1 −∝)100%) es 𝑋 ± 𝑧1−∝ 2 ∙ 𝑛
INTERVALO DE CONFIANZA A PARTIR DE LA
DISTRIBUCIÓN T -STUDENT
Cuando solo se tiene una estimación de 𝝈 a partir de los datos

muestrales, denotada por 𝑠, entonces el intervalo de confianza toma la
siguiente forma
Caso 𝝈 desconocido
Si el tamaño de la muestra es inferior a 100 se asume que 𝑊 ∼ 𝑡𝑛−1
𝑠 𝑠
𝑋 − 𝑡1−𝛼 2,𝑛−1 , 𝑋 + 𝑡1−𝛼 2,𝑛−1
𝑛 𝑛
PROCEDIMIENTO
1 Determinar los valores muestrales 𝑥1 , 𝑥2 , … , 𝑥𝑛 .
2 Determinar los siguientes valores
• 𝑛: tamaño muestral,
• 𝑋: media muestral,
• 𝑆: desviación estándar muestral
3 Especificar el nivel de confianza 1 − 𝛼 para el intervalo de confianza. Por lo

general se acostumbra a usar un nivel de confianza de 95% lo que produce un
𝛼 = 5%
4 Determinar el valor del factor de cobertura 𝑘.
• Si 𝑛 < 30, entonces 𝑘 = 𝑡𝑛−1,1−𝛼 2,

• Si 𝑛 ≥ 30, entonces 𝑘 = 𝑧1−𝛼 2 .
Los valores 𝑧1−𝛼 2 y 𝑡𝑛−1,𝛼 2 se pueden determinar en las tablas para la

distribución normal estándar y la t-Student, respectivamente; o a través de
un software especializado.
5 Aplique la fórmula:
𝑠 𝑠
𝑋−𝑘 ,𝑋 +𝑘
𝑛 𝑛
NOTAS:
1. La construcción del intervalo depende de la muestra
seleccionada.
2. La precisión de la estimación se mide a través de la
amplitud del intervalo.
3. A mayor n, menor amplitud y por tanto mayor
precisión en la estimación.
EJERCICIOS
Determine un intervalo de confianza del 90%, 95%, 99% para la media
poblacional de cada una de las variables (indicaciones) de los conjuntos
muestras de los datos 6. Los resultados preséntelos en la siguiente tabla:
90% 95% 99%

Datos
𝑳inf 𝑳sup 𝑳inf 𝑳sup 𝑳inf 𝑳sup
Muestra 1
Muestra 2
Muestra 3
Muestra 4
Muestra 5
EVALUACIÓN
REFERENCIAS
• Apuntes de Estadística para Ingenieros, Prof. Dr. Antonio José Sáez Castillo, Dpto
de Estadística e Investigación Operativa, Universidad de Jaén, España
• Cómo hacer comprensibles los datos, Naciones Unidas, Comisión Económica
para Europa
• Estadística para Química Analítica, Segunda Edición, JC Miller, JN Miller,
Addison-Wesley IBEROAMERICANA
• Estadística Básica Aplicada, Cuarta Edición., Ciro Martínez Bencardino, ECOE
Ediciones.
GRACIAS

Estadística Básica Dia 3

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística Básica Dia 3

Cargado por

Copyright:

Formatos disponibles

ESTADÍSTICA BÁSICA

Subdirección de innovación y Servicios tecnológicos - SIST

Una muestra aleatoria es un conjunto de datos seleccionados aleatoriamente

La teoría para la estimación de la incertidumbre de medición tiene como requisito de

Cuando todos los elementos de la población

Un fabricante de bombillas desea conocer el tiempo de vida útil de todas las

En la calibración de un instrumento de medición no se tuvo en

2.0, 2.1, 1.9, 2.0, 1.7, 1.5, 1.3, 1.0, ….

En la calibración del mismo instrumento de medición se controló

2.0, 2.0, 2.1, 2.0, 1.9, 2.2, 1.9 …

Muestra 1 2.14 2.28 2.06 1.90 2.40

Si tomamos otra muestra aleatoria de la misma variable 𝑋21 , … 𝑋2𝑛 tendremos 𝑋2 y la

Por tanto, 𝑥 y 𝑠 son variables aleatorias.

Calcule el promedio y la desviación estándar poblacional y muestral de los datos de

Cuando el número de resultados 𝑛 tiende a infinito y 𝑋 proviene de una muestra

Como 𝑋 ∼ 𝑁 𝜇, 𝜎/ 𝑛 , entonces se puede estandarizar esta variable de la siguiente

Se determinará la siguiente probabilidad:

Sin embargo, en muestras pequeñas es difícil demostrarlo. Entonces La estandarización

Y sigue una distribución distribución t-Student (𝑡 ∼ 𝑡𝑛−1 ). Suponiendo que 𝑥1 , 𝑥2 , … 𝑥𝑛

La curva de densidad de probabilidad de esta función es simétrica y semejante a la de la

A continuación se hacen algunas observaciones sobre grados de libertad.

Además de la estimación puntual (estadísticos de tendencia central), también

Nivel de significancia: probabilidad de cometer un error no controlable

Construcción de intervalos de confianza para la media 𝜇, con varianza

Cuando solo se tiene una estimación de 𝝈 a partir de los datos

1 Determinar los valores muestrales 𝑥1 , 𝑥2 , … , 𝑥𝑛 .

2 Determinar los siguientes valores

3 Especificar el nivel de confianza 1 − 𝛼 para el intervalo de confianza. Por lo

• Si 𝑛 < 30, entonces 𝑘 = 𝑡𝑛−1,1−𝛼 2,

Los valores 𝑧1−𝛼 2 y 𝑡𝑛−1,𝛼 2 se pueden determinar en las tablas para la

90% 95% 99%

También podría gustarte