Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRIMER DÍA
Estadísticos: Katherin Holguin Agudelo/Gustavo Adolfo Gómez Escobar
DESARROLLO DEL CURSO
Primer día Tercer Día
• Conceptos Básicos.
Generalidades • Muestras aleatorias
Definiciones – Muestra aleatorias
• Estadística descriptiva. – Distribución del promedio muestral
Representación de los datos
– Teorema Central del Límite (TLC)
Medidas de tendencia central
Medidas de dispersión – Distribución t de Student y Grados de libertad.
Medidas de posición • Estimación de la media por intervalos de confianza
– Nivel de confianza
Segundo Día – Intervalos de confianza para la media: Distribución
• Nociones de probabilidad normal
Funciones y operaciones con funciones. – Intervalos de confianza para la media: Distribución t-
Conceptos básicos Student
• Variables aleatorias
Funciones de distribución.
Funciones de densidad
• Distribuciones de probabilidad.
Rectangular, Triangular, Normal y t-student.
REQUISITOS
El participante debe:
• Tener una conocimientos de matemáticas y cálculo
• Formación en metrología básica.
• Contar con un computador (preferiblemente) o una
calculadora científica con funciones estadísticas.
OBJETIVO
D
Ciencia que Analizar
Con el fin
A
se encarga de T
de tomar
O decisiones
Presentar,
interpretar S
VARIABLE Y DATO
VARIABLE
Una variable es una característica de una unidad observada que puede asumir más de
un valor de un conjunto de valores los cuales pueden ser una medida numérica o una
categoría de una clasificación (por ejemplo, ingreso, edad, peso, etc., y "ocupación" ,
"Industria", "enfermedad", etc.)
Cualitativas
Cuantitativas
(atributos)
No se pueden representar Sus valores representan diferentes
numéricamente, pueden describir magnitudes:
cualidades: • Ejemplo: Temperatura [°C],
• Ejemplo: Color, Estado civil, Nivel Masa [kg], % concentración.
de estudios
VARIABLE Y DATO
VARIABLE
Cualitativas
Cuantitativas
(atributos)
Nota: Debido a que en el proceso de estimación de incertidumbre de medición se emplean variables cuantitativas, en este curso
nos centraremos en este tipo de variables.
Se conoce que la
palabra Datos proviene
del latín “Dtum” cuyo
significado es “lo que se
da”.
Puede referirse a
un numero, letra,
símbolo o signo
Dato
Corresponde a la determinación de una variable en un individuo u objeto (unidad
observacional). También se puede clasificar en cualitativo (categórico) y cuantitativo
POBLACIÓN Y MUESTRA
POBLACIÓN MUESTRA
También llamada universo, Subconjunto de la población.
es el conjunto de elementos Al número de elementos de
de referencia sobre el que se este subconjunto se le
realizan las observaciones de denomina tamaño muestral y
una o más variables de se representa por la letra 𝒏.
interés. El número de
elementos en este conjunto
se conoce como tamaño
poblacional y se representa
por la letra 𝑵.
POBLACIÓN Y MUESTRA
POBLACIÓN MUESTRA
SIDERÚRGICAS: producción total 100 varillas seleccionadas de
de varillas de referencia ½ in de dicha producción
una colada.
MATERIALES: proceso de llenado 10 Botellas extraídas de la línea
de una botella de la marca ABC de producción cada 3 horas.
(refresco) de una línea de
producción en el mes de Junio.
INTERPRETACIÓN EN ESTIMACIÓN DE INCERTIDUMBRE
Si se efectúa indefinidamente el proceso de Sin embargo, como en este caso la
medición en una pesa de clase F1 de 1 kg bajo las población es infinita, por lo que es
mismas condiciones de medición (un solo imposible obtenerla toda, en vez de
operario, temperatura estable, entre otras) se esto se obtiene un subconjunto de
puede obtener el siguiente conjunto de valores esa población infinita como el que se
numéricos para la masa (en kg): presenta a continuación:
ESTIMACIÓN
proceso que tiene por finalidad atribuir, a partir de observaciones en una muestra, valores
numéricos a los parámetros. Al valor numérico resultado de un proceso de estimación se le
conoce también como estimación.
EJEMPLOS
Total concentración de
Peso promedio plomo en el agua
de la población
Incertidumbre de
medición
Proponer 2 ejemplos de parámetros de su empresa u
organización.
NOTACIÓN
• 𝑋 Una variable,
• 𝑓 𝑋 una función de 𝑋,
• 𝑥𝑖 una observación de la variable 𝑋.
𝜃, µ, σ
ESTADÍSTICO Y ESTIMADOR
ESTADÍSTICO
Función medible de variables aleatorias de una muestra.
𝑛
𝑓 𝑋 = 2𝑋 𝑓 𝑋 = 𝑋2 𝑓 𝑋 = 𝑥𝑖
𝑛 𝑖
1
𝑓 𝑋 = 𝑥𝑖
𝑛
𝑖
ESTIMADOR
Cuando un estadístico se usa para estimar o “inferir” el valor de un parámetro de una
población, se dice que es un estimador de dicho parámetro. .
Nota: como sabemos en el proceso de estimación de incertidumbre en muchos casos es imposible determinar la totalidad de
valores de la población, por lo que se recurre a muestras de dicha población. En este caso se utilizan estadísticos en vez de para
estimar el valor de la incertidumbre.
NOTACIÓN (PARÁMETRO – ESTIMADOR)
Los parámetros poblacionales y sus estimadores se denotan:
𝜃→𝜃
Media: µ→𝑥
Desviación: σ → s
EJEMPLO 𝑋 = 𝑥1 , 𝑥2 𝑥3 ,…, 𝑥10 = 0.02 𝑘𝑔, 0.00 𝑘𝑔, 0.01 𝑘𝑔, … , 0.00 𝑘𝑔
POBLACIÓN PARÁMETRO
Los errores de La media de los
medición de diez errores de medición
pesas de 1 kg son para la población es:
(población):
0.02 + ⋯ + 0.00
0.02 kg, -0.01 kg, 𝜇 = 𝑁
10 1
0.00 kg, 0.00 kg, 𝜇 = 𝑓1 𝑋 = 𝑥𝑖 = 0.00
0.01 kg, -0.02 kg, En este caso la media 𝑁
0.00 kg, 0.01 kg, 𝜇 es un parámetro 𝑖
-0.01 kg, 0.00 kg. porque corresponde a
un resumen de los datos
de una población.
La población es de
tamaño 𝑁 = 10.
EJEMPLO
MUESTRA ESTADÍSTICO
Variable 1 Variable 2
N n* Parámetro*
Nombre Tipo Nombre Tipo
Datos 1
Datos 2
Recolección de Histograma
datos cuantitativos
continuos
Diagrama de
Si n<30
puntos
Solo una sugerencia…
cada experimento tiene
sus particularidades
DIAGRAMA DE PUNTOS
¿Qué es? ¿Para qué se utiliza?
• El diagrama de puntos es una gráfica muy útil para visualizar un CONJUNTO
PEQUEÑO de datos; por ejemplo, de unas 20 observaciones.
• La gráfica permite ver rápidamente la TENDENCIA y VARIABILIDAD de los datos.
¿Cómo se elabora?
1. Ordene los datos obtenidos de menor a mayor
2. Dibuje una línea horizontal demarcada con los valores encontrados en los datos.
(Ordenados).
3. Coloque un punto o círculo pequeño relleno (o esfera) cada vez que un dato ocurra,
encima uno de otro sobre el número del eje correspondiente al dato.
Ejemplo
• Aplicando las directrices de la norma técnica colombiana NTC 4513 se obtuvieron 8
mediciones sobre el punto de 0 mm con un comparador de caratula.
• •
• • •
• • •
Diagrama | | | | | | |
-0.003 -0.002 -0.001 0.000 0.001 0.002 0.003
-0.2 -1.3 -0.1 -1.3 -0.9 -0.5 -2.9 -0.9 -1.4 -1.6
-1.4 -1.9 -1.5 -1.4 -2.2 -1.1 -0.4 -1.9 -0.7 -0.3
-2.1 -1.5 -1.0 0.0 -2 0.2 -1 -2.2 -0.7 -3.5
-2.7 -2.4 -1.4 -0.5 0.5 -1.2 -2.2 -0.6 -2 0.5
-1.8 -0.7 -1.2 -0.4 -0.3 -2.1 -0.1 -0.8 -0.8 -1.7
3 Construcción de la tabla Clase: Orden del intervalo en el que se van a agrupar los resultados.
7 [0.1 a 0.7) 3 0,06 Frecuencia absoluta ni: Conteo de datos que caen en cada clase.
Equivale a los valores que se encuentran entre los límites de cada
intervalo.
Definición
El histograma es una sucesión de rectángulos construidos sobre un sistema de coordenadas.
6 Interprete
CONSTRUCCIÓN DE UN HISTOGRAMA (FRECUENCIA ABSOLUTA)
FORMA DE LA DISTRIBUCIÓN DE FRECUENCIAS
De acuerdo con la forma del histograma se tiene una distribución:
1 Simétrica 2 Asimétrica positiva
FORMA DE LA DISTRIBUCIÓN DE FRECUENCIAS
3 Asimétrica negativa 4 No definida
Nota: se puede cuantificar la forma de la distribución de frecuencias a través del calculo de estadísticos conocidos como
“coeficiente de asimetría”.
EJERCICIO 3
Realice la tabla de distribución de frecuencias
Datos 3: Se tienen 100 indicaciones de longitud
en el punto 3 mm con un comparador de
caratula.
Veamos un ejemplo
EJEMPLO
Cálculo de la mediana sobre el conjunto de mediciones sobre el punto de 0 mm
utilizando un comparador de caratula.
Un conjunto de datos puede tener una moda y se llama unimodal, dos modas y
se llama bimodal, o varias modas y llamarse multimodal. Sin embargo puede
ocurrir que la información no posea moda, por lo cual no es una medida
adecuada para representar los datos.
EJERCICIO 5: Halle la moda del conjunto de datos
• •••• ••• ••• ••• •• •••••• • •••• ••• ••••• • ••••• ••••••
𝑝%
Datos
𝑞𝑝
Los cuantiles son valores que dividen el conjunto de datos en partes iguales es
decir intervalos que comprenden la misma proporción de valores. Los más
usados son:
• Mediana
• Cuartiles
• Deciles
• Percentiles
Toda medida corresponde a lo ubicación del dato. Se deben ordenar los
resultados de forma ascendente
CUANTILES
C1 C2 C3 C4
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
PERCENTILES
Son 99 valores que dividen el conjunto de datos en 100 partes iguales
CUANTIL - Datos No Agrupados
𝑘 ∗ (𝑁 + 1)
𝑪𝒌 = , 𝑁 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
4
𝑘∗𝑁
𝑪𝒌 = , 𝑁 𝑒𝑠 𝑝𝑎𝑟
4
Donde:
𝑁 = Tamaño total de la muestra
𝑘 = 𝐶𝑢𝑎𝑛𝑡𝑖𝑙 𝑎 𝑒𝑣𝑎𝑙𝑢𝑎𝑟 (1,2,3,4)
CUANTIL - Datos Agrupados
𝑘∗𝑁
− 𝑁𝑖−1
𝑪𝒌 = 𝐿𝑖 + 4 ∗ 𝑎𝑖
𝑛𝑖
Donde:
𝐿𝑖 =Limite inferior del intervalo de clase donde se encuentra el cuantil.
𝑁 = Tamaño total de la muestra
𝑁𝑖−1 = Frecuencia absoluta acumulada del intervalo de clase anterior
𝑛𝑖 = frecuencia del intervalo donde se encuentra el cuantil
𝑎𝑖 = amplitud del intervalo de clases.
𝑘 = 𝐶𝑢𝑎𝑛𝑡𝑖𝑙 𝑎 𝑒𝑣𝑎𝑙𝑢𝑎𝑟 (1,2,3,4)
DECIL - Datos No Agrupados
𝑘 ∗ (𝑁 + 1)
𝑫𝒌 = , 𝑁 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
10
𝑘∗𝑁
𝑫𝒌 = , 𝑁 𝑒𝑠 𝑝𝑎𝑟
10
Donde:
𝑁 = Tamaño total de la muestra
𝑘 = 𝐷𝑒𝑐𝑖𝑙 𝑎 𝑒𝑣𝑎𝑙𝑢𝑎𝑟 (1,2,3, … , 10)
DECIL - Datos Agrupados
𝑘∗𝑁
10 − 𝑁𝑖−1
𝑫 𝒌 = 𝐿𝑖 + ∗ 𝑎𝑖
𝑛𝑖
Donde:
𝐿𝑖 =Limite inferior del intervalo de clase donde se encuentra el decil.
𝑁 = Tamaño total de la muestra
𝑁𝑖−1 = Frecuencia absoluta acumulada del intervalo de clase anterior
𝑛𝑖 = frecuencia del intervalo donde se encuentra el decil
𝑎𝑖 = amplitud del intervalo de clases.
𝑘 = 𝐷𝑒𝑐𝑖𝑙 𝑎 𝑒𝑣𝑎𝑙𝑎𝑟 (1,2,3, … , 9)
PERCENTIL - Datos No Agrupados
𝑘 ∗ (𝑁 + 1)
𝑃𝑘 = , 𝑁 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
100
𝑘∗𝑁
𝑃𝑘 = , 𝑁 𝑒𝑠 𝑝𝑎𝑟
100
Donde:
𝑁 = Tamaño total de la muestra
𝑘 = 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑎 𝑒𝑣𝑎𝑙𝑢𝑎𝑟 (1,2,3, … , 99)
PERCENTIL - Datos Agrupados
𝑘∗𝑁
100 − 𝑁𝑖−1
𝑃𝑘 = 𝐿𝑖 + ∗ 𝑎𝑖
𝑛𝑖
Donde:
𝐿𝑖 =Limite inferior del intervalo de clase donde se encuentra el percentil.
𝑁 = Tamaño total de la muestra
𝑁𝑖−1 = Frecuencia absoluta acumulada del intervalo de clase anterior
𝑛𝑖 = frecuencia del intervalo donde se encuentra el percentil
𝑎𝑖 = amplitud del intervalo de clases.
𝑘 = 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑎 𝑒𝑣𝑎𝑙𝑎𝑟 (1,2,3, … , 99)
EJEMPLO – Datos 1
• En la siguiente tabla se tienen 10 indicaciones de la masa de agua (g)
Fuente de https://sisu.ut.ee/measurement/41-n%C3%A4idis%C3%BClesandeks:
Ejemplo – Datos 1
• Dado el ordenamiento de los datos y que n = 10 es par
1 ∗ 100
− 10
𝐶𝑘 = 2.9970 + 4 ∗ 0.00105 = 2.99803
15
Donde:
𝐿𝑖 = 2.9970
𝑁 = 100
𝑁𝑖−1 = 10
𝑛𝑖 = frecuencia del intervalo donde se encuentra el cuantil
𝑎𝑖 = amplitud del intervalo de clases.
𝑘 = 𝐶𝑢𝑎𝑛𝑡𝑖𝑙 𝑎 𝑒𝑣𝑎𝑙𝑢𝑎𝑟 (1,2,3, 4)
Cómo podría verse un cuantil en un histograma?
Hacer el histograma con las frecuencias relativas y no con las absolutas.
Frecuencia relativa
25% fi
20%
15%
10%
5%
0%
2,9949 2,9959 2,9970 2,99803 2,9991 3,0002 3,0012 3,0023 3,0033 3,0044
2,9938 2,9949 2,9959 2,9970 2,9980 2,9991 3,0002 3,0012 3,0023 3,0033
EJERCICIO 7
1. Para los conjuntos de datos 3 llenar la siguiente tabla
Percentil Datos 3
𝑷𝟓
𝑷𝟗𝟓
𝑷𝟕𝟎
75 75
Dato atípico.
LS=Q3+1.5 RIC
70
65
Extraccion directa
Q3: 75%
60 Q2: Mediana.
55 Q1: 25%.
50
LI=Q1-1.5 RIC
45 45
43
Dato atípico.
40
¿CÓMO SE CONSTRUYE?
𝐼𝑄𝑅 = 𝑄3 - 𝑄1
LI = 𝑄1 − 1.5 ∙ 𝐼𝑄𝑅
LS = 𝑄3 + 1.5 ∙ 𝐼𝑄𝑅
IQR
50% de los datos
Valores
Extremos
LI LS
𝑸𝟏 𝑸𝟐 𝑸𝟑
ESTADÍSTICOS DE DISPERSIÓN
• Rango
• Varianza
• Desviación estándar
• Coeficiente de variación.
VARIABILIDAD - DISPERSIÓN
MEDIDAS DE DISPERSIÓN
Las medidas de tendencia central no son suficientes para resumir la información
contenida en una muestra o en un conjunto de datos.
𝑿𝟏 = 𝟒𝟎 𝑿𝟐 = 𝟒𝟎
•• • ••••••• •
| | | | | | | | | | |
•••••••••
| | | | | | |
20 25 30 35 40 45 50 55 60 20 25 30 35 40 45 50 55 60
Las dos muestras tienen el mismo promedio pero difieren en la separación de sus datos
MEDIDAS DE DISPERSIÓN
• Rango o recorrido
• Varianza
• Desviación típica o estándar
• Coeficiente de variación
RANGO
Se recomienda cuando el tamaño de muestra es muy pequeño (𝑛 < 10)
Definición
Corresponde a la diferencia entre el valor máximo 𝑋max y el valor mínimo 𝑋min . Se
representa por 𝑅 y se calcula como 𝑅 = 𝑋max − 𝑋min .
En este caso el rango es una medida suficiente para representar la dispersión presente
en los datos.
VARIANZA
33 1.27 1.61
Debido a que la varianza viene dada en
29 -2.73 7.45
una unidad de medición MPa2
diferente e la de los datos originales
30 -1.73 2.99
MPa, no se puede obtener ninguna
31 -0.73 0.53
conclusión que aplique a los datos de
26 -5.73 32.83 la muestra.
38 6.27 39.31
𝑿 = 𝟑𝟏. 𝟕𝟑
𝑺𝟐 = 𝟏𝟔. 𝟎𝟐
DESVIACIÓN ESTÁNDAR
DEFINICIÓN
Corresponde a la raíz cuadrada positiva de la varianza muestral. Se representa por 𝑆 y
se calcula de la siguiente forma:
𝑆 = 𝑆2
Definición
Es una medida de la dispersión relativa de los datos. Se representa por 𝐶𝑉 y se calcula
de la siguiente forma:
𝑆
𝐶𝑉 = × 100%
𝑋
b. Determine entre los conjuntos de datos 1(masa) y datos 1 (volumen) y entre los
conjuntos 3 y 4 ¿Cuál presenta mayor dispersión?: