Documentos de Académico
Documentos de Profesional
Documentos de Cultura
oas
Contenido
oas
Prólogo:
oas
Objetivos:
oas
“Los datos por si solos son
entes inertes, sin ninguna
utilidad; adquieren valor
únicamente cuando son
procesados, modelados,
analizados e interpretados,
y se convierten en
información útil para la
toma de decisiones”.
oas
Algunos paquetes estadísticos:
oas
Excel:
oas
TEMA I
Conceptos básicos
oas
Conceptos básicos
• Estudio estadístico:
Datos
brutos
Estadística
Descriptiva
Informaciones
Estadística
Inferencial
Conclusiones y Toma
previsiones de decisión
Estadística:
• Ciencia que recoge, organiza, presenta, analiza e interpreta
datos con el fin de propiciar la toma de decisiones más eficaz.
oas
Conceptos básicos
Aleatoriamente
Inferencia
Parámetros Estadísticos
(desconocidos) (conocidos)
𝜇 =? 𝜎 =? 𝑥ҧ =? 𝑠 =?
Variable
• Una variable es una característica de interés que posee cada
elemento de una población y que podemos medir.
Variables
Cuantitativas Cualitativas
Pueden expresarse de manera numérica Se mide de manera no numérica
Está limitada a
Si sus valores no Si sus valores se
Puede tomar ciertos valores,
se pueden pueden ordenar.
cualquier valor generalmente
ordenar. Género, Escolaridad,
dentro de un números
Grupo Grado de
rango dado. enteros. Número
Sanguíneo, satisfacción,
Altura, edad, de alumnos,
Religión, Lugar Intensidad de
peso. Número de
de nacimiento. dolor.
grupos.
Agrupamiento de datos
oas
Datos
Ejemplo 2.1:
El peso (kg) de cinco personas es 75, 73, 91, 83 y 80.
Ascendente Descendente
𝑥1 𝑛1 𝑁1 = 𝑛1 𝑓1 𝐹1 = 𝑓1
𝑥2 𝑛2 𝑁2 = 𝑁1 + 𝑛2 𝑓2 𝐹2 = 𝐹1+𝑓2
⋮ ⋮ ⋮ ⋮ ⋮
𝑥𝑘 𝑛𝑘 𝑁𝑘 = 𝑁𝑘−1 + 𝑛𝑘 𝑓𝑘 𝐹𝑘 = 𝐹𝑘−1 + 𝑓𝑘
𝑛 1
Tabla 2.1 Tabla de distribución de frecuencias.
oas
Distribución de frecuencias
Ejercicio 2.1:
• Se valora la calidad del curso de “Control Estadístico de
Procesos” catalogándolo como: Superior ( S: ≥ 90), Excelente
( E: 80 − 90) , Muy bueno ( MB: 70 − 80) , Bueno ( B: 60 − 70) ,
Menos bueno ( MB: 50 − 60) , Malo ( M: < 50). Los resultados
obtenidos son:
Variables cuantitativas:
Ejercicio 2.2:
Una especificación (característica) de calidad de un filete chilis
es su peso, que debe ser de 170 g con una tolerancia de ± 15 g.
oas
Distribución de frecuencias
Variables cuantitativas:
Ejercicio 2.2:
oas
Distribución de frecuencias
Variables cuantitativas:
Con intervalos:
Ejercicio 2.3:
• Se toma una muestra de 200 mediciones en carcasas de pollo
sobre el largo (cm) de corbata, los datos se muestran en la tabla
2.8.
Ejercicio 2.3:
Elabore una tabla de frecuencia sin intervalos que permita resumir
los datos y conteste las siguientes preguntas:
Ejercicio 2.4:
• La tabla 2.9 presenta 500 datos del largo de cuellos de carcasas
de pollo.
Ejercicio 2.3:
• Elabore una tabla de frecuencia con 6 intervalos que permita
resumir los datos y conteste las siguientes preguntas:
Estadísticos descriptivos
oas
Estadísticos descriptivos
Media:
• La media o media aritmética es simplemente el promedio de los
números 𝑥1 , … , 𝑥𝑛 , esto es, se suman todos estos datos y se
divide entre n. A la cantidad resultante se le denota por 𝑥ҧ y se lee
x barra.
𝑛
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 1
𝑥lj = = 𝑥𝑖 3.1
𝑛 𝑛
𝑖=1
Ejemplo 3.1:
• Se tiene el siguiente conjunto 𝑛 = 6 datos que representan
estaturas de personas medidas en metros:
Estaturas en metros
𝑥1 = 1.65 𝑥2 = 1.70 𝑥3 = 1.71
𝑥4 = 1.70 𝑥5 = 1.85 𝑥6 = 1.80
La moda:
• La moda es el valor que aparece con mayor frecuencia en el
conjunto de datos, si lo hubiera.
Unimodal Bimodal
Ejemplo 3.2:
• Considere el siguiente conjunto de edades de 6 personas.
Edades en años
𝑥1 = 15 𝑥4 = 20
𝑥2 = 20 𝑥5 = 25
𝑥3 = 15 𝑥6 = 15
oas
Estadísticos descriptivos
Ejemplo 3.3:
• Una variable cualitativa mide las condiciones de un producto y
que tiene como posibles valores: Malo, Regular, Bueno. Suponga
que tenemos el siguiente conjunto de 6 observaciones:
Condiciones de un producto
𝑥1 = 𝑀𝑎𝑙𝑜 𝑥4 = 𝑅𝑒𝑔𝑢𝑙𝑎𝑟
𝑥2 = 𝐵𝑢𝑒𝑛𝑜 𝑥5 = 𝑀𝑎𝑙𝑜
𝑥3 = 𝐵𝑢𝑒𝑛𝑜 𝑥6 = 𝐵𝑢𝑒𝑛𝑜
oas
Estadísticos descriptivos
La mediana:
• La mediana de un conjunto de datos 𝑥1 , 𝑥2 , … , 𝑥𝑛 es el valor que
se encuentra en el punto medio, cuando se ordena los valores
de menor a mayor.
• Se denota como Q2 y tiene la propiedad de que a cada lado del
valor se encuentra el 50% de las observaciones.
2+3
𝑄2 = = 2,5
𝑄2 = 3 2
1 2 3 4 5 1 2 3 4
a) Serie impar b) Serie par
Ejemplo 3.4:
• Se tiene el registro de las siguientes estaturas (en centímetros)
de 6 personas, calcular la mediana.
Estatura en centímetros
165, 172, 170, 165, 174, 182
170 + 172
𝑄2 = = 171
2
• El 50% de datos de las personas tienen una estatura menor o
igual a 171 𝑐𝑚 y el otro 50% mayor o igual a 171 𝑐𝑚.
oas
Estadísticos descriptivos
Ejemplo 3.5:
• Vamos a agregar el dato 175 𝑐𝑚 en el ejemplo anterior para así
tener 7 datos. Tenemos ahora un número impar de datos. Los
datos ordenados son:
50% 50%
• Como se trata de un número impar de datos, la mediana es el
dato central, esto es: 𝑄2 = 172 𝑐𝑚.
Ejercicio 3.1:
oas
Estadísticos descriptivos
Medidas de dispersión:
• Permiten medir el grado de dispersión de un conjunto de datos
numéricos.
Varianza:
• Es un promedio de la distancia al cuadrado de cada uno de los
datos 𝑥𝑖 respecto de la media 𝑥ҧ y es la medida de dispersión más
comúnmente usada.
𝑛
2
1 2
𝑠 = 𝑥𝑖 − 𝑥ҧ 3.2
𝑛−1
𝑖=1
Ejemplo 3.6:
• Consideremos el siguiente conjunto de pesos en kilogramos de 6
personas, calcular la varianza.
Peso en kilogramos
𝑥1 = 70 𝑥4 = 66
𝑥2 = 68 𝑥5 = 70
𝑥3 = 75 𝑥6 = 65
La varianza es:
6
1 64
𝑠2 = 70 − 69 2
+ ⋯ + 65 − 69 2 = = 12,8
6−1 5
𝑖=1
oas
Estadísticos descriptivos
Desviación estándar:
• A la raíz cuadrada positiva de la varianza se le llama desviación
estándar o desviación típica, y se le denota por la letra 𝑠. Así, para
su cálculo se usa la siguiente fórmula:
𝑠= 𝑠2 3.3
𝑠= 12,8 = 3,58
Rango:
• El rango se denota por la letra 𝑟 y es simplemente la diferencia
entre el dato mayor y el dato menor.
𝑟 = 75 − 65 = 10
oas
ഥys
Relación entre 𝒙
Coeficiente de variación:
• Sea 𝑥ҧ su media y sea 𝑠 su desviación estándar. Al cociente s/𝑥ҧ se
le llama coeficiente de variación y se denota por 𝑐𝑣.
𝑠
𝑐𝑣 = 3.5
𝑥lj
oas
ഥys
Relación entre 𝒙
Ejercicio 3.2:
• Sean los dos conjuntos de datos:
• 𝐴 = 10,12,14
• 𝐵 = 159,161,163
oas
ഥys
Relación entre 𝒙
Ejercicio 3.3:
• La Conversión Alimenticia es un indicador muy importante en la
producción de pollos. La CA es la relación que se da entre el
consumo de alimento y la ganancia de peso que tiene los pollos
en un periodo de tiempo determinado. Se tomo una muestra de 5
lecturas de dos granjas de la CA:
oas
ഥys
Relación entre 𝒙
1. Hipótesis Nula. 𝐻0 : 𝜇1 = 𝜇2
2. Hipótesis Alternativa. 𝐻1 : 𝜇1 ≠ 𝜇2
3. Estadístico de Prueba.
𝑥lj 1 − 𝑥lj 2
𝑡𝑜𝑏𝑠 =
3.6
𝑛1 − 1 𝑠12 + 𝑛2 − 1 𝑠22 1 1
+
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2
4. Región de Rechazo.
Ejercicio 3.4:
• A un nivel de significación del 0.01, verificar si la conversión
alimenticia de las dos granjas del ejercicio 3.3, es el mismo?.
1. Hipótesis Nula. 𝐻0 : 𝜇1 = 𝜇2
2. Hipótesis Alternativa. 𝐻1 : 𝜇1 ≠ 𝜇2
3. Estadístico de Prueba.
2,267 − 2,298
𝑡𝑜𝑏𝑠 = = −1,30
2
5 − 1 0,020 + 5 − 1 0,049 2 1 1
+
5+5−2 5 5
oas
ഥys
Relación entre 𝒙
𝑝 − valor 𝑝 − valor
0,1155 0,1155
Regla empírica:
• En una muestra de n mediciones 𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛
i) 68,27% de las mediciones caerá en 𝜇 ± 1𝜎
ii) 95,45% de las mediciones caerá en 𝜇 ± 2𝜎
iii) 99,73% de las mediciones caerá en 𝜇 ± 3𝜎
-7 -5
−3𝜎 -3
−2𝜎 -1
−1𝜎 𝜇 1
+1𝜎 3
+2𝜎 5
+3𝜎 7
68.27%
95.45%
99.73%
oas
ഥys
Relación entre 𝒙
Ejercicio 3.5:
• El peso promedio (pollo en pie) de un galpón que contiene 10.000
pollos, es de 2.5 kg con un coeficiente de variación del 12% .
Utilizando la regla empírica indique:
1. 68,27%?
2. 95,45%?
3. 99,73%?
oas
ഥys
Relación entre 𝒙
𝑁 𝑛
𝜇 𝑥lj
𝜎 𝑠
𝑅ሜ
𝜇 ≈ 𝑥lj 3.7 𝜎ො ≈ 3.8
𝑑2
Ejemplo 3.7:
• De los siguientes datos estimar los parámetros m y s:
Ejemplo 3.7:
𝜇 ≈ 𝑥lj = 1,51
𝑅ሜ 0,63
𝜎ො ≈ = = 0,27
𝑑2 2,326
Promedios →
oas
ഥys
Relación entre 𝒙
LRI = m - 3 s
3.9
LRS = m + 3 s
oas
ഥys
Relación entre 𝒙
Ejemplo 3.8:
• Si las especificaciones para una característica de calidad son que
ésta debe tener dimensiones de 800±5; luego la especificación
inferior es EI = 795, y la superior es ES = 805. Si además se sabe
que la media y la desviación estándar de tal característica de
calidad son m = 800,6 y s = 1,2, entonces los límites reales son:
Medidas de forma:
• Las medidas de forma nos dan una idea de la manera en la que
están distribuidos los datos.
Curtosis:
• El coeficiente de curtosis analiza el grado de concentración que
presentan los valores alrededor de la zona central de la
distribución.
Su fórmula es:
𝑛
4
𝑛 𝑛+1 𝑥𝑖 − 𝑥ҧ 3 𝑛−1 2
𝐾= − 3.10
𝑛−1 𝑛−2 𝑛−3 𝑠 𝑛−2 𝑛−3
𝑖=1
oas
Estadísticos descriptivos
Ejercicio 3.6:
• Se tiene ocho lecturas de la acidez del tomate de árbol como
porcentaje de ácido cítrico, calcular la curtosis.
n 1 2 3 4 5 6 7 8
% acidez 0,400 0,392 0,315 0,360 0,467 0,390 0,392 0,369
𝑥ҧ = 0.386
𝑠 = 0.043
Coeficiente de asimetría:
• El coeficiente de asimetría analiza si la curva que forman los
datos presenta la misma forma a izquierda y a derecha de la
media aritmética. Si es así, entonces la curva es simétrica; caso
contrario, la curva es asimétrica.
Su fórmula es:
𝑛
𝑛 𝑥𝑖 − 𝑥ҧ 3
𝐴𝑠 = 3.11
𝑛−1 𝑛−2 𝑠
𝑖=1
oas
Estadísticos descriptivos
Ejercicio 3.7:
• Calcular el coeficiente de asimetría del ejercicio 3.6:
𝑛 8
= = 0,190
𝑛−1 𝑛−2 8−1 8−2
𝑛 3 3 3
𝑥𝑖 − 𝑥ҧ 0,315 − 0,386 0,467 − 0,386
= + ⋯+ = 2,145
𝑠 0,043 0,043
𝑖=1
oas
Estadísticos descriptivos
Medidas de posición:
• Un cuantil es un número que separa a los datos en dos partes: un
cierto porcentaje de los datos son menores o iguales al cuantil y
el porcentaje complementario corresponde a datos que son
mayores o iguales al cuantil.
Cuantil
al 20%
x x x x x x x x x
20% de los datos 80% de los datos
100p%, 3.12
• con 0 < 𝑝 ≤ 1.
oas
Estadísticos descriptivos
Cuartiles:
• Los cuartiles son los tres valores de la variable que dividen a un
conjunto de datos ordenados en cuatro partes iguales.
𝑄1 𝑄2 𝑄3
𝑄𝑘 = 𝑥𝑖 + 𝑑(𝑥𝑖+1 − 𝑥𝑖 ) 3.14
• Segundo cuartil:
𝑁+1
𝑄2 = 3.15
2
oas
Estadísticos descriptivos
Ejemplo 3.9:
• Calcular los cuartiles Q1, Q2 y Q3 del siguiente conjunto de datos:
6, 9, 9, 12, 12, 12, 15 y 17.
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8
6 9 9 12 12 12 15 17
𝑄1 = 𝑥2 + 0,25(𝑥3 − 𝑥2 ) = 9 + 0,25(9 − 9) = 9
oas
Estadísticos descriptivos
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8
6 9 9 12 12 12 15 17
Deciles
• Los deciles son los nueve valores que dividen la serie de datos
en diez partes iguales.
𝐷1 𝐷2 𝐷3 𝐷4 𝐷5 𝐷6 𝐷7 𝐷8 𝐷9
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
oas
Estadísticos descriptivos
3.16
𝐷𝑖 = 𝑋((𝑁+1)𝑖)/10
𝐷𝑖 = 𝑥𝑡 + 𝑑(𝑥𝑡+1 − 𝑥𝑡 ) 3.17
oas
Estadísticos descriptivos
Ejemplo 3.10:
• Calcular el quinto decil del siguiente conjunto de datos: 6, 9, 9,
12, 12, 12, 15 y 17.
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8
6 9 9 12 12 12 15 17
𝑁+1 8+1
𝐷5 = 𝑖= 5 = 4,50
10 10
Percentiles
• Los percentiles son los 99 valores que dividen la serie de datos
en 100 partes iguales.
𝑃1 ... 𝑃10 ... 𝑃20 ... 𝑃30 ... 𝑃40 ... 𝑃50 ... 𝑃60 ... 𝑃70 ... 𝑃80 ... 𝑃90 ... 𝑃99
0% 1% 10% 20% 30% 40% 50% 60% 70% 80% 90% 99%100%
3.18
𝑃𝑖 = 𝑋((𝑁+1)𝑖)/100
𝑃𝑖 = 𝑥𝑡 + 𝑑(𝑥𝑡+1 − 𝑥𝑡 ) 3.19
Ejemplo 3.11:
• Calcular el percentil de orden P20 del peso de diez personas (kg):
80, 78, 65, 73, 65, 67, 72, 68, 70 y 72.
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8 𝑥9 𝑥10
65 65 67 68 70 72 72 73 78 80
𝑁+1 10 + 1
𝑃20 = 𝑖= 20 = 2,20
100 100
𝑀á𝑥
0.400 𝑄3
0.386
𝑄2
𝑥ҧ
𝑄1
𝑀í𝑛
0.300
Figura 3.13 Diagrama de caja ejercicio 3.6.
oas
Estadísticos descriptivos
Ejercicio 3.8:
• Utilizando las funciones del excel. Calcular las medidas de
tendencia central (media, mediana, moda), de dispersión (mín,
máx, rango, varianza, desviación estándar), relación entre la
media y la desviación estándar (coeficiente de variación), de
forma (curtosis, coeficiente de asimetría) y posición (Q1, Q2, Q3)
para los datos del ejercicio 2.3.
oas
Estadísticos descriptivos
Ejercicio 3.9:
• Tenemos información sobre el peso (kg) por sexo de pollos en pie
de tres granjas ubicadas en diferentes localidades del país:
oas
Estadísticos descriptivos
Ejercicio 3.9:
• ¿Cuál es el peso promedio total?
Ejercicio 3.10:
• Se tiene información sobre las ventas por zona, tipo de producto,
localidad y fecha, se requiere conocer:
Centro de
Fecha Producto Zona US
Distribución
07/01/2019 Cuenca Pollo Norte $ 409
15/01/2019 Quito Cerdo Este $ 199
23/01/2019 Guayaquil Pollo Sur $ 409
31/01/2019 Cuenca Cerdo Oeste $ 199
04/02/2019 Guayaquil Pollo Norte $ 409
12/02/2019 Cuenca Pollo Norte $ 409
20/02/2019 Quito Pollo Sur $ 409
28/02/2019 Guayaquil Pollo Oeste $ 409
05/03/2019 Guayaquil Cerdo Este $ 199
14/03/2019 Quito Embutidos Oeste $ 219
22/03/2019 Cuenca Cerdo Sur $ 199
27/03/2019 Quito Embutidos Sur $ 219
oas
Estadísticos descriptivos
Ejercicio 3.10:
• ¿Cuál es el monto promedio de venta en Quito?
Ejercicio 3.11:
• Realizar un análisis de la capacidad del proceso del ejercicio 2.2.
oas
Estadístico Análisis y comentarios
Medidas de tendencia
central:
m 𝑋ത =
Mediana =
Moda =
Medidas de dispersión:
R=
S=
Rango medio y
desviación estándar:
𝑅ത =
ത 2
𝜎ො = 𝑅/d
CV =
Medidas de forma:
Curtosis =
Asimetría =
Límites reales (m ± 3s):
LRI =
LRS =
Porcentaje fuera de
especificaciones:
Histograma:
Conclusiones finales:
Datos: oas