Está en la página 1de 38

CURSO: Expositor:

Dr. José Luis Salazar Navarrete - Chile


MODELACIÓN Y SIMULACIÓN DE Consultor de la Cámara Minera del Perú

PROCESOS METALÚRGICOS
UNIDAD I: Variables estadísticas, gráficos y distribuciones de
frecuencia
Todos los derechos reservados © 2020 - v1.3
ACERCA DEL EXPOSITOR

Experiencia:
Académico e investigador del Departamento de Ingeniería Química de la Universidad de Santiago
de Chile (USACH). Cuenta con más de 15 años de experiencia en áreas de modelación,
simulación y control de procesos, con variadas publicaciones científicas y proyectos de desarrollo
tecnológico en el ámbito de la minería, principalmente en la minería de cobre. Socio fundador de
diversas empresas en el ámbito de consultoría y de desarrollo tecnológico. Consultor de la
Cámara Minera del Perú-Escuela de Altos Estudios.

Formación:
Doctor en Ciencias de la Ingeniería con mención en Ingeniería de Procesos e ingeniero civil
Dr. José Luis químico de la Universidad de Santiago de Chile. Ph. D. en Ciencias de Ingeniería con
Salazar Navarrete especialización en Modelos Avanzados de Control en Procesos de Molienda SAG. Académico e
investigador en áreas de simulación, modelamiento y control avanzado de procesos de
conminución de minerales.
Bienvenido
a la unidad del curso
01
TEMARIO

01 Variables estadísticas, gráficas y


distribuciones de frecuencia 03 Conclusiones
Contenido y propósito del estudio

02 Medidas de posición, dispersión, forma


y concentración 04 Referencias
Identificación de fuentes
02

OBJETIVO DE LA UNIDAD
Analizar variables estadísticas y
distribuciones de frecuencia, estimando
medidas de posición, dispersión y forma.
Experiencia 03
profesional
04

MOTIVACIÓN

“ El mundo del hombre


contemporáneo se funda sobre los
resultados de la ciencia: el dato “
reemplaza al mito, la teoría a la
fantasía, la predicción a la profecía
Mario Bunge
Tema 01

Variables estadísticas, gráficas y


distribución de frecuencia
01 06
Variables estadísticas, gráficas y
distribución de frecuencia
La relevancia de los estadísticos

• Un extraterrestre llega a la región de Coquimbo (reconocida


por su calidad de cielos y centros astronómicos) y al
encontrarse con un habitante del sector le pide información
acerca de la raza humana, entre estas consultas destacan:
¿Cuál es la altura de la raza humana en metros?
• Sin dudar, el humano le responde que en promedio el ser
humano mide 1.70 m para los hombres y 1.65 m para las
mujeres (ambos en condición de adulto).
• Despavorido, el extraterrestre se aleja en su nave.
• ¿Fue correcta la información dada?, ¿faltó información?
• Usted es director del personal para la empresa minera La
Sureña y debe informar a su superior sobre el número de días
promedio que los empleados de la planta se ausentan del
trabajo. Sin embargo, la empresa tiene más de dos mil
trabajadores.
• Como director de producción, ¿qué le puede sugerir hacer?,
¿qué herramientas puedo incorporar para proporcionar esta
información?
01 07
Variables estadísticas, gráficas y
distribución de frecuencia
La relevancia de los estadísticos
Trabajadores Número de empresas

0 - 100 25

Los valores relativos al número de empresas mineras y trabajadores 100 - 200 37


en una determinada región son los siguientes:
200 - 300 12
¿Qué información podemos obtener a partir de la data?
400 - 500 22
• Construir la distribución de frecuencia.
500 - 600 21

• Hallar el número de empresas con más de 300 trabajadores. 600 - 700 13

• Hallar el porcentaje de empresas con más de 100 trabajadores 700 - 800 5


y menos de 400.
800 - 900 3

900 - 1000 2
01 08
Variables estadísticas, gráficas y
distribución de frecuencia
Las muestras

Descripción de los datos

Distribución de
Gráficos
frecuencia

Frecuencia
Histogramas
acumulada

Tabla de
contingencia Diagramas

Frecuencias
relativas
01 09
Variables estadísticas, gráficas y
distribución de frecuencia
Las muestras

Conjunto de métodos de descripción, análisis y representación de conjuntos


numerosos de datos. Utiliza métodos numéricos y gráficos con el fin de
resumir, ordenar y simplificar la información contenida en los datos.
Estadística
descriptiva
Es la colección de toda la posible información que caracteriza a un
Población fenómeno. Una población puede ser finita o infinita, según el número de
elementos que la compongan.

Muestra

Subconjunto representativo de una población.

Pero, ¿qué significa que una muestra sea representativa?

Una muestra representativa es aquella que refleja las características esenciales de la población de la cual se obtuvo.
01 10
Variables estadísticas, gráficas y
distribución de frecuencia
Las muestras

Discretas
(N.° de trabajadores)

Cuantitativa
(estatura, edad)

Variable Continuas
(peso, temperatura,
estadística longitud)

Cualitativa
(sexo, profesión)
01 11
Variables estadísticas, gráficas y
distribución de frecuencia
Las muestras

• Una de los primeros pasos en cualquier estudio estadístico es tabular los


resultados.

• Recoger información de la muestra resumida en una tabla en la que a cada

𝑛𝑖
valor de la variable se le asocian determinados números que representan el
número de veces que ha aparecido.

𝑓𝑖 = • Estos números se denominan frecuencias.

𝑁 • La frecuencia absoluta es el número de veces que aparece en la muestra


dicho valor de la variable. La denotaremos por la letra ηi

• La frecuencia relativa es el cuociente entre la frecuencia absoluta y el


tamaño de la muestra. La denotaremos por la letra fi.

• Según:
01 12
Variables estadísticas, gráficas y
distribución de frecuencia
Las muestras

• Si multiplicamos la frecuencia relativa por 100, obtendremos el porcentaje pi

• La frecuencia absoluta acumulada es el número de veces que ha aparecido en la muestra un valor menor
o igual que el de la variable y lo representaremos por Ni. La última frecuencia absoluta acumulada deberá
ser igual a N.

• La frecuencia relativa acumulada es el cuociente entre la frecuencia absoluta acumulada y el número total
de datos N. La denotaremos por Fi.

𝑁𝑖
𝐹𝑖 =
𝑁
• Si multiplicamos la frecuencia relativa acumulada por 100, se obtiene el porcentaje acumulado Pi.
01 13
Variables estadísticas, gráficas y
distribución de frecuencia
Tablas de frecuencia Para calcular el número de empresas con más de 300 trabajadores:

Es una tabla en la que se organizan los datos en • Ni (300) = 74 140 – 74 = 66 empresas


clases, es decir, en grupos de valores que describen • Fi (400) = 52.86 %
una característica de los datos y muestra el número de • Fi (100) = 17.86 %
observaciones del conjunto de datos que caen en cada
una de las clases. Por lo tanto, las empresas con más de 100 trabajadores y menos de
400 será: 52.86 % - 17.86 % = 35 %.

Intervalo Límite inferior Límite superior Marca de clase ni (Frecuencia absoluta) fi (Frecuencia relativa) Ni (Frec. Absoluta acum.) Fi (Frec. Relativa acum.)
1 0 100 50 25 0,17857 25 0,17857
2 100 200 150 37 0,26429 62 0,44286
3 200 400 300 12 0,08571 74 0,52857
4 400 500 450 22 0,15714 96 0,68571
5 500 600 550 21 0,15000 117 0,83571
6 600 700 650 13 0,09286 130 0,92857
7 700 800 750 5 0,03571 135 0,96429
8 800 900 850 3 0,02143 138 0,98571
9 900 1000 950 2 0,01429 140 1,00000
140
01 14
Variables estadísticas, gráficas y
distribución de frecuencia
Representaciones gráficas

Histograma
16 120,00%
14
100,00%
12
80,00%
10
Frecuencia

8 60,00%
Frecuencia
6
40,00% % acumulado
4
20,00%
2
0 0,00%
85 78 71 99 92 57 64 y mayor...
Clase
01 15
Variables estadísticas, gráficas y
distribución de frecuencia
Ejemplo

43,1 17,5 17 28,4 30,4 39 17,6 25


• La siguiente tabla de datos entrega el 36,1 30 17,6 28,8 36,4 35,1 28 38
consumo de combustible en litros 32,8 27,5 16,5 26,8 43,4 32,3 27 26
39,4 27,2 18,2 33,5 44,3 37 34 22
para un recorrido en kilómetros de
36,1 30,9 16,9 41,5 40,8 37,7 31 32
camiones de bajo tonelaje de
19,9 21,1 15,5 38,1 27,9 22,4 29 36
distintas marcas. 19,4 23,2 19,2 32,1 46,6 24,3 27 27
20,2 23,8 18,5 37,2 32,2 25,4 24 27
• ¿Qué información puede obtener de 19,2 23,9 31,9 28 37 30,7 23 44
los datos crudos? 20,5 20,3 34,1 26,4 31,3 28,1 36 32
20,2 17 35,7 24,3 23,7 31,6 37 28
• Desarrolle la tabla de frecuencias de 25,1 21,6 27,4 19,1 35 32,9 31 31
los datos. 20,5 16,2 25,4 34,3 23,6 32,4 38 20,2
19,4 31,5 23 29,8 32,4 33,7 36 18,1
• Represente los datos de manera 20,6 29,5 27,2 32,7 27,2 34,5 36 26,6
apropiada. 20,8 21,5 23,9 29,8 26,6 33 36 38
18,6 19,8 34,2 33,8 25,8 29,9 34 34,1
18,1 22,3 34,5 40,9 23,5 34,4 38 39,1
• ¿Qué conclusiones puede obtener?
19,2 20,2 31,8 44,6 30 34,7 32 37,3
17,7 20,6
01 16
Variables estadísticas, gráficas y
distribución de frecuencia
Ejemplo

Columna1

Media 28,79415584 Histograma


Error típico 0,594440072 Clase Frecuencia % acumulado Histograma
Mediana 28,9 15 0 0,00% 25 120,00%
Moda 36 18 10 6,49%
20 100,00%
21 23 21,43%
Desviación estándar 7,376807296
Histograma

Frecuencia
80,00%
24 16 31,82% 15
Varianza de la muestra 54,41728588 60,00%
27 16 42,21%
Curtosis -0,832637882 25 10 120,00%
30 19 54,55% 40,00%
Fre
Coeficiente de asimetría 0,112510159 5 100,00%
33 20 23 69,48% 20,00%
Rango 31,1 %a
36 21 83,12%

Frecuencia
0 80,00% 0,00%
Mínimo 15,5 15

15
18
21
24
27
30
33
36
39
42
45
48
y mayor...
39 15 92,86%
Máximo 46,6 60,00%
42 10 5 96,10%
Suma 4434,3 45 5 99,35% Clase
40,00%
Frecuencia
Cuenta 154 48 5 1 100,00% 20,00% Clase
Mayor (1) 46,6 y mayor... 0 100,00%
% acumulado
0 0,00%
Menor(1) 15,5
15
18
21
24
27
30
33
36
39
42
45
48
y mayor...
Nivel de confianza(95,0%) 1,174370049

Clase
Tema 02

Medidas de posición, dispersión, forma


y concentración
02 18
Medidas de posición, dispersión, forma
y concentración

• Medidas de localización (posición): Son coeficientes de tipo promedio que tratan de


representar la situación de una determinada distribución.

• Centrales: Media, mediana, moda

• No centrales: Cuantiles (cuartiles, deciles, percentiles)

• Medidas de dispersión: Son complementarias a las de posición en el sentido que señalan la


dispersión en conjunto de todos los datos de la distribución respecto de la medida o medidas
de localización adoptadas.

• Medidas de forma: Estudian la asimetría-simetría y deformación (apuntamiento,


aplastamiento) respecto de una distribución modelo denominada
distribución normal.

• Medidas de concentración: Estudian la concentración de una


distribución frente a la uniformidad.
02 19
Medidas de Posición, dispersión, forma
y concentración

Para un conjunto de datos existen, principalmente, tres medidas de tendencia central:

• Media
• Moda
• Mediana

Media: La media de las observaciones x1, x2,…xn es el promedio aritmético de estas y


se denota por

n
xi
x 
i 1 n

El único problema de la media es que puede verse afectada por la existencia de


algunos valores extremos.
02 20
Medidas de Posición, dispersión, forma
y concentración

Media aritmética ponderada: Es la media aritmética que se utiliza cuando a cada valor
de la variable (xi) se le otorga una ponderación o peso distinto de la frecuencia o
repetición.

σ 𝑋𝑖 𝑊𝑖 𝑛𝑖
𝑋ത𝑖 =
σ 𝑊𝑖 𝑛𝑖
Mediana: Para un conjunto de observaciones es el valor para el cual, cuando todas las
observaciones se ordenan de forma creciente, la mitad de estas es menor que este valor
y la otra mitad mayor.

Si el número de observaciones es impar, la mediana es el valor que se encuentre a la


mitad del conjunto ordenada.

Si el número de observaciones es par, se debe considerar a la mediana como el


promedio de los valores de las dos observaciones que se encuentren a la mitad del
conjunto ordenada.
02 21
Medidas de Posición, dispersión, forma
y concentración

Moda: Es el valor que ocurre con más frecuencia en el conjunto de


observaciones. Muestra hacia qué valor tienden los datos a agruparse.

Esta es una medida de tendencia central que proporciona información


acerca de un conjunto de datos, pero no proporciona ninguna idea de la
variabilidad de las observaciones.

La medida más útil para conocer la dispersión de los datos es la


varianza.
02 22
Medidas de Posición, dispersión, forma
y concentración

Medidas de tendencia no central

• Su función es informar del valor de la variable que ocupará la posición (en tanto por
cien) que nos interese respecto de todo el conjunto de variables.
• Podemos decir que los cuantiles son unas medidas de posición que dividen a la
distribución en un cierto número de partes de manera que en cada una de ellas hay el
mismo número de valores de la variable.

Cuartiles: Dividen a la distribución en cuatro partes iguales (tres divisiones): C1, C2, C3,
correspondientes al 25 %, 50 % y 75 %.

Deciles: Dividen a la distribución en 10 partes iguales (9 divisiones): D1, ..., D9,


correspondientes al 10 %, ..., 90 %.

Percentiles: Cuando dividen a la distribución en 100 partes (99 divisiones): P1, ..., P99,
correspondientes al 1 %, ..., 99 %.
02 23
Medidas de Posición, dispersión, forma
y concentración

Medidas de dispersión

• Las medidas de dispersión nos sirven para cuantificar la separación de los valores de una
distribución.
• La dispersión o variabilidad es la mayor o menor separación de los valores de la muestra,
respecto de las medidas de centralización que hayamos calculado.

Medidas de dispersión absolutas

• Recorrido
• Recorrido intercuartílico
• Varianza
• Desviación típica
• Desviación media respecto de la mediana

Medidas de dispersión relativas

• Coeficiente de variación de Pearson


• Índice de variación respecto de la mediana
02 24
Medidas de Posición, dispersión, forma
y concentración

Varianza

• La varianza de las observaciones x1, x2,…xn es el promedio del cuadrado de las


distancias entre cada observación y la media del conjunto de observaciones. Se
denota por

• La desviación estándar es la raíz cuadrada de la varianza.


02 25
Medidas de Posición, dispersión, forma
y concentración
Ejemplo

• La siguiente tabla muestra la producción diaria, en toneladas, de 20 celdas de electrodepositación de cobre de una
compañía minera.

• Determinemos la media, mediana y la desviación estándar.

40.2 29.3 35.6 88.2 42.9

26.9 28.7 99.8 35.6 37.8

44.2 32.3 55.2 50.6 25.4

31.7 36.8 45.2 25.1 39.7


02 26
Medidas de Posición, dispersión, forma
y concentración
Ejemplo

• La siguiente tabla muestra la producción diaria, en toneladas, de 20 celdas de electrodepositación de cobre de una
compañía minera.

• Determinemos la media, mediana y la desviación estándar.

40.2 29.3 35.6 88.2 42.9


Media 42.56
26.9 28.7 99.8 35.6 37.8
Mediana 37.30
Media Moda Media Moda Media
Mediana
Moda 35.60
44.2 32.3 55.2 50.6 25.4 Mediana Moda Mediana

Desviación
19.46 Asimétrica Simétrica Asimétrica
estandar
hacia la hacia la
31.7 36.8 45.2 25.1 39.7 izquierda derecha
02 27
Medidas de Posición, dispersión, forma
y concentración

Medidas de dispersión relativas

• El problema de las medidas de dispersión absolutas es que normalmente son el


indicador que da problemas a la hora de comparar.
• Compara muestras de variables entre sí, a veces estas no tienen
dimensiones iguales o equivalentes, de ahí a que se recurra
a medidas de dispersión relativas.

Coeficiente de variación de Pearson: Corresponde al


factor entre la desviación típica y la media aritmética de
la distribución.

𝑆
𝑉𝑥 =
𝑥ҧ
• A mayor valor de Vx, menor representatividad de 𝑥.ҧ
02 28
Medidas de Posición, dispersión, forma
y concentración

• Medidas de forma
• Las medidas de forma de una distribución se pueden clasificar en dos grandes grupos o bloques: medidas de
asimetría y medidas de curtosis.

• Medidas de asimetría
• Cuando al trazar una vertical, en el diagrama de barras o histograma, de una variable, según sea esta discreta o
continua, por el valor de la media, esta vertical se transforma en eje de simetría.
• Diremos que es simétrica cuando a ambos lados de la media aritmética existe el mismo número de valores de la
variable.

Asimétrica a la derecha Asimétrica a la izquierda Simétrica


02 29
Medidas de Posición, dispersión, forma
y concentración
Coeficiente de asimetría de Fischer

• Se basa en las desviaciones de los valores observados respecto a la media. La interpretación de los
resultados proporcionados por este coeficiente es igual a la del primer coeficiente de Pearson.

1 𝑛
σ𝑖=1 𝑥𝑖 − 𝑥ҧ 3 ∙ 𝑛𝑖
𝑔1 = 𝑁 3/2
1 𝑛 2
σ
𝑁 𝑖=1 𝑥𝑖 − 𝑥ҧ ∙ 𝑛𝑖
• Si g1 > 0, la distribución será simétrica positiva o a derecha.
• Si g1 < 0, la distribución será simétrica negativa o a izquierda.
• Si g1 = 0, la distribución será simétrica.
Tema 03

Conclusiones
Contenido y propósito del estudio
03 31
Conclusiones
Contenido y propósito del estudio

El estudio de las variables estadísticas resulta fundamental para conocer el


comportamiento de algunos fenómenos.

La información y su análisis permite una descripción más exacta de los


fenómenos que se están considerando.

Su utilización permite resumir los resultados de manera significativa y


cómoda.
Tema 04

Referencias
Identificación de fuentes
04 33
Referencias
Identificación de fuentes
 Arteaga, P. (2008). Análisis de gráficos estadísticos elaborados en  Lovera, D., Coronado, A., Arias, V., Quiñones, J., Puente, L.,
un proyecto de análisis de datos [tesis de maestría, Universidad de Herrera, J., Malpartida, C., Diego, J., Ipanaque, O., y López, P.
Granada]. (2005). Modelización y simulación de procesos metalúrgicos:
 Arteaga, P., Batanero, C., Díaz, C., y Contreras, J. M. (2009). El flotación, filtración, lixiviación y espesamiento. Revista del Instituto
lenguaje de los gráficos estadísticos. Revista Iberoamericana de de Investigación de la Facultad de Ingeniería Geológica, Minera,
Educación Matemática, 18, 93-104. Metalúrgica y Geográfica, 8(15), 19-24.

 Castro, J. D. (2019). Métodos estadísticos para el control y la  Montgomery, D. C. (2020). Introduction to statistical quality
mejora continua en el proceso de tratamiento térmico de la control.
aleación de aluminio AA2024 [tesis de maestría, Universidad  Montgomery, D. C. (2017). Design and analysis of experiments.
Tecnológica Nacional en Ingeniería en Calidad].
 Montgomery, D., Peck, E., y Vining, G. G. (2006). Introducción al
 Rosales Córdova, C. A., y De Ita de la Torre, A. D. (s. f.). análisis de regresión lineal. Limusa Wiley.
Determinación de la distribución de frecuencias del tamaño de
grano de un acero inoxidable austenítico 304 trabajado a diferentes  Moreno Echavarría, R. B. (2012). Propuesta didáctica para la
deformaciones y recristalizado a diferentes tiempos. enseñanza de la estadística en los modelos de regresión lineal
simple bajo un enfoque constructivista.
 Espinel, M. C., González, M. T., Bruno, A., y Pinto, J. (2009).
Las gráficas estadísticas. Tendencias actuales de la investigación
en educación estocástica.
 Gujarati, D. N. (2019). The linear regression model (LRM).
Gracias

También podría gustarte