Está en la página 1de 34

Estadística y

Probabilidad
Paulo Castillo Arellano
Ingeniero Mecánico – U. de Talca

Mg. en Educación Basada en Competencias – U. de Talca

paulo.castillo@inacapmail.cl
Descripción
• El propósito de Estadística y Probabilidad es entregar a los estudiantes
conocimientos y herramientas para que adquieran capacidades de recoger,
organizar, describir y presentar conjuntos de datos estadísticos
unidimensionales o bidimensionales que le permitan caracterizar un
fenómeno de interés. Además, desarrollar técnicas y habilidades para aplicar
procedimientos estadísticos en el cálculo de probabilidades y análisis
inferencial de situaciones reales.

2
Unidad 1:
Análisis de datos univariados.

Unidad 2:
Análisis de datos bivariados.

Desarrollo
Unidad 3:
Distribuciones de probabilidad.

Unidad 4:
Inferencia y dócimas de hipótesis.

3
Aprendizaje esperado
• 1.1.- Resuelve problemas de la especialidad y/o disciplina que
involucre el tópico de análisis descriptivo de datos univariados
(Integrada Competencia Genérica Resolución de Problemas).

• Resolución de Problemas Nivel 1: Resuelve problemas que


involucran un número limitado de variables, en operaciones
propias de la especialidad, aportando a la ciencia de los
procesos.

4
Aprendizaje esperado
• Resolución de Problemas Nivel 2: Resuelve problemas
integrando diversas variables, en sistemas y procesos propios
de la especialidad, aportando a su mejora y optimización.

• Resolución de Problemas Nivel 3: Resuelve problemas


simultáneos y/o de carácter multidisciplinario, en el ámbito de
la especialidad, aportando al conocimiento en su disciplina y
quehacer profesional.

5
Unidad 1:
Análisis de datos univariados
Clase 03:
Medidas de resumen
Clase 03:
Medidas de resumen
Definición
Tendencia Central

• Media aritmética
• Mediana
• Moda

Posición

Medidas de •

Percentil

resumen
Decil
• Quintil
• Cuartil

Variabilidad

• Rango
• Varianza
• Desviación estándar

8
• Es importante señalar que las medidas de resumen
pueden ser calculadas en ciertos criterios:

1. Naturaleza de los datos:

Medidas de
• Datos tabulados: Los datos son entregados directamente en
una tabla que los resume, de manera que ya se hizo una
contabilización y rectificación de ellos. Este escenario
resumen permite utilizar, principalmente, fórmulas teóricas y algunas
funciones de Excel.

• Datos no tabulados: Los datos no son entregados en una tabla


y deben ser ordenados en una planilla de Excel para una
mejor contabilización. De tal manera que se hace más simple
emplear las funciones de Excel.

9
2. Tipo de variable:

Medidas de • Variable cualitativa: Solo puede estimarse la mediana, moda y


las medidas de posición.

resumen • Variable cuantitativa: Puede estimarse las medidas de


tendencia central, posición y variabilidad.

10
Clase 03:
Medidas de resumen
Medidas de tendencia central
• Una de las propiedades más importantes a estudiar de
una distribución de frecuencias es la tendencia
Medidas de central de las puntuaciones.

tendencia • Esta característica de la distribución se puede resumir


central en un valor o puntuación que refleje esa tendencia
central de la distribución y que represente al conjunto
de observaciones.

12
• La media aritmética, también llamada promedio o
simplemente media, es la medida de tendencia central
más conocida y usada en la práctica debido,
Medidas de básicamente, a la sencillez de su cálculo y a la
simplicidad que otorga su “explicación”.
tendencia
central • La media aritmética indica la tendencia general de
una distribución de frecuencias de una variable y es
el valor central alrededor del cual están la mayoría de
las observaciones.

13
• La media aritmética de una variable , denotada por ,
se define como la suma de todos los valores
observados divididos por el número total de
observaciones.

Medidas de • Se expresa matemáticamente de la siguiente manera,


tendencia en caso de datos no tabulados:

central
• Donde:
• es el valor de la iteración 𝒊.
• es el número total de observaciones.

14
• Se expresa matemáticamente de la siguiente manera,
en caso de datos tabulados:

Medidas de
tendencia
central • Donde:
• es el valor de la iteración 𝒊.
• es la frecuencia absoluta de la iteración 𝒊.
• es el número total de observaciones.

15
• A diferencia de la media aritmética, la mediana no se
ve afectada por los valores extremos que pueda
adoptar la variable debido a que en su cálculo no
Medidas de intervienen todos los valores de la distribución sino
únicamente los que ocupan las posiciones centrales.
tendencia
central • La mediana de una variable 𝒙, representada por Me,
se define como el valor que divide la distribución de
frecuencias en dos partes iguales, conteniendo cada
una el 50% de las observaciones.

16
• La moda de una distribución, que se representa por
Mo, se define como el valor o categoría de la variable

Medidas de con mayor frecuencia absoluta.

tendencia • Pueden haber tres situaciones con respecto a la moda:


central • Que no exista moda.
• Que sea un valor único (unimodal).
• Que posea más de una moda, es decir, dos o más datos son
los que poseen la mayor frecuencia absoluta.

17
Región
Arica y Parinacota 226.068 226.068 1,2864% 1,2864%

Medidas de tendencia central Tarapacá 330.558 556.626 1,8809% 3,1673%

Ejemplo 1 Antofagasta 607.534 1.164.160 3,4570% 6,6243%


Atacama 286.168 1.450.328 1,6284% 8,2527%
Coquimbo 757.586 2.207.914 4,3108% 12,5635%
Valparaíso 1.815.902 4.023.816 10,3329% 22,8964%
• Consideremos el Ejercicio 02 de la
Metropolitana 7.112.808 11.136.624 40,4735% 63,3699%
Clase 01 (Censo 2017).
O'Higgins 914.555 12.051.179 5,2040% 68,5739%
Maule 1.044.950 13.096.129 5,9460% 74,5199%
• Media aritmética: Como es una Ñuble 480.609 13.576.738 2,7348% 77,2547%
variable cualitativa (regiones), no Biobío 1.556.805 15.133.543 8,8586% 86,1133%
se puede determinar la media La Araucanía 957.224 16.090.767 5,4468% 91,5601%
aritmética (promedio). Los Ríos 384.837 16.475.604 2,1898% 93,7499%
Los Lagos 828.708 17.304.312 4,7155% 98,4654%
Aysén 103.158 17.407.470 0,5870% 99,0524%
Magallanes 166.533 17.574.003 0,9476% 100,0000%

18
Región
Arica y Parinacota 226.068 226.068 1,2864% 1,2864%

Medidas de tendencia central Tarapacá 330.558 556.626 1,8809% 3,1673%

Ejemplo 2 Antofagasta 607.534 1.164.160 3,4570% 6,6243%


Atacama 286.168 1.450.328 1,6284% 8,2527%
Coquimbo 757.586 2.207.914 4,3108% 12,5635%
Valparaíso 1.815.902 4.023.816 10,3329% 22,8964%
• Consideremos el Ejercicio 02 de la
Clase 01 (Censo 2017). Metropolitana 7.112.808 11.136.624 40,4735% 63,3699%
O'Higgins 914.555 12.051.179 5,2040% 68,5739%
Maule 1.044.950 13.096.129 5,9460% 74,5199%
• Moda: Observamos la mayor Ñuble 480.609 13.576.738 2,7348% 77,2547%
frecuencia absoluta (f), por lo
Biobío 1.556.805 15.133.543 8,8586% 86,1133%
tanto la moda es la Región
La Araucanía
Metropolitana. 957.224 16.090.767 5,4468% 91,5601%
Los Ríos 384.837 16.475.604 2,1898% 93,7499%
Los Lagos 828.708 17.304.312 4,7155% 98,4654%
Aysén 103.158 17.407.470 0,5870% 99,0524%
Magallanes 166.533 17.574.003 0,9476% 100,0000%

19
Región
Arica y Parinacota 226.068 226.068 1,2864% 1,2864%

Medidas de tendencia central Tarapacá 330.558 556.626 1,8809% 3,1673%

Ejemplo 3 Antofagasta 607.534 1.164.160 3,4570% 6,6243%


Atacama 286.168 1.450.328 1,6284% 8,2527%
Coquimbo 757.586 2.207.914 4,3108% 12,5635%
Valparaíso 1.815.902 4.023.816 10,3329% 22,8964%
• Consideremos el Ejercicio 02 de la
Clase 01 (Censo 2017). Metropolitana 7.112.808 11.136.624 40,4735% 63,3699%
O'Higgins 914.555 12.051.179 5,2040% 68,5739%
Maule 1.044.950 13.096.129 5,9460% 74,5199%
• Mediana: Observamos en la Ñuble 480.609 13.576.738 2,7348% 77,2547%
frecuencia acumulada porcentual
Biobío 1.556.805 15.133.543 8,8586% 86,1133%
(Fp), el primer valor que iguale o
La Araucanía
supere el 50%. Así, la mediana 957.224 16.090.767 5,4468% 91,5601%

corresponde a la Región Los Ríos 384.837 16.475.604 2,1898% 93,7499%


Metropolitana. Los Lagos 828.708 17.304.312 4,7155% 98,4654%
Aysén 103.158 17.407.470 0,5870% 99,0524%
Magallanes 166.533 17.574.003 0,9476% 100,0000%

20
Clase 03:
Medidas de resumen
Medidas de posición
• Las medidas o índices de posición, también
denominados cuantiles, informan acerca de la
posición relativa de un sujeto con respecto a su grupo
de referencia, dentro de la distribución de frecuencias
Medidas de de la variable.

posición • Dado que se trata de localizar la posición de un sujeto


en una distribución, para construir un índice de
posición, debemos emplear porcentajes, con lo que la
columna de frecuencia porcentual acumulada será
nuestro parámetro a considerar.

22
Percentil (1%)

• Divide el 100% de los datos en 100 partes iguales

Decil (10%)

Medidas de • Divide el 100% de los datos en 10 partes iguales

posición Quintil (20%)

• Divide el 100% de los datos en 5 partes iguales

Cuartil (25%)

• Divide el 100% de los datos en 4 partes iguales

23
Región
Arica y Parinacota 226.068 226.068 1,2864% 1,2864%

Medidas de posición Tarapacá 330.558 556.626 1,8809% 3,1673%

Ejemplo 4 Antofagasta 607.534 1.164.160 3,4570% 6,6243%


Atacama 286.168 1.450.328 1,6284% 8,2527%
Coquimbo 757.586 2.207.914 4,3108% 12,5635%
Valparaíso 1.815.902 4.023.816 10,3329% 22,8964%
• Consideremos el Ejercicio 02 de la
Metropolitana 7.112.808 11.136.624 40,4735% 63,3699%
Clase 01 (Censo 2017).
O'Higgins 914.555 12.051.179 5,2040% 68,5739%
Maule 1.044.950 13.096.129 5,9460% 74,5199%
• Percentil 5 (5%): Observamos en Ñuble 480.609 13.576.738 2,7348% 77,2547%
la frecuencia acumulada Biobío 1.556.805 15.133.543 8,8586% 86,1133%
porcentual (Fp), el primer valor La Araucanía 957.224 16.090.767 5,4468% 91,5601%
que iguale o supere el 5%. Así, el Los Ríos 384.837 16.475.604 2,1898% 93,7499%
percentil 5 corresponde a la
Los Lagos 828.708 17.304.312 4,7155% 98,4654%
Región de Antofagasta.
Aysén 103.158 17.407.470 0,5870% 99,0524%
Magallanes 166.533 17.574.003 0,9476% 100,0000%

24
Región
Arica y Parinacota 226.068 226.068 1,2864% 1,2864%

Medidas de posición Tarapacá 330.558 556.626 1,8809% 3,1673%

Ejemplo 5 Antofagasta 607.534 1.164.160 3,4570% 6,6243%


Atacama 286.168 1.450.328 1,6284% 8,2527%
Coquimbo 757.586 2.207.914 4,3108% 12,5635%
Valparaíso 1.815.902 4.023.816 10,3329% 22,8964%
• Consideremos el Ejercicio 02 de la
Clase 01 (Censo 2017). Metropolitana 7.112.808 11.136.624 40,4735% 63,3699%
O'Higgins 914.555 12.051.179 5,2040% 68,5739%
Maule 1.044.950 13.096.129 5,9460% 74,5199%
• Decil 2 (20%): Observamos en la Ñuble 480.609 13.576.738 2,7348% 77,2547%
frecuencia acumulada porcentual
Biobío 1.556.805 15.133.543 8,8586% 86,1133%
(Fp), el primer valor que iguale o
La Araucanía
supere el 20%. Así, el decil 2 957.224 16.090.767 5,4468% 91,5601%

corresponde a la Región de Los Ríos 384.837 16.475.604 2,1898% 93,7499%


Valparaíso. Los Lagos 828.708 17.304.312 4,7155% 98,4654%
Aysén 103.158 17.407.470 0,5870% 99,0524%
Magallanes 166.533 17.574.003 0,9476% 100,0000%

25
Región
Arica y Parinacota 226.068 226.068 1,2864% 1,2864%

Medidas de posición Tarapacá 330.558 556.626 1,8809% 3,1673%

Ejemplo 6 Antofagasta 607.534 1.164.160 3,4570% 6,6243%


Atacama 286.168 1.450.328 1,6284% 8,2527%
Coquimbo 757.586 2.207.914 4,3108% 12,5635%
Valparaíso 1.815.902 4.023.816 10,3329% 22,8964%
• Consideremos el Ejercicio 02 de la
Clase 01 (Censo 2017). Metropolitana 7.112.808 11.136.624 40,4735% 63,3699%
O'Higgins 914.555 12.051.179 5,2040% 68,5739%
Maule 1.044.950 13.096.129 5,9460% 74,5199%
• Quintil 3 (60%): Observamos en Ñuble 480.609 13.576.738 2,7348% 77,2547%
la frecuencia acumulada
Biobío 1.556.805 15.133.543 8,8586% 86,1133%
porcentual (Fp), el primer valor
La Araucanía
que iguale o supere el 60%. Así, el 957.224 16.090.767 5,4468% 91,5601%

quintil 3 corresponde a la Región Los Ríos 384.837 16.475.604 2,1898% 93,7499%


Metropolitana. Los Lagos 828.708 17.304.312 4,7155% 98,4654%
Aysén 103.158 17.407.470 0,5870% 99,0524%
Magallanes 166.533 17.574.003 0,9476% 100,0000%

26
Región
Arica y Parinacota 226.068 226.068 1,2864% 1,2864%

Medidas de posición Tarapacá 330.558 556.626 1,8809% 3,1673%

Ejemplo 7 Antofagasta 607.534 1.164.160 3,4570% 6,6243%


Atacama 286.168 1.450.328 1,6284% 8,2527%
Coquimbo 757.586 2.207.914 4,3108% 12,5635%
Valparaíso 1.815.902 4.023.816 10,3329% 22,8964%
• Consideremos el Ejercicio 02 de la
Clase 01 (Censo 2017). Metropolitana 7.112.808 11.136.624 40,4735% 63,3699%
O'Higgins 914.555 12.051.179 5,2040% 68,5739%
Maule 1.044.950 13.096.129 5,9460% 74,5199%
• Cuartil 3 (75%): Observamos en Ñuble 480.609 13.576.738 2,7348% 77,2547%
la frecuencia acumulada
Biobío 1.556.805 15.133.543 8,8586% 86,1133%
porcentual (Fp), el primer valor
La Araucanía
que iguale o supere el 75%. Así, el 957.224 16.090.767 5,4468% 91,5601%

cuartil 3 corresponde a la Región Los Ríos 384.837 16.475.604 2,1898% 93,7499%


de Ñuble. Los Lagos 828.708 17.304.312 4,7155% 98,4654%
Aysén 103.158 17.407.470 0,5870% 99,0524%
Magallanes 166.533 17.574.003 0,9476% 100,0000%

27
• Podemos interpretar las medidas de posición a partir
de un diagrama de cajas o Boxplot que es un gráfico
que muestra la distribución de los datos, dividiendo
estos en cuatro partes iguales mediante los cuartiles.

Rango intercuartil

Medidas de Dato menor Dato mayor

posición
Cuartil 1 Cuartil 3
Cuartil 2
• Se llama rango intercuartil a la diferencia entre el
tercer cuartil y el primer cuartil.

28
Clase 03:
Medidas de resumen
Medidas de variabilidad
• Una propiedad de la misma importancia que la
tendencia central, es la variabilidad o dispersión de
los datos.
Medidas de
variabilidad • La variabilidad hace referencia al grado en que las
puntuaciones se asemejan o diferencian entre sí, o se
aproximan o alejan de una medida de tendencia
central como la media aritmética.

30
• El rango permite identificar la diferencia entre el
valor máximo y el valor mínimo de los datos del
estudio o muestra.
Medidas de
variabilidad • De esta manera:

31
• La varianza corresponde al promedio de los

Medidas de cuadrados de la diferencia entre cada dato y el


promedio del conjunto.
variabilidad

32
• La desviación estándar corresponde a la medida del
grado de dispersión de los datos con respecto al valor

Medidas de promedio (entre mayor es la desviación, más disperso


es el conjunto). Se calcula como la raíz cuadrada de
variabilidad la varianza del conjunto.

33
Gracias por su atención

También podría gustarte