Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA
Mail: lucero.mancilla@uaslp.mx
Se debe de cumplir con 2/3 asistencia en cada parcial, en caso contrario Sin derecho a examen
Para justificar la falta Tareas + evaluación de la clase faltante (>6) + justificante
Prohibido uso de corrector en tareas/trabajo/examen
COMPETENCIAS- ABET
CARRERA COMPETENCIA DESEMPEÑO
Ejemplo:
1,514 1,51
1,515 1,52
Cuando la cifra siguiente a la que se va a conservar es 5 o mayor a 5, la cifra que se conserva se debe
aumentar en una unidad
1,61562 queda redondeado a dos decimales 1,62
12,4456
UNIDAD 1.1_ ESTADÍSTICA
MSC. .LUCERO MÉNDEZ MANCILLA
UNIVERSIDAD AUTÓNOMA DE SAN LUIS POTOSI
FACULTAD DE CIENCIAS QUÍMICAS
ESTADÍSTICA
UNIDAD I
INTRODUCCIÓN
MSC LUCERO MÉNDEZ MANCILLA
ESTADÍSTICA
(DEL LATÍN, STATUS O CIENCIA DEL ESTADO)
DESCRIPTIVA INFERENCIAL
(deductiva) (estimar- inductiva)
Población
EJEMPLO
POBLACIÓN (N) :
Estudiantes
Conjunto total de variables que universitarios de San
poseen algunas características Luis Potosí 2019
comunes observables en un lugar
o momento determinado
MUESTRA (n) :
Subconjunto de la población, parte 50 Estudiantes
universitarios de San
representativa de una población
Luis Potosí 2019
DEFINICIONES BÁSICAS
EJEMPLO
σ= desviación estándar
s= desviación estándar
Parámetro
P= Proporción
p=proporción
Estadístico
σ2= varianza
s 2 = varianza
EJERCICIO: CLASIFICA (RESPUESTAS)
σ= desviación estándar
s= desviación estándar
Parámetro
P= Proporción
p=proporción
Estadístico
σ2= varianza
s 2 = varianza
EJERCICIO: CLASIFICA LAS VARIABLES
Nombres VCN Cantidad de hemoglobina VQC Densidad VQC Número de muestras VQD
Hace 10 años se aseguraba que sólo el 10% de la población de estudiantes potosinos de secundaria
fumaba. Se quiso verificar el dato anterior y recientemente se tomó una muestra de 50 escuelas
secundarias de la capital y se obtuvo que el 18% de la población fuma. Definir:
Muestra:
Población:
Parámetro:
Estadístico:
Variable:
Tipo Variable:
EJERCICIO
Hace 10 años se aseguraba que sólo el 10% de la población de estudiantes potosinos de secundaria
fumaba. Se quiso verificar el dato anterior y recientemente se tomó una muestra de 50 escuelas
secundarias de la capital y se obtuvo que el 18% de la población fuma
La luxación traumática de rodilla a menudo requiere cirugía para reparar los ligamentos rotos. Una medida de la
recuperación es la amplitud del movimiento (medido como el ángulo formado cuando, a partir de la pierna
estirada, la rodilla se dobla a la medida de lo posible). A continuación se figuran los datos en el rango de
movimiento posquirúrgico
Datos
142 126 120 108 134
Muestrales
MEDIA O PROMEDIO
Muestral
Valor promedio de todas las observaciones del conjunto de datos
𝑛
𝑖=1 𝑥𝑖 𝑥1 + 𝑥2 + … + 𝑥𝑛
x= =
𝑛 𝑛
Poblacional
154+122+135+142+126+120+137+135+127+133+108+134
µ= = 131,08
12
VARIANZA
Muestral
Variabilidad o dispersión de los datos, grado de homogeneidad
𝑛
𝑖=1(𝑥𝑖− 𝑥)2
𝑠2 =
𝑛−1 Grados libertad
Poblacional
𝑁
𝑖=1(𝑥𝑖 − µ)2
σ2 =
𝑁
Muestral
𝑛 (𝑥 −𝑥)2
𝑖=1 𝑖
s=
𝑛−1
s = 170=13,04
DESVIACIÓN ESTÁNDAR
Poblacional
𝑁 (𝑥 −µ)2
σ= 𝑖=1 𝑖
𝑁
σ= 125,24 = 𝟏𝟏, 𝟏𝟗
RANGO
Muestral y Poblacional
R= 154-108 = 46
MEDIANA
Muestral
Valor medio una vez que se ordenan las observaciones de la más pequeña a la más grande
é𝑠𝑖𝑚𝑜
𝑛+1
𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑚𝑒𝑑𝑖𝑜 ú𝑛𝑖𝑐𝑜 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟 = 𝑣𝑎𝑙𝑜𝑟 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑜
2
𝑥=
𝑛 é𝑠𝑖𝑚𝑜 𝑛 é𝑠𝑖𝑚𝑜
𝐸𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑 𝑒𝑙𝑜𝑠 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑒𝑑𝑖𝑜𝑠 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟 = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑦 +1
2 2
MEDIANA
Poblacional
Valor medio una vez que se ordenan las observaciones de la más pequeña a la más grande de una población
𝑁+1 é𝑠𝑖𝑚𝑜
𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑚𝑒𝑑𝑖𝑜 ú𝑛𝑖𝑐𝑜 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟 = 𝑣𝑎𝑙𝑜𝑟 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑜
2
µ=
𝑁 é𝑠𝑖𝑚𝑜 𝑁 é𝑠𝑖𝑚𝑜
𝐸𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑 𝑒𝑙𝑜𝑠 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑒𝑑𝑖𝑜𝑠 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟 = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑦 +1
2 2
MODA
Valor de los datos que ocurre con mayor frecuencia absoluta 𝑥𝑜𝜇
Es posible contar con una Moda
Si dos puntuaciones son adyacentes y tienen la máxima frecuencia = la moda es el promedio de las dos
puntuaciones adyacentes
Tres formas de distribución de la población o muestra
ERROR TÍPICO O ESTÁNDAR
Valor que cuantifica cuánto se apartan los valores de la media de la población
Cuantifica las oscilaciones de la media muestral alrededor de la media poblacional
Desviación típica de una distribución muestral, permite comprobar si una muestra con una determinada
media puede considerarse perteneciente a una población cuya media conocemos
𝑠
𝐸𝑆 =
𝑛
Se calcula dividiendo la desviación estándar muestral entre la raíz del número de muestras
13,04
E.S= = 𝟓, 𝟖𝟑
5
COEFICIENTE DE ASIMETRÍA
+ -
Fórmula ajustada Excel
COEFICIENTE DE VARIACIÓN
𝑠
CV=
𝜎
cv=
𝜇
COVARIANZA (COV)
Cuando dos variables son dependientes, es de interés valorar qué tan fuerte están relacionadas una
con otra
Es el producto esperado de las desviaciones
Provee la dirección de la relación lineal
Es NO acotada, depende de la escala de las variables
𝑁
𝑛
𝑖=1 𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦 𝑖=1 𝑥𝑖 − 𝜇𝑥 )(𝑦𝑖 − 𝜇𝑦
c𝑜𝑣 𝑋, 𝑌 = 𝐶𝑂𝑉 𝑋, 𝑌 =
𝑛−1 𝑁
CORRELACIÓN (COEFICIENTE DE CORRELACIÓN DE PEARSON)
Es estandarizada (-1, 0, 1)
𝑥 𝑦
𝑥𝑦 −
r 𝑋, 𝑌 = 𝑛
2 2
2 ( 𝑥) 2 ( 𝑦)
𝑥 − 𝑦 −
𝑛 𝑛
Fórmula de Sturges (K): sugiere un número de clases, con las que podemos agrupar
nuestros datos
𝑅𝑎𝑛𝑔𝑜
C=
𝐾
DISTRIBUCIÓN NORMAL O GAUSS
GRÁFICO DE CAJA
# 𝐷𝑎𝑡𝑜𝑠
• Percentiles: 1%
100
# 𝐷𝑎𝑡𝑜𝑠
• Deciles : 10%
10
25% 25% 25% 25%
# 𝐷𝑎𝑡𝑜𝑠 bigote Caja Caja bigote
• Cuartiles: 25%
4
FÓRMULAS DE CUARTILES NO AGRUPADOS
(PARES /IMPARES)-DETERMINAR POSICIÓN
CUARTIL.INC CUARTIL.EXC
2 (𝑛+1) 2 (𝑛+1)
𝑄2 = 𝑄2 =
4 4
𝑄4 − 𝑄2 3 (𝑛+1)
𝑄3 = 𝑄2 + 𝑄3 =
2 4
Min = 1° 36
𝑄2 +1 𝑄2 +1 5+1
𝑄1 = 𝑄1 = = = 3° 40
2 2 2
2 (𝑛+1) 2 (9+1)
𝑄2 = 𝑄2 = = 5° 70
4 4
𝑄4 − 𝑄2 9−5
𝑄3 = 𝑄2 + 𝑄3 = 5 + = 7° 84
2 2
𝑄4 =Max =n 9° 93
EJEMPLO CUARTIL.EXC
36 37 40 69 70 71 84 86 93
n=9
POSICIÓN VALOR
Min = 1° 36
1 (𝑛+1) 1 (9+1)
𝑄1 = 𝑄1 = = 2,5° 38,5
4 4
2 (𝑛+1) 2 (9+1)
𝑄2 = 𝑄2 = = 5° 70
4 4
3 (𝑛+1) 3 9+1
𝑄3 = 𝑄3 = = 7,5 85
4 4
𝑄4 =Max =n 9° 93
CALCULAR CUARTILES EXC. DATOS NO AGRUPADOS
Primer cuartil
𝑆𝑢𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
Posición Q1= 𝑥 1 = 𝑝𝑄1 −→ 𝑈𝑏𝑖𝑐𝑎𝑟 # 𝑐𝑙𝑎𝑠𝑒 𝑎𝑙 𝑐𝑢𝑎𝑙 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑧𝑐𝑎 𝑝𝑄1 𝑒𝑛 𝑓𝑎
4
𝑝𝑄1−𝑓𝑎−1 𝐴
Q1= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄1+ 𝑓
CÁLCULO CUARTILES (Q1, Q2, Q3,Q4) DATOS AGRUPADOS
1. Elaborar tabla que contenga : Clase, límite inferior (LI) y superior (LS), frecuencia (f), amplitud clase (A) y
frecuencia acumulada (fa)
Frecuencia frecuencia acumulada
Clase Lim inf Lim sup
f fa
1 1 7 8 8
Amplitud= Unidades del min al
2 8 14 9 17
máx de cada clase
3 15 21 7 24
4 22 28 10 34
34
Posición Q1=
𝑆𝑢𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
𝑥 1 = 𝑝𝑄1 −→ 𝑈𝑏𝑖𝑐𝑎𝑟 # 𝑐𝑙𝑎𝑠𝑒 𝑎𝑙 𝑐𝑢𝑎𝑙 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑧𝑐𝑎 𝑝𝑄1 𝑒𝑛 𝑓𝑎 = × 1 =8,5
4 4
8,5−8 7
Q1= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄1+
𝑝𝑄1−𝑓𝑎−1 𝐴
=8+ =8,39
𝑓 9
CÁLCULO CUARTILES (Q1, Q2, Q3,Q4)
Segundo cuartil
34
Posición Q2=
𝑆𝑢𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
4
× 2 = 𝑝𝑄2 −→ 𝑈𝑏𝑖𝑐𝑎𝑟 # 𝑐𝑙𝑎𝑠𝑒 𝑎𝑙 𝑐𝑢𝑎𝑙 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑧𝑐𝑎 𝑝𝑄2 𝑒𝑛 𝑓𝑎 = × 2 =17
4
𝟏𝟕−8 7
Q2= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄2+
𝑝𝑄2−𝑓𝑎−1 𝐴 =8+ = 15
𝑓 9
Frecuencia frecuencia acumulada
Clase Lim inf Lim sup
f fa
1 1 7 8 8
2 8 14 9 17
3 15 21 7 24
4 22 28 10 34
TOTAL 34
CÁLCULO CUARTILES (Q1, Q2, Q3,Q4)
Tercer cuartil
34
Posición Q3=
𝑆𝑢𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
4
× 3 = 𝑝𝑄3 −→ 𝑈𝑏𝑖𝑐𝑎𝑟 # 𝑐𝑙𝑎𝑠𝑒 𝑎𝑙 𝑐𝑢𝑎𝑙 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑧𝑐𝑎 𝑝𝑄3 𝑒𝑛 𝑓𝑎 = × 3 = 25,5
4
25,5−24 7
Q2= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄3+
𝑝𝑄3−𝑓𝑎−1 𝐴 =22+ = 23,05
𝑓 10
Frecuencia frecuencia acumulada
Clase Lim inf Lim sup
f fa
1 1 7 8 8
2 8 14 9 17
3 15 21 7 24
4 22 28 10 34
TOTAL 34
Cuarto cuartil
Frecuencia frecuencia acumulada
Clase Lim inf Lim sup
f fa
Q1 Q2 Q3 Q4
0 5 10 15 20 25 30
PUNTOS A CONSIDERAR AMPLITUD VS ANCHO CLASE
Para el cálculo del VALOR de las medidas de posición, (cuartil, decil o percentil), en los DATOS AGRUPADOS, es
importante considerar el tipo de datos que se están manejando
frecuencia frecuencia
Frecuencia Frecuencia
Clase Lim inf Lim sup acumulada Clase Lim inf Lim sup acumulada
f f
fa fa
1 1 7 8 8 1 1,00 7,00 8 8
2 8 14 9 17 2 7,01 13,01 9 17
3 15 21 7 24 3 13,02 19,02 7 24
4 22 28 10 34 4 19,03 25,03 10 34
TOTAL 34 TOTAL 34
Primer cuartil Primer cuartil En el cálculo pueden
USAR A A=C
usar A o C
A= 7 C=6 A≠ C A= 6,01 C=6
𝑝𝑄1−𝑓𝑎−1 𝑨 𝑝𝑄1−𝑓𝑎−1 𝑨 𝒐 𝑪
Q1= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄1+ = Q1= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄1+
𝑓
𝑓
8,5−8 𝟔,𝟎𝟏 8,5−8 𝟔
8,5−8 𝟕 =8+ = 8,33 𝑜 =8+ = 8,33
=8+ = 8,39 9 9
CÁLCULO DE PERCENTILES Y DECILES
No agrupados
𝑘(𝑛+1)
𝐷𝑘 = = 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 decil
10
Agrupados
Primer Decil
𝑆𝑢𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
Posición D1= 𝑥 1 = 𝑝𝐷1 −→ 𝑈𝑏𝑖𝑐𝑎𝑟 # 𝑐𝑙𝑎𝑠𝑒 𝑎𝑙 𝑐𝑢𝑎𝑙 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑧𝑐𝑎 𝑝𝐷1 𝑒𝑛 𝑓𝑎
10
𝑝𝐷1−𝑓𝑎−1 𝐴
D1= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝐷1+
𝑓
EJEMPLO DECILES DATOS NO AGRUPADOS
D1=5 D2
D3=15
2 4 6 8 10 12
14 16 18 20 22 24
26 28 30 32 34 36
38 40 42 44 46 48
1(24+1)
𝐷1 = = 2,5 → 𝐷1 = 4 + (0,5)(6-4)= 5
10
2(24+1)
𝐷2 = = 5 → 𝐷1 = 10
10
3(24+1)
𝐷3 = = 7,5 → 𝐷1 = 14 + (0,5)(16-14)= 15
10
EJEMPLO DECILES AGRUPADOS
Frecuencia frecuencia acumulada
Clase Lim inf Lim sup
f fa
1 1 7 8 8
2 8 14 9 17
3 15 21 7 24
4 22 28 10 34
TOTAL 34
Primer Decil
34 Sexto Decil
Posición D1= 𝑥 1 = 3,4 −→ # 𝑐𝑙𝑎𝑠𝑒 1 34
10 Posición D6= 10 𝑥 6 = 20,4 −→ # 𝑐𝑙𝑎𝑠𝑒 3
3,4−0 7
D1= 1 + = 3,98 20,4−17 7
8 D1= 15 + = 18,40
7
GRAFICO DE TALLO Y HOJA
1. Seleccione uno o más de los primeros dígitos para los valores del tallo. Los segundos
dígitos se convierten en hojas
4. Indique las unidades para tallos y hojas en algún lugar del gráfico
EJEMPLO
Compresión (PSI)
Resistencia a la compresión de 80 Tallo Hoja
ejemplares de prueba de una aleación
9 7
aluminio
10 5
13 1 4
105 218 228 15 1 4 7
97 199 131 16 0 3
245 160 180 17 8
18 0
163 196 178
19 6 9
207 221 157 20 7
134 154 151 21 8
22 1 8
24 5
EJERCICIO
Realizar diagrama de tallo y hoja de los siguientes datos Calificaciones (base 100) de los alumnos
61 71 84 65 88
70 84 95 75 78
83 93 65 100 78
100 64 73 66 79
63 71 87 77 81
Calificaciones (base 100))
Tallo Hoja
6 134556
7 011357889
8 134478
9 35
10 0 0