Está en la página 1de 65

UNIVERSIDAD AUTÓNOMA DE SAN LUIS POTOSI

FACULTAD DE CIENCIAS QUÍMICAS

ESTADÍSTICA

MSC LUCERO MÉNDEZ MANCILLA


OBJETIVOS

Visualizar la importancia de la Estadística como una herramienta


en su formación curricular.

Familiarizarse con el lenguaje y conceptos básicos de la materia


EVALUACIÓN
80% Examen
1er Parcial 20%
15% Tarea (s) + Actividades 2do Parcial 20%
5% Participación 3er Parcial 20%
4to Parcial 40%

Mail: lucero.mancilla@uaslp.mx

Formato Tarea (nombre del mail y documento adjunto) ApellidoNombre_Tarea#X_Estadística


Ejemplo: MendezLucero_Tarea1_Estadística

Se debe de cumplir con 2/3 asistencia en cada parcial, en caso contrario Sin derecho a examen
Para justificar la falta Tareas + evaluación de la clase faltante (>6) + justificante
Prohibido uso de corrector en tareas/trabajo/examen
COMPETENCIAS- ABET
CARRERA COMPETENCIA DESEMPEÑO

B- Habilidad para plantear y B1 Identifica y determina los factores


conducir experimentos, analizar relevantes de un problema y plantea la
IA, IBP,IQ datos, identifica las variables críticas hipótesis
y determina la validez de los mismos. B4 Analiza y contrasta la validez de la
información. Muestreo e
LQ B-Habilidad para diseñar y B4 Evalúa resultados experimentales inferencia
desarrollar experimentos, así como para la toma de decisiones, y proponer estadística
para el análisis e interpretación de alternativas para mejorar, modificar u
datos optimizar productos y/o procesos
químicos
QFB B-Capacidad para plantear y realizar B1 Realiza, analiza e interpreta datos de
análisis, experimentos y estudios en estudios y elabora informes en el área
el área Químico Farmacológica, así Químico Farmacobiológico
como para analizar, interpretar datos
y elaborar informes
REDONDEO 2 DECIMALES

Ejemplo:

1,514  1,51
1,515  1,52

 Cuando la cifra siguiente a la que se va a conservar es 5 o mayor a 5, la cifra que se conserva se debe
aumentar en una unidad
1,61562 queda redondeado a dos decimales  1,62

12,4456
UNIDAD 1.1_ ESTADÍSTICA
MSC. .LUCERO MÉNDEZ MANCILLA
UNIVERSIDAD AUTÓNOMA DE SAN LUIS POTOSI
FACULTAD DE CIENCIAS QUÍMICAS
ESTADÍSTICA

UNIDAD I

INTRODUCCIÓN
MSC LUCERO MÉNDEZ MANCILLA
ESTADÍSTICA
(DEL LATÍN, STATUS O CIENCIA DEL ESTADO)

Ciencia encargada de Recopilar, Organizar, Describir e Interpretar datos

Objetivo Obtener conclusiones de investigación empírica usando modelos


matemáticos
UN POCO DE HISTORIA…

Padre de la estadística: Godofredo Achenwall (1714-1772) nacionalidad


Alemana (Prusia)

Padre de la estadística moderna: Adolfo Quetelet (1796-1874) nacionalidad


belga
ESTADÍSTICA

DESCRIPTIVA INFERENCIAL
(deductiva) (estimar- inductiva)

Población

Muestra Toma decisiones


Muestra de los datos recopilados en la
estadística descriptiva

Recopilar, Organizar, Describir Interpretar datos Conclusión


“Pasado” “Futuro”
DEFINICIONES BÁSICAS

EJEMPLO
 POBLACIÓN (N) :

Estudiantes
Conjunto total de variables que universitarios de San
poseen algunas características Luis Potosí 2019
comunes observables en un lugar
o momento determinado
 MUESTRA (n) :
Subconjunto de la población, parte 50 Estudiantes
universitarios de San
representativa de una población
Luis Potosí 2019
DEFINICIONES BÁSICAS
EJEMPLO

 ESTADÍSTICO : valor que describe una muestra


= Media muestral

 PARÁMETRO: valor que describe una Población µ = Media poblacional

Nominal Color, Lugar nacimiento


Cualitativa- Atributo
Ordinal Grado Escolar, Nivel satisfacción
 VARIABLE
Discreta=Enteros #camas, recién nacidos, estudiantes, grupos
Característica
de interés
Cuantitativa- Numérica

Continua=Fracción Peso, talla, edad


EJERCICIO: CLASIFICA

σ= desviación estándar

s= desviación estándar
Parámetro
P= Proporción

p=proporción
Estadístico

σ2= varianza

s 2 = varianza
EJERCICIO: CLASIFICA (RESPUESTAS)

σ= desviación estándar

s= desviación estándar
Parámetro
P= Proporción

p=proporción
Estadístico

σ2= varianza

s 2 = varianza
EJERCICIO: CLASIFICA LAS VARIABLES

Nombres Cantidad de hemoglobina Densidad Número de muestras

Frecuencia cardiaca Número de veces que


se lanza una moneda Grupo sanguíneo Estado civil

Concentración molar Clase social


Molaridad Presión

Temperatura Grado de Dolor

Marca automóvil Lugar que ocupa en


Calorías la familia
Viscosidad
EJERCICIO: CLASIFICA LAS VARIABLES

Nombres VCN Cantidad de hemoglobina VQC Densidad VQC Número de muestras VQD

Frecuencia cardiaca VQD Número de veces que VCN


se lanza una moneda VQD Grupo sanguíneo VCN Estado civil

Concentración molar VQC Clase social VCO


Molaridad VQC Presión VQC

Temperatura VQC Grado de Dolor VCO

Marca automóvil VCN Lugar que ocupa en


Calorías la familia
VQC Viscosidad VQC VCO
EJERCICIO

Hace 10 años se aseguraba que sólo el 10% de la población de estudiantes potosinos de secundaria
fumaba. Se quiso verificar el dato anterior y recientemente se tomó una muestra de 50 escuelas
secundarias de la capital y se obtuvo que el 18% de la población fuma. Definir:

Muestra:
Población:
Parámetro:
Estadístico:
Variable:
Tipo Variable:
EJERCICIO

Hace 10 años se aseguraba que sólo el 10% de la población de estudiantes potosinos de secundaria
fumaba. Se quiso verificar el dato anterior y recientemente se tomó una muestra de 50 escuelas
secundarias de la capital y se obtuvo que el 18% de la población fuma

Muestra: estudiantes de 50 escuelas secundarias de la capital


Población: Estudiantes potosinos de secundaria
Parámetro: 10% fuma
Estadístico: 18% fuma
Variable: fuma o no fuma
Tipo Variable: cualitativa nominal
CÁLCULO DE PARÁMETROS Y ESTADÍSTICOS

 La luxación traumática de rodilla a menudo requiere cirugía para reparar los ligamentos rotos. Una medida de la
recuperación es la amplitud del movimiento (medido como el ángulo formado cuando, a partir de la pierna
estirada, la rodilla se dobla a la medida de lo posible). A continuación se figuran los datos en el rango de
movimiento posquirúrgico

154 122 135


142 126 120
Datos 137 135 127
poblacionales 133 108 134

Datos
142 126 120 108 134
Muestrales
MEDIA O PROMEDIO

 Muestral
Valor promedio de todas las observaciones del conjunto de datos

𝑛
𝑖=1 𝑥𝑖 𝑥1 + 𝑥2 + … + 𝑥𝑛
x= =
𝑛 𝑛

142 + 126 + 120 + 108 + 134


x= = 𝟏𝟐𝟔
5
MEDIA O PROMEDIO

 Poblacional

Valor promedio de todas las observaciones de una población

𝑖=1 𝑥𝑖 𝑥1+𝑥2+ …𝑥𝑛


µ= =
𝑁 𝑁

154+122+135+142+126+120+137+135+127+133+108+134
µ= = 131,08
12
VARIANZA

 Muestral
Variabilidad o dispersión de los datos, grado de homogeneidad

𝑛
𝑖=1(𝑥𝑖− 𝑥)2
𝑠2 =
𝑛−1 Grados libertad

Entre más grande sea el valor de 𝑠 2 , más grande es la variabilidad

(142−126)2 +(126−126)2 +(120−126)2 +(108−126)2 +(134−126)2


𝑠2 = =170
5−1
VARIANZA

 Poblacional

Variabilidad o dispersión de los datos de una población

𝑁
𝑖=1(𝑥𝑖 − µ)2
σ2 =
𝑁

(154−131,08)2 +(122−131,08)2 + ⋯+(134−131,08)2


𝜎2 = =125,24
12
DESVIACIÓN ESTÁNDAR

 Muestral

Variabilidad o dispersión de los datos

𝑛 (𝑥 −𝑥)2
𝑖=1 𝑖
s=
𝑛−1

s = 170=13,04
DESVIACIÓN ESTÁNDAR

 Poblacional

Variabilidad o dispersión de los datos de una población

𝑁 (𝑥 −µ)2
σ= 𝑖=1 𝑖
𝑁

σ= 125,24 = 𝟏𝟏, 𝟏𝟗
RANGO
 Muestral y Poblacional

Diferencia entre la observación más grande y la más pequeña

 Muestral  r= Máx (xi) – mín (xi)


r= 142 – 108 = 34

 Poblacional  R= Máx (xi) – mín (xi)

R= 154-108 = 46
MEDIANA
 Muestral
Valor medio una vez que se ordenan las observaciones de la más pequeña a la más grande

é𝑠𝑖𝑚𝑜
𝑛+1
𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑚𝑒𝑑𝑖𝑜 ú𝑛𝑖𝑐𝑜 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟 = 𝑣𝑎𝑙𝑜𝑟 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑜
2
𝑥=

𝑛 é𝑠𝑖𝑚𝑜 𝑛 é𝑠𝑖𝑚𝑜
𝐸𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑 𝑒𝑙𝑜𝑠 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑒𝑑𝑖𝑜𝑠 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟 = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑦 +1
2 2
MEDIANA
 Poblacional
Valor medio una vez que se ordenan las observaciones de la más pequeña a la más grande de una población

𝑁+1 é𝑠𝑖𝑚𝑜
𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑚𝑒𝑑𝑖𝑜 ú𝑛𝑖𝑐𝑜 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟 = 𝑣𝑎𝑙𝑜𝑟 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑜
2

 µ=
𝑁 é𝑠𝑖𝑚𝑜 𝑁 é𝑠𝑖𝑚𝑜
𝐸𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑 𝑒𝑙𝑜𝑠 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑒𝑑𝑖𝑜𝑠 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟 = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑦 +1
2 2
MODA

 Valor de los datos que ocurre con mayor frecuencia absoluta 𝑥𝑜𝜇
 Es posible contar con una Moda

 Es posible contar con dos o más Modas = Bimodal o multimodal

 Si dos puntuaciones son adyacentes y tienen la máxima frecuencia = la moda es el promedio de las dos
puntuaciones adyacentes
Tres formas de distribución de la población o muestra
ERROR TÍPICO O ESTÁNDAR
 Valor que cuantifica cuánto se apartan los valores de la media de la población
 Cuantifica las oscilaciones de la media muestral alrededor de la media poblacional
 Desviación típica de una distribución muestral, permite comprobar si una muestra con una determinada
media puede considerarse perteneciente a una población cuya media conocemos

𝑠
𝐸𝑆 =
𝑛

Se calcula dividiendo la desviación estándar muestral entre la raíz del número de muestras

13,04
E.S= = 𝟓, 𝟖𝟑
5
COEFICIENTE DE ASIMETRÍA

Fórmula ajustada Excel


CURTOSIS
También llamado SESGO o APUNTAMIENTO

+ -
Fórmula ajustada Excel
COEFICIENTE DE VARIACIÓN

 Para comparar la dispersión entre dos poblaciones heterogéneas

𝑠
CV=
𝜎
cv=
𝜇
COVARIANZA (COV)

 Cuando dos variables son dependientes, es de interés valorar qué tan fuerte están relacionadas una
con otra
 Es el producto esperado de las desviaciones
 Provee la dirección de la relación lineal
 Es NO acotada, depende de la escala de las variables

𝑁
𝑛
𝑖=1 𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦 𝑖=1 𝑥𝑖 − 𝜇𝑥 )(𝑦𝑖 − 𝜇𝑦
c𝑜𝑣 𝑋, 𝑌 = 𝐶𝑂𝑉 𝑋, 𝑌 =
𝑛−1 𝑁
CORRELACIÓN (COEFICIENTE DE CORRELACIÓN DE PEARSON)

 Provee la dirección e INTENSIDAD de la relación lineal entre dos variables

 Es estandarizada (-1, 0, 1)

𝑥 𝑦
𝑥𝑦 −
r 𝑋, 𝑌 = 𝑛
2 2
2 ( 𝑥) 2 ( 𝑦)
𝑥 − 𝑦 −
𝑛 𝑛

Refleja la bondad del ajuste de un modelo a la variable


Coeficiente de determinación = 𝑟2 que pretender explicar
EJERCICIO (ACTIVIDAD 1)
Nivel Molaridad Conductividad
Nombre Código material Repeticiones
concentración [M] (µS/cm)
NaCl KA01 Fuerte 0,01 625 2
NaCl KA01 Fuerte 0,01 915 2
NaCl KA01 Fuerte 0,02 1597 2
CH3COOH HB403 Débil 0,01 151,3 3
CH3COOH HB403 Débil 0,10 625 3
NaCl KA01 Fuerte 0,01 1344 3
CH3COOH HB403 Débil 0,05 108,4 2
NaCl KA01 Fuerte 0,01 1220 2
CH3COOH HB403 Débil 0,50 1131 2
CH3COOH HB403 Débil 0,01 108,4 3
CH3COOH HB403 Débil 0,20 110 3
CH3COOH HB403 Débil 0,40 2500 3
NaCl KA01 Fuerte 0,01 915 3
NaCl KA01 Fuerte 0,02 1597 2
CH3COOH HB403 Débil 0,01 151,3 3
CH3COOH HB403 Débil 0,10 625 2
NaCl KA01 Fuerte 0,01 1344 3
CH3COOH HB403 Débil 0,05 108,4 2
NaCl KA01 Fuerte 0,01 1220 3
CH3COOH HB403 Débil 0,50 1131 3
Calcular y/o definir

a) Clasificación de variables analizadas


b) Media
c) Mediana
d) Moda
e) Varianza y Desviación estándar
f) Rango
g) Coeficiente de asimetría (Molaridad y Conductividad)
h) Curtosis (Molaridad y Conductividad)
i) Coeficiente de variación (Molaridad y Conductividad)
j) Covarianza entre Molaridad y Conductividad, interpretar
k) Correlación entre Molaridad y Conductividad, interpretar
l) Grados libertad
FÓRMULA DE STURGES (K) Y ANCHO DE CLASE (C)

 Fórmula de Sturges (K): sugiere un número de clases, con las que podemos agrupar
nuestros datos

K= 1+ 3,322 log (N)

 Ancho de clase (C)

𝑅𝑎𝑛𝑔𝑜
C=
𝐾
DISTRIBUCIÓN NORMAL O GAUSS
GRÁFICO DE CAJA

Medidas de posición Conjunto de datos los agrupa en %

# 𝐷𝑎𝑡𝑜𝑠
• Percentiles:  1%
100

# 𝐷𝑎𝑡𝑜𝑠
• Deciles : 10%
10
25% 25% 25% 25%
# 𝐷𝑎𝑡𝑜𝑠 bigote Caja Caja bigote
• Cuartiles:  25%
4
FÓRMULAS DE CUARTILES NO AGRUPADOS
(PARES /IMPARES)-DETERMINAR POSICIÓN

CUARTIL.INC CUARTIL.EXC

Min = 1er dato ordenado


1 (𝑛+1)
𝑄2 +1 𝑄1 =
𝑄1 = 4
2

2 (𝑛+1) 2 (𝑛+1)
𝑄2 = 𝑄2 =
4 4

𝑄4 − 𝑄2 3 (𝑛+1)
𝑄3 = 𝑄2 + 𝑄3 =
2 4

𝑄4 =Max =dato n° 𝑄4 = no definido ≈ 𝑀𝑎𝑥


EJEMPLO CUARTIL.INC
36 37 40 69 70 71 84 86 93
n=9
POSICIÓN VALOR

Min = 1° 36

𝑄2 +1 𝑄2 +1 5+1
𝑄1 = 𝑄1 = = = 3° 40
2 2 2

2 (𝑛+1) 2 (9+1)
𝑄2 = 𝑄2 = = 5° 70
4 4

𝑄4 − 𝑄2 9−5
𝑄3 = 𝑄2 + 𝑄3 = 5 + = 7° 84
2 2

𝑄4 =Max =n 9° 93
EJEMPLO CUARTIL.EXC
36 37 40 69 70 71 84 86 93
n=9
POSICIÓN VALOR

Min = 1° 36

1 (𝑛+1) 1 (9+1)
𝑄1 = 𝑄1 = = 2,5° 38,5
4 4

2 (𝑛+1) 2 (9+1)
𝑄2 = 𝑄2 = = 5° 70
4 4

3 (𝑛+1) 3 9+1
𝑄3 = 𝑄3 = = 7,5 85
4 4

𝑄4 =Max =n 9° 93
CALCULAR CUARTILES EXC. DATOS NO AGRUPADOS

Dato Dato Dato Dato k=número de cuartil = 1, 2, 3, 4


1 5,3 9 6,7 17 7,3 25 8,4 𝑘(𝑛 + 1)
2 5,8 10 6,8 18 7,4 26 8,4 𝑄𝑘 = = 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑐𝑢𝑎𝑟𝑡𝑖𝑙
4
3 6 11 6,8 19 7,6 27 8,5
4 6,4 12 6,9 20 7,9 28 8,5 1 (31+1)
𝑄1 ⇒ =8° posición => Q1= 6,6
5 6,5 13 6,9 21 8,1 29 9,1 4

6 6,6 14 6,9 22 8,1 30 9,2 2 (31+1)


7 6,6 15 6,9 23 8,2 31 9,3 𝑄2 ⇒ =16° posición => Q2=
4
8 6,6 16 7,1 24 8,3 3 (31+1)
𝑄3 ⇒ = 24° posición => Q3=
4
CALCULAR CUARTILES DATOS NO AGRUPADOS

Dato Dato Dato Dato k=número de cuartil = 1, 2, 3, 4


1 5,3 9 6,7 17 7,3 25 8,4 𝑘(𝑛 + 1)
2 5,8 10 6,8 18 7,4 26 8,4 𝑄𝑘 = = 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑐𝑢𝑎𝑟𝑡𝑖𝑙
4
3 6 11 6,8 19 7,6 27 8,5
4 6,4 12 6,9 20 7,9 28 8,5 1 (31+1)
𝑄1 ⇒ =8° posición => Q1= 6,6
5 6,5 13 6,9 21 8,1 29 9,1 4

6 6,6 14 6,9 22 8,1 30 9,2 2 (31+1)


7 6,6 15 6,9 23 8,2 31 9,3 𝑄2 ⇒ =16° posición => Q2= 7,3
4
8 6,6 16 7,1 24 8,3 3 (31+1)
𝑄3 ⇒ = 24° posición => Q3=8,4
4
NOTA: En caso de que la posición sea un número con decimales se utiliza la siguiente fórmula para determinar el VALOR del
cuartil ( no la posición)
𝟐(𝟑𝟎+𝟏)
𝑸𝒌 = 𝑳𝒊 + (𝒅𝒆𝒄𝒊𝒎𝒂𝒍 𝒑𝒐𝒔𝒊𝒄𝒊ó𝒏 × 𝑳𝑺 − 𝑳𝑰 ), Ejemplo: Si tuviéramos 30 datos entonces 𝑸𝟐 = = 15,5
𝟒
𝑬𝒏𝒕𝒐𝒏𝒄𝒆𝒔 𝑸𝟐 = 𝟔, 𝟗 + (𝟎, 𝟓)(𝟕, 𝟏 − 𝟔, 𝟗) = 𝟕, 0
GRÁFICA
Graficar cuartiles datos NO agrupados
CÁLCULO CUARTILES (Q1, Q2, Q3,Q4) DATOS AGRUPADOS
1. Elaborar tabla que contenga : Clase, límite inferior (LI) y superior (LS), frecuencia (f), amplitud clase (A) y
frecuencia acumulada (fa)
Frecuencia frecuencia acumulada
Clase Lim inf Lim sup
f fa
Amplitud (A)= Diferencia 1 1 7 8 8
Límites inferiores entre clases
2 8 14 9 17
Ancho de clase (C)= Ls-Li 3 15 21 7 24
(Límite superior menos límite 4 22 28 10 34
inferior de cada clase) TOTAL 34

Primer cuartil

𝑆𝑢𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
Posición Q1= 𝑥 1 = 𝑝𝑄1 −→ 𝑈𝑏𝑖𝑐𝑎𝑟 # 𝑐𝑙𝑎𝑠𝑒 𝑎𝑙 𝑐𝑢𝑎𝑙 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑧𝑐𝑎 𝑝𝑄1 𝑒𝑛 𝑓𝑎
4

𝑝𝑄1−𝑓𝑎−1 𝐴
Q1= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄1+ 𝑓
CÁLCULO CUARTILES (Q1, Q2, Q3,Q4) DATOS AGRUPADOS
1. Elaborar tabla que contenga : Clase, límite inferior (LI) y superior (LS), frecuencia (f), amplitud clase (A) y
frecuencia acumulada (fa)
Frecuencia frecuencia acumulada
Clase Lim inf Lim sup
f fa
1 1 7 8 8
Amplitud= Unidades del min al
2 8 14 9 17
máx de cada clase
3 15 21 7 24
4 22 28 10 34

 Primer cuartil TOTAL 34

34
 Posición Q1=
𝑆𝑢𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
𝑥 1 = 𝑝𝑄1 −→ 𝑈𝑏𝑖𝑐𝑎𝑟 # 𝑐𝑙𝑎𝑠𝑒 𝑎𝑙 𝑐𝑢𝑎𝑙 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑧𝑐𝑎 𝑝𝑄1 𝑒𝑛 𝑓𝑎 = × 1 =8,5
4 4

8,5−8 7
 Q1= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄1+
𝑝𝑄1−𝑓𝑎−1 𝐴
=8+ =8,39
𝑓 9
CÁLCULO CUARTILES (Q1, Q2, Q3,Q4)
Segundo cuartil

34
 Posición Q2=
𝑆𝑢𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
4
× 2 = 𝑝𝑄2 −→ 𝑈𝑏𝑖𝑐𝑎𝑟 # 𝑐𝑙𝑎𝑠𝑒 𝑎𝑙 𝑐𝑢𝑎𝑙 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑧𝑐𝑎 𝑝𝑄2 𝑒𝑛 𝑓𝑎 = × 2 =17
4

𝟏𝟕−8 7
 Q2= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄2+
𝑝𝑄2−𝑓𝑎−1 𝐴 =8+ = 15
𝑓 9
Frecuencia frecuencia acumulada
Clase Lim inf Lim sup
f fa
1 1 7 8 8
2 8 14 9 17
3 15 21 7 24
4 22 28 10 34
TOTAL 34
CÁLCULO CUARTILES (Q1, Q2, Q3,Q4)
Tercer cuartil

34
 Posición Q3=
𝑆𝑢𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
4
× 3 = 𝑝𝑄3 −→ 𝑈𝑏𝑖𝑐𝑎𝑟 # 𝑐𝑙𝑎𝑠𝑒 𝑎𝑙 𝑐𝑢𝑎𝑙 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑧𝑐𝑎 𝑝𝑄3 𝑒𝑛 𝑓𝑎 = × 3 = 25,5
4

25,5−24 7
 Q2= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄3+
𝑝𝑄3−𝑓𝑎−1 𝐴 =22+ = 23,05
𝑓 10
Frecuencia frecuencia acumulada
Clase Lim inf Lim sup
f fa
1 1 7 8 8
2 8 14 9 17
3 15 21 7 24
4 22 28 10 34
TOTAL 34
Cuarto cuartil
Frecuencia frecuencia acumulada
Clase Lim inf Lim sup
f fa

Posición Q4= Valor máximo 1 1 7 8 8


2 8 14 9 17
3 15 21 7 24
4 22 28 10 34
TOTAL 34

Q1 Q2 Q3 Q4

0 5 10 15 20 25 30
PUNTOS A CONSIDERAR AMPLITUD VS ANCHO CLASE
 Para el cálculo del VALOR de las medidas de posición, (cuartil, decil o percentil), en los DATOS AGRUPADOS, es
importante considerar el tipo de datos que se están manejando
frecuencia frecuencia
Frecuencia Frecuencia
Clase Lim inf Lim sup acumulada Clase Lim inf Lim sup acumulada
f f
fa fa
1 1 7 8 8 1 1,00 7,00 8 8
2 8 14 9 17 2 7,01 13,01 9 17
3 15 21 7 24 3 13,02 19,02 7 24
4 22 28 10 34 4 19,03 25,03 10 34
TOTAL 34 TOTAL 34
Primer cuartil Primer cuartil En el cálculo pueden
USAR A A=C
usar A o C
A= 7 C=6 A≠ C A= 6,01 C=6
𝑝𝑄1−𝑓𝑎−1 𝑨 𝑝𝑄1−𝑓𝑎−1 𝑨 𝒐 𝑪
Q1= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄1+ = Q1= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝑄1+
𝑓
𝑓
8,5−8 𝟔,𝟎𝟏 8,5−8 𝟔
8,5−8 𝟕 =8+ = 8,33 𝑜 =8+ = 8,33
=8+ = 8,39 9 9
CÁLCULO DE PERCENTILES Y DECILES

No agrupados
𝑘(𝑛+1)
𝐷𝑘 = = 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 decil
10

Cuando la posición es decimal 𝐷𝑘 = 𝐿𝑖 + (𝑑𝑒𝑐𝑖𝑚𝑎𝑙 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 × 𝐿𝑆 − 𝐿𝐼 ),

Agrupados

Primer Decil
𝑆𝑢𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
Posición D1= 𝑥 1 = 𝑝𝐷1 −→ 𝑈𝑏𝑖𝑐𝑎𝑟 # 𝑐𝑙𝑎𝑠𝑒 𝑎𝑙 𝑐𝑢𝑎𝑙 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑧𝑐𝑎 𝑝𝐷1 𝑒𝑛 𝑓𝑎
10

𝑝𝐷1−𝑓𝑎−1 𝐴
D1= 𝐿𝐼 𝑐𝑙𝑎𝑠𝑒 𝑝𝐷1+
𝑓
EJEMPLO DECILES DATOS NO AGRUPADOS
D1=5 D2
D3=15
2 4 6 8 10 12
14 16 18 20 22 24
26 28 30 32 34 36
38 40 42 44 46 48

1(24+1)
𝐷1 = = 2,5 → 𝐷1 = 4 + (0,5)(6-4)= 5
10

2(24+1)
𝐷2 = = 5 → 𝐷1 = 10
10

3(24+1)
𝐷3 = = 7,5 → 𝐷1 = 14 + (0,5)(16-14)= 15
10
EJEMPLO DECILES AGRUPADOS
Frecuencia frecuencia acumulada
Clase Lim inf Lim sup
f fa
1 1 7 8 8
2 8 14 9 17
3 15 21 7 24
4 22 28 10 34
TOTAL 34

Primer Decil
34 Sexto Decil
Posición D1= 𝑥 1 = 3,4 −→ # 𝑐𝑙𝑎𝑠𝑒 1 34
10 Posición D6= 10 𝑥 6 = 20,4 −→ # 𝑐𝑙𝑎𝑠𝑒 3
3,4−0 7
D1= 1 + = 3,98 20,4−17 7
8 D1= 15 + = 18,40
7
GRAFICO DE TALLO Y HOJA

1. Seleccione uno o más de los primeros dígitos para los valores del tallo. Los segundos
dígitos se convierten en hojas

2. Enumere los posibles valores de tallos en una columna vertical

3. Anote la hoja para cada observación junto al correspondiente valor de tallo

4. Indique las unidades para tallos y hojas en algún lugar del gráfico
EJEMPLO
Compresión (PSI)
 Resistencia a la compresión de 80 Tallo Hoja
ejemplares de prueba de una aleación
9 7
aluminio
10 5
13 1 4
105 218 228 15 1 4 7
97 199 131 16 0 3
245 160 180 17 8
18 0
163 196 178
19 6 9
207 221 157 20 7
134 154 151 21 8
22 1 8
24 5
EJERCICIO
 Realizar diagrama de tallo y hoja de los siguientes datos Calificaciones (base 100) de los alumnos

61 71 84 65 88
70 84 95 75 78
83 93 65 100 78
100 64 73 66 79
63 71 87 77 81
Calificaciones (base 100))
Tallo Hoja
6 134556
7 011357889
8 134478
9 35
10 0 0

También podría gustarte