Documentos de Académico
Documentos de Profesional
Documentos de Cultura
01NotaClase PDF
01NotaClase PDF
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10
N
0 1 2 3 4 5 6 7 8 9 10
∑x i
μX = i =1
0 1 2 3 4 5 6 7 8 9 10
N
12
∑x i
0 1 2 3 4 5 6 7 8 9 10
μX = i =1
=6
Calificación en la escala del uno al diez
12
41
Media:
Interpretación y propiedades
• Punto de equilibrio del sistema de
masas datos
• Representante del conjunto de datos
• Valor comprendido entre el mínimo y
máximo
• No siempre coincide con un valor
observado
• Es única
42
Variabilidad – Dispersión
Rango = xmáx – xmín
R=0 R = 10
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10
R=2
0 1 2 3 4 5 6 7 8 9 10
R = 10 R = 10
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
43
Rango
44
Medición de la dispersión
¿Cuánto se alejan los datos del
punto de equilibrio?
0 1 2 3 4 5 6 7 8 9 10
( xi − μ X )
0 1 2 3 4 5 6 7 8 9 10
∑ (x − μ )=0
0 1 2 3 4 5 6 7 8 9 10
i X
i =1
0 1 2 3 4 5 6 7 8 9 10
∑ (x − μ i X ) 2
Varianza Poblacional:
σ =
2 i =1 Promedio de las
desviaciones cuadráticas
X
N respecto de la media
∑ ( xi − μ X ) 2 Desviación Estándar
Poblacional: Surge de la
σX = i =1
necesidad de volver a la
N unidad de medida de la
48 variable en estudio
Para pensar ...
• ¿Cuál es la estatura promedio de las
personas presentes?
• ¿Cuál es la desviación estándar de las
personas presentes?
• Comparemos:
– Estatura de los adultos
– Estatura de adolescentes (13 a 17 años)
– ¿Cuál tiene mayor desviación estándar?
• Comparemos media y desviación estándar:
– Estatura de los adultos
– Estatura de las modelos de Pancho Dotto
49
Valores numéricos de σ
0 1 2 3 4 5 6 7 8 9 10
σX = 0
0 1 2 3 4 5 6 7 8 9 10
σ X = 0, 71
0 1 2 3 4 5 6 7 8 9 10
σ X = 4,32
50 Calificación en la escala del uno al diez
Tabla: valores de σ
# Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5 Grupo 6 Grupo 8
1 6 5 5 5 5 5 5
2 6 6 5 5 5 5 5
3 6 6 6 5 5 5 5
4 6 6 6 6 5 5 5
5 6 6 6 6 6 5 5
6 6 6 6 6 6 6 5
7 6 6 6 6 6 6 7
8 6 6 6 6 6 7 7
9 6 6 6 6 7 7 7
10 6 6 6 7 7 7 7
11 6 6 7 7 7 7 7
12 6 7 7 7 7 7 7
Media = 6 6 6 6 6 6 6
DE Pob= 0 0,4082 0,5774 0,7071 0,8165 0,9129 1
51
Gráficos: valores de σ
σ=0 σ = 0,82
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
σ = 0,41 σ = 0,91
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
σ = 0,58 σ=1
52 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Caso 4
Los datos, en promedio, ¿cuánto se
alejan a un lado y al otro de la media?
σ=1
0 1 2 3 4 5 6 7 8 9 10
53
Caso 5
Los datos, en promedio y aproximadamente,
¿cuánto se alejan a un lado y al otro de la media?
σ = 2,082
0 1 2 3 4 5 6 7 8 9 10
σ = 3,055
0 1 2 3 4 5 6 7 8 9 10
54
Interpretación de σ
Sistema real
En ambos sistemas:
μX = 7
0 1 2 3 4 5 6 7 8 9 10 σ X = 2,5
Sistema equivalente
2,5 2,5
En promedio, las
calificaciones se alejan de
la media, 2,5 puntos
55 1 2 4 5 6
0 3 7 8 9 10
Resumen de fórmulas (Población)
Población de tamaño N
N
Media
Poblacional
∑x i
μX = i =1
N
N
Desviación
Estándar
∑ (x − μ i X ) 2
Poblacional σX = i =1
N
56
Resumen de fórmulas (Muestra)
Muestra de tamaño n
n
Media Muestral ∑x i
X= i =1
n
n
Desviación
Estándar Muestral
∑ (x − X ) i
2
SX = i =1
n −1
57
Coeficiente de Variación
Medida de dispersión relativa
Permite efectuar comparaciones entre
variables medidas en la misma unidad o en
unidades de medida diferentes
Expresa la dispersión como proporción o
porcentaje respecto de la media del conjunto
de los datos
Fórmula de cálculo:
σX
Poblacional CV =
μX
SX
58
Muestral CV =
X
Capacidad estadística vs.
Pensamiento estadístico
Análisis de la Variabilidad
Caso 1: Tiempos
• Variable en estudio:
– Tiempo requerido para realizar una tarea
• Se desea comparar el tiempo empleado por
un grupo de personas para realizar una tarea
X, con el tiempo empleado por otro grupo de
personas para realizar una tarea Y.
– Desviación estándar (X): σX = 0,04 min
– Desviación estándar (Y): σY = 2880 min (dos días)
• ¿Qué tiempos están más dispersos, los de la
tarea X o los de la tarea Y?
60
Caso 2: Derrames
• Variable en estudio:
– Derrame Medio Anual (hm³)
• Se desea comparar el volumen de agua que
anualmente aportan dos ríos, denominados
genéricamente X e Y.
– Desviación estándar (Río X): σX = 546 hm³
– Desviación estándar (Río Y): σY = 113.121 hm³
• ¿Cuáles son los derrames que están más
dispersos, los del Río X o los del Río Y?
61
Caso 3: Estaturas y Pesos
• Variables en estudio:
– Estatura (X) y Peso (Y)
• Se desea comparar las estaturas con los
pesos de un grupo de personas, en términos
de variabilidad.
– Desviación estándar estaturas: σX = 8,6 cm
– Desviación estándar pesos: σY = 13,7 kg
• ¿Qué datos están más dispersos, las
estaturas o los pesos de las personas del
grupo?
62
Caso 4: Tiempos
• Variable en estudio:
– Tiempo requerido para realizar una tarea
• Se desea comparar el tiempo empleado por
los hombres (H) con el tiempo empleado por
las mujeres (M) para realizar la misma tarea.
– Desviación estándar (hombres): σH = 4,69 min
– Desviación estándar (mujeres): σM = 1,70 min
• ¿Qué tiempos están más dispersos, los de los
hombres o los de las mujeres?
63
Otras medidas de
tendencia central
Mediana (Me) y Moda (Mo)
Mediana
• Definición:
– Es un valor de la variable que ocupa la posición
central en un conjunto ordenado de datos.
• Determinación de la mediana:
– Si el número de observaciones es impar, es el
valor observado que ocupa la posición central de
los datos, una vez que éstos han sido ordenados
de manera creciente.
– Si el número de observaciones es par, se calcula
como el promedio aritmético de las dos
observaciones centrales, una vez que éstos han
sido ordenados de manera creciente.
65
Determinación de la Mediana (1)
Cuando el número de datos es IMPAR
Orden Observación
1º 200
2º 200 Mediana = x%= x n +1
3º 200 2
4º 200
Orden de la mediana: 5º
5º 400
Valor que ocupa la posición central
6º 450
7º 650 Me = 400
8º 800 Media = 1000
66
9º 5900 Moda = 200
Determinación de la Mediana (2)
Cuando el número de datos es PAR
Orden Observación
1º 200 xn + xn
+1
2º 200 x%= 2 2
3º 200
2
4º 400 Orden de la mediana:
5º 450 Entre el 4º y 5º
6º 650
Mediana = Promedio de los
7º 800 valores centrales
8º 5900 Me = (400+450)/2 = 425
67 Media = 1100
Propiedades de la Mediana
68
Moda
• Definición:
– Es el valor de las observaciones que aparece con
mayor frecuencia
• Propiedades de la Moda:
– Se puede determinar tanto para datos numéricos
como para datos no numéricos
– No se ve afectada por datos apartados o valores
extremos
– La moda puede o no existir; cuando existe,
puede no ser única
69
Dificultades de la Moda
Conjunto pequeño de datos
Media = 5,42
Moda = 10
Mediana = 5,5
Desviación estándar = 3,3
0 1 2 3 4 5 6 7 8 9 10
30
percentage
20
10 Número de calzado
0
34 36 38 40 42 44 46
Calzado
Antigüedad en la
20
15
empresa
10
5
0
0 5 10 15 20 25 30 35 40 45 50
ANTIG
71
Medidas de Posición
Cuartiles y Percentiles
Valor Z
Gráfico de caja
Interpretación de los cuartiles
Se forman cuatro grupos con igual cantidad de datos
La cuarta parte de La mitad de los datos Tres cuartas partes de
los datos asume (dos cuartos) asume los datos asume valores
valores iguales o valores iguales o iguales o inferiores a 7,8
inferiores a 2,2 inferiores a 3,6
Q2 = Me = 3,6 Q3 = 7,8
Q1 = 2,2
Rango Intercuartil: RI = Q3 – Q1
xmín = 1,1 xmáx = 9,9
0 1 2 3 4 5 6 7 8 9 10
73 Escala graduada de la variable en estudio
Interpretación de los percentiles
Se forman cien grupos con igual cantidad de datos
El 25% de los datos El 50% de los datos (la El 75% de los datos son
son iguales o mitad) son iguales o iguales o inferiores a
inferiores a 2,2 inferiores a 3,6 7,8
0 1 2 3 4 5 6 7 8 9 10
74 Escala graduada de la variable en estudio
Para pensar ...
El cuartil inferior, ¿puede resultar igual a la mediana?
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
1 5 5 5 5 5 5 5 7 9
El percentil 20, ¿puede resultar mayor que el cuartil
superior?
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
1 9 7 5 7 7 5 5 5 5
1 5 5 5 5 5 7 7 7 9
Sofía Puertas
75
Valor Z
• Describe la posición de un valor individual de la
variable en estudio, respecto de la media del
grupo al cual pertenece.
• Indica a qué distancia de la media del grupo se
encuentra, sea por encima (signo positivo) o
por debajo de la misma (signo negativo),
medida en unidades de desviación estándar.
• Fórmula de cálculo:
x−μ
z= Valor z (población)
σ
xz == μx −+ xz ⋅ σ Valor z (muestra)
76
S
Interpretación del Valor Z
• Un valor Z negativo
– indica que la observación está por debajo de la
media
• Un valor Z positivo
– indica que la observación está por encima de la
media
• Un valor Z igual a cero x−μ
z=
– ¿qué indica?
σ
x−x
z=
77 S
Transformación X Æ Y
x L M A G
-3 -2 -1 0 1 2 3 4 5
μX = 2
y = x+1 L M A G
y = (x – Media)
L
-3 -2 -1 M
0 A1 G
2 3 4 5
μY = μX+1
-3 -2 -1 0 1 2 3σY =4σX 5
μY = 0
78
σY = σX
Transformación X Æ W
x L M A G
-3 -2 -1 0 1 2 3 4 5
μX = 2
σX = 2,16
w = (x / constante)
constante = 2
L MAG
-3 -2 -1 0 1 2 3 4 5
μW = μX / constante = 1
79
σW = σX / constante = 1,08
Transformación X Æ Z
y = (x – Media)
x L M A G
L M A G
-3 -2 -1 0 1 2 3 4 5
-3 -2 -1 0 1 μ =2 2 3 4 5
X
μY = 0 σY = σX = 2,16
σX = 2,16
z y==(x
y (x –Media)
Media)/ sigma
/–constante
constante = sigma
L L M MA G
A G
-3 -2 -1 0 1 2 3 4 5
-3 -2 -1 0 1 2 3 4 5
μYμZ==0 μ
0Y / sigma = 0
80
σσY Z==σσ
1Y / sigma = 1
X
Ilustración
0 1 2 3 4 5 6 7 8 9 10 11 12
Variable Numérica
Datos No Apartados
83
Construcción del Gráfico de Caja
Primer dato no apartado por debajo de la REF 3
Q1 Q3
REF1 = Q1 – 3 RI xmín xmáx
REF2 = Q1 – 1,5 RI
REF3 = Q3 + 1,5 RI
REF4 = Q3 + 3 RI
+ +
REF1 REF2 REF3 REF4
anómalos atípicos atípicos anómalos
Q2=Me
0 1 2 3 4 5 6 7 8 9 10 11 12
Variable Numérica
Datos No Apartados
84