Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDIMENSIONAL
Apuntes de introducción a la estadística unidimensional:
Variables estadísticas unidimensionales. Variables cualitativas
y cuantitativas discretas. Variables cuantitativas continuas.
Medidas de localización: media, moda y mediana. Los
cuantiles. Medidas de dispersión: rango, desviación típica y
varianza. Coeficiente de variación.
Que nació en el siglo XVII como Desde la antigüedad los Estados han recogido
la teoría matemática de los datos sobre sus habitantes con el objetivo
juegos de azar. principal de recaudar impuestos y tributos, y
reclutar jóvenes para el ejército.
Sociología
Medicina
Ingeniería
Social Media
Psicología
Marketing/Publicidad
El impulso fundamental para la aparición de la Estadística
fue la necesidad de estimar cantidades desconocidas a
partir de muestras.
Población
Muestra
Estadística para predecir resultados electorales
En 1936 en las 38.º elecciones presidenciales de EEUU se
presentaban a las elecciones dos candidatos:
Cualitativos Cuantitativos
EJERCICIO
Xi fi
La representación gráfica de una
variable cualitativa puede hacerse Rojo 6
mediante un diagrama de barras o Verde 8
por medio de un gráfico de sectores Azul 7
Amarillo 5
𝑓"
ℎ" = Turquesa 4
𝑛
Total 30
EJERCICIO
a)Efectúa el recuento
b)Calcula las frecuencias absolutas y relativas.
Gráfico de sectores
La representación gráfica de una variable cualitativa suele
hacerse mediante un diagrama de barras o por medio de
un gráfico.
La amplitud de cada
sector es
directamente
proporcional a su
frecuencia absoluta
DIAGRAMA DE
SECTORES
Aunque podría ser
irregular, un diagrama de
sectores suele construirse
con sectores circulares
uniformes con centro en el
centro de la circunferencia
y el arco correspondiente
Imagina que hemos clasificado los coches de un garage
atendiendo a los colores
Sabemos que la amplitud de
Xi fi fi/30 cada sector es directamente
Rojo 6 0,2 proporcional a su frecuencia
Verde 8 0,21 absoluta
Azul 7 0,15
Amarillo 5 0,33 ¿Cómo construirías el
diagrama de sectores
Turquesa 4 0,11 atendiendo a estas
Total 30 1 frecuencias?
FRECUENCIA ABSOLUTA ACUMULADA
¿Cuánto valdrá
siempre la última
Xi fi fi/30 Fi de las frecuencias
absolutas
Turquesa 4 0,11 4 acumuladas?
Amarillo 5 0,33 9
Rojo 6 0,2 15
Azul 7 0,15 22
Verde 8 0,21 30
FRECUENCIA ABSOLUTA ACUMULADA
"
Xi fi fi/30 Rojo
Rojo 6 0,20
Verde 8 0,21
Verde
Azul 7 0,15 Azul
Amarillo 5 0,33
Turquesa 4 0,11
Total 30 1
FG
𝐻" = ℎ' + ℎ) +… +ℎ" =
H
𝑖 = 1, 2, … , 𝑘 𝐻- = 1
EJERCICIO
En el ejercicio de los coches calcula el valor
de la frecuencia relativa acumulada
Xi fi fi/30 Fi Hi
x1 ⋅ f1 + x 2 ⋅ f 2 + ...+ x n ⋅ f n
x=
f1 + f 2 + ...+ f n
Ejemplo
x1 ⋅ f1 + x 2 ⋅ f 2 + ...+ x n ⋅ f n
x=
f1 + f 2 + ...+ f n
0 ⋅1+1⋅ 2 + 2 ⋅ 3+ 3⋅ 2 + 4 ⋅ 3+ 5⋅ 6 + 6 ⋅ 5 + 7 ⋅ 6 + 8⋅ 3+ 9 ⋅ 2 +10 ⋅1
x=
1+ 2 + 3+ 2 + 3+ 6 + 5 + 6 + 3+ 2 +1
€
Moda de una variable estadística
Para seleccionar el
𝑄'
Tomamos el valor cuya 𝐹" > 25% 𝑑𝑒 𝑁
Cuartiles
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
12 12 13 13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 16 16 16 16 16 17 17 17 18 18 19
34
𝑄' = = 8,5
4
EDAD
Nº DE JÓVENES
(AÑOS)
xi fi Fi
25% 𝑑𝑒 34 𝑒𝑠 8,5
12 2 2
¿Qué valor deja al menos un 25% de
13 6 8
valores a la izquierda?
14 8 16
Redondeando sería el noveno valor por la
izquierda. En este caso el 14. 15 7 23
75 16 5 28
𝑄) = D 34 = 25,5 17 3 31
100 18 2 33
Redondeando sería el vigésimo sexto (26). 19 1 34
El valor que buscamos es el 28 que es >26
Considera la siguiente distribución de
Pag 241 Ej 10 frecuencias de una variable cuantitativa
discreta.
MEDIDAS DE
DISPERSIÓN
Considera la siguiente tabla donde se expresa la vida de dos marcas
de baterías de coche diferentes.
8,00
¿Porqué no resultan
7,00 útiles en este caso los
6,00
medidas de localización?
5,00
4,00
3,00
2,00
1,00
0,00
0 5 10 15 20 25 30 35
BRAND Y
8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
0,00
0 5 10 15 20 25 30 35
MEDIDAS DE DISPERSIÓN
xVanesa = 6 xIván = 6
RangoIván = 10 − 2 = 8
𝑅𝑎𝑛𝑔𝑜RSHTUS = 7 − 5 = 2
Los dos han obtenido la misma nota media, pero mientras que Vanesa ha sido muy
regular, Iván ha realizado un curso con algunas notas muy buenas y otras muy
malas.
𝑅𝐼𝐶 = 𝑄Y − 𝑄'
La desviación típica
Las diferencias entre cada valor de la variable, xi,
y la media aritmética, x , se llaman desviaciones
respecto de la media, di
di = xi − x
6 6-6=0
7 7-6=1
6 6-6=0
5 5-6=-1
6 6-6=0
6 6-6=0
7 7-6=1
5 5-6=-1
48 0
Desviación absoluta media
Se llama desviación absoluta media respecto a la media
muestral
𝑥̅
Y se representa por 𝐷]̅
A la media aritmética de los valores absolutos de las
diferencias entre los valores de
𝑥 𝑥̅ y
H
1
𝐷]̅ = * 𝑓" 𝑥" − 𝑥̅
𝑛
",'
Desviación absoluta media
Cuanto mayor es la desviación media más
Valores
(xi)
Desviación (xi-x) dispersos o menos concentrados están los
6 6-6=0 datos.
7 7-6=1 La desviación absoluta media no
6 6-6=0
tiene buenas propiedades
5 5-6=-1
6 6-6=0 algebraicas por lo que
6 6-6=0 habitualmente para medir la
7 7-6=1 variabilidad de los datos se utilizan la
5 5-6=-1 varianza y la desviación típica.
48 0
H
1 4D 6−6 −2 5−6 +2 7−6 =
𝐷]̅ = * 𝑓" 𝑥" − 𝑥̅ =
𝑛 8
",'
4 1
= =
8 2
Desviación absoluta media
-
1
𝑆 = * 𝑓" 𝑥" ) − 𝑥̅ )
)
𝑛
",'
Parámetros de dispersión: Desviación típica
Con respecto a los datos obtenidos, la varianza emplea
unidades cuadráticas. Parece adecuado entonces utilizar
una medida que emplee las unidades de los propios datos.
- La desviación típica es
1 ) la raíz cuadrada positiva
𝑆= * 𝑓" 𝑥" − 𝑥̅
𝑛 de la varianza
",'
El coeficiente de variación (solo para variables positivas)
Debe observarse que el rango no proporciona información
acerca de la forma en que se distribuyen los valores entre
sus valores máximo y mínimo.
𝑠
𝐶𝑉 =
𝑥̅
Parámetros de dispersión: Desviación típica
El entrenador de un equipo de baloncesto tiene datos recogidos de sus
jugadores. Al final de un partido crucial tiene que decidir a cuál de ellos
sacar.
Ana 36 41 43 39 45 27 40 37 31 28
Patricia 36 39 36 38 35 37 35 36 38 34
Morgan 34 41 38 37 48 19 33 43 21 44
Paula 34 35 33 35 33 34 33 35 34 33
Estrella 41 33 39 36 38 36 29 34 38 39
% TIROS DE CAMPO EN LOS ÚLTIMOS 10 PARTIDOS
Ana 36 41 43 39 45 27 40 37 31 28
Patricia 36 39 36 38 35 37 35 36 38 34
Morgan 34 41 38 37 48 19 33 43 21 44
Paula 34 35 33 35 33 34 33 35 34 33
Estrella 41 33 39 36 38 36 29 34 38 39
(𝑥 − 𝑥)̅ (𝑥 − 𝑥)̅ )
Ana
(𝑥 − 𝑥)̅ (𝑥 − 𝑥)̅ )
De una muestra de 100 hogares, seleccionados
Pag 251 Ej 32 aleatoriamente en una ciudad pequeña, se contabiliza el
número de personas empleadas. Los datos se recogen
agrupados en Ia tabla siguiente
Pag 251 Ej 32
Pag 251 Ej 32
Pag 251 Ej 32
Pag 251 Ej 33