Está en la página 1de 87

ESTADÍSTICA

UNIDIMENSIONAL
Apuntes de introducción a la estadística unidimensional:
Variables estadísticas unidimensionales. Variables cualitativas
y cuantitativas discretas. Variables cuantitativas continuas.
Medidas de localización: media, moda y mediana. Los
cuantiles. Medidas de dispersión: rango, desviación típica y
varianza. Coeficiente de variación.

Adrián Martín Dinnbier


geogebra.org/u/adrianmartin
¿Cuándo empezó la estadística?

La Estadística actual es el resultado de la unión de dos disciplinas que


evolucionaron de forma independiente hasta confluir en el siglo XIX
El Cálculo de Probabilidades La “Estadística”, o ciencia del Estado

Que nació en el siglo XVII como Desde la antigüedad los Estados han recogido
la teoría matemática de los datos sobre sus habitantes con el objetivo
juegos de azar. principal de recaudar impuestos y tributos, y
reclutar jóvenes para el ejército.

Babilonia, Imperio romano, Carlomagno…


España lleva a cabo uno de los primeros censos
de población en el siglo XVI en Perú.
¿Cuándo empezó la estadística?

La interacción de ambas líneas de pensamiento da lugar a la ciencia


que estudia cómo obtener conclusiones de la investigación
empírica mediante el uso de modelos matemáticos

Es transversal a una amplia variedad de disciplinas, desde


la física hasta las ciencias sociales, desde las ciencias de la
salud hasta el control de calidad.

Sociología
Medicina
Ingeniería
Social Media
Psicología
Marketing/Publicidad
El impulso fundamental para la aparición de la Estadística
fue la necesidad de estimar cantidades desconocidas a
partir de muestras.

Población
Muestra
Estadística para predecir resultados electorales
En 1936 en las 38.º elecciones presidenciales de EEUU se
presentaban a las elecciones dos candidatos:

Franklin Delano Roosevelt Alf Landon


(Demócrata) (Republicano)
Estadística para predecir resultados
electorales
En el censo de 1930 Estados Unidos tenía
122.175.446 habitantes.
En 1936, el "Literary Digest" utilizó una
muestra significativa de 2,3 millones de
"votantes", con la cual habían determinado
que la población norteamericana tendía a
simpatizar con el Partido Republicano.
Para escoger su muestra se basó en
direcciones de abonados al teléfono, listas
de propietarios de automóviles y clubs de
campo.
Les enviaron papeletas a sus casas para
que quienes quisieran respondieran a la
“falsa” votación
Estadística para predecir
resultados electorales
Es decir encuestaron a 2,3
millones de votantes y observaron
que el Partido Republicano era
mayoritariamente preferido por la
muestra. Y por eso dedujeron que
también lo sería en todo el país.

Una semana antes del día de las elecciones presidenciales, se


informaba que Alf Landon del Partido Republicano era, de lejos,
mucho más popular que Franklin D. Roosevelt del Partido
Demócrata
Estadística para predecir resultados
electorales

George Gallup fue un periodista,


matemático y estadístico
estadounidense. También tenía interés
por los resultados de la elecciones.
George Gallup. Gallup realizó una encuesta mucho más
pequeña.
Gallup decidió encuestar sólo 5000
personas y predijo una victoria
arrolladora de Roosevelt
Estadística para predecir
resultados electorales

Los resultados, tal y como había


predicho Gallup dieron un aplastante
triunfo a Roosvelt.
PREDICCIONES

¿Porqué la predicción de “Literary Digest” pese a


utilizar una muestra más grande fue equivocada?

¿No debería ser mejor la predicción cuanto más


grande fuera la muestra?
Estadística para predecir resultados
electorales
¿Porqué la predicción de “Literary Digest” pese a utilizar una muestra
más grande fue equivocada?

La muestra del “Literay Digest” no era


representativa por diferentes razones,
principalmente:
El “Literary Digest” utilizaba
listados telefónicos y de
propietarios de
automóviles. Eso ya
Gallup realizó una encuesta
suponía no utilizar un
mucho más pequeña, pero con
proceso aleatorio para
mejores bases científicas,
seleccionar a los
utilizando muestras demográficas
encuestados. Su muestra
representativas
no era representativa.
Estadística para predecir resultados
electorales
En 1936 EEUU atravesaba una
compleja crísis con el reciente crack del
29

Los propietarios de coches, usuarios de


teléfono y miembros de clubes de
campo eran gente rica. Y la gente rica
vota mayoritariamente al partido
Republicano.

El sistema se basaba en la voluntad del votante para rellenar y


enviar el voto a la revista. Esto no ocurrió en muchos de los
votantes de Roosvelt que seguramente por la imagen que tenían
de la revista optaron por no participar en el proceso
CONCLUSIONES ERRÓNEAS

¿Se te ocurre otro caso de predicción errónea?


Inventa un caso en que la elección de la muestra
para un estudio nos conduzca a conclusiones
erróneas
Población y muestras estadísticas
Una población es el conjunto de todos los
elementos o individuos sobre las que se va a
realizar un estudio estadístico.

En muchas ocasiones no es posible


analizar estadísticamente toda la
población, ya que costaría mucho
tiempo, esfuerzo y dinero. Por ello el
estudio se realiza sobre una parte de la
población, llamada muestra estadística.
Población y muestras estadísticas
Una muestra representativa, es un subconjunto de la
población que represente bien todas sus
características, para realizar el estudio estadístico
cuyos resultados se extrapolan a toda la población

La muestra del “Literay Digest” no era representativa

La selección de la muestra en la población es un paso


crítico ya que una elección no adecuada implica que los
resultados no serán válidos para la población.
Población y muestras estadísticas
• Para que una muestra sea útil para realizar un estudio estadístico,
debe ser representativa de la población.
• Por ejemplo, supongamos que tenemos un barril con 1000
judías. Algunas judías son negras, otras son blancas.
• Supongamos que tomamos una muestra de 100 judías del barril,
y que 50 son blancas y 50 son negras.
• Podemos inferir de forma inductiva que la mitad de las judías en
el barril (en otras palabras, 500) son negras y la otra mitad
blancas. Pero todo razonamiento inductivo depende de la
similaridad entre la muestra y la población. Cuanto más se
asemeje la muestra a la población como un todo, más fiable será
la inferencia inductiva.
• Y para ello estudiaremos más adelante que la forma de escoger
la muestra es determinante para que esta sea representativa.
Población y muestras estadísticas
• El uso de las muestras estadísticas es necesario
por…
• LA IMPOSIBILIDAD DE ANALIZAR: Si la
población es muy grande (en ocasiones, infinita,
como ocurre en determinados experimentos
aleatorios) es imposible de analizar en su
totalidad.
• LA VARIACIÓN: Las características de la
población varían si el estudio se prolonga
demasiado tiempo.
• LA REDUCCIÓN DE GASTOS: Al estudiar una
pequeña parte de la población, los gastos de
recogida y tratamiento de los datos serán
menores que si los obtenemos del total de la
población.
Población y muestras estadísticas
• LA VELOCIDAD: Al reducir el tiempo de recogida y tratamiento
de los datos, se consigue mayor rapidez.
• LA MAYOR COMPLEJIDAD DE LOS ESTUDIOS: La elección
de una muestra permite la realización de estudios que serían
imposible hacerlo sobre el total de la población.
• LOS PROCESOS DESTRUCTIVOS: El proceso de estudio es
destructivo o es necesario consumir un artículo para extraer la
muestra (ejemplos: vida media de una bombilla, carga soportada
por una cuerda, precisión de un proyectil, etc.)
Caracteres y variables estadísticos
• Un carácter estadístico es cualquier aspecto o propiedad
que se puede estudiar en una población y que permite
clasificar a los individuos o elementos de la misma.
• Puede ser:
• Cuantitativo: si se puede medir y expresar con un número
• Cualitativo: si no se puede medir

Cualitativos Cuantitativos

• Color de Pelo • Número de


• Música preferida hermanos
• Deporte • Estatura (cm)
practicado • Peso (kg)
Caracteres y variables estadísticos
• Una modalidad es cada uno de los valores que puede
tomar un carácter estadístico cualitativo.
• Una variable estadística es el conjunto de valores x1, x2,
x3, x4…,xn que toma un carácter estadístico cuantitativo.
Puede ser:
• Discreta: si toma valores aislados.
• Continua: si toma todos los valores posibles de un intervalo.
Caracteres y variables estadísticos

EJERCICIO

• Color de pelo: moreno, rubio, castaño, pelirrojo… (variable cualitativa)


• Música preferida: rock, pop, hip-hop, heavy… (variable cualitativa)
• Deporte practicado: fútbol, baloncesto, tenis, natación,
gimnasia, yudo… (variable cualitativa)
• Número de hermanos: 0, 1, 2, 3 (variable discreta)
• Estatura (cm): 175; 177,3; 164,9… (variable continua)
• Peso (kg): 57,8; 52, 7; 61,7; 65,1… (variable continua)
EJERCICIO

Clasifica los siguientes caracteres y en su caso, di de qué tipo son


sus variables asociadas:
a) Número de pétalos de una flor
b) Lugar de nacimiento de los jugadores de un equipo de baloncesto
c) Peso de los residuos producidos en las viviendas de una ciudad.
d) Número de DVD vendidos en una gran superficie.
e) Temperaturas registradas en un observatorio cada hora
f) Actividades preferidas para los fines de semana de un grupo de jóvenes
entre 14 y 16 años.
Caracteres y variables estadísticos
Clasifica las variables estadísticas asociadas a los
siguientes caracteres:
a) Número de notables en las notas
b) Profesión de la madre
c) Nivel de colesterol de la sangre
d) Edad del hermano mayor
• Cuantitativo discreto
• Cualitativo
• Cuantitativo Continuo
• Cuantitativo discreto
FRECUENCIA ABSOLUTA

Al número de veces que cada Xi fi


valor o modalidad xi aparece en Rojo 6
la muestra se le denomina Verde 8
frecuencia absoluta de dicho Azul 7
valor o modalidad y se escribe fi Amarillo 5
Imagina que hemos clasificado los
coches de un garage atendiendo a Turquesa 4
los colores
Total 30
FRECUENCIA RELATIVA

Al resultado de dividir la frecuencia Xi fi


absoluta de cada valor posible xi de Rojo 6
la variable por el número total de Verde 8
elementos de la muestra se le llama
frecuencia relativa xi Azul 7
Amarillo 5
𝑓"
ℎ" = Turquesa 4
𝑛
Total 30
REPRESENTACIÓN GRÁFICA DE VARIABLES CUALITATIVAS

Xi fi
La representación gráfica de una
variable cualitativa puede hacerse Rojo 6
mediante un diagrama de barras o Verde 8
por medio de un gráfico de sectores Azul 7
Amarillo 5
𝑓"
ℎ" = Turquesa 4
𝑛
Total 30
EJERCICIO

El número de consultas al dentista de un grupo de


alumnos en el último año ha sido:

a)Efectúa el recuento
b)Calcula las frecuencias absolutas y relativas.
Gráfico de sectores
La representación gráfica de una variable cualitativa suele
hacerse mediante un diagrama de barras o por medio de
un gráfico.

El diagrama de sectores puede aplicarse a cualquier tipo de variable,


aunque es el más adecuado en variables cualitativas y para una
primera toma de contacto con los valores de una población.

Es un círculo dividido en sectores de ángulo proporcional a la frecuencia


de cada valor
DIAGRAMA DE SECTORES

La amplitud de cada
sector es
directamente
proporcional a su
frecuencia absoluta
DIAGRAMA DE
SECTORES
Aunque podría ser
irregular, un diagrama de
sectores suele construirse
con sectores circulares
uniformes con centro en el
centro de la circunferencia
y el arco correspondiente
Imagina que hemos clasificado los coches de un garage
atendiendo a los colores
Sabemos que la amplitud de
Xi fi fi/30 cada sector es directamente
Rojo 6 0,2 proporcional a su frecuencia
Verde 8 0,21 absoluta
Azul 7 0,15
Amarillo 5 0,33 ¿Cómo construirías el
diagrama de sectores
Turquesa 4 0,11 atendiendo a estas
Total 30 1 frecuencias?
FRECUENCIA ABSOLUTA ACUMULADA

𝐹" La frecuencia absoluta acumulada de xi se define como el número


de veces que aparece en la muestra un valor igual o inferior a dicho
valor

¿Cuánto valdrá
siempre la última
Xi fi fi/30 Fi de las frecuencias
absolutas
Turquesa 4 0,11 4 acumuladas?

Amarillo 5 0,33 9

Rojo 6 0,2 15
Azul 7 0,15 22
Verde 8 0,21 30
FRECUENCIA ABSOLUTA ACUMULADA

"

𝐹" = 𝑓' + 𝑓) +… +𝑓" = * 𝑓+


+,'

𝑖 = 1, 2, … , 𝑘 𝐹- = 𝑛 ¿Cuánto valdrá siempre la


última de las frecuencias
absolutas acumuladas?
Diagrama de sectores

Xi fi fi/30 Rojo
Rojo 6 0,20
Verde 8 0,21
Verde
Azul 7 0,15 Azul
Amarillo 5 0,33
Turquesa 4 0,11
Total 30 1

𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑠𝑒𝑐𝑡𝑜𝑟


=
𝑛º 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 360C
Diagrama de sectores
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑠𝑒𝑐𝑡𝑜𝑟
=
𝑛º 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 360C

39,6º Si de la ecuación anterior despejamos los


72º
grados del sector, vemos que es igual a la
frecuencia relativa (frecuencia/nº total de
54º datos) multiplicado por 360
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
118,8º 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑠𝑒𝑐𝑡𝑜𝑟 = D 360
75,6º 𝑛º 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠

Xi fi fi/30 º de cada sector


Rojo 6 0,20 0,20x360=72º
Verde 8 0,21 0,21x360=75,6º
Azul 7 0,15 0,15x360=54º
Amarillo 5 0,33 0,33x360=118,8º
Turquesa 4 0,11 0,11x360=39,6º
Total 30 1 360º
Diagramas de sectores
EJERCICIO
Los datos siguientes corresponden a una encuesta de
deportes en un curso de un colegio. Representa los
datos siguientes en un diagrama de sectores y calcula
el ángulo que le corresponde a cada parte.

Xi fi fi relativa ángulo de cada sector


Fútbol 35
Baloncesto 18
Tenis 4
Balonmano 14
Patinaje 6
Voley 5
FRECUENCIA RELATIVA ACUMULADA

Dividiendo la Fi entre el número total de datos de


la muestra se obtiene la frecuencia relativa
acumulada.
FRECUENCIA RELATIVA ACUMULADA

Dividiendo la Fi entre el número total de datos de la


muestra se obtiene la frecuencia relativa acumulada.

FG
𝐻" = ℎ' + ℎ) +… +ℎ" =
H
𝑖 = 1, 2, … , 𝑘 𝐻- = 1
EJERCICIO
En el ejercicio de los coches calcula el valor
de la frecuencia relativa acumulada

Xi fi fi/30 Fi Hi

Turquesa 4 0,11 4 0,13

Amarillo 5 0,33 9 0,3


Rojo 6 0,2 15 0,5
Azul 7 0,15 22 0,73
Verde 8 0,21 30 1

¿Cuánto valdrá siempre la última de las frecuencias relativas


acumuladas?
Diagrama de barras
Los datos de variables cuantitativas discretas para
alguna de las frecuencias calculadas se
representan con diagramas de baras y se
completan con el polígono de frecuencias
Frecuencias
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8
Pag 237 Ej 2
Pag 237 Ej 2
Pag 239 Ej 6
Pag 239 Ej 6
PARÁMETROS DE CENTRALIZACIÓN

Se denominan parámetros de centralización los


valores que resumen una distribución estadística y
que tienden a situarse hacia el centro del conjunto
de los datos.

Los más importantes son la media aritmética, la


moda y la mediana.
Media aritmética
Media aritmética de una variable estadística X, es el cociente
entre la suma de todos lo valores de la variable y el número de
estos.

Si la variable X toma los valores xi con


frecuencias fi la media aritmética será:

x1 ⋅ f1 + x 2 ⋅ f 2 + ...+ x n ⋅ f n
x=
f1 + f 2 + ...+ f n
Ejemplo

x1 ⋅ f1 + x 2 ⋅ f 2 + ...+ x n ⋅ f n
x=
f1 + f 2 + ...+ f n
0 ⋅1+1⋅ 2 + 2 ⋅ 3+ 3⋅ 2 + 4 ⋅ 3+ 5⋅ 6 + 6 ⋅ 5 + 7 ⋅ 6 + 8⋅ 3+ 9 ⋅ 2 +10 ⋅1
x=
1+ 2 + 3+ 2 + 3+ 6 + 5 + 6 + 3+ 2 +1


Moda de una variable estadística

La moda de una variable estadística es el valor de la variable


que tiene mayor frecuencia absoluta. Se representa por Mo

La moda es el valor que más se repite


Parámetros estadísticos
En la tabla se recogen las edades de los miembros de una
asociación juvenil.
Edad (años), xi 12 13 14 15 16 17 18 19
Nº de jóvenes, fi 2 6 8 7 5 3 2 1

La edad media del grupo viene determinada por la media aritmética.


12 ⋅ 2 +13⋅ 6 +14 ⋅ 8 +15⋅ 7 +16 ⋅ 5 +17 ⋅ 3+18⋅ 2 +19 ⋅1 505
x= = = 14,85
2 + 6 + 8 + 7 + 5 + 3+1 34

La moda es el valor de la variable edad que tiene mayor frecuencia


absoluta. Por tanto la moda es:
M 0 = 14 años
Mediana
La mediana de una variable estadística es el valor de la variable tal que que el número
de valores menores que él es igual al número de valores mayores que él. Se representa
por M.
LOS CUANTILES
Los cuantiles son puntos tomados a intervalos regulares de
la función de distribución de una variable aleatoria.
Los cuantiles suelen usarse por grupos que dividen la
distribución en partes iguales; entendidas estas como
intervalos que comprenden la misma proporción de
valores. Los más usados son:
Los cuartiles, que dividen a la distribución en cuatro partes (corresponden a los
cuantiles 0,25; 0,50 y 0,75);

Los deciles, que dividen a la distribución en diez partes;

Los percentiles, que dividen a la distribución en cien partes.


CUARTILES

Los cuartiles de una variable estadística son tres valores de la variable


que dividen los datos en cuatro partes iguales.
§ El primer cuartil, Q1, deja a su izquierda la cuarta parte de
los datos.
§ El segundo cuartil, Q2, coincide con la mediana: Q2=M
§ El tercer cuartil, Q3, deja a su izquierda las tres cuartas
partes de los datos.
Cuartiles
Ejemplo

Hallemos los cuartiles de la distribución de edades


del ejemplo. (tabla de la derecha)

Para seleccionar el
𝑄'
Tomamos el valor cuya 𝐹" > 25% 𝑑𝑒 𝑁
Cuartiles
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
12 12 13 13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 16 16 16 16 16 17 17 17 18 18 19

34
𝑄' = = 8,5
4
EDAD
Nº DE JÓVENES
(AÑOS)

xi fi Fi
25% 𝑑𝑒 34 𝑒𝑠 8,5
12 2 2
¿Qué valor deja al menos un 25% de
13 6 8
valores a la izquierda?
14 8 16
Redondeando sería el noveno valor por la
izquierda. En este caso el 14. 15 7 23

75 16 5 28
𝑄) = D 34 = 25,5 17 3 31
100 18 2 33
Redondeando sería el vigésimo sexto (26). 19 1 34
El valor que buscamos es el 28 que es >26
Considera la siguiente distribución de
Pag 241 Ej 10 frecuencias de una variable cuantitativa
discreta.
MEDIDAS DE
DISPERSIÓN
Considera la siguiente tabla donde se expresa la vida de dos marcas
de baterías de coche diferentes.

¿Qué batería comprarías?


Calcula la media, mediana y moda.

¿Qué batería comprarías ahora?

¿Resultan útiles la moda, la media y la mediana para comparar?


¿Resultan útiles la moda, la media y la mediana para
comparar?
BRAND X
9,00

8,00
¿Porqué no resultan
7,00 útiles en este caso los
6,00
medidas de localización?
5,00

4,00

3,00

2,00

1,00

0,00
0 5 10 15 20 25 30 35

BRAND Y
8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
0,00
0 5 10 15 20 25 30 35
MEDIDAS DE DISPERSIÓN

Como has comprobado en el ejemplo de las baterías, las


medidas de localización proporcionan información útil
pero no describen completamente una muestra
Por este motivo es necesario introducir otras medidas
que proporcionen información sobre la dispersión que
representan los datos respecto a los valores centrales.
El rango
• Los parámetros o medidas de dispersión miden la
separación de los datos de una distribución respecto de
su media.
• Los más importantes son el rango o recorrido, la varianza
y la desviación típica.

El rango o recorrido de una distribución es la


diferencia entre el mayor y el menor valor de la
variable estadística.
El rango
Las notas de matemáticas de Vanesa e Iván fueron:
Vanesa: 6, 7, 6, 5, 6, 6, 7, 5.
Iván: 2, 10, 10, 2, 2, 2, 10, 10.

6 + 7+ 6 + 5+ 6 + 6 + 7+ 5 2 +10 +10 + 2 + 2 + 2 +10 +10


x= =6 x= =6
8 8

xVanesa = 6 xIván = 6
RangoIván = 10 − 2 = 8
𝑅𝑎𝑛𝑔𝑜RSHTUS = 7 − 5 = 2

Los dos han obtenido la misma nota media, pero mientras que Vanesa ha sido muy
regular, Iván ha realizado un curso con algunas notas muy buenas y otras muy
malas.

CONCLUSIÓN: las notas de Vanesa, cuyo rango es 7-5=2, son menos


dispersas que las de Iván cuyo rango es 10-2=8
El rango
• Gráficamente lo podemos
ver así:
• Observa que las notas de Iván
aparecen en azul y las de
Vanesa en rojo.
• La media está marcada con una
línea verde
El rango
Si los datos están agrupados en clases, el rango se calcula como
diferencia entre el extremo superior del último intervalo y el extremo
inferior del primero.

Las tallas en centímetros de los 64 alumnos


varones de 1º de Bachillerato de un instituto
se resumen en la tabla de la derecha.

El rango de la distribución sería:


200 −150 = 50cm
Rango intercuartílico
Debe observarse que el rango no proporciona información
acerca de la forma en que se distribuyen los valores entre
sus valores máximo y mínimo.

Para ello se consider el rango intercuartílico

𝑅𝐼𝐶 = 𝑄Y − 𝑄'
La desviación típica
Las diferencias entre cada valor de la variable, xi,
y la media aritmética, x , se llaman desviaciones
respecto de la media, di

di = xi − x

¿La suma de las desviaciones de cada valor de la


variable sería un buen parámetro para medir la
dispersión?
Desviación respecto de la media
¿La suma de las desviaciones de cada
valor de la variable sería un buen
Valores (xi) Desviación (xi-x)
parámetro para medir la dispersión?
6 6-6=0
Notas de Vanesa: 7 7-6=1
6, 7, 6, 5, 6, 6, 7, 5 6 6-6=0
5 5-6=-1
6 + 7+ 6 + 5+ 6 + 6 + 7+ 5 6 6-6=0
x= =6
8 6 6-6=0
7 7-6=1
5 5-6=-1
Observa que la suma de las
desviaciones respecto de la 48 0
media es cero por lo que no es un
buen parámetro para medir la
dispersión.
Desviación respecto de la media
Valores (xi) Desviación (xi-x)

6 6-6=0
7 7-6=1
6 6-6=0
5 5-6=-1
6 6-6=0
6 6-6=0
7 7-6=1
5 5-6=-1
48 0
Desviación absoluta media
Se llama desviación absoluta media respecto a la media
muestral
𝑥̅
Y se representa por 𝐷]̅
A la media aritmética de los valores absolutos de las
diferencias entre los valores de
𝑥 𝑥̅ y

H
1
𝐷]̅ = * 𝑓" 𝑥" − 𝑥̅
𝑛
",'
Desviación absoluta media
Cuanto mayor es la desviación media más
Valores
(xi)
Desviación (xi-x) dispersos o menos concentrados están los
6 6-6=0 datos.
7 7-6=1 La desviación absoluta media no
6 6-6=0
tiene buenas propiedades
5 5-6=-1
6 6-6=0 algebraicas por lo que
6 6-6=0 habitualmente para medir la
7 7-6=1 variabilidad de los datos se utilizan la
5 5-6=-1 varianza y la desviación típica.
48 0

H
1 4D 6−6 −2 5−6 +2 7−6 =
𝐷]̅ = * 𝑓" 𝑥" − 𝑥̅ =
𝑛 8
",'
4 1
= =
8 2
Desviación absoluta media

(ESTADÍSTICA. MARIO F. TRIOLA)


Parámetros de dispersión: la Varianza
Una alternativa al valor absoluto es emplear el cuadrado
que sí que es una operación algebraica.

La varianza de una variable


- estadística es la media de los
)
1 ) cuadrados de las desviaciones
𝑆 = * 𝑓" 𝑥" − 𝑥̅
𝑛 de los datos respecto a la
",'
media.

-
1
𝑆 = * 𝑓" 𝑥" ) − 𝑥̅ )
)
𝑛
",'
Parámetros de dispersión: Desviación típica
Con respecto a los datos obtenidos, la varianza emplea
unidades cuadráticas. Parece adecuado entonces utilizar
una medida que emplee las unidades de los propios datos.

- La desviación típica es
1 ) la raíz cuadrada positiva
𝑆= * 𝑓" 𝑥" − 𝑥̅
𝑛 de la varianza
",'
El coeficiente de variación (solo para variables positivas)
Debe observarse que el rango no proporciona información
acerca de la forma en que se distribuyen los valores entre
sus valores máximo y mínimo.

El coeficiente de variación es adimensional.

𝑠
𝐶𝑉 =
𝑥̅
Parámetros de dispersión: Desviación típica
El entrenador de un equipo de baloncesto tiene datos recogidos de sus
jugadores. Al final de un partido crucial tiene que decidir a cuál de ellos
sacar.

¿Cómo puede decidir el entrenador a quién sacar?

% TIROS DE CAMPO EN LOS ÚLTIMOS 10 PARTIDOS

Ana 36 41 43 39 45 27 40 37 31 28
Patricia 36 39 36 38 35 37 35 36 38 34
Morgan 34 41 38 37 48 19 33 43 21 44
Paula 34 35 33 35 33 34 33 35 34 33
Estrella 41 33 39 36 38 36 29 34 38 39
% TIROS DE CAMPO EN LOS ÚLTIMOS 10 PARTIDOS

Ana 36 41 43 39 45 27 40 37 31 28

Patricia 36 39 36 38 35 37 35 36 38 34

Morgan 34 41 38 37 48 19 33 43 21 44

Paula 34 35 33 35 33 34 33 35 34 33

Estrella 41 33 39 36 38 36 29 34 38 39

¿Qué jugador parece ser más regular?


a) Analiza los datos de Paula usando una tabla como la que te mostramos.
Determina la media de los datos, 𝑥,̅ para Paula y completa el resto de la
tabla:
𝑥̅ =33,9
Cuadrado de la desviación
% de campo de Paula (%) Desviación (𝑥 − 𝑥)̅
(𝑥 − 𝑥)̅ )
34
35
33
35
33
34
33
35
34
33
VARIANZA: Media de los cuadrados de las desviaciones
DESVIACIÓN TÍPICA: Raíz de la media de los
cuadrados de las desviaciones
Paula

(𝑥 − 𝑥)̅ (𝑥 − 𝑥)̅ )
Ana

(𝑥 − 𝑥)̅ (𝑥 − 𝑥)̅ )
De una muestra de 100 hogares, seleccionados
Pag 251 Ej 32 aleatoriamente en una ciudad pequeña, se contabiliza el
número de personas empleadas. Los datos se recogen
agrupados en Ia tabla siguiente
Pag 251 Ej 32
Pag 251 Ej 32
Pag 251 Ej 32
Pag 251 Ej 33

También podría gustarte