Está en la página 1de 40

Lic.

Flor Norma Quiñonez Cuyubamba


MODA
 En la Tabla 2 se ve que la moda es mujer pero
que es 53%, ¿eso hace que la moda sea
representativa? ¿Sería mejor si la moda fuera
el 90%?
 ¿Para el caso de los resultados electorales es
representativa la moda?
MEDIANA
MEDIANA
 Ejemplo
 17,4,8,21,4
Ordenando
4,4,8,17,21 n=5
Nùmero impar de elementos- me=8
 17,4,8,21,4,15,13,9
Ordenando
 4,4,8,9,13,15,17,21 n=8

 Nùmero par de elementos - me=(9+13)/2


 me =11
 Para ver la calidad representativa de la
mediana se calcular el IQR. Veamos un
ejemplo:
 La media es mejor que la mediana en el
sentido que utiliza todos los valores para su
cálculo y la mediana utiliza las posiciones
para su cálculo.
 Pero la mediana siempre nos dice el valor a la
mitad de la distribución y la media lo hará si
es de calidad.
 Enfaticemos estas diferencias entre media y mediana, para
ello imaginemos que tenemos cinco grupos (A, B, C, D y E)
con 11 casos cada uno como se muestra en la Tabla 3.
RELACIÒN ENTRE LA MEDIA; MODA Y
MEDIANA
Simétrico o sesgo nulo Datos concentrados
Media=mediana=moda en el centro

Asimétrica negativa o sesgo Datos concentrados


izquierdo en los valores más
Media<mediana<moda grandes

Asimétrica positivo o sesgo


derecho
Datos concentrados
Media>mediana>moda en los valores más
pequeños
CURTOSIS
2 σ𝑁 ҧ 2
1 (𝑥𝑖 − 𝑥)
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝜎 (𝑥) = 𝑁

2 σ𝑛1 (𝑥𝑖 − 𝑥)ҧ 2


𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑠 (𝑥) = 𝑛−1
 El coeficiente de variación, también
denominado como coeficiente de variación de
Spearman, es una medida estadística que nos
informa acerca de la dispersión relativa de un
conjunto de datos.
𝑠 𝑥
𝑐. 𝑣. 𝑥 = × 100%
𝑥ҧ

 Sirve para comparar dos o más conjunto de


datos de distintas unidades.
 OBSERVACIÓN
 Para la muestra se considera que una estimación
con un coeficiente de variación:
 Hasta del 7%, es precisa;
 Entre el 8 y el 14% significa que existe una
precisión aceptable;
 Entre el 15% y 20% precisión regular y por lo
tanto se debe utilizar con precaución
 Mayor del 20% indica que la estimación es poco
precisa y por lo tanto se recomienda utilizarla
sólo con fines descriptivos

 Según Magallanes (2012): “La idea de la varianza
(o desviación típica) es muy simple: su valor
desea mostrar que tan alejados están los datos
de la media. Sin embargo, la varianza no tiene
valores topes por lo que su uso es más
importante para comparar la misma variable en
diferentes grupos”.
 “El coeficiente de variación (CV) mejora a la
varianza y a la desviación típica en que no solo
permite comparaciones de la dispersión entre la
misma variable numérica para diferentes grupos,
sino que permite comparar la dispersión entre
cualquier par de variables numéricas”
MEDIDAS DE DISPERSIÖN

 Motivación
El entrenador de un equipo de natación debe
elegir a uno de sus integrantes para la próxima
competencia de estilo libre. Según los tiempos
en segundos que obtuvieron los postulantes de
las cinco últimas carreras de 100 m de estilo
libre, ¿qué nadador le conviene elegir?
Diego 61,7 61,7 62,3 62,9 63,1
Tomás 61,5 62,9 62,9 63,7 63,7
Sergio 60,7 62,4 62,7 62,7 63,2
 Para poder decidir, calcula las medidas de
posición de cada uno.
promedio moda mediana

Diego 62,34 61,7 62,3

Tomás
62,94 62,9 62,9

Sergio
62.34 62,7 62,7
 Diego y Sergio, dos de los nadadores del
ejercicio anterior, obtuvieron el mismo
promedio y sin embargo sus tiempos están
distribuidos de manera diferente.
 Calcula los desvíos estándares de los tiempos
de los nadadores:
Tiempos de Diego Tiempos de Sergio

xi (xi – x) (xi – x)2 xi (xi – x) (xi – x)2


61,7 -0,64
61,7 -0,64
62,3 -0,04
62,9 0,56
63,1 0,76
total total

 Diego   
54  Sergio   

Entonces:

0.428 0.923
n-1 4 n-1 4
0.6542 0.9607
0.428 0.923
 Tiempo Diego
0.6542
 C.V(x)= =1.049%
62.34

 Tiempo Sergio
0.6542
 C.V(x)= =1.541%
62.34
 por lo tanto los tiempos de Diego son menos
dispersos frente a la media.
VALORES ATÍPICOS
 El término "valores atípicos" se refiere a aquellas
observaciones que tienen valores inusuales, es
decir, que difieren notablemente de una medida
de tendencia central. Mientras que algunos
valores atípicos se producen de forma natural,
otros son consecuencia de la introducción de
datos erróneos.
 Existen distintos procedimientos estadísticos
para identificar atípicos. No tenerlos localizados
y no tener controlada su influencia puede dar
lugar a modelos inestables que produzcan
cambios impredecibles en las estimaciones
realizadas a lo largo del tiempo.
DIAGRAMA DE CAJAS
 Cuartil. Los cuartiles son los tres valores de la
variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales. Q1, Q2 y
Q3 determinan los valores correspondientes
al 25%, al 5% y al 75% de los datos.
Q2 coincide con la mediana.

 RIC= Q3 - Q1
EJEMPLO
 Los siguientes datos representan la edad de
20 personas que asisten a un club de tenis.

 36 25 37 24 39 20 36 45 31 31 39 24 29 23

41 40 33 24 34 40

 Dibujar el diagrama de caja y bigotes


SOLUCIÒN
 Calculando los cuartìles y la mediana

 Limite inferior: Q1-1.5RIC=24.5-1.5*(39-24.5)=2.75


 Limite superior=Q3+ 1.5RIC=39+1.5*(39-24.5)=60.75

También podría gustarte