Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SEDE ESCUINTLA
PLAN SÀBADO
SEGUNDO SEMESTRE
FACULTAD DE CIENCIAS ECONÒMICAS
CATEDRÀTICO LICENCIADO. RONALD ESTUARDO SANCEZ OVALLE
ESTADÌSTICA
Para poder realizar estas operaciones es necesario definir una medida de distancia
medida de distancia entre vectores característicos.
Algunas de las medidas de distancia más utilizadas son las distancias o métricas
inducidas por las normas en espacios.
Siendo una estima de la varianza del i-ésimo coeficiente cepstral. Aquí, los datos
que son menos confiables (con mayor varianza) son pesados menos.
Una formulación más general, que tiene en cuenta la interacción entre coeficientes
a través de una matriz de covarianza es la denominada distancia de
Mahalanobisdistancia de Mahalanobis, definida como
Ejemplo de medida de Distancia
Datos:
D=1296km
T=2h
V= ?
V= d/t
V= 1296km/4h
V= 324km/h
Pero como nos pide en m/s, entonces dividimos la velocidad por 3,6
Tipos
Donde
Dispersión
Desviación absoluta mediana: es una indicador estadístico robusto que usa las
desviaciones absolutas respecto a la mediana (no respecto a la media).
Máxima desviación absoluta: es una medida muy poco robusta, que utiliza la
desviación absoluta máxima.
Normalización
Una forma es dividir por una medida de escala (una medida de dispersión), la
mayoría de las veces es la desviación estándar de la población, en unidades
tipificadas, o la desviación estándar de la muestra, cuando se studentiza (por
ejemplo, el residuo studentizado)
En cambio, se puede escalar por la ubicación, en vez de por la dispersión:
la fórmula para calcular una desviación porcentual es restar el valor observado
menos el valor aceptado, y dividir la diferencia por el valor aceptado, multiplicando
el resultado por 100%.
MEDIDAS DE DISPERSIÓN RELATIVA
• Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más
personas distintas.
DONDE:
CV = coeficiente de variación
S = desviación típica
X = media aritmética
CARACTERISTICAS DE MEDIDAS DE DISPERSION
Casi todos los valores de una variable aleatoria tienden a agruparse alrededor de
un valor central como la media. Pero en algunas distribuciones, los valores están
más dispersos que en otras, dando como resultado curvas más aplanadas o
esbeltas.
Leptocúrtica: en la cual los valores están muy agrupados alrededor de la media,
por lo que la distribución se presenta bastante apuntada y esbelta, (figura 1,
izquierda).
Mesocúrtica: posee una concentración moderada de valores alrededor de la
media (figura 1 en el centro).
Platicúrtica: está distribución tiene una forma más ancha, pues los valores
tienden a estar más dispersos (figura 1 a la derecha).
Fórmulas y ecuaciones
La curtosis puede tener cualquier valor, sin limitaciones. Su cálculo se lleva a cabo
dependiendo de la manera en que se entreguen los datos. La notación empleada
en cada caso es la siguiente:
-Coeficiente de curtosis: g2
-Media aritmética: X o x con barra
-Un valor i-ésimo: xi
-La desviación estándar: σ
-El número de datos: N
-La frecuencia del valor i-ésimo: fi
-Marca de clase: mxi
Con esta notación, presentamos algunas de las fórmulas más utilizadas para
encontrar la curtosis:
Curtosis de acuerdo con la presentación de los datos
Datos sin agrupar o agrupados en frecuencias
Exceso de curtosis
También llamado coeficiente de apuntamiento de Fisher o medida de Fisher sirve
para comparar la distribución en estudio con la distribución normal.
Cuando el exceso de curtosis vale 0, estamos en presencia de una distribución
normal o campana de Gauss. De esta forma, siempre que se calcule el exceso
curtosis de una distribución, en realidad la estamos comparando con la
distribución normal.
Tanto para los datos sin agrupar como para los datos agrupados, el coeficiente de
apuntamiento de Fisher, denotado por K, es:
K= g2 – 3
Ahora bien, se puede demostrar que la curtosis de la distribución normal es 3, por
lo tanto, si el coeficiente de apuntamiento de Fisher es 0 o cercano a 0 y se tiene
una distribución mesocúrtica. Si K >0 la distribución es leptocúrtica y si K<0 es
platicúrtica.
O pudo significar que las preguntas de la prueba tenían muy distintos grados de
dificultad.
La curva B es mesocúrtica, indicativa de que los resultados de la prueba siguieron
una distribución normal. Este suele ser el caso más frecuente.
Ejemplo resuelto de curtosis
Hallar el coeficiente de apuntamiento de Fisher para las siguientes calificaciones,
obtenidas en un examen de Física a un grupo de alumnos, con una escala del 1 al
10:
5, 5, 4, 7, 7,7, 9, 8, 9, 4, 3
Solución
Se utilizará la siguiente expresión para datos no agrupados, dada en las secciones
precedentes:
K = g2 – 3
Este valor permite conocer el tipo de distribución.
Para calcular g2 es conveniente hacerlo de manera ordenada, paso a paso, ya que
hay que resolver varias operaciones aritméticas.
Paso 1
En primer lugar, se calcula el promedio de las calificaciones. Hay N = 11 datos.
X= (5+5+4+7+7+7+9+8+9+4+3)/11 =6.182
Paso 2
Se encuentra la desviación estándar, para lo cual se utiliza esta ecuación:
σ = 1.992
O también se puede construir una tabla, que igualmente se requiere para el
siguiente paso y en la que se escribe cada término de las sumatorias que se van a
necesitar, comenzando por (xi – X), luego (xi – X)2 y luego (xi – X)4 :
Paso 3
Efectuar la sumatoria indicada en el numerador de la fórmula para g2. Para esto se
utiliza el resultado de la columna derecha de la tabla anterior:
∑ (xi – X)4= 290.15
Por lo tanto:
g2 = (1/11) x 290.15 /1.9924 = 1.675
El coeficiente de apuntamiento de Fisher es:
K = g2 – 3 = 1.675 – 3 = -1.325
Lo que interesa es el signo del resultado, que al ser negativo corresponde a una
distribución platicúrtica, lo cual puede interpretarse como se hizo en el ejemplo
anterior: posiblemente sea un curso heterogéneo con estudiantes de distintos
grados de interés o bien las preguntas de examen fueron de diferentes niveles de
dificultad.
El uso de una hoja de cálculo como Excel, facilita en gran medida la resolución de
este tipo de problemas y también ofrece la opción de graficar la distribución.
Conclusión