Está en la página 1de 23

UNIVERSIDAD REGIONAL DE GUATEMALA

SEDE ESCUINTLA
PLAN SÀBADO
SEGUNDO SEMESTRE
FACULTAD DE CIENCIAS ECONÒMICAS
CATEDRÀTICO LICENCIADO. RONALD ESTUARDO SANCEZ OVALLE
ESTADÌSTICA

MEDIDAS DE DISPERSIÒN Y MEDIDAS DE FORMA

Integrantes del Grupo: Carné


Julio Roberto Pérez Y Pérez 2219150
Joselyn Julissa Chavarría Avelar 2219058
José Iván Rivas López 2219099
Elisa Haydeé Cujá Martínez 2219024
Manuela del Carmen Gómez Martin 2219199
Enrique David Díaz Maldonado 2219054
Hodelquis Uribel Guardado Vásquez 2219124

Fecha de entrega: 14/10/2022


Introducción

En la presente investigación aprenderemos conceptos, formas de aplicación en


casos estadísticos; con el fin de ampliar nuestro conocimiento, en los temas
asignados:

➢ Las medidas de dispersión son un conjunto de variables que se utiliza en


estadística para calcular de qué manera se comporta la distribución; son
números que indican si una variable se mueve mucho, o poco, más o menos
que otra.

➢ Las medidas de forma permiten comprobar si una distribución de frecuencia


tiene caracteristicas especiales como simetría, asimetría, nivel de
concentración de datos y nivel de apuntamiento que clasifiquen en un tipo
particular de distribución. En las medidas de forma son necesarias para
determinar el comportamiento de los datos y así poder adaptar las
herramientas para el análisis problemático.
Medidas De Dispersión

Las medidas de dispersión consisten en números que otorgan información acerca


de la variabilidad de los datos. Es decir, se encargan de mostrar qué tan juntos o
separados se encuentran los datos de una distribución. Por lo general, se usa junto
con las medidas de tendencia central, como la media o la mediana, para
proporcionar una descripción general de un conjunto de datos, indicando por medio
de un número si las diferentes puntuaciones de una variable están muy alejadas de
la media. Cuanto mayor sea ese valor mayor será la variabilidad, cuando menor
sea, más homogénea será a la media; así se sabe si todos los casos son parecidos
o varían mucho entre ellos, miden que tanto se dispersan las observaciones
alrededor de su media. Esta medida permite juzgar la confiabilidad de la media de
tendencia central, el uso de las medidas de dispersión se puede aplicar en diversos
ámbitos, como el sector salud, industrial, económico empresarial. La definición y
alcance del término medidas de dispersión son los valores que intervienen en la
calibración de variables en estudios estadísticos. Se trata de ciertos valores que
representan relaciones entre variables, datos y otras variables, suponen una
descripción matemática de un sistema de datos indefinidos que organizan en
variables y que buscan descubrir patrones y esquema.

A través de diferentes fórmulas y modelos, la estadística permite conocer los valores


numéricos que representan tendencias y fluctuaciones en todo tipo de sistemas de
datos, recolectados una vez volcados sobre una variable que será a su vez utilizada
en un modelo. Por lo tanto, las medidas de dispersión no sirven al propósito
particular del análisis estadístico, si no que sirve para producir ensayos y calibrar la
implementación de un modelo estadístico genérico para conocer hasta qué punto
de relación entre los datos ingresados en el pueden ser considerados confiables: la
llamada dispersión estadística representa un grado de distribución de datos que
oscilan en referencia a un valor absoluto que se utiliza como la media aritmética. La
variabilidad o dispersión de datos se configura respecto a la distancia entre los
valores de una variable y la media y el valor medido; se puede decir que la variable
dispone de un grado de dispersión muy alto.
Medidas de Distancia

Una característica fundamental de los sistemas de reconocimiento (de palabra o de


locutor) es la forma en que los vectores característicos son combinados y
comparados con los patrones de referencia.

Para poder realizar estas operaciones es necesario definir una medida de distancia
medida de distancia entre vectores característicos.

Definición: Una distancia entre dos vectores x e y de un espacio vectorial X es una


función a valores reales d (x, y) sobre el producto Cartesiano, que verifica las
propiedades

Algunas de las medidas de distancia más utilizadas son las distancias o métricas
inducidas por las normas en espacios.

Por ejemplo, si son las componentes de dos vectores característicos, pueden


definirse las siguientes métricas inducidas por las normas
Una medida de distancia muy utilizada cuando se emplean como característica los
coeficientes cepstral, que ha probado tener una muy buena performance en tareas
de reconocimiento, es la distancia Euclídea ponderada, definida como

Siendo una estima de la varianza del i-ésimo coeficiente cepstral. Aquí, los datos
que son menos confiables (con mayor varianza) son pesados menos.

Cuando se utiliza el power cepstrum como vector característico, a la distancia en L2


se la denomina distancia cepstral. Teniendo en cuenta la identidad de Parseval,
resulta

En la práctica, sólo se computa un número finito Q de coeficientes power cepstral,


resultando

Una formulación más general, que tiene en cuenta la interacción entre coeficientes
a través de una matriz de covarianza es la denominada distancia de
Mahalanobisdistancia de Mahalanobis, definida como
Ejemplo de medida de Distancia

Calcular la velocidad de un auto que recorre 1296kmen 4 h, y expresa su


velocidad en m/s

Nos pide calcular la velocidad y dejar en m/s

Datos:

D=1296km

T=2h

V= ?

Para calcular la velocidad aplicamos la siguiente fórmula

V= d/t

V= 1296km/4h

V= 324km/h

Su velocidad es: 324km/h

Pero como nos pide en m/s, entonces dividimos la velocidad por 3,6

324km/h 3,6= 90m/s

Solución: su velocidad es 90m/s


MEDIDAS DE DESVIACION PROMEDIO

En matemáticas y estadística, la desviación es una medida de la diferencia entre el


valor observado de una variable y algún otro valor, a menudo la media de esa
variable. El signo de la desviación informa del sentido de esa diferencia (la
desviación es positiva cuando el valor observado excede el valor de referencia). La
magnitud del valor indica el tamaño de la diferencia.

Tipos

Una desviación que es una diferencia entre un valor observado y el valor


verdadero de una cantidad de con significado estadístico (como la media de una
población) es un error, y una desviación que es la diferencia entre el valor observado
y una estimación del valor verdadero (tal estimación puede ser una media muestral)
es un residuo. Estos conceptos son aplicables para datos en los niveles de
medición de intervalo y de valor relativo.

Sin signo o desviación absoluta

En estadística, la desviación absoluta de un elemento de un conjunto de datos es


la diferencia absoluta entre ese elemento y un punto dado. Por lo general, la
desviación se calcula a partir de un valor central, y se interpreta como algún tipo
de promedio, con mayor frecuencia la mediana o, a veces, la media del conjunto de
datos.

Donde

Di es la desviación absoluta, eh irrefutable

xi es un elemento del conjunto de datos

y m (X) es la medida elegida de las medidas de tendencia central del conjunto de


datos, a veces la media (x), pero más a menudo la mediana.
Desviación Medida con signos

Cuando se considera un estimador no sesgado, el promedio de las desviaciones


con signo en el conjunto de todas las observaciones del valor del parámetro de
población no observada, promedia cero en un número arbitrariamente grande de
muestras. Sin embargo, por construcción, el promedio de las desviaciones con signo
de los valores con respecto al valor medio de la muestra siempre es cero, aunque
la desviación con signo promedio de otra medida de tendencia central, como la
mediana de la muestra, pueda no ser cero necesariamente.

Dispersión

Las estadísticas de la distribución de desviaciones se utilizan como medidas de


dispersión.

Desviación típica: es la medida de dispersión utilizada con más frecuencia: utiliza


desviaciones de cuadráticas y tiene propiedades deseables, pero no es robusta.

Desviación media: es la suma de los valores absolutos de las desviaciones dividida


por el número de observaciones.

Desviación absoluta mediana: es una indicador estadístico robusto que usa las
desviaciones absolutas respecto a la mediana (no respecto a la media).

Máxima desviación absoluta: es una medida muy poco robusta, que utiliza la
desviación absoluta máxima.

Normalización

Las desviaciones tienen unidades de la escala de medición (por ejemplo, metros o


pulgadas si se miden longitudes). Es posible adimensionalizarlas de dos maneras.

Una forma es dividir por una medida de escala (una medida de dispersión), la
mayoría de las veces es la desviación estándar de la población, en unidades
tipificadas, o la desviación estándar de la muestra, cuando se studentiza (por
ejemplo, el residuo studentizado)
En cambio, se puede escalar por la ubicación, en vez de por la dispersión:
la fórmula para calcular una desviación porcentual es restar el valor observado
menos el valor aceptado, y dividir la diferencia por el valor aceptado, multiplicando
el resultado por 100%.
MEDIDAS DE DISPERSIÓN RELATIVA

Determinan la dispersión de la distribución estadística independientemente de las


unidades en que se expresa la variable.
UTILIDAD DEL COEFICIENTE DE VARIACION

• El CV es muy usado para evaluar la precisión de un experimento, comparado


en CV del experimento en cuestión con los valores de este en experiencias
anteriores.

• Comparar la variabilidad entre dos grupos de datos referidos a distintos


sistemas de unidades de medida. Por ejemplo, Kilogramos y centímetros.

• Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más
personas distintas.

• Comparar dos grupos de datos que tienen distinta medida.

DONDE:
CV = coeficiente de variación
S = desviación típica
X = media aritmética
CARACTERISTICAS DE MEDIDAS DE DISPERSION

➢ Las medidas de dispersión sirven para cuantificar la separación de valores


de distribución

➢ Llamemos dispersión, a la mayor o menor separación de los valores de la


muestra, respecto de las medidas de centralización que hayamos calculado.

➢ Al calcular una medida de centralización como la medida aritmética, resulta


necesario acompañarla de la otra medida que indique el grado de dispersión,
del resto de valores de la distribución, respecto de esta medida.

➢ A estas cantidades o coeficientes, les llamamos medidas de dispersión,


pudiendo ser absolutas o relativas.

La Dispersión hace referencia a la forma en que se dispersan o alejan las


puntuaciones de una distribución o lista de puntajes
Medidas de forma
Aunque no forma parte del contenido estipulado en el programa, considero que la
descripción de un conjunto de datos no está completa si no se analiza su forma.
Para comprender correctamente los conceptos que abajo se expresan, es
necesario conocer algo sobre la distribución normal. Por ello le recomendamos, de
acuerdo a la secuencia del programa de la asignatura, que una vez que vea se
compenetre con esta distribución, regrese a este tema.
Las medidas de forma permiten conocer que forma tiene la curva que representa
la serie de datos de la muestra. En concreto, podemos estudiar las siguientes
características de la curva:
Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro
de la misma (centro de simetría) los segmentos de curva que quedan a derecha e
izquierda son similares.
Curtosis: mide si los valores de la distribución están más o menos concentrados
alrededor de los valores medios de la muestra.
Asimetría
El concepto de asimetría se refiere a si la curva que forman los valores de la serie
presenta la misma forma a izquierda y derecha de un valor central (media
aritmética)
Para calcular la asimetría se puede utilizar el llamado coeficiente de Fisher
que presentaremos como g1 y Se determina por la fórmula:
Los resultados pueden ser los siguientes:
g ¡= 0 distribución simétrica. Existe la
misma concentración de valores a la derecha y a la izquierda de la media.
g1 • 0 distribución asimétrica positiva. Existe mayor concentración de valores a la
derecha de la media que a su izquierda.
g1 • 0 distribución asimétrica negativa.
Existe mayor concentración de valores a la izquierda de la media que a su
derecha.
SESGO ESTADISTICO

El sesgo estadístico es la diferencia que se produce entre un estimador


matemático y su valor numérico, una vez realizado un análisis.
Por tanto, el sesgo es la diferencia que se da entre la teoría y la realidad.
Es muy habitual en estadística y debe ser controlado. Por otro lado, los
estimadores que no tienen sesgo se denominan insesgados y sería el estado ideal
en una investigación, aunque ello se debe a que es, prácticamente, inalcanzable.

¿Qué produce el sesgo en la ciencia?


El sesgo puede producirse, sobre todo, por tres vías:
El sesgo de selección: Es el más habitual en estadística. Normalmente tiene que
ver con la elección de los grupos. Lo más frecuente es que no se haya tomado la
decisión con base en métodos de muestreo objetivos. Por ejemplo, que se elija la
muestra por afinidad a un candidato en un sondeo.
Sesgo de información: Estamos ante un sesgo debido a una información
deficiente. Por tanto, no podemos comparar los grupos porque tenemos
información demasiado limitada de ellos.
Sesgo de confusión: En este caso existe una variable llamada así, de confusión,
que es la que provoca el sesgo. Suele ser difícil encontrar dónde está el problema.

El sesgo estadístico y los métodos de muestreo


Cuando realizamos una investigación debemos saber si vamos a realizar un
estudio exploratorio o confirmatorio. Esta pregunta es esencial. De ella va a
depender el tipo de muestreo que elijamos.
Así, cuando deseamos realizar un estudio confirmatorio, utilizaremos métodos
aleatorios. Sin embargo, cuando la intención es realizar una exploración que sirva
de base para otras investigaciones, el método puede ser no aleatorio. Hay que
tener en cuenta que este último método suele tener menor coste y ser más
sencillo.
El sesgo estadístico de selección
Este es el más habitual y el que cometen, en mayor medida, los investigadores.
Debemos tener mucho cuidado con la elección de una muestra estadística. En
este proceso se comete este tipo de sesgo estadístico de selección.
Por eso es muy importante establecer el protocolo antes y hacerlo de forma
detallada. Además, hay que formar a las personas que recopilarán los datos. Esta
última parte es una prioridad para evitar, también, otros tipos de sesgo, como el de
información.
Ejemplos de sesgo estadístico de selección
Vamos a ver, para terminar, algunos ejemplos donde puede producirse un sesgo
estadístico.
Son muy habituales y suelen dar lugar, como resultado, a investigaciones
sesgadas que no reflejan la realidad. Por eso es importante evitarlos.
Por ejemplo, imaginemos que queremos estudiar la afinidad de la población por
un candidato político. Los encuestadores podrían cometer un error que provoque
un sesgo si no eligen las zonas al azar. Es decir, si eligen zonas afines a dicho
candidato.
En economía, se puede cometer un sesgo, por ejemplo, en el estudio de la
pobreza. Los países deberían ser elegidos de forma paritaria para que exista un
equilibrio. Así se podrían estudiar las variables que promueven la pobreza, pero
también la prosperidad.
En medicina, se produce un sesgo estadístico de selección si al estudiar una
enfermedad no se usa el muestreo adecuado. Es decir, si queremos ver la
incidencia poblacional, debemos utilizar muestreos aleatorios, sobre todo si el
Formula
LA CURTOSIS

La curtosis o Kurtosis es un parámetro estadístico que sirve para caracterizar la


distribución de probabilidad de una variable aleatoria, indicando el grado de
concentración de los valores alrededor de la medida central. Esto también se
conoce como “grado de pico”.
El término proviene del griego “kurtos” que significa arqueado, por lo tanto, la
curtosis señala el grado de apuntamiento o achatamiento de la distribución, como
se ve en la siguiente figura:

Casi todos los valores de una variable aleatoria tienden a agruparse alrededor de
un valor central como la media. Pero en algunas distribuciones, los valores están
más dispersos que en otras, dando como resultado curvas más aplanadas o
esbeltas.
Leptocúrtica: en la cual los valores están muy agrupados alrededor de la media,
por lo que la distribución se presenta bastante apuntada y esbelta, (figura 1,
izquierda).
Mesocúrtica: posee una concentración moderada de valores alrededor de la
media (figura 1 en el centro).

Platicúrtica: está distribución tiene una forma más ancha, pues los valores
tienden a estar más dispersos (figura 1 a la derecha).

Fórmulas y ecuaciones
La curtosis puede tener cualquier valor, sin limitaciones. Su cálculo se lleva a cabo
dependiendo de la manera en que se entreguen los datos. La notación empleada
en cada caso es la siguiente:

-Coeficiente de curtosis: g2
-Media aritmética: X o x con barra
-Un valor i-ésimo: xi
-La desviación estándar: σ
-El número de datos: N
-La frecuencia del valor i-ésimo: fi
-Marca de clase: mxi
Con esta notación, presentamos algunas de las fórmulas más utilizadas para
encontrar la curtosis:
Curtosis de acuerdo con la presentación de los datos
Datos sin agrupar o agrupados en frecuencias

Datos agrupados en intervalos

Exceso de curtosis
También llamado coeficiente de apuntamiento de Fisher o medida de Fisher sirve
para comparar la distribución en estudio con la distribución normal.
Cuando el exceso de curtosis vale 0, estamos en presencia de una distribución
normal o campana de Gauss. De esta forma, siempre que se calcule el exceso
curtosis de una distribución, en realidad la estamos comparando con la
distribución normal.
Tanto para los datos sin agrupar como para los datos agrupados, el coeficiente de
apuntamiento de Fisher, denotado por K, es:

K= g2 – 3
Ahora bien, se puede demostrar que la curtosis de la distribución normal es 3, por
lo tanto, si el coeficiente de apuntamiento de Fisher es 0 o cercano a 0 y se tiene
una distribución mesocúrtica. Si K >0 la distribución es leptocúrtica y si K<0 es
platicúrtica.

¿Para qué sirve la curtosis?


La curtosis es una medida de variabilidad utilizada para caracterizar la morfología
de una distribución. De esta forma se pueden comparar distribuciones simétricas
con el mismo promedio e igual dispersión (dada por la desviación estándar).
Disponer de medidas de variabilidad asegura que los promedios sean confiables y
ayuda a controlar las variaciones de la distribución. A modo de ejemplo,
analicemos estas dos situaciones.
Los salarios de 3 departamentos
Supongamos que el siguiente gráfico muestra las distribuciones en el salario de 3
departamentos de una misma compañía:

La curva A es la más esbelta de todas, y de su forma se infiere que la mayor parte


de los salarios de ese departamento está muy cercano a la media, por lo tanto, la
mayoría de los empleados reciben compensaciones parecidas.
Por su parte en el departamento B, la curva de los salarios sigue una distribución
normal, ya que la curva es mesocúrtica, en la que suponemos que los salarios
quedaron distribuidos al azar.
Y finalmente tenemos la curva C que es muy achatada, una señal de que en este
departamento el rango salarial es mucho más amplio que en los otros.
Los resultados de un examen
Supongamos ahora que las tres curvas de la figura 2 representan los resultados
de un examen aplicado a tres grupos de alumnos de una misma asignatura.
El grupo cuyas calificaciones se representa por la curva A leptocúrtica, es bastante
homogéneo, la mayoría obtuvo una calificación promedio o cercana.
También es posible que el resultado se debiera a que las preguntas del examen
tenían más o menos el mismo grado de dificultad.
En cambio, los resultados del grupo C indican una mayor heterogeneidad en el
grupo, que probablemente contiene estudiantes promedio, algunos alumnos más
aventajados y seguramente otro tanto menos atentos.

O pudo significar que las preguntas de la prueba tenían muy distintos grados de
dificultad.
La curva B es mesocúrtica, indicativa de que los resultados de la prueba siguieron
una distribución normal. Este suele ser el caso más frecuente.
Ejemplo resuelto de curtosis
Hallar el coeficiente de apuntamiento de Fisher para las siguientes calificaciones,
obtenidas en un examen de Física a un grupo de alumnos, con una escala del 1 al
10:
5, 5, 4, 7, 7,7, 9, 8, 9, 4, 3
Solución
Se utilizará la siguiente expresión para datos no agrupados, dada en las secciones
precedentes:

K = g2 – 3
Este valor permite conocer el tipo de distribución.
Para calcular g2 es conveniente hacerlo de manera ordenada, paso a paso, ya que
hay que resolver varias operaciones aritméticas.
Paso 1
En primer lugar, se calcula el promedio de las calificaciones. Hay N = 11 datos.
X= (5+5+4+7+7+7+9+8+9+4+3)/11 =6.182
Paso 2
Se encuentra la desviación estándar, para lo cual se utiliza esta ecuación:

σ = 1.992
O también se puede construir una tabla, que igualmente se requiere para el
siguiente paso y en la que se escribe cada término de las sumatorias que se van a
necesitar, comenzando por (xi – X), luego (xi – X)2 y luego (xi – X)4 :

Paso 3
Efectuar la sumatoria indicada en el numerador de la fórmula para g2. Para esto se
utiliza el resultado de la columna derecha de la tabla anterior:
∑ (xi – X)4= 290.15
Por lo tanto:
g2 = (1/11) x 290.15 /1.9924 = 1.675
El coeficiente de apuntamiento de Fisher es:
K = g2 – 3 = 1.675 – 3 = -1.325
Lo que interesa es el signo del resultado, que al ser negativo corresponde a una
distribución platicúrtica, lo cual puede interpretarse como se hizo en el ejemplo
anterior: posiblemente sea un curso heterogéneo con estudiantes de distintos
grados de interés o bien las preguntas de examen fueron de diferentes niveles de
dificultad.
El uso de una hoja de cálculo como Excel, facilita en gran medida la resolución de
este tipo de problemas y también ofrece la opción de graficar la distribución.
Conclusión

Las medidas de dispersión son importantes para comprobar la veracidad de la


información de datos, a través de estas medidas podemos informarnos cuanto se
alejan del centro de los valores de la distribución; es también conocida como
medidas de variabilidad; en las medidas de forma nos permite comprobar si una
distribución de frecuencias tiene caracteristicas especiales como simetría,
asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen
en un tipo particular de distribución.
EGRAFIA
https://www.lifeder.com/curtosis/
https://economipedia.com/definiciones/sesgosestadisticos.html
https://es.slideshare.net/edidpanccaapaza1/medidas-de-dispersion-absolutasy-
relativas-55214966
https://www.fceia.unr.edu.ar/prodivoz/Medidas_de_Distorsion_bw.pdf
https://www.economipedia.com/definiciones/medidas-de-dispersion.html

También podría gustarte