Está en la página 1de 61

UNIDAD 2

Semana 5
Sesión 9

Medidas De Dispersión Para


Datos No Agrupados Medidas
De Dispersión Para Datos No
Agrupados

-Ronald Agüero Curiñahui


Medidas de dispersión para datos no
agrupados
Los datos no agrupados son el conjunto de datos que no se ha clasificado y se es
presentada en su forma de aparición en una tabla de datos donde cada valor se
representa de forma individual. Por lo general este conjunto comprende una
cantidad de elementos menor a 30 (n<30) con poca o nula repetición

RANGO: El rango de un conjunto de


números es la diferencia entre el mayor
y el menor de todos ellos. Hay 2
maneras de expresar esta medida:
• La diferencia entre los valores mayores y menor.
• Los valores mayor y menor del grupo.
DESVIACION ESTANDAR: Denota con el símbolo σ o s, dependiendo de la procedencia del conjunto
de datos, es una medida de dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo.
Se define como la raíz cuadrada de la varianza de la variable.
Para un mejor entendimiento, se muestran las fórmulas con las que se llega al resultado y claro
ejemplo para obtener la desviación estándar.
VARIANZA: Se refieren a la media aritmética de los cuadrados de las desviaciones
de cada valor respecto de la media aritmética de los datos, por lo que a veces
también se denomina desviación cuadrática media.
Se utilizan cualquiera de las fórmulas para obtener un resultado, va dependiendo si se
calcula toda una población o solo una muestra de esa población.
Medidas de dispersión de datos agrupados
Los datos agrupados son aquellos datos que pertenecen a un tamaño de
muestra mayor a 20 o más elementos, por lo que para ser analizados
requieren ser agrupados en clases a partir de ciertas características.
Su objetivo es resumir la información, implica: ordenar, clasificar y expresar
los en una tabla de frecuencias.

Rango:El rango de un grupo de números es la diferencia entre el número


mayor y el menor del grupo.
Varianza
De una distribución de frecuencia la varianza puede ser
obtenida de la fórmula.

Coeficiente de variación
La variación real o dispersión determinada a partir de la
desviación estándar u otra medida de dispersión, es llamada la
dispersión absoluta.
Si la dispersión absoluta es la desviación estándar S y el
promedio, la dispersión relativa se llama coeficiente de variación
o coeficiente de dispersión.
Semana 5
Sesión 10

Medidas De Dispersión
Para Datos Agrupados
Medidas De Distribución
Asimetría Y Curtosis

-Rubi España Castro


Math - 11th Grade

ASIMETRI
A
Here is where your presentation begins
Que la asimetria ?
.
Es una medida de forma de una distribución que
permite identificar y describir la manera como los datos
tiende a
reunirse de acuerdo con la frecuencia con que se hallen
dentro de
la distribución de una variable respecto a la media aritmética
Permite identificar las
características de la distribución de datos sin
necesidad de generar el gráfico
TIPOS DE Math - 11th Grade

ASIMETRI
A
Here is where your presentation begins
ASIMETRI
A
NEGATIVA
O A LA
INTRODUCCION:
Seda cuando en una distribución la minoría de los
datos está en la parte izquierda de la media. Este tipo de
distribución presenta un alargamiento o sesgo hacia la
izquierda, es decir, la distribución de los datos tiene a
la izquierda una cola más larga que a la derecha.
También se dice que una distribución es
simétrica a la izquierda o tiene sesgo negativo cuando el
valor de la media aritmética es menor que la mediana y
éste valor de la mediana a su vez es menor que la moda, en
símbolos

Nota: Sesgo es el grado de asimetría de


una distribución, es decir, cuánto se aparta de la
simetría.
SIMETRIA
INTRODUCCION:
Se da cuando en una
distribución se distribuyen aproximadamente la misma
cantidad de los datos a ambos lados de la media
aritmética. No tiene alargamiento o sesgo. Se representa
por una curva normal en forma de campana llamada campana
de Gauss
(matemático Alemán 1777-1855) o también
conocida como de Laplace (1749-1827).También se dice que
una distribución es simétrica cuando su media
aritmética, su mediana y su moda son iguales, en
símbolos Md=Mo
ASIMETRI
A
POSITIVA
O A LA
INTRODUCCION:
Se da cuando en una distribución la minoría de los datos
está en la parte derecha de la media aritmética.
Este tipo de distribución presenta un alargamiento o sesgo
hacia la derecha, es decir, la distribución de los datos
tiene a la derecha una cola más larga que a la
izquierda.
También se dice que una distribución es
simétrica a la derecha o tiene sesgo positivo cuando el
valor de la media aritmética es mayor que la mediana y
éste a valor de la mediana a su vez es mayor que la moda,
en símbolos
Math - 11th Grade

CURTOSIS
Here is where your presentation begins
Que la curtosis ?
. La curtosis (o apuntamiento) es una medida de forma
que mide cuán escarpada o achatada está una curva o
distribución.
Este coeficiente indica la cantidad de datos que hay
cercanos a la media, de manera que a mayor grado de
curtosis, más escarpada (o apuntada) será la forma de
la curva
La curtosis se mide promediando la
cuarta potencia de la diferencia entre
cada elemento del conjunto y la media,
dividido entre la desviación típica
elevado también a la cuarta potencia.
Sea el conjunto X=(x1, x2,…, xN),
entonces el coeficiente de curtosis
será:
En la fórmula se resta 3 porque es
la curtosis de una distribución
Normal. Entonces la curtosis
valdrá 0 para la Normal, tomándose
a ésta como referencia.
Cuando los datos están agrupados o
agrupados en intervalos, la fórmula
del coeficiente de curtosis se
convierte en:
Semana 6
Sesión 11-12

Medidas De Distribución
Asimetría Y Curtosis
Ejercicios

-Jhamely Romero Lopez


Math - 11th Grade

Medidas de
Distribución
¿Qué son las medidas de Distribución?
Las medidas de distribución son valores que intervienen en la calibración de variables en estudios estadísticos. Se
trata de ciertos valores que representan relaciones entre variables, datos y otras variables. Suponen una descripción
matemática de un sistema de datos indefinidos que se organizan en variables y que buscan descubrir patrones y
esquemas.

A través de diferentes fórmulas y modelos, la estadística permite conocer los valores numéricos que representan
tendencias y fluctuaciones en todo tipo de sistemas de datos. Su cálculo se utiliza en distintas disciplinas para
conocer hasta qué punto son confiables los datos recolectados una vez volcados sobre una variable que será, a su
vez, utilizada en un modelo.
Existe dos tipos de medidas de distribución también
conocido como medidas de forma:
Es necesario definir una serie de medidas que permitan
cuantificar en lo posible la forma de la distribución de
frecuencias. Esta cuantificación se realiza en 2 sentidos
principales:
-Medidas de asimetría: Se dirigen a elaborar un
indicador que permita establecer el grado de simetría.

-Medidas de apuntamiento o curtosis: Las medidas de


curtosis se aplican a distribuciones campaniformes, es
decir unimodales simétricas o con ligera asimetría.
01
Ejercicios de Asimetría y
Curtosis
1.- Con la siguiente información, determine el Coeficiente de Asimetría y Curtosis.

Se sabe: Md= 80,45 kg P10= 62,25 kg P25= 72,22 kg P75= 88,21 kg P90= 94,43 kg

Peso de los trabajadores


Fórmula:

Para calcular la asimetría, necesitamos la mediana, la media aritmética y la Desviación Estándar. Ya la Mediana nos la
da el ejercicio, falta determinar la Media Aritmética y la Desviación Estándar.

Aplicando la fórmula de la Media Aritmética para datos agrupados, tenemos:

Ahora con esta información, procedemos a determinar la Desviación Estándar:

Fórmula:
Una vez calculada la Desviación Estándar, procedemos a sustituir datos en la fórmula
del Coeficiente de Asimetría.

Interpretación: Se contrasta el resultado con la tabla:


Si Coeficiente de Asimetría es igual a:
Cero "0" es Simétrica Por lo tanto -0,16 es Moderadamente sesgada hacia la
0,01 a 0,10 es Ligeramente Sesgada izquierda. El signo – ó + indica si elsesgo es para la
0,11 a 0.30 es Moderadamente Sesgada izquierda (-) o para la derecha (+).
0,31 a 1 es Marcadamente Sesgada
COEFICIENTE DE CURTOSIS O APUNTAMIENTO
Fórmula:

Entre los datos del ejercicio están los percentiles a utilizar, solo deben sustituirlos en lafórmula y calcular

Interpretación:
Este resultado se contrasta con la siguiente tabla:
Si el Coeficiente de Curtosis es igual a:
= 0,263 Mesocúrtica
>0,263 Leptocúrtica
< 0,263 Platicúrtica
Como el resultado obtenido 0,248 es menor que 0,263 se concluye que la Distribución es Platicúrtica
Ejercicio 2
2.- Para el siguiente conjunto de datos calcular, el coeficiente de asimetría y de curtosis y emitir un juicio
acerca del grado de asimetría y de apuntamiento de los datos. Use el criterio del RIC puede decirse que hay
valores atípicos
43.8 36.4 58.8 58.8 40.0 43.5 27.0 31.3
Calculando el coeficiente de asimetría:

Calculando el coeficiente de curtosis


Calculando la desviación estándar:
Para calcular la desviación estándar primero tenemos que calcular la varianza
Semana 7
Sesión 13-14

Conoce Los Coeficientes


Explica Los Coeficientes De
Regresión Lineal Simple
-Yeraldi Ventocilla Salcedo
Qué es la regresión
01 lineal?
La regresión lineal es una técnica de modelado
estadístico que se emplea para describir una variable
de respuesta continua como una función de una o
varias variables predictoras. Puede ayudar a
comprender y predecir el comportamiento de
sistemas complejos o a analizar datos experimentales,
financieros y biológicos.
Tipos de Regresión Lineal

Regresión Lineal
01 Regresión Lineal Simple 03 Multivariante

Regresión Lineal Múltiple


02 Regresión Lineal Múltiple 04 Multivariante
Regresión Lineal Simple
El modelo de regresión lineal simple se
describe de acuerdo a la ecuación:
La regresión lineal simple consiste en
generar un modelo de regresión (ecuación
de una recta) que permita explicar la
relación lineal que existe entre dos
variables. la variable dependiente o
respuesta se le identifica como Y, y a la
variable predictora o independiente como
X.
—regresión lineal simple

En el caso de una regresión lineal simple, el objetivo es


examinar la influencia de una variable independiente
sobre una variable dependiente.
El objetivo de una regresión lineal simple es predecir
el valor de una variable dependiente a partir de una
variable independiente. Cuanto mayor sea la relación
lineal entre la variable independiente y la variable
dependiente, más precisa será la predicción.
Modelo de Regresión
Lineal Simple
 Ecuación de regresión lineal poblacional

 Variable respuesta o dependiente: Y


 Coeficiente de intersección poblacional
 Coeficiente de regresión poblacional
 Variable predictora, regresora o independiente
 Error aleatorio no observable
Explicación del Error

Si todos los puntos (valores medidos) estuvieran exactamente en


una línea recta, la estimación sería perfecta. Sin embargo, casi
nunca es así y, por tanto, en la mayoría de los casos hay que
encontrar una línea recta que se aproxime lo más posible a los
puntos de datos individuales. Así pues, se intenta que el error en
la estimación sea lo más pequeño posible, de modo que la
distancia entre el valor estimado y el valor real sea lo menor
posible. Esta distancia o error se denomina "residuo", se abrevia
como "e" (error).
Al calcular la recta de regresión
Se intenta determinar los coeficientes de
regresión (a y b) de modo que la suma de los
residuos al cuadrado sea mínima.
EL COEFICIENTE DE REGRESIÓN B PUEDE TENER AHORA DISTINTOS
SIGNOS

• b< 0: existe una • b = 0: no hay


• b > 0: existe una correlación correlación
correlación positiva negativa entre x e y
entre x e y (a entre x e y (cuanto
mayor x, mayor y) mayor es x, menor
es y)
Semana 8
Sesión 15-16

Explica Los Coeficientes De


Correlación
Explica Los Correlación
Lineal De Pearson Y De
Spearman
-Camila Venturo Terrel
Math - 11th Grade

COEFICIENTE DE
CORRELACION
¿Qué es el coeficiente de correlación?
El coeficiente de correlación es la medida
específica que cuantifica la intensidad de la relación
lineal entre dos variables en un análisis de
correlación. En los informes de correlación, este
coeficiente se simboliza con la r.
¿Cómo se utiliza el coeficiente de
correlación?
Para dos variables, la fórmula compara la distancia de cada dato
puntual respecto a la media de la variable y utiliza esta
comparación para decirnos hasta qué punto la relación entre las
variables se ajusta a una línea imaginaria trazada entre los datos.
A esto nos referimos cuando decimos que la correlación examina
las relaciones lineales
¿Cómo calculamos
efectivamente el coeficiente de
correlación?

R= ∑[(xi−¯¯¯x)(yi−¯¯¯y)]
√Σ(xi−¯¯¯x)2 ∗ Σ(yi −¯¯¯y)2
01
CORRELACIÓN
LINEAL DE
PEARSON
El coeficiente de correlación de Pearson es una prueba que mide la relación estadística entre
dos variables continuas. Si la asociación entre los elementos no es lineal, entonces el
coeficiente no se encuentra representado adecuadamente.
Para llevar a cabo la correlación de Pearson es necesario cumplir lo siguiente:
• La escala de medida debe ser una escala de intervalo o relación.
• Las variables deben estar distribuida de forma aproximada.
• La asociación debe ser lineal.
• No debe haber valores atípicos en los datos.
Cómo se calcula el coeficiente de
correlación de Pearson

Donde:
“x” es igual a la variable número uno, “y” pertenece a la variable número dos, “zx” es
la desviación estándar de la variable uno, “zy” es la desviación estándar de la
variable dos y “N” es es número de datos.
Interpretación del coeficiente de correlación de
Karl Pearson
El coeficiente de correlación de Pearson tiene el objetivo de indicar cuán
asociadas se encuentran dos variables entre sí por lo que:

Correlación menor a cero: Si la correlación es menor a cero, significa que es negativa, es


decir, que las variables se relacionan inversamente.
Cuando el valor de alguna variable es alto, el valor de la otra variable es bajo. Mientras
más próximo se encuentre a -1, más clara será la covariación extrema. Si el coeficiente
es igual a -1, nos referimos a una correlación negativa perfecta.
Interpretación del coeficiente de correlación de
Karl Pearson
Correlación mayor a cero: Si la correlación es igual a +1 significa que es positiva perfecta. En
este caso significa que la correlación es positiva, es decir, que las variables se
correlacionan directamente.
Cuando el valor de una variable es alto, el valor de la otra también lo es, sucede lo mismo
cuando son bajos. Si es cercano a +1, el coeficiente será la covariación.
Correlación igual a cero: Cuando la correlación es igual a cero significa que no es posible
determinar algún sentido de covariación. Sin embargo, no significa que no exista una
relación no lineal entre las variables.
Ventajas y desventajas del
coeficiente de correlación
de Pearson
Entre las principales ventajas del coeficiente de correlación de Karl Pearson se
encuentran:
+El valor es independiente de cualquier unidad que se utiliza para medir las
variables.
+Si la muestra es grande, es más probable la exactitud de la estimación.
Alguna de las desventajas del coeficiente de correlación son:
+Es necesario las dos variables sean medidas a un nivel cuantitativo continuo.
+La distribución de las variables deben ser semejantes a la curva normal.
COEFICIENTE DE
02 CORRELACIÓN DE
SPEARMAN
El coeficiente de correlación de Spearman es una medida no paramétrica de la correlación de rango
(dependencia estadística del ranking entre dos variables). Se utiliza principalmente para el análisis de
datos.
Mide la fuerza y la dirección de la asociación entre dos variables clasificadas.
Para el cálculo y la prueba de significación de la variable de ranking, se requiere que la siguientes
suposiciones de datos sean ciertas:
● Nivel de intervalo o ratio
● Relación lineal
● Bivariante distribuido
Si tus datos no cumplen con las suposiciones anteriores, necesitarás el coeficiente de correlación de
Spearman. Para esto, es necesario saber qué función monótona es para entenderlo.
Una función monótona es aquella que nunca disminuye o nunca aumenta, ya que es un incremento
variable independiente.
Monotónicamente Disminuye No monótono:
en aumento: monótonamente:
Cuando la variable “x” Cuando la variable “x” Cuando la variable “x”
aumenta y la variable “y” aumenta pero la aumenta y la
nunca disminuye variable “y” nunca variable “y” a veces
aumenta. aumenta y a veces
disminuye.
Cómo calcular el coeficiente de correlación de
Spearman

n= número de puntos de datos de las dos variables


di= diferencia de rango del elemento «n”
El Coeficiente Spearman,⍴, puede tomar un valor entre +1 y -1 donde,
Un valor de +1 en ⍴ significa una perfecta asociación de rango
Un valor 0 en ⍴ significa que no hay asociación de rangos
Un valor de -1 en ⍴ significa una perfecta asociación negativa entre los rangos.
Si el valor de ⍴ se acerca a 0, la asociación entre los dos rangos es más débil.

También podría gustarte