Está en la página 1de 35

ESCUELA DE TRABAJO SOCIAL

ESTADISTICA I
MEDIDAS DE VARIABILIDAD
FACILITADOR: Dr. Cayetano Rosales
Auxiliar: Floridalma Martínez
Semestre II. 2022
Medidas de Variabilidad

Varianza
Desviación estándar

Coeficiente de variación
La Varianza y la Desviación estándar
Varianza

Desviación estándar

O desviación típica
Peso de los niños
A
10 lb. 12 lb. 22 lb. 26 lb. 30 lb.
10 + 12 + 23 + 25 + 30 100 =20 lb.
∑𝑋 =
= = 5
𝑁 5
La media aritmética, describe
16 lb. 18 lb. 20 lb. 22 lb. 24 lb. B el centro de los datos.

100 No indica
∑𝑋 16 + 19 + 20 + 21 + 22 = =20 lb.
= = 5 Cuánto están dispersos
𝑁 5
Cuánto unidos están
B unidos
dispersos A Peso (lb)
10 12 14 16 18 20 22 24 26 28 30 32

¿ Como demostrar la dispersión es mayor?


Con las medidas de dispersión
Varianza Desv. Estándar
∑(𝑥 − 𝑥)2
Muestra 𝑖 S= 𝑠2
𝑠2 =
𝑛−1
Población 2
∑(𝑥𝑖 − 𝑥)2 𝜎= 𝜎2
𝜎 =
𝑁

Variancia tiene un problema, se expresa en medidas elevadas al cuadrado

La varianza carecen de un significado práctico


2
𝑚
𝑎ñ𝑜𝑠 2 Se debe simplificar al lenguaje común

𝑄2 $2 Se vale de la Desviación estándar


A ∑𝑋 100
f 𝑥𝑖 − 𝑥 (𝑥𝑖 − 𝑥)2 = =
5
= 20
𝑁
10 -10 100
12 -8 64 ∑(𝑥𝑖 − 𝑥)2 304
2 𝑠2 = = 76𝑙𝑏2
𝑠 = 4
22 2 4 𝑛−1
26 6 36
S = 8.71 Se elimina el efecto de
30 10 100 S= 𝑠2 S= 76 haber elevado al cuadrado.
100 304
B
f 𝑥𝑖 − 𝑥 (𝑥𝑖 − 𝑥)2 =
∑𝑋
=
100 = 20 𝑙𝑏
𝑁 5
16 -4 16
18 -2 4 ∑(𝑥𝑖 − 𝑥)2 40
= 10𝑙𝑏2
𝑠2 = 𝑠2 =
20 0 0 𝑛−1 4

22 2 4 S= 𝑠2 S= 10 S = 3.16 𝑙𝑏
24 4 16
100 40
Ejercicio

A 15 16 17 17 18 19

B 14 15 15 17 18 21

Determinar:

Varianza
Desviación estándar
VARIANZA Y DESVIACIÓN ESTÁNDAR

La varianza es la media aritmética de los cuadrados de las desviaciones


respecto a la media aritmética, es decir, es el promedio de las
desviaciones de la media elevadas al cuadrado. La desviación estándar o
desviación típica es la raíz de la varianza.

La varianza y la desviación estándar proporcionan una medida sobre el


punto hasta el cual se dispersan las observaciones alrededor de su media
aritmética
PROPIEDADES

La varianza y desviación estándar (o cualquier otra medida de dispersión)


indican el grado en que están dispersos los datos en una distribución.
A mayor medida, mayor dispersión.

La varianza es un número muy grande con respecto a las observaciones,


por lo que con frecuencia se vuelve difícil para trabajar.
La desviación estándar es solo un ente matemático o estadístico que no
permite explicarse en función de los datos.

Los valores puntuales de la desviación estándar carecen de un significado


práctico.

La desviación estándar es una medida de dispersión comparativa.

Gutiérrez, J. (s.a). p. 92. Revista universitaria Eafit. 101


Media aritmética
19 - 28 = -9
∑𝑓𝑋𝑖 1400
Li-Ls Xi f fXi 𝟐
(𝒙𝒊 −𝒙) (𝒙𝒊 − 𝒙) = = = 28
= -6
𝑁 50 22 - 28
18 20 19 4 76 -9 81
21 23 22 4 88 -6 36 …
24 26 25 18 450 -3 9 Varianza
27 29 28 4 112 0 0
30 32 31 6 186 3 9
2
∑(𝑥𝑖 − 𝑥)2 252 = 5.04
33 35 34 10 340 6 36 𝜎 = =
𝑁 50
36 38 37 4 148 9 81
50 1400 252 Desviación Estándar

𝜎= 𝜎2 𝜎= 5.04 𝜎 = 2.24

R// El departamento de recursos humanos le da seguimiento a las notas de


desempeños de los colaboradores de la organización… en donde se registró que la
desviación estándar es aproximadamente 2.24 puntos que se desvía de la media.
DESVIACIÓN ESTÁNDAR
Series2 Series3 Series4 Series5
20

15

10

0
18 -20 21 -23 24 -26 27 -29 30 -32 33 -35 36 -38

R// La mayoría de los colaboradores de la organización… están entre los límites máximo
y mínimo, son datos aceptables para tomar decisiones porque ellos están en promedio
a 2.24 de la media aritmética. En tanto, los colaboradores que están afuera de la línea
de la desviación típica, los alcanzaron notas entre 24 y 26, no serán incluidos en el
análisis.
Importancia de la Desviación estándar
Comparar dos poblaciones: Son semejantes o diferentes

- Muy llenas, muy debajo de la media


Análisis de la calidad y
control de procesos:
- Controlar la variabilidad
- Ahorro, 9% anual
Medición del riesgo:
- Inversión, 25% anual o 0%

-Concentran de los datos


Estimar tendencias y
concentración de datos: -Se ajustan a una
distribución = curva normal
CURVA NORMAL
Área bajo la curva= 1

-50% 50%

Media desviación típica


Curva normal
Es una distribución de variable continua condicionada por dos parámetros, de
los que depende su función de densidad. La media y la desviación estándar
de la distribución. Gráfica que se traza en el cuadrante I del plano cartesiano.

La curva normal permite asumir que las


observaciones derivan de la sumatoria de
causas independientes. Sirve para modelar
fenómenos sociales y naturales de forma
aproximada a la realidad.
La campana de Gauss depende de los parámetros µ y δ.

La media indica la posición de la campana, de modo que para diferentes valores de µ, la


gráfica es desplazada a lo largo del eje horizontal del plano cartesiano.

La desviación estándar determina el grado de apuntamiento de la curva. Cuanto mayor


sea el valor de δ, más se dispersarán los datos en torno a la media y la curva será más
plana.

Hay diferente medias


La curva normal es de mucha utilidad en las investigaciones de Trabajo Social

a) Las variables que se miden en la investigación Trabajo social tienen


distribuciones que se asemejan mucho a la curva normal. Ejemplos: estatura, peso,
inteligencia y el rendimiento, entre otros.

b) Las pruebas de inferencia que se utilizan en el análisis de los experimentos


tienen distribuciones muestrales que adquieren una distribución normal cuando
el tamaño de la muestra aumenta.
c) Las pruebas de inferencia requieren distribuciones muestrales que tengan
semejanza con la curva normal.

La prueba z, la t de Student y la F son ejemplos de pruebas de inferencia que


dependen de la curva.
La curva normal se aplica en la resolución de dos tipos de problemas:

1. Cálculo de valores críticos: Determinar los extremos del intervalo que comprenda
una probabilidad dada.

2. Cálculo de probabilidades: Calcular la probabilidad de que la variable tome


valores en intervalos determinados por uno o dos puntos dados.
Su importancia:
Permiten predecir a qué proporción de la población (estadística) caerá dentro de cierto
rango, si la variable tiene distribución normal.

Para conocer la probabilidad de encontrar un valor de la variable que sea igual o inferior a
un cierto valor.

Es necesario contar con: la media, la desviación estándar y la varianza de un conjunto


de datos que se sustituye en la función que describe el modelo.

Se debe estudiar primero si los datos siguen una distribución normal.

paramétrica
realiza la prueba

no paramétrica Kolmogorov-Smirnov (n ≥ 50)


Además, la distribución normal su uso se debe a que hay muchas variables asociadas a
fenómenos naturales que siguen el modelo de la normal.

•Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie. Ejm. tallas,
pesos, envergaduras, diámetros, perímetros,...
•Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma
cantidad de abono.
•Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de
individuos, puntuaciones de examen.
•Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio,...
•Errores cometidos al medir ciertas magnitudes.

•Valores estadísticos muestrales, por ejemplo: la media.

•Otras distribuciones como la binomial o la de Poisson son aproximaciones normales, ...


Características de la distribución normal

a) Forma de campana
b) Simétricas
Actúa como espejo en ambas colas

c) Asíntota
La curva tiende a cero al eje de la x,
nunca corta

Mediana
Moda
Motivos de su importancia

Los mejores test estadísticos supone que la distribución de los valores


es normal.

En la curva normal la media es independiente de la varianza.

Muchos fenómenos sociales y naturales tienen una distribución


cercana a la normalidad.

Teorema del límite central.


La curva normal

Es un modelo teórico capaz de aproximar satisfactoriamente el valor de una variable aleatoria a


un valor real.
Adopta una variable aleatoria a una función que depende de la media y la desviación típica. Es
decir, la función y la variable aleatoria tendrán la misma representación pero con ligeras
diferencias.
Características de la distribución normal

1. Simétrica respecto a su media. La media actúa como espejo en la distribución y hace que
ambas colas sean idénticas y, por tanto, simétricas.

2. Media = Moda = Mediana. Las medidas de centralización son iguales porque la distribución
es simétrica.

3. La distribución cambia de curvatura o tiene puntos de inflexión en los puntos del eje horizontal:

µ −𝜎
Intervalos
µ+𝜎
La distribución normal depende de dos parámetros: µ 𝜎
Media y desviación típica.
𝑥−µ 𝑥−µ
Distribución normal reducida. 𝑧= 𝑧=
𝜎 𝐷𝐸

Importancia
a) La mayoría de fenómenos se puede modelizar con esta distribución.
b) Muchas distribuciones de usos frecuente tienden a aproximarse a la
distribución normal bajo ciertas condiciones.
c) Las variables que pueden considerarse causadas por un gran número
de pequeños defectos, (errores de observación) tienden a la
distribución normal.
¿Cómo se construye la curva
normal?
Para construir la curva normal en Excel

1) Determinar el Mínimo y el Máximo, para estructurar la variable continua.

Al Mínimo y el Máximo se le añade entre dos o tres datos a los extremos.

2) =DISTR.NORM.N(Variable continua, Media, Desviación estándar, FALSO)

3) Se selecciona la variable continua y los datos de la distribución normal.

4) Se pincha en la tableta INSERTA y se selecciones graficas Dispersión.

5) Clik derecho al ratón para elegir color y tipo de diseño para la o las curvas.
Apuntamiento (curtosis)

El apuntamiento o curtosis de una distribución de frecuencias no tiene un referente natural como en el caso de la
simetría, sino que se sustenta en la comparación respecto a una distribución de referencia, en concreto, la
distribución normal o campana de Gauss. En consecuencia, su obtención sólo tendrá sentido en variables cuya
distribución de frecuencias sea similar a la de la curva normal –en la práctica ello se reduce, básicamente, a que
sea unimodal y más o menos simétrica.

El apuntamiento expresa el grado en que una distribución acumula casos en sus colas en comparación con los
casos acumulados en las colas de una distribución normal cuya dispersión sea equivalente (Pardo y Ruiz, 2002).
Así, de forma análoga a la asimetría, se diferencian 3 grandes categorías de apuntamiento:
- Distribución Platicúrtica. Indica que más casos acumulados que en las colas de una
distribución normal.
- Distribución Mesocúrtica. presenta un grado de concentración medio alrededor de
los valores centrales de la variable (el mismo que presenta una distribución normal).
- Distribución Leptocúrtica. Cuando es más apuntada y con colas menos anchas que
la normal.

Distribución normal
0.45

0.4

0.35

0.3

0.25
Probabilidad

0.2

0.15

0.1

0.05

0
0 5 10 15 20 25 30
-0.05
Notas de los estudiantes

A B C
La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación
típica(δ).

El área bajo la curva aproximadamente: 3)


2)
A una desviación estándar de la media es igual 0.68
1)
A dos desviaciones estándar de la media es igual a 0.95

A tres desviaciones estándar de la media es igual a 0.99


La asimetría es un indicador que te permite saber cuán asimétrica o no simétrica es la
distribución de los puntajes o la curva. Esta puede ser tanto positiva como negativa. Cuando
la asimetría es muy grande (mayor a 3) tanto positiva, como negativa entonces podemos
decir que nuestra distribución es asimétrica. Si la asimetría es igual a 0 somos personas muy
felices porque nuestra distribución es normal.

Cuando la asimetría es positiva, entonces el tope de la montaña está al lado izquierdo,


cuando es negativa entonces el tope de la montaña está al lado derecho. En otras
palabras, la asimetría es positiva cuando el pie de la montaña está a la derecha y la asimetría
es negativa cuando el pie de la montaña está a la izquierda.

Como muchas notas altas se repiten entonces el tope de la montaña está hacia el lado
derecho. Por ende, el pie de la montaña está al lado izquierdo. En ese caso, la asimetría es
negativa. (otro gráfico para amenizar el día).
Diferencia entre desviación estándar y desviación media
Las dos formas más comunes de medir la variabilidad o volatilidad en un
conjunto de datos, la desviación estándar y la desviación media o
desviación media total.

Las dos medidas son similares, se calculan de manera diferente y ofrecen


vistas de los datos ligeramente diferentes.

•La desviación estándar es la medida más común de variabilidad y se usa a menudo


para determinar la volatilidad de los datos.

•Se considera que la desviación estándar es la medida de variabilidad más apropiada


cuando se usa una muestra de población.
• La desviación media, es una mejor medida de variabilidad cuando hay un flujo de
salida distante o si los datos no están bien distribuidos.
Coeficiente de variación
El coeficiente de variación, también denominado como coeficiente de
variación de Pearson, es una medida estadística que nos informa acerca de
la dispersión relativa de un conjunto de datos.
𝜎𝑥
CV =
| |
CV = Coeficiente de variación
𝜎𝑥 = Desviación típica de la variable
| |= Medida de la variable X en valor absoluto con | | ≠ 0

El coeficiente de variación se puede ver expresado con las letras CV o r, dependiendo del libro o la
fuente de lectura que se utilizada.
Del caso Regla de desición
𝜎𝑥
CV =
𝜎 = 2.24
| | Platicurtica K< 0
= 28 Mesocurtica K = 0
Leptocúrtica K > 0
2.24
CV = CV = 0.08
28

R// Dado que el Coeficiente de variación es mayor que cero, esto indica que es una
curva Leptocúrtica, por lo tanto se puede practicar inferencias para la variable en las
notas de desempeño.
Ejercicio
Sec. A Sec. B Sec. C
Media - Desviación estándar
55 60 60 Media + Desviación estándar
S 8 18 22
N 30 200 80

También podría gustarte