Está en la página 1de 9

Clase N 6

Varianza y desviación típica

Introducción
La idea detrá s de las medidas de dispersió n es entender qué
tan distintos son los valores entre sí. Intuitivamente sabemos que, si
todos los valores son iguales, la dispersió n o diversidad de los datos es
nula. Pero cuando los valores son distintos
¿có mo medir la diferencia entre estos?
Uno de los enfoques má s comú nmente utilizados es tomar una medida
de tendencia central como la media y comparar todos los valores con
esta. Hay quienes opinan incluyéndome que no tiene sentido reportar
una medida de tendencia central sin acompañ arla de al menos una
medida de dispersió n apropiada.
Varianza
Es una medida de dispersió n que representa la variabilidad de una
serie de datos respecto a su media.
Formalmente se calcula como la suma de los residuos al cuadrado
divididos entre el total de observaciones.
También se puede calcular como la desviació n típica al cuadrado.
Dicho sea de paso, entendemos como residuo a la diferencia entre el
valor de una variable en un momento y el valor medio de toda la
variable.
Fó rmula para calcular la varianza
La unidad de medida de la varianza será siempre la unidad de medida
correspondiente a los datos pero elevada al cuadrado.
La varianza siempre es mayor o igual que cero.
Al elevarse los residuos al cuadrado es matemá ticamente imposible
que la varianza salga negativa. y de esa forma no puede ser menor que
cero.

Donde
 X: variable sobre la que se pretenden calcular la varianza
 xi: observació n nú mero i de la variable X.
y puede tomará valores entre 1 y n.
 n: nú mero de observaciones.
 x̄: Es la media de la variable X.
entonces podremos decir:

¿Por qué se elevan al cuadrado los residuos?


La razó n por la que los residuos se elevan al cuadrado es sencilla.
Si no se elevasen al cuadrado, la suma de residuos sería cero.
Es una propiedad de los residuos.
Así pues, para evitarlo, tal como ocurre con la desviació n típica se
elevan al cuadrado.
El resultado es la unidad de medida en la que se miden los datos, pero
elevada al cuadrado.
Por ejemplo, si tuviésemos datos sobre los salarios de un conjunto de
personas en dó lares, el dato que arroja la varianza sería en dó lares
cuadrados.
Para que tenga sentido la interpretació n calcularíamos la desviació n
típica y pasaríamos el dato a dó lares.
1. Desviació n -> (2-3) = -1
2. Desviació n -> (4-3) = 1
3. Desviació n -> (2-3) = -1
4. Desviació n -> (4-3) = 1
5. Desviació n -> (2-3) = -1
6. Desviació n -> (4-3) = 1
Si sumamos todas las desviaciones el resultado es cero.
¿Qué diferencia existe entre la varianza y la desviación típica?
En realidad, vienen a medir lo mismo.
La varianza es la desviació n típica elevada al cuadrado. o al revés, la
desviació n típica es la raíz cuadrada de la varianza.
La desviació n típica se hace para poder trabajar en las unidades de
medida iniciales.
Para calcular la covarianza necesitamos la varianza y no la desviació n
típica, para calcular algunas matrices econométricas se utiliza la
varianza y no la desviació n típica.
Es una cuestió n de comodidad a la hora de trabajar con los datos en
segú n qué cá lculos.
Ejemplo de cálculo de la varianza
Vamos a acuñ ar una serie de datos sobre salarios. Tenemos cinco
personas, cada uno con un salario diferente:
Juan: 1.500 euros
Pepe: 1.200 euros
José: 1.700 euros
Miguel: 1.300 euros
Mateo: 1.800 euros
La media del salario, la cual necesitamos para nuestro cá lculo, es de
((1.500 + 1.200 + 1.700 + 1.300 + 1.800) /5) 1.500 euros.
Dado que la fó rmula de la varianza en su forma desglosada se formula
como sigue:

Obtendremos que se debe calcular tal que:

El resultado es de 52.000 euros al cuadrado. Es importante recordar


que siempre que calculamos la varianza tenemos las unidades de
medida al cuadrado. Para pasarlo a euros, en este caso tendríamos que
realizar la desviación típica. El resultado aproximado sería de 228
euros. Esto quiere decir que, en media, la diferencia entre los salarios
de las distintas personas será de 228 euros.
La desviació n está ndar o desviació n típica es una medida que ofrece
informació n sobre la dispersió n media de una variable. La desviació n
está ndar es siempre mayor o igual que cero.
Para entender este concepto necesitamos analizar 2 conceptos
fundamentales.
 Esperanza matemática, valor esperado o media: Es la media
de nuestra serie de datos.
 Desviación: La desviació n es la separació n que existe entre un
valor cualquiera de la serie y la media.
Ver todas las medidas de dispersión
Ahora, entendiendo estos dos conceptos la desviació n típica se
calculará de forma similar a la media. Pero tomando como valores las
desviaciones. Y aunque este razonamiento es intuitivo y ló gico tiene un
fallo que vamos a comprobar con el siguiente grá fico.

En la imagen anterior tenemos 6 observaciones, es decir, N = 6. La


media de las observaciones está representa por la línea negra situada
en el centro del grá fico y es 3. Entenderemos por desviació n, la
diferencia que existe entre cualquiera de las observaciones y la línea
negra. Así pues, tenemos 6 desviaciones.
1. Desviació n -> (2-3) = -1
2. Desviació n -> (4-3) = 1
3. Desviació n -> (2-3) = -1
4. Desviació n -> (4-3) = 1
5. Desviació n -> (2-3) = -1
6. Desviació n -> (4-3) = 1
Como podemos ver si sumamos las 6 desviaciones y dividimos entre N
(6 observaciones), el resultado es cero. La ló gica sería que la
desviació n media fuese de 1. Pero una característica matemá tica de la
media respecto a los valores que la forman es, precisamente, que la
suma de las desviaciones es cero. ¿Có mo arreglamos esto? Elevando al
cuadrado las desviaciones
Rango
Fó rmulas para calcular la desviació n típica
La primera es elevando al cuadrado las desviaciones, dividir entre el
nú mero total de observaciones y por ú ltimo hacer la raíz cuadrada
para deshacer el elevado al cuadrado, tal que:
Alternativamente existiría otra forma de calcularla.
Sería haciendo un promedio de la suma de los valores absolutos de las
desviaciones.
Es decir, aplicar la siguiente fó rmula:

Sin embargo, esta fó rmula no es una alternativa de la desviació n típica


pues arroja diferentes resultados.
En realidad, la fó rmula anterior es la desviació n respecto de la media.
La desviació n está ndar o típica y la desviació n respecto de la media
tienen similitudes, pero no son lo mismo.
A esta ú ltima forma se le conoce como desviació n media.
Desviación Estándar
Ejemplo de cálculo de la desviación estándar
Vamos a comprobar có mo, con cualquiera de las dos fó rmulas
expuestas, el resultado de la desviació n típica o desviació n media es el
mismo.
Segú n la fó rmula de la varianza (raíz cuadrada):

Segú n la fó rmula del valor absoluto:

Tal como se aplicado las fó rmulas el cá lculo intuitivo.


La desviació n media es de 1.
Pero,
¿no habíamos dicho que la fó rmula del valor absoluto y de la
desviació n típica daban valores diferentes?
Así es,
pero hay una excepció n.
El ú nico caso en que la desviació n está ndar y la desviació n respecto de
la media ofrecen el mismo resultado es el caso en que todas las
desviaciones son igual a 1.
La relació n de la desviació n típica con la varianza
En definitiva, la varianza no es má s que la desviació n está ndar al
cuadrado. o lo que viene a ser lo mismo, la desviació n típica es la raíz
cuadrada de la varianza.
Se relacionan de la siguiente forma:

Tras esta imagen, queda claro que toda la fó rmula que está dentro de la
raíz cuadrada es la varianza.
La razó n por la que es necesario entender que esa parte se conoce
como varianza es que se utiliza en otras fó rmulas para calcular otras
medidas.
Así pues, aunque la desviació n típica sea má s intuitiva para interpretar
resultados, es imperativo có mo se calcula la varianza.

Media Geométrica.
Es un tipo de media que se calcula como la raíz del producto de un
conjunto de nú meros estrictamente positivos.
La media geométrica se calcula como un producto conjunto.
Es decir, que todos los valores se multiplican entre sí.
De modo que, si uno de ellos fuera cero, el producto total sería cero.
Por ello, debemos siempre tener en cuenta que a la hora de calcular la
media geométrica necesitamos nú meros que sean ú nicamente
positivos.
Uno de sus principales usos es para calcular medias sobre porcentajes,
pues su cá lculo ofrece unos resultados má s adaptados a la realidad.

Medidas de tendencia central


Fó rmula de la media geométrica
La fó rmula de la media geométrica es la siguiente:

Fó rmula de la media geométrica


Donde:
 N: Se trata del nú mero total de observaciones.
Por ejemplo,
Si tenemos el crecimiento de los beneficios de una empresa
durante 4 periodos, N será 4.
 x: La variable X es sobre la que calculamos la media geométrica.
Siguiendo el ejemplo anterior:
El crecimiento de los beneficios estará expresado en porcentaje y
será la variable X.
 i: Representa la posició n de cada observació n.
En este ejemplo,
podríamos ponerle un nú mero cada periodo.
Un 1, al periodo 1, un 2 al periodo 2, etc.
De manera que
x1 es el crecimiento de los beneficios en el periodo 1,
x2 el crecimiento de los beneficios en el periodo 2,
x3 el crecimiento de los beneficios en el periodo 3 y
x4 el crecimiento de los beneficios en el periodo 4.

Media Armónica.
Es igual al nú mero de elementos de un grupo de cifras entre la suma de
los inversos de cada una de estas cifras.
En otras palabras, la media armó nica es una medida estadística
recíproca a la media aritmética, que es la suma de un conjunto de
valores entre el nú mero de observaciones.
Fórmula de la media armónica:
La fó rmula de la media armó nica (H)
de un conjunto de nú meros x1, x2, x3, …, xn, es la siguiente:

Donde:
N: es el nú mero de elementos sobre los cuales se calcula la media.
Este tipo de media suele utilizarse, principalmente, en velocidades,
tiempos, o en el á rea de la electró nica.
Sin embargo, su uso no está muy extendido en otras disciplinas.
Debemos tener en cuenta que esta presenta ciertas desventajas, como
que no puede calcularse si una de las observaciones es igual a cero.
Es decir, ninguno de los elementos puede ser nulo.
Asimismo, resulta interesante señ alar que tiene menos sensibilidad o
presenta un menor impacto ante nú meros altos, sucediendo lo opuesto
con valores pequeñ os.
Esto es porque el inverso de 100, por ejemplo, es 0,001,
pero el de 5 es 0,2.
Así, cuanto má s grande sea una observació n, menos influirá en el
resultado, y lo contrario sucederá si la observació n se acerca a cero.
Ejercicios
1. Supongamos Gerardo decide salir a correr 10km.
Los primeros 2 km corre a 15 km/h,
los siguiente 2km, a 17 km/h, los siguientes 2km, a 14 km/h, y los
otros dos tramos de 2km, a 13 km/h y 12 km/h, respectivamente.
calcular la media armó nica.

2. Un País tiene, en 2010 una població n de 6.5 millones de habitantes la


cual sube en 2020 a 8 millones de habitantes
Se pregunta por la població n media del periodo y por la tasa anual
de crecimiento.

3. En la siguiente distribució n de frecuencia calcule:


Media Geométrica
Media armó nica
Centro Recorrido
Media Cuadrá tica

Intervalos Frecuencia (F)


115 – 123 3
123 – 131 10
131 – 139 19
139 – 147 13
147 - 155 5

También podría gustarte