Está en la página 1de 37
El concepto de varianza y su uso en la estimación estadística Enrique Morosini Universidad Nacional
El concepto de varianza y su uso en la estimación estadística
El concepto de varianza
y su uso en la estimación estadística

Enrique Morosini

Universidad Nacional de Asunción Facultad de Filosofía Psicología Especialidad Clínica – Cátedra Psicometría Aplicada II Asunción - 2012


Advertencia
Advertencia

Este material intenta introducir los principios lógico-conceptuales del razonamiento estadístico relacionado con la varianza y los procesos relacionados con la estimación estadística.

Las precisiones técnicas, los aspectos críticos y los planteamientos estadísticos estrictos deben ser consultados en la bibliografía recomendada.


La varianza
La varianza

Uno de los conceptos más importantes en el análisis estadístico y el control experimental de variables es la varianza.

En principio, la varianza es una medida de variabilidad que da cuenta del grado de homogeneidad de un grupo de observaciones, la fórmula de cálculo es la siguiente:

2

X

σ

N

=

i = 1

(

X

i

)

2

µ

X

N

APROXIMACIÓN CONCEPTUAL Y ESTADÍSTICA 5/7/2012 La varianza y la inferencia estadística - Enrique Morosini 4
APROXIMACIÓN CONCEPTUAL Y ESTADÍSTICA
APROXIMACIÓN
CONCEPTUAL
Y ESTADÍSTICA

Características colectivas
Características colectivas

Supongamos un grupo de personas que comparten características comunes, obviamente, observaremos también características diferenciales.

Supongamos, además, que estamos realizando la tarea de cuantificar esas respectivas características. Más o menos podríamos representar la situación de la siguiente manera:

Características individuales
Características individuales

Cuantificación de variables
Cuantificación de variables

Denominemos estas variables evaluadas o cuantificadas “X”, asignándole valores según un sistema específico de asignaciones.

En la gráfica anterior el grupo de personas se conformaría con asignaciones diferentes de “X”, lo cual podríamos representar de la siguiente manera:

Cuantificación de variables
Cuantificación de variables

Medidas “promedio”
Medidas “promedio”

El conjunto de medidas podrían ser resumidas mediante promedios o medidas de tendencia central.

En este caso utilizamos la media aritmética (pudo haber sido la mediana o la moda). Ese valor está representado por un valor central y un “caso modelo” que representaría las características promedio del grupo:

La media como referencia
La media como referencia

La dispersión de la media
La dispersión de la media

Una vez calculada la medida promedio resulta fácil notar que existe una diferencia (distancia) entre las medidas individuales y el promedio.

Cuanto mayor dispersión se observe (distancia respecto a la media) menos homogéneas son las observaciones.

La dispersión puede cuantificarse calculando la diferencia entre las medidas individuales y el promedio.

La distancia respecto a la media
La distancia respecto a la media
El cálculo de la varianza  La varianza como medida de dispersión es el promedio
El cálculo de la varianza
El cálculo de la varianza

La varianza como medida de dispersión es el promedio de las diferencias cuadráticas de las diferencias individuales respecto de la media (tal como se anticipó). A partir de las observaciones registradas, se aplica la siguiente fórmula:

2

S =

X

n

i = 1

(

X

i

X

)

2

n 1

El cálculo de la varianza Observaciones x1 = 19 x2 = 27 x3 = 20
El cálculo de la varianza
Observaciones
x1
=
19
x2
=
27
x3
=
20
x4
=
22
x5
=
18
x6
=
21
x7
=
27
x8
=
18
El cálculo de la varianza Observaciones x1 = 19 x2 = 27 x3 = 20
El cálculo de la varianza
Observaciones
x1
=
19
x2
=
27
x3
=
20
x4
=
22
x5
=
18
x6
=
21
x7
=
27
x8
=
18
Suma
=
172
Promedio
=
21,5
El cálculo de la varianza Observaciones Media Diferencia x1 = 21,5 19 - 2,5 x2
El cálculo de la varianza
Observaciones
Media
Diferencia
x1
=
21,5
19
- 2,5
x2
=
21,5
27
5,5
x3
=
21,5
20
- 1,5
x4
=
21,5
22
0,5
x5
=
21,5
18
-
3,5
x6
=
21,5
21
- 0,5
x7
=
21,5
27
5,5
x8
=
21,5
18
- 3,5
Suma
=
172
Promedio
=
21,5
El cálculo de la varianza Observaciones Media Diferencia x1 = 21,5 19 - 2,5 x2
El cálculo de la varianza
Observaciones
Media
Diferencia
x1
=
21,5
19
- 2,5
x2
=
21,5
27
5,5
x3
=
21,5
20
- 1,5
x4
=
21,5
22
0,5
x5
=
21,5
18
-
3,5
x6
=
21,5
21
- 0,5
x7
=
21,5
27
5,5
x8
=
21,5
18
- 3,5
Suma
=
172
Suma =
0,0
Promedio
=
21,5
Promedio =
0,0
El cálculo de la varianza Observaciones Media Diferencia Cuadrado x1 = 21,5 6,25 19 -
El cálculo de la varianza
Observaciones
Media
Diferencia
Cuadrado
x1
=
21,5
6,25
19
- 2,5
x2
=
21,5
30,25
27
5,5
x3
=
21,5
2,25
20
- 1,5
x4
=
21,5
0,25
22
0,5
x5
=
21,5
12,25
18
-
3,5
x6
=
21,5
0,25
21
- 0,5
x7
=
21,5
30,25
27
5,5
x8
=
21,5
12,25
18
- 3,5
Suma
=
172
Suma =
0,0
Promedio
=
21,5
Promedio =
0,0
El cálculo de la varianza Observaciones Media Diferencia Cuadrado x1 = 21,5 6,25 19 -
El cálculo de la varianza
Observaciones
Media
Diferencia
Cuadrado
x1
=
21,5
6,25
19
- 2,5
x2
=
21,5
30,25
27
5,5
x3
=
21,5
2,25
20
- 1,5
x4
=
21,5
0,25
22
0,5
x5
=
21,5
12,25
18
-
3,5
x6
=
21,5
0,25
21
- 0,5
x7
=
21,5
30,25
27
5,5
x8
=
21,5
12,25
18
- 3,5
Suma =
172
Suma =
0,0
94
Promedio =
21,5
Promedio =
0,0
13,43

5/7/2012

La varianza y la inferencia estadística - Enrique Morosini

19

COMPONENTES DE LA VARIANZA 5/7/2012 La varianza y la inferencia estadística - Enrique Morosini 20
COMPONENTES DE LA VARIANZA
COMPONENTES
DE LA VARIANZA

Varianza conocida
Varianza conocida

Supongamos que el grupo de personas representado anteriormente pertenecen a un grupo dentro del cual comparten características comunes. Entendemos que estos aspectos comunes hacen que sean más similares entre sí que con otras personas en determinados aspectos.

Teóricamente, si sus características dependieran únicamente de ese factor común las características deberían ser iguales a la media.


Varianza explicada
Varianza explicada

Supongamos, además, que conocemos otros factores que influyen en las diferencias individuales: el sexo y la edad. Dicho de otro modo, las puntuaciones varían conforme fueran hombres o mujeres, más jóvenes o mayores que la edad promedio.

Estas variables explican parte de las variaciones o desviaciones de la media.

Varianza explicada Agregar símbolo de la media 5/7/2012 La varianza y la inferencia estadística -
Varianza explicada Agregar símbolo de la media 5/7/2012 La varianza y la inferencia estadística -

Varianza explicada Agregar símbolo de la media

Varianza explicada Agregar símbolo de la media 5/7/2012 La varianza y la inferencia estadística - Enrique
Varianza error  Aún conociendo estas variables responsables de la variación, es posible observar que
Varianza error
Varianza error

Aún conociendo estas variables responsables de la variación, es posible observar que las puntuaciones presentan algunas variaciones respecto a los valores medios o esperados. Este grado de variación se conoce como varianza error.

Varianza error
Varianza error
DISTRIBUCIÓN DE PROBABILIDADES 5/7/2012 La varianza y la inferencia estadística - Enrique Morosini 26
DISTRIBUCIÓN DE PROBABILIDADES
DISTRIBUCIÓN
DE PROBABILIDADES

Probabilidades
Probabilidades

Durante muchos años el azar y la posibilidad de establecer suposiciones que permitan comprender las leyes que le subyacen fueron objeto de interés por científicos y matemáticos.

El concepto que ha permitido acercarse a comprensión del azar es el estudio sistemático de la manera en cómo se distribuyen empíricamente los sucesos y el análisis de las probabilidades de ocurrencia de un fenómeno.


Distribución de probabilidades
Distribución de probabilidades

La forma en cómo se distribuyen las probabilidades de ocurrencia de un determinado fenómeno ha generado modelos que facilitan mecanismos de estimación.

Uno de estos modelos cuyo uso se ha extendido (en forma peculiar en las ciencias sociales, del comportamiento y la salud) es el de la distribución normal, cuya forma intuitiva se representa a continuación:

La distribución de observaciones
La distribución de observaciones
La distribución de observaciones Aquí se puede observar que la mayoría de los casos observados
La distribución de observaciones
Aquí se puede observar
que la mayoría de los
casos observados
presentan valores
cercanos a la media.
La distribución normal
La distribución normal
ESTIMACIÓN ESTADÍSTICA 5/7/2012 La varianza y la inferencia estadística - Enrique Morosini 32
ESTIMACIÓN ESTADÍSTICA
ESTIMACIÓN
ESTADÍSTICA

Aproximación conceptual
Aproximación conceptual

El principio fundamental en el proceso de estimación estadística es la necesidad de conocer los parámetros de una población a partir de las observaciones de valores en una muestra.

Un conjunto de datos obtenidos de una muestra, utilizando el concepto de varianza y la distribución de probabilidad, representa un valor con cierta probabilidad de representar el parámetro de la población.

Aproximación conceptual  Si utilizamos el modelo de distribución normal, que como lo habíamos adelantado
Aproximación conceptual
Aproximación conceptual

Si utilizamos el modelo de distribución normal, que como lo habíamos adelantado es uno de los más utilizados (atendiendo que existen críticas importantes respecto a esta suposición), es posible conocer de antemano la distribución teórica de probabilidades para una distribución similar.

teórica de probabilidades para una distribución similar. 5/7/2012 La varianza y la inferencia estadística -
La distribución normal -2,58 -1,96 -1,68 1,68 1,96 2,58
La distribución normal
-2,58
-1,96
-1,68
1,68
1,96
2,58

Error de estimación
Error de estimación

Las observaciones distribuidas conforme al modelo de distribución normal, presenta una dispersión cuya unidad de medida es el error de estimación.

Este error de estimación, cuya unidad de medida es sigma (σ), se basa en el cálculo de la raíz cuadrada de la varianza:

σ =

ε

2 σ x n
2
σ
x
n

=

σ x n
σ
x
n

El proceso de estimación
El proceso de estimación

La estimación propiamente se realiza aplicando un margen de error a la medida muestral objeto de estimación (θ).

El margen de error aplicado es el valor del error de medición multiplicado por el valor z correspondiente a la probabilidad de ocurrencia del suceso, también llamado confianza de estimación.

θ ± σ . z