DEFINICIÓN Proviene de griego heteros = diferentes Cedasticidad: dispersión En estadística se denomina cuando los errores no son constantes a lo largo de toda la muestra. REPRESENTACIÓN MATEMÁTICA Para comprenderlo de forma intuitiva
¿cómo lo podemos razonar ?
Iguales varianzas de “u” para los distintos valores de “x” implica necesariamente igual dispersión (varianzas) de “y” para distintos valores de “x” lo que implica necesariamente que la recta de regresión va a representar con igual precisión la relación entre “x” e “y” independientemente de los valores de “x”. ¿Por qué es importante? Esto es muy importante porque debe recordarse que el análisis de regresión es un análisis de regresión condicional de “y” sobre “x” ¿Qué implica? Implica por lógica, que si se desea obtener un parámetro de relación estable y útil entre ambas variables, los valores muéstrales de “y” deben mostrarse igualmente dispersos ante variaciones de “x”. EN TERMINOS DE ERROR Aunque el error será́ mayor para mayores valores de “x” (no se fuerza que el error tenga un tamaño igual para el recorrido de “x”) la dispersión del error alrededor de la recta de regresión será́ la misma. ENTONCES ¿QUÉ NOS PERMITE CONSIDERAR? Esto permite considerar igualmente válidos todos los datos muéstrales de los regresores “x” para determinar la relación condicional de “y” a los valores de “x” sin tener que ponderar más o menos unos valores u otros de “x” en función de la menor o mayor dispersión de “y” en los distintos casos. CAUSAS FRECUENTES DE LA HETEROCEDASTICIDAD VARIABLES EXÓGENAS Variables explicativas con una distribución asimétrica Si una variable explicativa presenta una distribución asimétrica (por ejemplo la renta), resultará inevitable que, por ejemplo para el caso de asimetría a derechas, los valores mayores del regresor estén asociados a una mayor dispersión en el término de error de la regresión. Variables explicativas con amplio recorrido Las variables con amplio recorrido favorecen la aparición de heterocedasticidad en mayor medida que aquellas otras que presentan un agrupamiento muy claro alrededor del valor de la media. Omisión de variables relevantes en el modelo especificado. En este caso no hablamos de las variables seleccionadas, sino, precisamente, de las no seleccionadas. Cuando se ha omitido una variable en la especificación, dicha variable quedará parcialmente recogida en el comportamiento de las perturbaciones aleatorias, pudiendo introducir en éstas su propia variación, no necesariamente fija. Otras causas Cambio de estructura El hecho de que se produzca un cambio de estructura determina un mal ajuste de los parámetros al conjunto de los datos muestrales. Forma funcional incorrecta La utilización de una forma funcional incorrecta, por ejemplo la utilización de una función lineal en lugar de una logarítmica potencial, puede provocar que la calidad del ajuste de la regresión varíe según los valores de las exógenas, por ejemplo, ajustando bien para los valores pequeños y mal para los grandes; en ese caso, es posible que en las zonas de peor ajuste existan, no sólo errores mayores, sino también errores más dispersos. Modelos de aprendizaje sobre los errores Esta causa, apuntada por Gujarati3, se refiere a la modelización de fenómenos que contienen un mecanismo de auto - aprendizaje en función de los errores (desajustes) previos. Presencia de puntos atípicos Esta causa, apuntada por Gujarati, se refiere a la modelización de fenómenos que contienen un mecanismo de auto - aprendizaje en función de los errores (desajustes) previos. TAREA
El método Zettelkasten: Cómo tomar notas de forma eficaz para impulsar la escritura y el aprendizaje de estudiantes, académicos y escritores de no ficción